传神语联承办CAAI-IMLIP企业专项研讨会,共探多语信息领域新突破
2022年3月16日,由中国人工智能学会多语种智能信息处理专委会(CAAI-IMLIP)主办,传神语联网网络科技股份有限公司承办的"人工智能在多语信息处理领域的创新探讨研讨会",在武汉、北京两地,以线上+线下结合的形式联动呈现。本次研讨会汇聚多位多语信息处理领域的知名专家学者,共聚一堂,围绕深度语义解析、多语言语音处理、推荐系统中的信息去噪、机器翻译技术等,共探人工智能在多语种信息处理领域的创新和发展。
物联网、云计算、大数据、人工智能、区块链等新技术正当其时,技术的变革往往带来文化的新形态,由此也会对语言文字带来广泛而深刻的影响。同时,伴随"一带一路"建设的深入推进,多语种信息处理领域急需进一步整合语种资源、数据资源,利用云计算、人工智能、大数据等技术深入开展自然语言理解、智能语音交互、机器翻译等技术的研究。
数字时代发展,多语信息领域呈全新趋势
中国人工智能学会多语种智能信息处理专委会秘书长张华平教授代表专委会在研讨会上致辞,强调专委会成立的初衷,通过成立各个工作组、开展各项主题会议的形式,促进多语种智能处理的发展,链接全球、链接产学研,实现语言相通、信息相通,为"一带一路"上各国家各民族的经贸相通、文化相通与民心相通贡献力量。
传神语联此次承办研讨会,也获得了张华平秘书长的高度赞扬和支持,对此传神语联创始人兼董事长何恩培在发言中提到,在信息大爆炸时代,面对不同语言背后的信息转化需求,要从两个维度用AI重塑翻译作业流程和供应链改造,从而达到机器的速度,人的质量。而数字技术的介入,意味着新翻译时代已然到来。
不同语言的转化不只是简单的信息转换,更多是不同文化的碰撞和呈现。翻译需要赋予不同语言标准、正确、精美的含义。而语义分析作为处理自然语言时需要执行的步骤之一,其核心目的就是将正确的意义分配给句子,让整句话呈现精准的含义。
贯穿语义和语音层面,探索创新可能
语义分析作为NLP核心技术中的一项,一直以来都备受业内人士关注。北京语言大学信息学院院长荀恩东教授在演讲中提到,"语义分析的本质是生成语义概念结构。通过采用组合策略实现深度语义分析,消解在语义分析过程中遇到的多样性以及歧义性等问题,从而提升系统的可解释性。"
人类通过语言链接自身和外部世界,语言作为沟通和认知的工具,辅助人类不断探索未知。科技的进步让语言有了更多样、更智能化的呈现模式。在这其中语义分析技术相当于人类大脑,负责思考和信息处理,而语音技术则相当于人的嘴巴和耳朵,负责表达和获取。
围绕解决低资源语言语音处理问题,新加坡科技研究局董明会博士以语音识别和语音翻译为例,讲解了利用已有的大语种语言数据的多语言处理技术、通过使用无监督学习的方法、预训练模型和迁移学习的新思路。
技术赋能创新,信息获取和转化方式更便捷
数字技术的不断发展,为互联网经济发展赋予了全新思路。来自武汉大学国家网络安全学院的李晨亮教授,从序列推荐、购物篮推、新闻推荐以及短视频推荐四个任务,讲述了利用信息去噪改善推荐性能的几项尝试。
随着全球化网络时代的到来,人们依托数据推荐获取更精准的信息,在接受多样化信息的同时,也面临着语言障碍问题。实现任意时间、任意地点、任意语言的无障碍自由沟通是人类追求的一个梦想。也是全球化、数字化背景下的一个行业缩影。因此技术的融入,赋予了人们快速跨越语言障碍的方式方法,更便捷更高效的满足信息转化的需求。
伴随AI技术在翻译行业逐步深入的应用,如何在确保机器翻译优势的前提下,满足商用交付质量成当下亟待解决的问题。传神语联网研究院执行院长何征宇在演讲中,表明语联网自主开发构建IOLAIDrive语联网人工智能底层支撑系统,并在产能智能化组织调度、机器翻译以及人机共译等三大关键核心NLP技术领域取得突破进展。语联网提出新的交付标准"HWD",即交付速度的计量记录刷新: 十万字以小时(HOUR)计,百万字以天(DAY)计,千万字以周(WEEK)计,将来还可能进一步提升。
会议最后,传神语联创始人兼董事长何恩培表示,"信息大爆炸时代读取信息的对象,已经从单纯的人类,变为了人与机器同时阅读和处理。因此多语信息的处理,不仅要做好效能提升,更要在此基础上进行创新突破,打破人力处理能力的瓶颈和界限,衔接好人与机器,这是身处多语信息处理领域所有企业的共同使命。"