一部不止于技术的神经机器翻译“百科全书” | 文末赠书
2022 年 7 月,Meta(原 Facebook)AI 发布了一个大规模机器翻译模型 NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达 545 亿,在覆盖 202 种语言、2440 个语向的 180 亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即 202X201=40602 个语向的互译)。
该模型的名字是英文 No Language Left Behind 的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。
历经 70 载,机器翻译进入深度学习驱动时代机器翻译诞生于二十世纪四五十年代,纵观机器翻译 70 多年的发展历程,从最初的朴素统计模式,发展到基于规则的机器翻译、统计机器翻译,再到目前的深度学习驱动的神经机器翻译,不同技术范式在不同历史时期各领风骚。
(图源:https://acutrans.com/top-10-most-commonly-spoken-languages-in-the-world/)
目前机器翻译的主流技术范式——神经机器翻译——是一种基于神经网络的端到端机器翻译模式。区别于前代的统计机器翻译采用的多步骤级联方式,神经机器翻译只需要输入源语言句子,就能直接输出目标语言序列。
如下图所示,其基本思想是利用神经网络对源语言进行编码得到源语言的语义表示,然后根据该语义表示解码生成目标语言。这种端到端模式使模型可以一次性整体训练,既避免了传统级联方式的错误传递,也大大降低了模型训练和部署的烦琐程度。
(来自书中图4.1:神经机器翻译结构示例)时至今日,神经机器翻译已成为在线机器翻译的主要引擎,每天以数千亿单词量的翻译规模服务全世界各地用户。
但即便如此,机器翻译仍然存在诸多挑战和难题。
一方面,全世界在使用的语言有几千种,即使像 NLLB 这样的大规模模型,目前也只能覆盖 200 余种语言,占比不到已有语言的 1/30,大量语言在机器翻译版图里仍然被“Left Behind”。
另一方面,神经机器翻译虽然显著提升了译文质量,但仍然面临鲁棒性、可解释性、广域语境依赖性、多模态、资源稀缺等多种挑战和开放问题。
《神经机器翻译:基础、原理、实践与进阶》正是在这样的背景中写就的。
“百科全书”式内容,展现神经机器翻译全景视图该书为实践者总结已有技术,为研究者梳理前沿进展,并站在机器翻译历史发展的角度,对比不同机器翻译范式,希望读者能从对比中窥见技术发展的内在原因和规律,以此吸引更多机器翻译爱好者为实现所有语言互译的美好愿景添砖加瓦。
全书分为基础篇、原理篇、实践篇和进阶篇,覆盖神经机器翻译的基础知识、经典框架、原理技术、实践方法与技巧,以及无监督神经机器翻译、多语言神经机器翻译、语音与视觉多模态机器翻译等前沿研究方向。
全书理论与实践相结合,基础与前沿相交映。
技术与短评双主线叙事,不止于技术除此之外,本书的一个特色是在每一章均附有一篇短评,针对相应章节的主题,介绍和评论神经机器翻译技术背后的历史、故事、思想、哲学、争议和规范等。短评与全书内容相交错,使读者对神经机器翻译技术不仅知其然,而且知其所以然。
适读人群 本书适合高等院校计算机专业高年级本科生,以及人工智能、自然语言处理方向的研究生阅读,也可供机器翻译研究者、实践者、使用者,以及机器翻译行业的管理者、人工翻译研究人员等对机器翻译技术感兴趣的读者参考。
作者介绍熊德意
天津大学智能与计算学部教授、博士生导师、自然语言处理实验室负责人,天津大学“语言智能与技术”中外联合研究中心主任,中译语通 - 天津大学自然语言处理联合实验室主任、中译语通人工智能首席科学家。
主要研究方向为自然语言处理,特别专注于机器翻译、对话、问答、自然语言生成、常识推理、认知计算等方向的研究。在 Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL 等国际著名期刊和会议上发表论文 100 余篇,在 Springer 出版英文专著一部。
获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金等资助。
获得新加坡资讯通信研究院 2008 年年度研究贡献奖、北京市科学技术奖二等奖、中文信息学会“钱伟长中文信息处理科学技术奖 - 汉王青年创新奖”一等奖等奖项。
曾是亚洲自然语言处理联合会 AFNLP 干事、新加坡中文与东方语文信息处理学会理事会成员,目前是中国中文信息学会理事。担任 IALP 2012&2021 程序委员会共同主席,CWMT 2017 程序委员会共同主席,欧盟多国联合项目 QTLeap 咨询专家,ACL、EMNLP、NAACL、COLING 等多个知名国际会议领域主席,以及 TACL 和 ARR 的 Action Editor 等。
李良友
华为诺亚方舟实验室研究员、机器翻译团队负责人。在欧盟玛丽居里项目资助下,于 2017 年获得都柏林城市大学计算机博士学位。
主要研究方向为自然语言处理,特别专注于机器翻译相关技术领域的研发。在 ACL、EMNLP 等多个国际著名会议和期刊上发表论文 10 余篇,并担任 ACL、EMNLP 等国际会议领域主席和会议审稿人。
张檬
华为诺亚方舟实验室研究员。于 2018 年获得清华大学计算机科学与技术系博士学位。
主要研究方向为机器翻译和跨语言自然语言处理。在 ACL、EMNLP、AAAI、TASLP 等国际著名会议和期刊上发表论文 10 余篇。
曾获中国中文信息学会优秀博士学位论文提名奖。担任 ACL、EMNLP、AAAI、IJCAI 等多个知名国际会议审稿人。
粉丝专享六折优惠
感兴趣的小伙伴可以扫码或点击阅读原文
活动推荐
AI 前线为粉丝准备了《神经机器翻译》纸质书籍3本!长按识别下图小程序,参与抽奖活动,由小程序随机抽出 3 位,每人赠送一本书。开奖时间:9月 13日(下周二) 18:30,获奖者每人获得一本。
??点击【阅读原文】购买,六折优惠。
阅读原文
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线