怡心湖

小语种语料资源匮乏情况下的机器翻译的解决方法一览

机器翻译是人工智能领域的研究热点和典型应用。在经济全球化和“一带一路”倡议的背景下,各国经济、文化交流愈加频繁和深入,机器翻译的应用和产业价值日益突显。2014年以来,随着深度学习技术的发展,神经机器翻译方法开始兴起,机器翻译性能得到了显著提升。英语、法语、德语、西班牙语、汉语、日语等主要语种间的翻译质量已经接近或达到人工翻译的水平。神经机器翻译方法大多属于数据驱动的端到端模型,需要大规模的平行语料作为训练数据。在平行语料资源匮乏的情况下,神经机器翻译模型通常无法得到充分的训练,很难获得好的翻译效果。目前性能较好的神经机器翻译系统一般需要千万级甚至亿级的训练数据支持,但如此巨量的训练数据仅能在少数语言对获得,数据来源也仅限于新闻、专利或官方记录等少数特定领域。

此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 小语种语料资源匮乏情况下的机器翻译的解决方法一览

()
分享到:

相关推荐