当前位置:K88软件开发文章中心办公应用办公应用17 → 文章内容

机器翻译世界杯的中英互译冠军实力如何?让谷歌和它PK下就知道了

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-2-28 5:13:21

机器翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,是AI(人工智能)的终极目标之一。1954年,美国乔治敦大学研制出世界首个英俄机器翻译系统。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,机器翻译的技术研发历程,可谓旷日持久。然而,计算机系统始终难以理解人类的语言,满足不了生活工作所需的“聪明”程度。直到最近十年,随着AI技术的信息突破,机器翻译正在离开环境苛刻的实验室,开始为市场上的普通用户提供服务。曾经的机器翻译,只是一个美好的科幻梦想。如今,它正在变为具有无限可能性的现实,一步步的向我们走来。人工智能时代的百家争鸣,产品体验决定一切随着国际化的进一步加深,人们对于不同语种间的沟通需求也愈发迫切,传统的人工翻译行业,或许要受到一次史无前例的挑战。Google、Facebook、微软、腾讯、阿里巴巴、搜狗,都不愿错过这一场人工智能的历史进程。各大科技巨头公司的市场角逐中,产品体验上的易用性,成为了当下评价机器翻译产品的最好指标。2006 年,Google宣布上线Google Translate翻译功能,拉开了最近十年的“人工智能+机器翻译”的AI技术舞台帷幕。2016年Google发布了GNMT-谷歌神经机器翻译系统,将整个输入句子视作翻译的基本单元,大大提升了翻译效率。在不同的语言对比中,GNMT把PBMT与人工翻译的鸿沟缩小了 58% ~ 85%,接近了人工翻译的水平。许多人工翻译工作者感慨:“作为翻译,看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。”Google率先拿出了神经机器翻译的概念,其他科技公司也不甘示弱,从产品和技术上展开了激烈的竞争。9月7日,全球范围内最具权威的国际评测大赛WMT2017,在丹麦首都哥本哈根举行。WMT全称Workshop on Machine Translation,是由来自欧洲和美国的高校、研究机构的研究人员联合举办的业界公认的国际顶级机器翻译比赛之一。在20多家国际知名机构的激烈竞争中,搜狗提交的中英和英中系统,获得了WMT2017人工评价指标的双向第一名。同时,搜狗提交的中译英系统在20个提交的系统中,获得八项机器评价指标中的七项第一,并且获得主要机器指标BLEU(Bilingual Evaluation Understudy)第一名。随着深度学习理念的技术开发,包括Google、Facebook、微软、腾讯、阿里巴巴、搜狗在内的各大巨头,都在试图将深度学习理念应用到机器翻译之中,推出各类产品来探索其应用性。例如搜狗推出的输入法“中英互译”功能,将深度神经元网络翻译系统与输入相结合,利用搜索技术跨越信息阻隔,再用神经元翻译技术打破语言障碍,实现“一边说中文、一边出英文”的智能机器同传翻译效果。显而易见,中国的语音翻译技术,已经进入了世界最前沿的技术领域。作为普通用户,我们能享受到多少AI翻译的“红利”?作为普通用户,人们更关心的是AI智能翻译技术,究竟能在实际应用中达到一个怎样的表现水准。尤其是当用户运用口语化的声音表达时,AI能否准确判断出语音的语义理解,做出准确的停顿思考,最终得到一个合格的翻译成果。下面,我们就来做几项实际的语音翻译测试。通过和“谷歌翻译”和“搜狗输入法”的智能翻译翻译结果来做对比,挑战各种高难度的翻译语境,验证人工智能的机器翻译水准到底怎么样。1、情感对话。汉语一向博大精深,许多时候我们说话时的文字内容没有变化,可能仅仅只是前后序列稍加变动,整个语句的语义就大有不同。尤其是在诠释情感对话时,往往会更激烈、更直接、更不看重缜密的语法排列。对于机器翻译成英文来说,这无疑是一个相当难理解的挑战。原文:曾经我喜欢过一个人,现在我喜欢一个人过谷歌翻译:I used to have a person, and now I like a person too?搜狗输入法翻译:Once I liked a person, now I like to live alone机器翻译世界杯的中英互译冠军实力如何?让谷歌和它PK下就知道了“喜欢过一个人”和“喜欢一个人过”,有着明显的语义区别。搜狗输入法的理解要更准确一些,基本完美的诠释了前后两句话中的中文意境。谷歌的翻译则显得“机翻”的味道太过严重,不符合生活实际。2、景点地名。当我们身处海外时,经常都会有寻求当地人问路的需要。对于那些不熟悉的景点地名,一个准确直接的英文翻译,肯定能帮上大忙。原文:格里菲斯天文台怎么走?谷歌翻译:How does the Griffith Observatory go?搜狗输入法翻译:How to get to Griffith Observatory?格里菲斯天文台是洛杉矶的著名景点,中国游客想要问路前往该处,是比较常见的海外旅游对话。双方都理解了中文的语义,但是谷歌的英文翻译略有不足,而搜狗输入法的英文翻译更加准确。3、诗词古文典籍。诗词古文,是中英文翻译时的一大难点。因为用词语法时的高度省略化,导致翻译时难度倍增,许多人工翻译都显得力有未逮。我们选用了林则徐的一句著名诗句为例,这句诗词寓意深远又朗朗上口,在中国互联网上拥有很高的人气。翻译成英文时,不知道能否准确的还原语义呢?原文:苟利国家生死以,岂因祸福避趋之谷歌翻译:Gou Li country life and death, not because of bad fortune to avoid the trend搜狗输入法翻译:He who would profit the life and death of his country will not avoid it because of misfortune and good fortune两种英文翻译,都有一些问题。相对来说,搜狗输入法的英文翻译,稍微还原了林则徐这句诗的本意。而谷歌的翻译完全是离题万里,“Gou Li”的翻译一出,表明谷歌对于中文语境的本土化理解严重不足。总的来说,人工智能技术,在机器翻译领域确实表现出了让人惊喜的水准。无论是说走就走的出国旅游,还是跨洋交流的留学办公,使用语音翻译软件来实现“说中文,出英文”的功能效果,基本都能满足与外国人的日常交流,大大提升彼此的沟通效率。语音识别与同传翻译的组合,让看起来还很遥远的人工智能概念,变得触手可及。不知不觉中,更加“懂你”的AI技术正在影响着我们生活的每一个角落。

机器翻译世界杯的中英互译冠军实力如何?让谷歌和它PK下就知道了