谷歌公开展示了一种最新的机器翻译机制

文章来源：Techweb

字体：大中小

发布时间：2017-09-01 18:09:03

　　TechWeb报道9月1日消息，据科技博客techcrunch报道，我们每天都在使用不同的技术，但却不知道它们的工作原理。事实上，了解机器学习引擎并不容易。今天，谷歌在iResearch博客发布了一篇有趣的文章，详细介绍了机器翻译的一些问题的性质及其解决方案。

　　机器学习已被证明是一个非常有用的翻译工具，但它有个弱点。翻译模式逐字逐行的翻译倾向是其中之一，这可能导致严重错误。

　　Jakob Uszkoreit在公司的自然语言处理部门解释了这个问题。比如，下面这两个句子：

　　我过街后就到了银行(bank)。

　　我过河后就到了岸边(bank)。

　　显然，“bank”是指每句话都有不同之处，但是，逐字翻译的算法可能很可能挑选错误的含义——因为它不知道哪一个“bank”是正确的，除非它能看到句子结尾。你稍加留意就能发现，这种歧义随处可见。

　　谷歌的解决方案是所谓的关注机制，也就是说在翻译软件中内置一个名为“变压器”(Transformaer)系统。它将句子中的单词逐一进行比较，以确定它们之间是否以某种关键方式相互影响——例如，看“他”或“她”是否在说话，或者像“银行”这样的词是否以特定的方式表示。就像下面这个动图：

　　当翻译的句子正在构建时，关注机制将每个单词随附到每个单词之间进行比较。

　　据此前报道，谷歌翻译的竞争对手DeepL也在使用关注机制。该公司称，自己所研发基于神经网络的DeepL Translator翻译结果要优于微软和谷歌，当用户输入文本的时候，DeepL的人工智能能够捕捉最细微的差别，而且有别于其他服务的是在翻译中会尽可能的还原和模仿。

　　但有趣的是，谷歌可以让人们有机会看到系统的运作原理，Transformer给每个词提供一个与其他单词相关程度的得分，你可以看到它认为哪些是相关的词，哪些是潜在相关词。(yoyo)

首页推荐

苹果新品发布会剧透:AR或成重点

热门图片

24小时热门资讯

24小时论坛热帖