谷歌翻译得道多助失道寡助(谷歌翻译三字经)

生活常识 2023-05-15 11:57生活常识www.xinxueguanw.cn

唐 当你们富有时,不要忘记彼此。你什么意思?读后感 唐 当你富有时,不要忘记彼此。20次,没钱的人总会被遗忘。

陈生生,阳城人,字涉。吴光哲,杨霞人,是叔叔。

我 我相信很多人还记得高中时背诵《陈涉世家》的痛苦,,当你在考试时,你被要求翻译一句名言,如 燕子知道天鹅的野心。or 秦久的世界是苦涩的。。我听说我有几个儿子,所以我没有 I don’我站不直。当我站起来的时候,我是傅肃的儿子。 。

如今,随着AI技术的成熟,机器正在逐渐学习如何以人类的方式行动和思考。

既然如此,为什么唐 我们来测试一下,看看《陈涉世家》在AI眼里是什么故事。

最近,一位名叫 鹰眼成人 2007年,哔哩哔哩用谷歌翻译对人工智能进行了一次课堂测试,但其性能却是见仁见智。

例如,艾翻译了著名的短语 富有和不 不要忘记彼此。进入“没有钱的人,总是会被遗忘”。.

燕子唐 我不知道天鹅的野心。原来是AI 里的“蝎子给了我一个热烈的拥抱”???。的观点。

整个过程中,抽象菌笑黑问号脸,拍桌子。

有网友指出,这波讽刺竟然是“翻译出了本质”。

也有网友说 喜欢到他们拼出一首诗 。你能猜出每一句的原文对应的是什么吗?

然后,再检查一下答案,看看整个《陈涉世家》都被AI翻译成什么了。

1 机器翻译为何如此困难?

其实语言翻译和古文翻译都是机器翻译的范畴之一。

,如果翻车的情况继续发生,我们还能相信吗?

唐 别担心,让我们 让我们从NMT(神经机器翻译)的诞生开始,看看什么是机器翻译。

2013年,Nal Kalchbrenner和Phil Blunsom提出了一种新的用于机器翻译的端到端编解码器结构。该模型可以通过使用卷积神经 (CNN)将给定的一段源文本编码成连续向量,然后使用循环神经 (RNN)作为解码器将状态向量转换成目标语言。

这项研究成果的发布可以说标志着NMT的诞生。尽管许多研究人员从那时起已经做出了改进,例如,仍然缺乏对模型的理解。,经常有问题,包括但不限于缓慢的训练和解码过程;同一个词翻译风格不一致;翻译结果不在词汇表中;黑箱的神经 机制解释很差;训练中使用的大多数参数都是根据经验选择的。

NMT与 T的比较

总体不确定性是翻译中的一个核心挑战。.

知己知彼,百战不殆。为了根除这种不确定性,我们仍然需要知道它的来源。

在一篇论文中,作者指出在构建翻译的模型的时候,基本上有两种不确定性,一种是任务本身固有的不确定性,另一种是数据收集过程中存在的不确定性。

所谓内部不确定性,是指不确定性的一个来源是一个句子会有几种对等的翻译。因为在翻译的过程中,或多或少都可以直译,即使字面上同样的意思有很多种表达方式。句子的表达可以是主动的,也可以是被动的。对于某些语言,像 , of or 他们的 是可选的。

除了一个句子可以有多种翻译方式之外,缺乏标准化也是翻译不确定性的来源。,如果没有背景输入,模型通常无法预测翻译语言的时态或数,简化或增加相关背景也是翻译不确定性的来源。

外部的不确定性是因为系统,尤其是模型,需要大量的训练数据才能表现良好。为了节省时间和精力,使用低质量的 数据进行高质量的人工翻译是很常见的。这个过程容易出错,并导致数据分布的其他不确定性。目标句可能只是源句的部分翻译,或者目标句中的信息在主动句中不可用。

在一些具有复制机制的翻译模式中,当翻译目标语言时,源语句可能被完全或部分复制。通过研究,作者发现即使复制机制很小,也能对模型预测产生很大的影响。

https://arxiv.org/pdf/1803.00047.pdf

2 机器翻译频繁翻车,微信谷歌无一幸免

去年3月,微信翻译的频繁翻车吸引了人们 机器翻译的不确定性也被更多的人理解。

目前机器翻译领域主要使用的NMT框架都是类似的。一方面,问题出在解码者的语言模型上,使用的语料库让它以更大的概率学习到这些单词。好像微信团队没有 不处理 特殊情况和。在处理过程中,我们可以看到这样的翻译发生

如果加上特殊词的复制机制,不可译的词可以不翻译直接复制。换句话说,一个聪明的模型应该知道什么应该翻译,什么不应该翻译。

随后,微信也通过将原句返回敏感词 蔡徐坤 或者句子 你真是……. 。

除了解码器语言模型,问题可能更多地出现在语料库上。现在业界所做的机器翻译很大程度上靠语料“怼”,只要平行语料库的数量足够多,质量足够好,通用系统也能训练出好的结果。

,如果有更多的培训资料,

自电影字幕、多语言会议等材料,那么模型最终呈现的翻译内容也会相对应比较“活泼”和“口语化”。面对库中不存在的词,比如caixunkun,算法会自动匹配最经常出现,或者在同语境下最容易匹配的内容,比如形容词“帅哥”或“傻蛋”。

除了微信,被业界视为先驱的谷歌也发生过类似的翻车案例。

此前就有Reddit网友指出,谷歌翻译在学习过程中可能受到了输入来源的影响,将一些意味不明的语句翻译成了如圣经一般的语言。比如这个

英文大意为世界末日时钟在12点3分钟,我们正在经历世界上的人物和戏剧性的发展,这表明我们越来越接近末日和耶稣的回归。

哈佛大学助理教授、研究自然语言处理和计算机翻译的Andrew Rush认为,这些神秘的翻译结果可能和谷歌几年前采用的“神经机器翻译”技术有关。他表示,在神经机器翻译中,系统训练用了一种语言的大量文本来和另一种语言进行相应翻译,以在两者之间创建模型。但当输入的是无意义内容时,系统就会出现“幻觉性”的输出结果。

在去年AI Time的一次辩论中,中科院自动化研究所研究员宗成庆就表示,机器翻译近几年的进步确实很大,其需要基于场景和任务。机器翻译在一些场景下确实能帮助人,比如旅游问路,在某些领域,比如高层次的翻译,要对机器翻译寄予太多的希望还为时过早。

东北大学计算机学院教授朱靖波根据自己的经验列举出好的机器翻译系统需要的三个东西一是扩大训练数据规模,提高品质;二是不断创新技术;三是根据问题不断打磨,三者缺一不可。

看来,机器翻译未来还有很长一段路要走啊!

[赠书福利]

食物、能源、水的短缺是人类面对的终极挑战。人工智能技术是我们面对这些挑战强有力的武器。最前沿的发展如何?我们如何突破困境?腾讯首席探索官网大为最新力作《重构地球AI FOR FEW》,马化腾力荐!

AI科技评论为大家带来5本《重构地球AI FOR FEW》正版新书。

在1月13日末条文章(注意不是本文!)《赠书福利!腾讯x先生论AI如何解决全球吃饭难题,马化腾力荐》留言区畅所欲言,谈一谈你对本书的看法。

AI 科技评论将会在留言区选出 5 名读者,每人送出《重构地球AI FOR FEW》一本。

谷歌翻译三字经 谷歌翻译句子

Copyright@2015-2025 www.xinxueguanw.cn 心血管健康网版板所有