前不久,一名口译员发帖抗议科大讯飞 AI 同传造假的事掀起了热议。公众的反应则揭示了在翻译领域,人们似乎已经想当然地认为机器翻译更具优势并且会取代人工译员。但事实上,同传和口译仍然是需要专业人工译员去完成的工作,而这似乎让人们感到震惊。
到目前为止,无论是谷歌翻译、Skype 翻译,还是市场上数个声称是下一个 “巴别鱼”(出自道格拉斯•亚当斯的科幻小说《银河系漫游指南》,如果你把一条巴别鱼塞进耳朵,你就能立刻理解以任何形式的语言对你说的任何事情。)的可穿戴翻译设备,都没有真正解决这个问题。
不可否认,人工智能在物流配送、诊断癌症、罚球和预测作物产量等方面始终优于人类,更不用说国际象棋、围棋、扑克等比赛项目。但是,当涉及到翻译和口译时,你不得不承认,世界上最复杂的技术仍然是人的大脑。这也是为什么 AI 不会取代人类译员的原因。
语言带有主观色彩
人工智能通常擅长基于客观现实的任务。不管是在数据集中识别难以捉摸的信号模式,还是在复杂的道路条件下导航,在面对控制其决策的清晰的数学或物理规则时,机器都能胜出。
相比之下,自然语言是由人类群体发明的互相沟通的主观建构。虽然不同的语言都有一定的规则可循,例如,需符合语法,但这些规则只基于惯例,而不是实际应用,并且语言也在不断演化。
也许人类在识别肿瘤或判断信用风险方面已经丧失了主导地位,但我们可能永远拥有判断一种语言是否 “自然” 的绝对权威。这种权威性反映在人类评价机器翻译质量的指标——BLEU(双语评估替换)中,BLEU 的设计思想是:机器翻译结果越接近人工翻译的结果,则越好。
因此,人工翻译并不只是设立标准,它本身就是标准。
大数据没有幽默感
在翻译中,译员都知道笑话、双关语和巧妙的暗讽(以及细微的文化差异)是最难的部分。但是,如果没有这些玩笑或习语,我们的表达质量就会很差。从口译的角度来看,语调和肢体语言也可以直接表达出说话者的意图,需要进行准确地分析并且用恰当的目标语言传达出去。
这对于人类来说尚且具有挑战,目前对于机器来说,更加不可能做到。
虽然机器翻译在总体质量上有了显著的改进,但是神经机器翻译比以往更依赖于大量的训练数据。而且,由于最大的双语数据集主要来自政府文件和宗教文本的官方翻译,这些算法中对幽默、文字游戏和非语言表达的曝光率非常低。
最令人不安的是,神经机器翻译常常不承认错误。就像一个准备不足的学童,它总是试图搪塞过去。因此,当 Google 翻译将无意义的内容翻译成圣经一样的语言时,专家们将这些错误归因于神经网络对流利性而非准确性的偏好。也就是说,如果它面对一些特殊的内容,只能展现一些和输入内容完全没有关系,但仍然流利通顺的东西。
然而,这些 “假的积极结果” 比笨拙和明显的错误更可怕,因为目标语言的受众可能永远不会意识到出现了差错,并且可能把这种古怪的翻译归因于原文本身。
机器人,你听懂了吗?
以上还只是针对静态文本进行机器翻译的挑战。如果要求机器进行现场口译会变得更加复杂,必须增加自动语音识别(ASR),然后再翻译。
虽然苹果的 Siri 和亚马逊的 Alexa 在日常问题交谈方面似乎比较擅长,但是,您与机器人的互动通常局限于有限的情境和条件:在受控环境中,使用有限的词汇量,基于指令进行短暂交互。而在实际情况中,大多数现场会议和商业讨论是自发的、连续的、高度依赖于上下文的发言,这些特点使得自动语音识别和机器翻译的错误率达到了顶点。
一些由此造成的滑稽和荒谬的例子比比皆是。今年早些时候在北京发表演讲时,对冲基金大师雷蒙德•戴利奥讲述了他年轻时作为一个交易员曾经做过的错误预测。
他用英文说道:“How arrogant! How could I be so arrogant?”
通过自动语音识别技术的实时字幕,则努力使用着修辞手法。显示的英文字幕是:
“How? Aragon, I looked at myself and i……”
下面翻译的中文则是:
“怎么做?阿拉贡,我看着自己和我自己……”
如果现场观众只看字幕,一定会以为雷蒙德是搞笑大师。
长期以来,人类一直为自己超越其他物种以及机器的认知而感到优越,但这种主宰万物的优越感,却是不明智的。
也许有一天,计算机会开发出类似自然语言的命令;也许有一天,口译、笔译,以及文案作者、编辑、电台主持人和语言经济领域的其他专业人士,都会被机器人所取代。
但那一天会比大多数人想象的要遥远。因为语言工作,一半是科学,一半是艺术,在 AI 迭代的早期是不会被取代的。
像许多其他行业一样,语言行业的专业人员应该把精力集中在如何使用 AI/NLP 技术来提高工作效率、质量和竞争力上。计算机辅助翻译工具在文本翻译中已经被广泛使用,而同声传译员将来或许可以从语音识别和翻译记忆技术中获益。不过,在可预见的未来,这些工具将只是人类翻译成果的补充,而不是替代品。
那么现在,只要有人还在同声传译室,我们就应该给予他们应得的荣誉。
文章及图片来源:World Economic Forum,已经过 CSOFT 编译。
[dqr_code size="120" bgcolor="#fff"]