分类: 中文版

当我们试图分析机器翻译 (MT) 和神经机器翻译 (NMT) 等技术驱动的翻译解决方案之间的区别时,经常会倾向于运用更简单的类比方法。然而,分析这两个解决方案各自的优势,首先需要了解机器学习和人工智能两个概念的区别,随着技术创新不断细分整个本地化行业二者的区别会变得更加明显。

IBM 的国际象棋引擎击败卫冕世界冠军加里-卡斯帕罗夫,就是通过 MT 的统计模型来实现的。谷歌的 AlphaZero 国际象棋人工智能(AI)在近三十年的发展中,击败 Deep Blue 最新版本 Stockfish 的方式,与 NMT 提供翻译服务的方式更为相似。AlphaZero 用国际象棋规则的基础编程通过深度学习模型,学会了下棋,甚至制作出了人类无法想到的完美棋局。虽然 NMT 无法创造棋局,但能复制语言逻辑,模仿人类在翻译时,更注重语义,而不是呆板的逐字逐句直译的方法。在 “MT “ 上加 “N”,不是一个小小的补充,而是一个重大的转变。

可能有人会问,为什么在已经能使用 NMT 的情况下,还要使用 MT 呢?这取决于公司在本地化过程中的投资规模,以及对应的具体场景和行业。虽然这两种解决方案都面向大批量翻译输出,但 NMT 更有利于捕捉语言中细微的差别。虽然 NMT 和 MT 都支持翻译校验, 但在大多数情况下,译员对细微差别和文化有更深刻的理解,能够保证质量。因此非神经机器翻译的初始翻译更容易编辑,从而节省更多的成本。

回到上面 AlphaZero 的例子,它在游戏世界中的作用也迅速出现在语言 AI 领域。最近,被称为 NLP(自然语言处理)的机器学习形式登上了新闻头条,接连不断的技术突破让聊天机器人能够以前所未有的方式与人们进行交流。随着像 GPT-3 这样的原型机显示出不可思议的对话能力,实验性的人工智能正在迅速超越人们以往的认知。随着这些可能性的出现,人工智能模型测试和开发更加注重机器的训练数据,数据的质量和完整性也将影响研发结果。开发者为了进一步提升性能,在人工智能训练中增加了更多领域的知识和运用。换句话说,数据有助于让人工智能表现出与顶级语言学家相似的语言能力。

语言服务提供商可以从大规模本地化项目中提取语言数据,进行匿名化处理后应用在语言机器训练中,这样可以使机器翻译对语言的理解更细致,更准确,也能帮助客户提高效率,节约成本。

CSOFT 华也国际借助 MT 和 MTPE(机器翻译后编辑)为企业提供多语言本地化解决方案。请访问 csoftintl.com 了解更多关于我们的解决方案和案例。

[dqr_code size="120" bgcolor="#fff"]