在媒体对自然语言处理(NLP)大肆宣传的影响下,人们似乎对人工智能处理语言的技术已经司空见惯了。上周我们讨论了语言数据能否检测出 GPT-2 和 GPT-3 等语言算法带来的欺诈问题。然而,比解决在政府网站出现的模仿真实用户的机器人更复杂的问题是弄明白是什么构成了语言相关应用。
近日有消息称,一个麻省理工学院的研究团队成功地应用模型解开了病毒中的基因序列,就像解开一个复杂的句子一样,自然语言处理能够评估其中一种或另一种观察到的病毒突变的预期影响。正如《科技评论》所报道的那样:“逃避中和抗体的病毒有可能发生突变(病毒逃逸)而阻碍疫苗的开发。为了预测哪些突变可能会导致病毒逃逸,研究人员使用了一种包括两个部分:语法(或句法)和意义(或语义)的机器学习技术进行自然语言处理。正如一句话中一个词语变化可能对句子的语法没有影响,但会改变句子整体的意思一样,一个孤立的突变可能对病毒的表现形式产生影响。”
语言语法和氨基酸序列可以由同一个神经网络来建模,虽然听起来这更像是一个哲学问题,但也反映出传播逻辑有许多共通之处,因此语言机器也可以学会分子科学的 “语言”。当然,我们可以说 NLP 模型对人类语言的把握是有价值的,只是没有我们想象的那么精密,它只是把我们的语言作为一个分析游戏中的一类变量。很多人都指出,即使是最会聊天的机器人,也并不知道自己在说什么。而这一点可能正是人工智能的优势所在,在没有已有认知的限制下,NLP 和其他类型的实验性人工智能可能比人类更加擅长分析。
相比之下,训练有素的 MT 可以满足我们在本地化领域的需求:消息经过妥善翻译,可以始终如一地转换到新语言中去。
访问官网 csoftintl.com 了解更多 CSOFT 华也国际技术驱动的翻译服务。
[dqr_code size="120" bgcolor="#fff"]