分类: 中文版

神经网络对于人类语言和思维的理解是自然语言生成(NLG)技术发展的一个重要基础,让机器表达更具有人性的特点也是我们对语言人工智能不断探索的重要指标目标之一。随着 GPT-3 在人类语言领域运用地越来越娴熟,我们开始需要辨别 GPT-3 生成的语言的真实性,尤其是有关医学研究的领域,否则不实的信息可能会给生命带来不可挽回的伤害。人工智能在处理大规模数据时展现了非常杰出的能力,尤其在疫情期间,事实证明,人工智能对语言的理解和处理能力已经大大超过了我们的预期。

最近,CSOFT 华也生命科学参加了 2021 年药物信息协会全球年会(DIA),在由微软科学家主持的 “深度学习语言模型和生命科学的应用” 创新会议上,微软首席数据科学家 Mario Inchiosa 首先强调了转移学习方法适用于大型预训练神经网络,可通过针对特定领域的主动学习(即人类的培训)对其进行优化。目前专家正在使用数学方法在对应语句的位置嵌入语义训练,机器翻译和人工编辑的分工一直比较明确,因为在基础内容方面机器需要人工输入以确保质量。同样,合理分批人力和机器资源是微软和众多语言服务提供商工作中的一个重要考虑因素。但强大的 GPT-3 目前已经能够不需要事先进行相关知识的训练就能对病理信息做出详细准确的判断和描述了,这点确实让人震惊。

相关阅读:人工智能是抗生素的新希望吗?

在高级数据和应用科学家 Robert Horton 的一个场景介绍中,微软利用 Synthea 平台自动生成了一个完整的医疗场景下患者健康状况记录,GPT-3 模型仅仅利用了一些事实和英语能力就能够输出大量的可信的分析,虽然有时会出现过度解读的现象,但从生命科学本地化和机器翻译的角度来看,语言人工智能对推动现实世界医疗场景有很大的积极作用,而人类必须在推动人工智能的发展和保持创新中继续前行。

CSOFT 华也生命科学有一支由生命科学领域的专家和母语译员组成的国际化团队,能为客户提供 250 多种语言的高质量翻译服务,以支持创新解决方案的市场推广。如要了解更多关于我们的服务,请访问 csoftintl.com

[dqr_code size="120" bgcolor="#fff"]