两周前,我们讨论人工智能语言功能和能力进步中提到了 Nvidia 宣布其开发的迄今为止世界上最强大的自然语言生成(NLG)模型,超过了 GPT-3 成为最新的高功率文本生成器模型。Nvidia 本周决定向企业提供用于训练其他人工智能的语言模型 Megatron 530B。虽然像这样的实验性 NLG 模型在市场上得到了创新性应用,但长远来看,它们在全球市场的影响力取决于现有语言数据集的规模。目前,浪潮人工智能研究公司发布的新型 NLG 人工智能源 1.0 采用中文进行语言训练,训练数据集规模遥遥领先 GPT-3 的训练模型,这也反映出数据模型体量对训练 NLG 的重要性是无可比拟的。
虽然 NLG 目前还是一个不太成熟的实验性语言模型,但本周的新闻进一步加深了我们对这项技术的应用和对语言人工智能总体发展的理解。Nvidia 的 NLG 算法在数千亿的英语数据集上进行了训练,并展示了其有效执行各种 NLG 功能的能力,包括生成文本和阅读理解。Megatron530B 体现了训练这种规模的人工智能所涉及的复杂性,特别是与对高质量数据集日益增长的需求。Nvidia 负责应用深度学习研究的副总裁表示,” 为新的语言和领域建立大型语言模型可能是迄今为止最大的超级计算应用,现在这种能力对全世界的企业来说是触手可及的”。显然,这一决定的目的是进一步提高企业的培训能力,这些企业在语言 AI 的机器学习过程中遇到了许多固有的挑战。
相关阅读:世界地球日:CSOFT 华也国际的化学翻译为绿色科技贡献力量
与 Megatron 530B 一样,浪潮人工智能研究院发布的源 1.0 不仅扩展了我们对 NLG 技术在不同市场应用的理解,也表明了针对不同语言环境和市场的复杂语言人工智能的发展方式。仿照开放人工智能的 GTP-3 语言模型,浪潮人工智能开发出了第一个可以与 NLG 模型势均力敌的中文模型。这是中文人工智能一大显著的进步,同时,研究人员也指出收集大量的适合人工智能学习的高质量中文和数据集也不是一项容易的工作。因此,像 Nvidia 这样强大的语言模型将需要针对除英语以外的市场进行深入和特定背景的开发。
随着语言人工智能领域的开发者不断产生强大的 NLG 模型,并将其应用于机器学习等关键领域,解决在全球范围内推进这项技术所需的支持的挑战也更加明显。从支持技术供应商跨国界提供这些新产品到提供尖端技术驱动的翻译,CSOFT 仍然致力于确保用 250 多种语言为不断变化的全球环境提供成功的沟通。了解更多信息请访问 csoftintl.com!
[dqr_code size="120" bgcolor="#fff"]