首页 > 原创作品 > 原创作品 > 国际最新研究称,一人工智能模型能翻译200种不同语言

国际最新研究称,一人工智能模型能翻译200种不同语言

发布时间:2024-06-09 15:50:05

京6月8日电 (记者 孙自法)国际著名学术期刊《自然》最新一篇人工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。

该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都公开、低成本或是普遍可及,此类语言被称为“低资源语言”。而增加模型在翻译语言数量上的语言输出可能会影响模型的翻译质量。

为此,本篇论文作者、“不落下任何语言”(No Language Left Behind,NLLB)团队开发出一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力来翻译低资源语言。作为成果,NLLB团队开发了一个在线多语言翻译工具,名为NLLB-200,该工具能容纳200种语言,其低资源语言数量是高资源语言的三倍,翻译表现比已有系统高了44%。

由于NLLB团队在许多低资源语言上只能获取1000-2000例样本,为扩大NLLB-200的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。该团队还从互联网存档中挖掘双语文本数据,帮助提升了NLLB-200的翻译质量。

《自然》同期发表同行专家“新闻与观点”文章指出,NLLB团队研发的这个工具,可以帮助很少被翻译的那些语言的使用者,让他们能使用互联网和其他技术。

此外,NLLB团队还强调教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。不过,该团队也提醒说,误译的情况仍有可能出现。(完)

原创作品更多>>

长城魏牌80进军马来西亚市场更名魏牌G9,本土化组装插混 MPV 即将上市 捷豹路虎拟利用英国闲置产能代工奇瑞车型,中英车企合作或成英国汽车业复苏关键 博通推出业界首款6G兼容DFE数字前端SoC芯片BroadPeak 详读2万3千字的新“AI 宪法”之后,我理解了Anthropic的痛苦 爬虫公司SerpApi反诉谷歌,称“谷歌才是全球最大爬虫” 阿里云Coding Plan上新:支持千问3.5、GLM-4.7、Kimi-K2.5等模型 三星Galaxy S26 Ultra宣传材料曝光:相机规格与电池容量尘埃落定 三星Galaxy S26系列手机将深度整合Perplexity AI,打造多智能体协同生态系统 宝马将在中国投产长轴距版iX3,4月北京车展首发,年内上市 中国汽车2025年出口:总量跃升与结构变迁 特斯拉取消标配自动辅助驾驶功能,新车默认不提供车道居中功能 中国电动跑车SC01正式登陆欧洲,限量1000台 大众ID.4改款后更名,ID.5将停产 晓莺说热点:2026CES观察:AI狂奔,从灵魂到躯体 宝马iX3与奔驰EQ GLC预售超预期,双方加速产能爬坡 丰田在加拿大工厂投产2026款混动版RAV4 TikTok将在欧盟加强年龄验证技术,数千个未成年人账号被移除 西贝宣布关店102家后,罗永浩最新发声 抖音加强治理摆拍演绎:煽动对立情绪最高永久封禁 华为、小米等品牌被纳入iPhone以旧换新范围 极氪007/GT车型更新计划公布:今年Q2焕新上市,将提供900V版 中国电子董事长:2026年将着力打造国产全谱系全流程EDA工具系统 推出新一代高性能芯片 突破2700万辆!2025年中国车企全球销量首超日本 工信部:动力电池、新能源汽车生产者承担动力电池回收“兜底”责任 迎接新作,《火焰之纹章》全系列17部游戏大盘点,重回旧日时光 甄嬛传、蜡笔小新、爱情公寓,百部经典影片被搬上“游戏大银幕” 官方重磅确认!工作室正全力开发《匹诺曹的谎言》续集 美国新一轮入境限制生效,全球机场乱成一团! 北京高考状元回中学母校当老师?原来10年前他就告诉了答案 2025行业之光大会——第34届全国建材与家居行业年会圆满落幕