Facebook开源新AI语言模型,“可对100种语言实现一对一翻译”
根据《siliconangle》消息:Facebook表示其利用AI技术在不依赖英语数据的情况下翻译任意两种语言的尝试,已经取得了实质性进展。Facebook正在开源一种名为M2M-100的新AI语言模型,该模型可以在100种语言中的任何一对之间进行翻译。据称,以前的多语言模型严重依赖英语作为中介,例如,中文译成法文的步骤通常是从中文译成英文,然后再从英文译成法文。在大多数情况下,这种模型都可以很
原创
2020-10-21 13:08:12
来源:钉科技  

根据《siliconangle》消息:Facebook表示其利用AI技术在不依赖英语数据的情况下翻译任意两种语言的尝试,已经取得了实质性进展。Facebook正在开源一种名为M2M-100的新AI语言模型,该模型可以在100种语言中的任何一对之间进行翻译。

【201020】Facebook开源新AI语言模型,可对100中语言实现一对一翻译168_副本.png

据称,以前的多语言模型严重依赖英语作为中介,例如,中文译成法文的步骤通常是从中文译成英文,然后再从英文译成法文。在大多数情况下,这种模型都可以很好地工作,但是在涉及更复杂的句子和短语时通常不准确。

Facebook表示,M2M-100可以直接从中文翻译成法语,或者在100多种语言对之间进行翻译,从而更好地保留含义,而无需使用英语作为中介。

在这么多不同的语言对之间进行翻译不是一件容易的事,因为模型需要访问海量的高质量训练数据。Facebook人工智能研究员Angela Fan在一篇博客文章中解释了她和她的团队如何着手创建一个庞大的“多对多”数据集,其中包含100多种不同语言的超过75亿个句子。

这些数据根据诸如语言分类、地理和文化相似性等参数分为14种不同的语言组。然后,在每个语言组中,Facebook为每个语言标识一到三种“过渡语言”,作为将其翻译成不同语言的基础。

M2M-100模型比Facebook当前使用的以英语为中心的多语言模型准确度更高。该公司声称,M2M -100在评估机器翻译的BLEU度量标准上比之前模型高出“10分”。

Facebook最终希望用M2M-100替换之前的翻译模型,以提高其翻译质量。(钉科技根据《siliconangle》消息编译)

最新文章
1
在进博会重新认识索尼
2
快手推出“快成长计划”,百亿流量及百万创作金扶持中小创作者
3
激发潜能 共创未来——索尼于进博会正式发布“年轻力场”企业项目
4
中国软件业,市值被低估
5
二级及以上能效占比超50% “国补”下彩电行业回稳升级
6
Redmi K80系列官方八大爆料汇总:双旗舰 会涨价
7
太蓝发布全新固态锂电池技术:颠覆性砍掉隔膜 安全大幅提升
8
苏泊尔、九阳、小熊们拓展海外时,国外小家电也在瞄准中国市场
9
网友许愿的三筒洗衣机,海信在七年前就已经推出
10
快手双11智能生活节与冬季变美节收官,高画质电视、电动车、假发、气垫等类目迎来热销
11
快手电商兴农计划·冬季鲜食节将启动 携手商达共迎冬补食品销售旺季
12
画质与护眼两全,海信激光电视助力观影新体验
13
索尼连续19年发布《索尼中国可持续发展报告》 以绿色、感动、责任共筑可持续未来
14
索尼宣布SORPLAS进入可编辑空间领域 进博会首发CMF色板样品 推动环保材料在空间设计中的应用
15
科技赋能创意和可持续 索尼携多元创新成果亮相2024中国国际进口博览会
16
洛图:2024Q3智能投影5000+市场保持增长 Vidda销额第一
17
三大运营商开“卷”低空智联网
18
补贴叠加双十一促销,大尺寸电视价格狂降助力市场回暖
19
30亿!我国物联网连接数有望新突破
20
首台“重庆造”国产服务器下线:搭载华为鲲鹏920+昇腾AI处理器
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512