Meta AI大模型能识别4000多种语言,称错误率仅有OpenAI产品的一半

Android社区 收藏文章

Meta公司周一(5月22日)推出了一个开源AI语言模型——大规模多语言语音(Massively Multilingual Speech, MMS)模型,可以识别和产生1000多种语言的语音——比目前可用的模型增加了10倍。研究人员表示,他们的模型可以转换1000多种语言,但能识别4000多种语言。

Meta公司在新闻稿中写道,“今天,我们公开分享我们的模型和代码,以便研究界的其他人可以在我们的工作基础上继续发展。通过这项工作,我们希望为保护全世界令人惊叹的语言多样性做出一点贡献。”

语音识别和文本到语音模型通常需要对模型进行数千小时的音频训练,并附带语音转录标签。这些标签对机器学习至关重要,它使算法能够更准确地分类和理解数据。

如此一来,收集数千种语言的音频数据是Meta面临的第一个挑战,而现有最大的语音数据集最多涵盖100种语言。

对于那些在工业化国家没有被广泛使用的语言,其中的许多语言在未来几十年甚至存在消失的风险。

Meta使用了一种非常规的方法来收集音频数据:利用翻译完成的宗教文本的录音。

该公司表示,“为了克服这个问题,我们转向了宗教文本,如圣经,这些文本已被翻译成多种不同的语言,这些译本也已被用于广泛的语言研究中。”

这些宗教文本的各语言译本也有专业人士进行阅读并录音。作为MMS项目的一部分,Meta创建了一个超过1100种语言的“《新约》阅读数据集”,平均每种语言有32小时的数据。

此外,Meta还指出,考虑到其他宗教类读物的未标记录音,我们将可提供的语言数量增加到4000多种。

相关标签
 相关文章
王慧文病休53天,旗下OneFlow团队重新创业 8月以前  |  1次阅读
智己CEO现场怒怼!不满LS6和小鹏G6当对手 8月以前  |  1次阅读
董明珠回应落榜世界500强:总比爆雷的世界500强好 8月以前  |  1次阅读
阿里云上线 AI 视频生成工具 Live Portait:可一键让照片开口说话 8月以前  |  78次阅读
妙鸭相机将并入神力视界,阿里大文娱CTO郑勇:不是“搬家”是“回家” 8月以前  |  85次阅读
特斯拉上海超级工厂约40秒下线一台车,零部件本土化率超95% 8月以前  |  69次阅读
宁德时代发布神行超充电池,可实现充电10分钟行驶800里 8月以前  |  71次阅读
中科院博士被骗到缅甸已一年!女友:他负债几万,家里条件一般,以为去当翻译 8月以前  |  85次阅读
小鹏汽车否认收购玛莎拉蒂传闻:系谣言 8月以前  |  63次阅读
联想二季度净利润猛降66%,股价应声跳水 8月以前  |  80次阅读
业内人士:视觉中国对不同侵权主体采用差异化策略,老客由销售沟通新客发律师函 8月以前  |  70次阅读
恒大集团在美国申请破产保护 8月以前  |  56次阅读
劳斯莱斯首款纯电轿跑将在北美亮相 8月以前  |  89次阅读
realme印度前CEO确认加盟荣耀,即将推出手机新品 8月以前  |  88次阅读
OpenAI正在测试内容审核系统,一天可以完成六个月的工作 8月以前  |  80次阅读
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出 8月以前  |  77次阅读
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购 8月以前  |  80次阅读
海口规定:电动汽车充电服务费不得超过0.65元每度 8月以前  |  80次阅读
波音任命柳青为波音中国总裁 8月以前  |  88次阅读
业内人士谈图片复杂代理链:图片代理商越多摄影师分成越少 8月以前  |  67次阅读

扫一扫

在手机上阅读