原创 国际最新研发一种人工智能模型 能即时澳门最准最快的资料免费翻译101种语言
中新网北京1月16日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。
这款名为SEAMLESSM4T的人工智能模型,填补了语言覆盖方面的空白,并且性能优于现有的系统。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。
该论文介绍,科幻小说的读者可能很熟悉《银河系漫游指南》里的“巴别鱼”,这种小鱼能侵入耳朵,即时将一种口语翻译成另一种口语。类似“巴别鱼”的这种工具对于促成全球互联环境下的交流非常有用,但大多数现有的机器学习翻译系统都是文本导向,或者需要语音识别、翻译成文本、再将文本转换成语音好几步。此外,现有语音到语音模型的语言覆盖范围也远低于文本到文本的模型,并且倾向于从源语言翻译成英语,而非从英语到另一种语言。
为了解决这些限制,在本项研究中,美国Meta基础人工智能研究的“无缝交流团队”开发出一个单一模型SEAMLESSM4T,其支持多达101种语言之间的多种翻译模式,可以支持语音到语音(识别101种语言并翻译为36种语言)、语音到文本(101种语言译为96种)、文本到语音(96种语言译为36种)、文本到文本(96种语言)的翻译,以及自动语音识别(96种语言)。
研究团队表示,在语音到语音的翻译中,SEAMLESSM4T的文本翻译比现有系统准确率提升23%。同时,该人工智能模型可过滤背景噪音并适应说话者的差异。
《自然》同期发表同行专家的“新闻与观点”文章指出,虽然后续还需要进一步优化,但人工智能模型SEAMLESSM4T可能代表着向跨越语言障碍促进交流的进步。(完)
2022年,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,对构建数据基础制度作了全面部署;2023年,中共中央、国务院印发《数字中国建设整体布局规划》,进一步指出要加快建立数据产权制度,开展数据资产计价研究等。该年8月发布的《企业数据资源相关会计处理暂行规定》,也提供了数字资产入表的技术路径,这份文件已经于1月1日施行。
随着政策的支持和越来越多的数据资产入标案例出现,数据资产化将成为企业和政府数字化转型的关键步骤,更多企业和政府部门将数据视为核心资产进行管理和运用,数据资产的市场化运作将进一步增强,数据资产的价值也将通过市场机制得到体现和利用。
清华大学中国新型城镇化研究院执行副院长、教授尹稚曾撰文表示,在房屋总价值不变的情况下,按照什么样的面积去作价销售,只是一个“算法游戏”。