加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、容器安全、数据加密、云日志、云数据迁移!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

Meta上线全新AI模型SeamlessM4T可转录和翻译近百种语言

发布时间:2023-08-23 11:00:27 所属栏目:外闻 来源:网络
导读:   今天,Facebook的母公司Meta Platforms发布了被称为SeamlessM4T的一种人工智能工具,可以进行多种语言的翻译、转换等操作,可以让说不同语言的人更有效地进行交流,为开发人类通用语言
  今天,Facebook的母公司Meta Platforms发布了被称为SeamlessM4T的一种人工智能工具,可以进行多种语言的翻译、转换等操作,可以让说不同语言的人更有效地进行交流,为开发人类通用语言翻译器提供了助力。
 
  Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。
 
  Meta 表示,该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的 AI 模型中分别进行翻译。SeamlessM4T 支持:
 
  1、近 100 种语言的语音识别。
 
  2、近 100 种输入和输出语言的语音到文本翻译。
 
  3、支持近 100 种输入语言和 36 种输出语言的语音到语音翻译。
 
  4、支持近 100 种语言的文本到文本翻译。
 
  5、支持近 100 种输入语言和 35 种输出语言的文本到语音翻译。
 
  现在 Meta 已经决定使用研究许可证的方式让大众可以无偿地获取这个构型(只有非盈利的使用方式),方便学者和开发者来利用这一资源进行他们的工作。
 
  据介绍,Meta 还将发布 SeamlessAlign 元数据,这是迄今为止最大的开放多模式翻译数据集,挖掘的语音和文本对齐总计达 270000 小时。
 
  马克・扎克伯格表示,他坚信这些工具将促进来自全球各地的用户在元宇宙中的互动,这也是他对该公司未来的赌注所在。
 
  他还表示,开放 AI 生态系统对 Meta 有利,因为该公司通过有效地将创建面向消费者的工具的任务众包来获得更多收益,而不是通过访问模型来收费。
 
  据称,Meta 后续还将把这些翻译和转录方面的 AI 进展整合到 Facebook、Instagram、WhatsApp、Messenger 和 Threads 中。
 
  关于 SeamlessM4T 模型,Meta 研究人员在一份研究论文中表示,他们从“爬取的网页数据的公开可用存储库中”收集了 400 万小时的“原始音频”,但没有找到具体是哪个存储库的说明,官方只提到文本数据来自去年创建的数据集,而该数据集来自于维基百科及相关网站提取的内容。文件系统的一部分,用于存储用户的个人信息。这些信息包括姓名、地址、电子邮件地址、联系人、照片、日历、通讯录、网络设置等。

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章