温尼伯站

 找回密码
 注册用户
搜索
热搜: 接送 租房
查看: 174|回复: 0
上一主题 下一主题

[综合资讯] Facebook的最新人工智能可以在没有人类转录的情况下学习语音

[复制链接]

14万

主题

14万

帖子

29万

积分

管理员

有bug,有问题请私信。

Rank: 9Rank: 9Rank: 9

积分
290469
跳转到指定楼层
楼主
发表于 2021-5-22 00:16:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
据外媒报道,语音识别是科技巨头的人工智能“机器中的一个重要齿轮”。这项技术为我们手机上的数字语音助理、汽车上的数字助理和家里的智能音箱提供动力。但是,尽管它无处不在,语音识别仍然是一项进展中的工作。Facebook在训练这些系统学习新语言的方式上预示着一项重大突破。该公司周五表示,它已经开发出一种建立不需要转录数据的语音识别工具的方法。  



据Facebook称,其全新的系统可以使技术摆脱对文本到语音输入的依赖。这项耗时的任务涉及人类聆听和转录数小时的音频,这是一个单调的过程,必须对每种语言进行重复。而Facebook的 “无监督 “系统则纯粹从语音音频和未配对的文本中学习,使其更好地了解人类交流的声音。  

Facebook的模型基本上依赖于由 “生成器 “和 “辨别器 “组成的生成对抗网络(GAN)之间的反馈回路。前者“吐出”上传的语音模式的代表,看起来完全是胡言乱语,直到它们被放到相应的鉴别器网络中,后者充当了某种翻译。同时,Facebook还输入由人类编写的额外文本,以帮助生成器收集计算机化和真实世界结果之间的差异。这个过程不断重复,直到生成器的输出与真实文本相匹配。  

Facebook表示,它的方法使它能够在没有任何注释数据集的情况下创建语音识别系统。该公司已经在斯瓦希里语、吉尔吉斯语和克里米亚鞑靼语上测试了这个模型--被称为Wav2vec-U(U代表无监督)--由于训练数据的差异,这些国家都缺乏高质量的语音识别工具。  

Facebook的测试表明,该系统提供的错误比下一个最佳的无监督方法少63%。它补充说,该工具与几年前的监督系统一样准确。为了加速其发展,Facebook在GitHub上分享了Wav2vec-U的代码。  

该公司表示,这一突破可以为全世界更多的语言和方言带来语音识别系统,帮助实现技术的民主化。自然,它将从这种扩散中受益。在Facebook的28.5亿月活跃用户中,有76%以上位于北美和欧洲之外。而自动翻译对其通过首选语言连接数十亿人的目标至关重要。
【郑重声明】温尼伯站坛刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经本网同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册用户

本版积分规则



手机版|温尼伯站

JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!

GMT-5, 2026-4-28 23:12 , Processed in 0.067157 second(s), 37 queries , Gzip On.

温尼伯站版权所有

All right reserved by Winnipeg Chinese Media.

快速回复 返回顶部 返回列表