到目前为止,创建最复杂的人工智能语音模型可以模仿人的原声
到目前为止,到目的人Meta已经开发出了最复杂的止创人工智能语音模型。图片来源:英国《每日邮报》网站。建最 科技日报记者 刘霞。复杂 据英国《每日邮报》23日报道,工智脸书母公司元宇宙平台公司(Meta)据说它已经开发出了“最强大的音模原声语音生成人工智能Voicebox”,它可以模仿包括死者在内的模仿任何人的声音。然而,到目的人Meta宣布不会公开其人工智能模型,止创因为它担心这种先进技术会被滥用。建最 Meta深度学习人工智能研究人员在介绍Voicebox时指出,复杂Voicebox采用了“流匹配”方法,工智其性能优于最先进的音模原声生成语音系统。结果表明,模仿Voicebox生成的到目的人人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人更相似,速度快了近20倍。 Voicebox在跨语言翻译中的表现优于备受好评的多语言文本语音AI YourTS,平均单词错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。 Meta阐述了Voicebox的各种用途,称它可以用来帮助视障人士听到朋友和亲戚的信息,或者允许非母语人士用自己的声音翻译自己的话。Voicebox目前可以说英语、法语、西班牙语、德语、波兰语和葡萄牙语六种语言。 然而,Meta强调,由于潜在的滥用风险,他们不会披露Voicebox模型及其代码。虽然他们认为向人工智能社区开放和共享研究对促进人工智能的发展至关重要,但在开放和责任之间取得正确的平衡也至关重要。 总编辑圈点。 ChatGPT已经诞生半年多了,人们已经深深感受到了人工智能语言模型的力量。对于各种各样的问题,它可以像流一样回答,令人惊叹。想象一下,如果人工智能在回答人类问题时,不仅内容形式与真人相似,而且声音也很难区分真假,用户可能会感到更强烈的影响。后者是语音生成人工智能的目标。然而,正如文章所说,这些强大的技术确实可能被滥用。在人工智能技术不断升级迭代的同时,相关监管和伦理约束也应及时“上路”。
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 青岛自贸片区:16个重点项目集中开工
- “南气北上”通道新增年输气量25亿立方米
- 广东始兴:绘就绿美画卷 推动生态“价值化”
- 在生产线上搞实验——蒙西集团研发粉煤灰提取氧化铝技术纪实
- 远古世界曾有这么多“龙”
- 四届中阿技术转移与创新合作大会“交答卷”
- “开学科普第一课”点亮孩子光明未来
- 南方暴雨破百年纪录,南北方暴雨有何区别?专家详解——
- 首次人体受控临床试验证实——石墨烯纳米材料可安全开发
- 27.1万m³,中国开发出世界最大LNG运输船设计方案
- 沿着河湖看新疆丨新疆三文鱼喜获丰收,新疆为何能在沙漠里养海鱼
- 国产科学仪器新品亮相行业盛会
- 江苏:铆足干劲,向创新要动力
- 在生产线上搞实验——蒙西集团研发粉煤灰提取氧化铝技术纪实
- 腾讯混元大模型正式亮相
- 保护黑土地 科研人员组成“集团军”
- 新春走基层丨厦门:“茶园+碳汇”点亮山居生活
- 破局的华为,让我们看到了什么?
- 封面新闻丨“薪火”相传!杭州亚运会火炬传递启动
- 新疆植棉模式研究与应用研讨会在乌鲁木齐召开
- 搜索
-