到目前为止,创建最复杂的人工智能语音模型可以模仿人的原声
到目前为止,到目的人Meta已经开发出了最复杂的止创人工智能语音模型。图片来源:英国《每日邮报》网站。建最 科技日报记者 刘霞。复杂 据英国《每日邮报》23日报道,工智脸书母公司元宇宙平台公司(Meta)据说它已经开发出了“最强大的音模原声语音生成人工智能Voicebox”,它可以模仿包括死者在内的模仿任何人的声音。然而,到目的人Meta宣布不会公开其人工智能模型,止创因为它担心这种先进技术会被滥用。建最 Meta深度学习人工智能研究人员在介绍Voicebox时指出,复杂Voicebox采用了“流匹配”方法,工智其性能优于最先进的音模原声生成语音系统。结果表明,模仿Voicebox生成的到目的人人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人更相似,速度快了近20倍。 Voicebox在跨语言翻译中的表现优于备受好评的多语言文本语音AI YourTS,平均单词错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。 Meta阐述了Voicebox的各种用途,称它可以用来帮助视障人士听到朋友和亲戚的信息,或者允许非母语人士用自己的声音翻译自己的话。Voicebox目前可以说英语、法语、西班牙语、德语、波兰语和葡萄牙语六种语言。 然而,Meta强调,由于潜在的滥用风险,他们不会披露Voicebox模型及其代码。虽然他们认为向人工智能社区开放和共享研究对促进人工智能的发展至关重要,但在开放和责任之间取得正确的平衡也至关重要。 总编辑圈点。 ChatGPT已经诞生半年多了,人们已经深深感受到了人工智能语言模型的力量。对于各种各样的问题,它可以像流一样回答,令人惊叹。想象一下,如果人工智能在回答人类问题时,不仅内容形式与真人相似,而且声音也很难区分真假,用户可能会感到更强烈的影响。后者是语音生成人工智能的目标。然而,正如文章所说,这些强大的技术确实可能被滥用。在人工智能技术不断升级迭代的同时,相关监管和伦理约束也应及时“上路”。
- 最近发表
- 随机阅读
-
- 北京发布《养老人才队伍建设行动计划》
- 三星One UI 6.0 beta预计下周推送 面向中国等7个国家
- 渤海亿吨级油田群垦利6
- 中国第13次北冰洋科学考察队起航
- 离子发动机解决小型卫星动力难题
- 高质量发展调研行丨从“动批”到国家级金融科技示范区的蝶变故事
- 国家重点研发计划轨道交通调控一体化与联程运输项目启动
- 整列高铁快运动车组列车试点在昆明
- 青岛:节后开工生产忙
- 能设计新蛋白质的AI再现突破,生成在天然蛋白质中从未见过的拓扑结构
- 十年“追踪” 天文学家揭开行星状星云特殊排列的奥秘
- 中消协:养老辅具产品尚未“适老”
- 乘着高铁看雄安,揭秘创新加速度!
- 中国石油塔里木油田:“瘦身健体”实现绿色低碳转型
- 华为公布多项专利许可计划
- 科技馆之城暑期联合行动之走进回天拉开序幕
- 水中电子阿秒级运动首次“定格”
- 排沙腾库容49.9亿立方米 黄河汛前调水调沙顺利结束
- 国家重点研发计划轨道交通调控一体化与联程运输项目启动
- 首个连接鄂豫两省水系航运枢纽项目开工
- 搜索
-