OpenAI预览了语音引擎通过15秒语音样本令人信服地克隆人语音的能力

导读 OpenAI预览了其语音引擎技术的能力,可以通过15秒的语音样本令人信服地克隆人的声音。该引擎还可以在翻译语音时将一个人的口音转换成其他口...

OpenAI预览了其语音引擎技术的能力,可以通过15秒的语音样本令人信服地克隆人的声音。该引擎还可以在翻译语音时将一个人的口音转换成其他口语,非正式地说出新文本,并为那些有声音障碍或疾病的人恢复清晰的语音。

OpenAI预览了其语音引擎技术的当前状态,该技术可以使用15秒的语音样本作为输入,令人信服地克隆人的语音。该技术还可以在翻译语音时将一个人的口音转换成其他口语,即使目标语言使用非正式或俚语语音。对于患有语音障碍或导致言语不清的疾病(例如喉炎)的说话者,语音引擎可以以清晰的声音重复所说的话。

人工智能技术已经发展到可以识别元音、单词和其他词性并理解句子主旨的程度。语音克隆人工智能可以识别一个人讲话的独特特征,例如口音、情感、时间和重点,然后利用这些特征将文本作为令人信服的克隆来朗读。

OpenAI在其博客页面上展示了令人信服的示例:

语音克隆

带有语音口音克隆的语音翻译

非正式地说话,或者用俚语

为哑巴说话

当患有语言障碍时,用一个人原来的、清晰的声音说话

尽管市场上有许多其他人工智能语音克隆和语音适应服务,但由于担心滥用,OpenAI目前尚未向公众发布语音引擎。此类技术已在美国大选期间被用来制造“假总统”电话,并在世界各地从公司和个人那里诈骗钱财。不幸的是,一旦潘多拉魔盒被打开,就像用于创建假教皇图像的生成人工智能图像技术一样,就没有回头路了。

关心的读者应该与家人和亲密的朋友创建安全词以验证他们的身份,阅读如何识别诈骗电话,禁用金融提供商的语音识别验证,并考虑使用变声器来防止接听时声音被复制未知来电者。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。