OpenAI推出語音克隆AI模型

據報道,據外電報道,OpenAI 剛剛宣佈近期進行了小規模預演一個名爲語音引擎的新工具的誕生。

這是一種聲音克隆技術,可以通過分析 15 秒的音頻樣本來模仿任何說話者。該公司表示,它可以生成自然的語音和情感豐富且真實的聲音。

該模型還可以執行語音克隆。它的工作原理是這樣的:人類說話者通過手機或計算機麥克風錄製 15 秒的語音片段,OpenAI 的語音引擎會生成與原始說話者非常相似的自然語音,並且可以在以後使用,大聲說出人類用戶輸入的任何文本。

該技術基於本公司預先存在的文本轉語音 API。自 2022 年以來,這項工作一直在進行中。OpenAI 已經在使用該工具集的一個版本來支持當前文本轉語音 API 和 Read Aloud 功能中可用的預設語音。該公司的官方博客上有一堆樣本,它們聽起來非常接近真實的東西。(鞭牛士)