OpenAI首次展示語音生成模型Voice Engine:可複製原聲

當地時間3月29日,OpenAI在官網首次展示了名爲“Voice Engine”的語音生成模型。該模型正處於小規模預覽階段,可利用文本輸入和單個15秒音頻樣本來生成與原聲非常相似的自然語音。據介紹,OpenAI於2022年底首次開發出該模型,並已將其應用於其文本轉語音API以及ChatGPT語音和朗讀功能中的預設語音。OpenAI表示,由於合成語音被濫用的潛在風險,其將採取謹慎和知情的方式進行更廣泛的發佈。