微軟宣佈Azure AI Speech"Avatar"智能語音服務上線

微軟宣佈Azure AI Speech"Avatar"智能語音服務全面上線,該服務允許開發人員構建支持自然語音的語音功能、多語種、生成式 AI 應用程序。Azure AI Speech服務中新的文本到語音頭像功能可以將簡單的文本轉換爲逼真的人以自然的聲音說話的視頻。開發人員可以使用作爲該服務一部分的任何預建替身,也可以創建自己的自定義替身。

新功能使開發人員能夠爲其用戶創建個性化和引人入勝的內容。這項服務的輸出視頻分辨率爲 1920 x 1080,每秒 25 幀(FPS)。

下面是文字轉語音"頭像"服務的演示:

Azure Speech 文本轉語音"Avatar"具有以下功能:

文字轉語音"Avatar"服務的定價有點複雜。不出所料,收費將基於視頻輸出的長度,並按秒計費。此外,作爲文本到語音頭像服務解決方案一部分的文本到語音、語音到文本、Azure OpenAI 或其他 Azure 服務將單獨收費。此外,該服務現在可在以下 Azure 地區使用:東南亞、北歐、西歐、瑞典中部、美國中南部和美國西部。

您可以在這裡瞭解更多有關文字轉語音"Avatar"服務的信息。