☰

OpenAI首次展示語音生成模型Voice Engine：可複製原聲

當地時間3月29日，OpenAI在官網首次展示了名爲“Voice Engine”的語音生成模型。該模型正處於小規模預覽階段，可利用文本輸入和單個15秒音頻樣本來生成與原聲非常相似的自然語音。據介紹，OpenAI於2022年底首次開發出該模型，並已將其應用於其文本轉語音API以及ChatGPT語音和朗讀功能中的預設語音。OpenAI表示，由於合成語音被濫用的潛在風險，其將採取謹慎和知情的方式進行更廣泛的發佈。

相關資訊

▣ OpenAI首次展示音頻模型Voice Engine 15秒即可複製原音
▣ 全球科技早參丨OpenAI發佈語音模型Voice Engine
▣ OpenAI發佈語音模型Voice Engine，出於安全考慮僅小範圍試用
更厲害！OpenAI推Voice Engine技術 15秒聲音範本可合成語音
▣ 英偉達展示新型人工智能模型：可修改聲音和生成新聲音
▣ 英偉達展示人工智能新模型能修改聲音生成新聲音
Nvidia展示可修改並生成聲音的AI模型Fugatto
▣ 英偉達展示AI模型Fugatto：能修改並生成新聲音
▣ OpenAI推出語音克隆AI模型
▣ 英偉達對外展示了一款模型，可以生成音樂和音頻
▣ OpenAI：上線ChatGPT高級語音模式Advanced Voice的視頻和共享屏幕功能
▣ GPT-4o模仿人聲說“不”，無意的語音生成仍是模型弱點
▣ OpenAI發佈首個視頻生成模型，可生成60秒一鏡到底視頻
▣ 比擴散模型快50倍！OpenAI發佈多模態模型實時生成進展
▣ 智譜清言上線情感語音模型 GLM-4-Voice：可理解情感，有情緒表達和共鳴
▣ OpenAI開發者大會派禮包：大幅降低模型成本，AI語音加持App，小模型“蹭”大模型性能
▣ OpenAI推遲ChatGPT新語音模式
OpenAI推出新模型輸入提示可達300頁
▣ 智譜清言上線情感語音模型GLM-4-Voice：有情緒表達、情感共鳴
OpenAI推模擬真人語音技術
▣ OpenAI用26分鐘再次震撼世界！新模型GPT-4o語音水平接近人類，科幻正在成真
▣ Orange與OpenAI、Meta合作開發定製非洲語言AI模型
▣ 英偉達(NVDA.US)推出新AI模型Fugatto，可修改並生成新聲音
▣ AI週報｜OpenAI展示新模型o3;智譜完成新一輪30億元融資
▣ OpenAI語音模式負責人離職創業
初音未來舞獅原型首次亮相！　直擊初音未來特展
▣ OpenAI發佈文生圖模型：ChatGPT即將融入，文字生成圖片模型。
▣ 科技早報｜OpenAI發佈最新語音模型；商務部迴應美升級芯片出口管制措施
▣ vivo移動夥伴大會展示創新成果，多款6G原型機首次亮相

DMCA | PRIVACY | s@bg3.co