趣丸科技開源語音大模型MaskGCT
10月24日,趣丸科技宣佈與香港中文大學(深圳)聯合研發的語音大模型“MaskGCT”正式在Amphion系統中開源,面向全球用戶開放使用。區別於傳統TTS模型,該模型採用掩碼生成模型與語音表徵解耦編碼的技術範式,在聲音克隆、跨語種合成、語音控制等任務中性能表現突出。據介紹,MaskGCT在三個TTS基準數據集上都達到了SOTA效果。
相關資訊
- ▣ 文化灣企說丨廣州趣丸科技:聯合港中大(深圳)開源首個語音大模型,效果全球領先躋身第一梯隊
- ▣ 國產AI音樂生成效果幾何?實測趣丸科技天譜樂大模型
- ▣ 盈趣科技:已接入多個大語言模型、視覺大模型和多模態大模型等,並積極開展相關應用
- ▣ 廣州海珠打造最盈利大模型產業集聚高地,趣丸科技等大模型企業入駐
- ▣ AI早知道|商湯科技發佈東風泰語大模型;Meta計劃開源 AI 模型Llama3 405B
- ▣ 全球科技早參丨OpenAI發佈語音模型Voice Engine
- ▣ 騰訊混元大語言模型和3D模型正式開源
- ▣ AI早知道|國內首個端到端語音大模型Lingo;摩爾線程開源音頻理解大模型MooER摩耳
- ▣ 豆包實時語音大模型和大模型1.5線,美政府聯手科技巨頭啓動“星際之門”
- ▣ 騰訊混元宣佈大語言模型和3D模型正式開源
- ▣ 盈趣科技:暫無自主研發AI大模型,開發相關AI應用
- ▣ 科大訊飛行業首發端到端語音同傳大模型
- ▣ 天津大學“伏羲傳語”多語言大模型正式發佈並開源,應對大模型多語言能力不足
- ▣ xAI宣佈開源大語言模型Grok-1並開放下載
- ▣ AI早知道|百度將推出人工智能模型 Ernie5.0;小紅書開源語音識別模型FireRedASR
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- 科大訊飛大模型競速2年多,答卷不只是語音
- ▣ 寧夏電力能源科技申請模型訓練相關專利,完成語音識別測試時的自適應
- ▣ 科大訊飛星火語音大模型“星火極速超擬人交互”8月底開放
- ▣ 豆包實時語音大模型上線
- ▣ AI早知道|騰訊推全球首個語音指揮FPS AI ;摩爾線程開源音頻理解大模型
- ▣ OpenAI開發者大會派禮包:大幅降低模型成本,AI語音加持App,小模型“蹭”大模型性能
- ▣ 中電信數智科技申請基於端到端跨語言大模型語音識別方法專利,提升語音識別準確度及魯棒性
- ▣ 從趣丸集團天譜樂AI音樂大模型看算法如何催生行業新質生產力
- ▣ 聯發科 推繁中大型語言模型
- ▣ AI早知道|科大訊飛發佈星火同傳語音大模型;阿里巴巴推出多模態大模型Valley2
- ▣ 字節跳動全量開放豆包即時語音大模型
- ▣ 全球科技早參丨全球首個芯片設計開源大模型誕生
- ▣ 商湯科技發佈新版日日新·商量大語言模型