AI早知道|國內首個端到端語音大模型Lingo;摩爾線程開源音頻理解大模型MooER摩耳

1.西湖心辰推出的端到端語音大模型Lingo,具備實時打斷、指令控制、超級擬人等能力,支持多種語音風格表達,提供高自然流暢度的交互體驗。

2.雲知聲推出山海多模態大模型,該模型實現了多模態輸入和輸出,提供流暢的語音交互和個性化的視覺體驗,支持文本、音頻、圖像等多種模態輸入和任意組合輸出,實現高效語音交互。

3.摩爾線程開源了音頻理解大模型 -MooER(摩耳),是業界首個基於國產全功能 GPU 進行訓練和推理的大型開源語音模型。基於摩爾線程誇娥(KUAE)智算平臺,MooER 大模型用 38 小時完成了 5000 小時音頻數據和僞標籤的訓練。

4.蘋果正式進軍機器人市場,計劃推出搭載生成式AI的桌面設備,預計在2026年或2027年上市。這一舉措將爲智能家居帶來革命性變革,爲用戶提供更便捷的生活體驗。

5.xAI團隊的Grok-2和Grok-Mini模型在LMSys聊天機器人Arena排行榜上脫穎而出,Grok-2以第二名的佳績超越了OpenAI的GPT-4o,與Gemini並列。

6.Meta Reality 實驗室最新推出了名爲Sapiens 的AI視覺模型,專門設計用於理解圖片和視頻中的人類動作。它支持多種任務,包括2D姿態估計、身體部位分割、深度估計和表面法線預測等。

想要了解更多AI 行業資訊以及ChatGPT和AI繪畫實戰案例,歡迎加入我們的「互聯網AI早讀課」知識星球!

在這個星球,你可以更加系統的學習AIGC相關知識:

1. ChatGPT和AI繪畫(Midjourney+Stable Diffusion+Photoshop beta)基礎+進階全攻略;

2. ChatGPT和AI繪畫最直接變現案例;

3. 與200+行業先行者鏈接,積累你的專屬人脈資源;

4. 社羣保姆級一站式服務,包教包會包討論;

現在加入,立享99元早鳥價優惠,星球用戶每漲100人,價格上調100元,直到恢復499元原價!

這個風口抓不抓的住,就看你願不願意邁出第一步了!

越晚加入成本越貴!最後兩個名額又要漲價了!