AI早知道|阿里雲發佈音頻模型;OpenAI發佈新技術PVG

1.阿里雲最新發布的Qwen2-Audio 大規模音頻語言型模型,革新了語音交互體驗,用戶無需輸入文字即可與其進行語音交互,提供更便捷的體驗。

2.百度網盤推出了名爲「盤盤單詞」的全球首個結合個人照片場景與英語學習的AI工具,旨在解決傳統英語學習中的記憶困難和表達問題。用戶可通過照片呈現單詞和場景化內容,創造熟悉的英語環境。

3.OpenAI最近推出了Prover-Verifier Games(PVG)技術,旨在解決人工智能模型輸出的“黑盒”問題。這項技術通過小模型監督大模型輸出,提高了內容的準確性和可控性。

4.智源研究院聯合大連理工大學、北京大學等高校推出了新一代無編碼器的視覺語言模型EVE,通過精細化訓練策略和額外的視覺監督,解決了多模態大模型訓練分離導致的視覺歸納偏置問題。

5.微軟推出了一款名爲SpreadsheetLLM的新AI系統,它結合了大型語言模型的能力和電子表格中的結構化數據,能夠更高效地處理數據,幫助企業獲得更深入的見解。

6.Runway的iOS客戶端迎來了重大更新,蘋果用戶也能在手機上體驗到Gen3模型的強大功能。Gen-3Alpha支持多種生成工具,包括文本到視頻、圖像到視頻、文本到圖像轉換,爲創作者提供豐富創作選擇。

7.小冰公司最近宣佈了其AI數字員工產品線的全新升級,旨在進一步豐富產品並提升實時交互效果。新技術包括“零樣本”數字人技術、超千億大模型基座和透影音畫傳輸系統,展現了小冰公司在數字人領域的技術創新和發展動力。

想要了解更多AI 行業資訊以及ChatGPT和AI繪畫實戰案例,歡迎加入我們的「互聯網AI早讀課」知識星球!

在這個星球,你可以更加系統的學習AIGC相關知識:

1. ChatGPT和AI繪畫(Midjourney+Stable Diffusion+Photoshop beta)基礎+進階全攻略;

2. ChatGPT和AI繪畫最直接變現案例;

3. 與200+行業先行者鏈接,積累你的專屬人脈資源;

4. 社羣保姆級一站式服務,包教包會包討論;

現在加入,立享99元早鳥價優惠,星球用戶每漲100人,價格上調100元,直到恢復499元原價!

這個風口抓不抓的住,就看你願不願意邁出第一步了!

越晚加入成本越貴!最後兩個名額又要漲價了!