李彥宏發佈文心大模型4.0工具版 推理成本降至1年前的1%

每經記者:可楊 每經編輯:文多

4月16日,百度創始人、董事長兼首席執行官李彥宏在Create 2024百度AI開發者大會上,正式宣佈發佈文心大模型4.0的工具版。

李彥宏表示,相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。“也就是說,客戶原來一天調用1萬次,同樣成本之下,現在一天可以調用100萬次。”

此外,李彥宏在演講中分享了百度過去一年實踐出來的、開發AI原生應用的具體思路和工具。“這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”他強調,大語言模型本身並不直接創造價值,基於大模型開發出來的AI應用才能滿足真實的市場需求。

圖片來源:企業提供

李彥宏首先表示,未來,大型的AI原生應用基本都是MoE。他介紹:“這裡所說的MoE不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。”

其次,李彥宏表示,小模型推理成本低,響應速度快,在一些特定場景中,經過精調後的小模型使用效果可以媲美大模型。這也是百度發佈ERNIE Speed、ERNIE Lite和ERNIE Tiny三個輕量模型的原因。“我們通過大模型,壓縮‘蒸餾’出來一個基礎模型,然後再用數據去訓練,這比從頭開始訓小模型,效果要好很多,比基於開源模型訓出來的模型,效果更好,速度更快,成本更低。”他表示。

第三是智能體。李彥宏表示,“智能體”是當前非常熱的一個話題,隨着智能體能力的提升,會不斷催生出大量的AI原生應用。智能體機制包括理解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成複雜任務,在環境中持續學習、實現自我迭代和自我進化。“在一些複雜系統中,我們還可以讓不同的智能體互動,相互協作,更高質量地完成任務。這些智能體能力,我們已經開發出來了,並且向開發者全面開放。”李彥宏介紹。