三大AI開發神器亮相!李彥宏:只要會說話,就可以成爲一名開發者

“未來,自然語言將成爲新的通用編程語言,你只要會說話,就可以成爲一名開發者,用自己的創造力改變世界。”

4月16日,Create 2024百度AI開發者大會在深圳舉辦。百度創始人、董事長兼首席執行官李彥宏發表了題爲《人人都是開發者》的主旨演講。他認爲,大模型和生成式AI將徹底改變開發者這個羣體。

“AI正在掀起一場創造力革命,未來開發應用就像拍個短視頻一樣簡單,人人都是開發者,人人都是創造者。”

百度已經爲開發者們準備好了三大“開箱即用”的工具,包括智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder、各種尺寸的模型定製工具ModelBuilder。“這三個工具,都代表了先進生產力。”

值得一提的是,李彥宏現場分享了百度在開發AI原生應用上的具體思路,並表示:“這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”這三個開發AI原生應用的思路分別是,MoE、小模型和智能體。

會上,李彥宏正式發佈了文心大模型4.0的工具版。他還透露,截至目前文心一言用戶數已經突破2億。“文心大模型已成爲中國最領先、應用最廣泛的AI基礎模型。”

得益於文心大模型的強大,開發者通過文心4.0降維裁剪出來的更小尺寸模型,要比直接拿開源模型調出來的模型,同等尺寸下效果明顯更好;同等效果下,成本明顯更低。“大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。”

以下爲李彥宏的主要觀點:

自然語言將成爲新的通用編程語言,只要會說話就可以成爲一名開發者

“大模型和生成式AI,將徹底改變開發者這個羣體。過去,開發者用代碼改變世界;未來,自然語言將成爲新的通用編程語言,你只要會說話,就可以成爲一名開發者,用自己的創造力改變世界。”

“上崗一年多,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業,生成的代碼採納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。”

“今天,你不會寫代碼,也可以做出一個AI應用;不用編程,也可以做出一個智能體。AI正在掀起一場創造力革命,未來開發應用就像拍個短視頻一樣簡單,人人都是開發者,人人都是創造者。”

AgentBuilder、AppBuilder、ModelBuilder,都代表了先進生產力

“作爲一家技術公司,百度的角色定位,就是儘可能地爲大家提供所需的開發工具,不斷提升整個社會的創造力。”

“具體來說,我們提供1個強大的基礎模型系列,就是文心大模型系列,這包括旗艦版的ERNIE3.5, ERNIE4.0, 也包括輕量版的ERNIE Speed、Lite、Tiny等等。”

“我們還提供基於大模型來開發各種應用的工具,包括智能體開發工具AgentBuilder,AI原生應用開發工具AppBuilder,以及各種尺寸的模型定製工具ModelBuilder。這三個工具,都代表了先進生產力。”

文心一言用戶數突破2億,文心大模型4.0工具版正式發佈

“文心一言從去年3月16日發佈,到今天是一年零一個月的時間。我們的用戶數突破了2億,API日均調用量也突破了2億,服務客戶數達到了8.5萬,利用千帆平臺開發的AI原生應用數超過了19萬。”

“近幾個月來,文心大模型在代碼生成、代碼解釋、代碼優化等通用能力方面實現了進一步的顯著提升,達到國際領先水平。今天,我們正式發佈文心大模型4.0的工具版。”

“文心大模型已經成爲了中國最領先、應用最廣泛的AI基礎模型。”

“相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調用1萬次,同樣成本現在一天可以調用100萬次。”

開發AI原生應用的具體思路,是過去一年踩了無數坑、交了高昂學費換來的

“大模型本身並不直接創造價值,基於大模型開發出來的AI應用才能滿足真實的市場需求。”

“今天我想跟大家分享的是一些基於大模型開發AI原生應用的具體思路和工具。這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”

“第一是MoE。未來大型的AI原生應用基本都是MoE架構,這裡所說的MoE不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。”

“第二是小模型。小模型推理成本低,響應速度快,在一些特定場景中,經過SFT精調後的小模型,它的使用效果可以媲美大模型。這就是我們發佈Speed,Lite、Tiny三個輕量模型的原因。我們通過大模型,壓縮蒸餾出來一個基礎模型,然後再用數據去訓練,這比從頭開始訓小模型,效果要好很多,比基於開源模型訓出來的模型,效果更好,速度更快,成本更低。”

“第三是智能體。智能體是當下很熱的一個話題,隨着智能體能力的提升,會不斷催生出大量新的應用。智能體機制,包括理解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成複雜任務,在環境中持續學習、實現自我迭代和進化。在一些複雜系統中,我們還可以讓不同的智能體互動,相互協作,更高質量地完成任務。”

智能體是未來離每個人最近、最主流的大模型使用方式

“智能體可能是未來離每個人最近、最主流的大模型使用方式,基於強大的基礎模型,智能體可以批量生成,應用在各種各樣的場景。”

“百度剛剛升級了文心智能體平臺。截至目前,已經有3萬多個智能體被創建、5萬多名開發者和上萬家企業入駐。我們的目標是,讓每個人、每個組織都成爲智能體的開發者,打造國內最完整的智能體生態。那如何實現這個目標呢?就是給大家提供零門檻的智能體開發工具AgentBuilder。”

“今天,每一個商家、每一個客戶,都能在百度擁有專屬的智能體。整個過程完全不需要編程,通過類似提示詞的信息輸入,和簡單的幾步操作調優,就能迅速生成一個智能體,成爲7X24小時在線的金牌業務員。”

現場,李彥宏演示了新加坡旅遊局、啓德教育和索菲亞三個智能體案例,手把手教開發者用自然語言,5分鐘、零門檻創建一個智能體。

“啓德教育智能體非常的受歡迎,上線第一週,就成功分發了155萬次,與用戶交互了5.8萬次,線索轉化量直線增長、有效線索的轉化成本明顯降低,經營效率大幅提升。”

“索菲亞商家智能體上線以來,有效線索成本下降了30%。也就是說,它獲得一個有效客戶,如果過去的成本是100塊,現在只需要70塊了。

AppBuilder:最好用的AI原生應用開發工具,用自然語言三步就能開發一個應用

“AppBuilder,它是目前最好用的AI原生應用開發工具。在AppBuilder上面,我們提前封裝和預置了開發AI原生應用所需的各種組件和框架,大幅降低開發門檻。”

“最快只需三步,開發者就可以用自然語言開發出一個AI原生應用,並且能夠便捷地發佈、集成到各種各樣的業務環境中。”

現場,通過“遊樂場排隊助手”、華北電力大學“華電AI助理”和百度文庫智能漫畫生成三個案例,李彥宏展示了一個AI原生應用的創建過程。只需名稱設定、填寫角色指令、插入組件簡單三步,即可創建一個AI原生應用。

他還指出,AppBuilder擁有兩大優勢:

“一是功能強大。依託文心4.0對指令的理解和遵循能力,我們的AppBuilder,能保證冷啓動就能達到一個不錯的水平,不會因爲效果差,再花很長時間去調優,大大降低了開發門檻。依託檢索增強技術RAG,在知識問答等典型場景,我們的問答準確率和友好回覆程度都達到了95%以上,大幅超越其他同類產品。”

“AppBuilder還提供豐富完整的組件工具,包括百度搜索等基於百度多年技術積累的AI能力組件、大模型能力組件,還有百度獨家開放的業務組件等55個組件。以及一些主流場景的第三方API,比如航班查詢、論文查詢等。我們還剛剛支持了自定義組件,客戶可以直接對接自己專有的任何工具和數據。這些豐富的組件,共同支撐起了AI原生應用的高效開發。”

“二是簡單易用。使用AppBuilder,只需三步即可快速創建應用、一鍵分發。我們也支持開源的SDK,方便大家進行二次開發。”

各種尺寸的模型定製工具ModelBuilder:高效低價生產模型

“更適合專業開發者使用的工具,那就是ModelBuilder,它可以根據開發者的需求定製任意尺寸的模型,並根據細分場景對模型進一步精調SFT,這樣就能達到更好的效果。”

現場,李彥宏展示了教育行業作文批改的案例,經過數據處理、模型精調後的“作文批改助手”,不僅可以擁有更專業的老師點評思維、做到格式遵循,而且相比未精調模型,精調後的模型打分與真實的老師點評分數更爲接近。

他還在現場與小度實時互動,展示小度用MoE多個模型組合的方式來執行不同任務,例如使用小模型ERNIE Tiny執行模型路由工作,而性能最好的文心4.0則用來執行日程安排等複雜需求。據介紹,相比全部使用文心大模型的旗艦版,小度可以實現響應速度提升2倍,成本下降99%。

李彥宏表示,“這幾個關於ModelBuilder的例子,展示的是百度高效低價生產模型的能力”。

“爲了方便大家快速上手,ModelBuilder預置了最全面最豐富的大模型。包括了ERNIE3.5和ERNIE4.0,這是旗艦版的大模型,它適合通用的複雜場景,能力強大;還有三個輕量級的大模型,ERNIE Speed、Lite、Tiny;另外還有兩個垂直場景的模型,ERNIE Character適合角色扮演;ERNIE Functions適合對話或問答場景中的外部工具使用和業務函數調用。當然ModelBuilder也支持國內外第三方主流模型,總數量達到77個,是國內擁有大模型數量最多的開發平臺。”

開源模型會越來越落後

“因爲有了最強大的基礎模型文心4.0,我們可以根據需要,兼顧效果、響應速度,推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,並且支持精調和post pretrain。”

“這樣通過降維裁剪出來的模型,比直接拿開源模型調出來的模型,同等尺寸下效果明顯更好,同等效果下,成本明顯更低。”

“大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。”

多模態大模型是通往AGI的必經之路,視覺大模型最大的應用場景是自動駕駛

“面向未來,我認爲多模態大模型,或者說文字、圖片、語音、視頻等多模態的融合,是基礎模型非常重要的長期發展方向,是通往AGI的必經之路。百度在這些領域有着長期投入,並將及時更新大模型的最新進展。”

“我有一個非常不一樣的判斷:視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是最好的,是自動駕駛的全球領導者,我們不只訓練AI如何生成視頻,更訓練AI理解真實世界發生的事情並預測未來。”

“基於超過1億公里的、中國複雜城市道路測試里程數據,百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、適應性更強、更安全的自動駕駛方案。”

人人都可以成爲開發者,未來,必將是一個由開發者一起創造出來的未來

“今天的中國,有10億互聯網用戶,有強大的基礎大模型,有足夠多的AI應用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持‘人工智能+’行動,每一個人,每一家企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。”

“人人都可以成爲開發者,而未來,也必將是一個由開發者一起創造出來的未來!”