十年一劍,商湯正在穿越技術週期
來源:連線Insight
文/陳鋒
編輯/子夜
今年5月,IBM發佈了《2024年CEO調研報告》,其中有兩組數據尤爲值得關注。
根據該調研報告,59%的受訪CEO認爲,未來企業的競爭優勢,取決於誰擁有最先進的生成式AI;62%的CEO表示,他們需要重新制定商業策略,才能在未來贏得勝利。
得益於大模型技術和生成式AI的推動,整個人工智能領域,也迎來了新的範式轉移——正加速從AI 1.0時代,邁向AI 2.0時代。
AI 2.0時代的重要特徵在於,人工智能會從之前點狀的創新應用,逐步規模化發展到賦能企業業務流程的各個環節,並逐步向產業深水區發展。
上述背景下,連線Insight觀察到,當下中國AI產業也在加速涌現出新趨勢:
一方面,基座大模型底層技術還在不斷迭代,但更多玩家開始思考,怎麼將大模型落地到各個產業中去,賦能到具體的業務場景,儘快跑通商業化路徑;
另一方面,隨着越來越多的企業開始擁抱大模型及生成式AI,AI產業鏈也在加速成熟和分化,上下游產業角色和環節在不斷增多。
AI產業鏈條中的每一個玩家,都面臨着抉擇:要充當什麼角色?聚焦到哪些領域或場景?怎麼落地?等等。
其中,我們注意到,已經在AI領域深耕了十年的商湯科技,選擇了一條難而正確的路——從AI基礎設施到大模型到應用,全棧佈局。
前段時間的“2024商湯十週年國際論壇:邁向AI 2.0共融新時代”的大會上,商湯科技董事長兼首席執行官徐立表示,當下正處於AGI的轉折點,在人工智能2.0時代,商湯的核心戰略是無縫集成數字基礎設施、人工智能模型和應用,集團將以此爲基礎,推動新一輪創新。
在這背後,商湯爲什麼要選擇全棧佈局?它的底氣源於何處?這一戰略又將把它帶向何處?
1、破解AI 2.0時代成本難題,商湯要做各行各業的“水電煤”
面對生成式AI浪潮,企業們面臨的關鍵問題,早已不是“要不要佈局大模型”了,而是“怎麼擁抱大模型”“怎麼用大模型來賦能業務”。
但在AI 2.0時代,跑通大模型的應用路徑,其實並不容易。
徐立最近在一次論壇上表示,生成式AI或者AI 2.0時代,除了模型的通用性之外,最大的特點是成本結構由“研發人員密集型”轉化爲了“算力資源密集型”。
具體來看,大模型訓練、生成式AI應用,不僅對GPU或異構計算的需求大幅增加,傳統的CPU算力已經無法滿足,還對GPU集羣的計算效率、穩定性等方面提出了諸多要求。
此外,算力也不是簡單的堆砌,而是要爲大模型進行優化的複雜系統性工程。
不過算力成本過高、算力資源的浪費,又是當前業界普遍存在的現象,這也就導致,如今的AI解決一個問題,自身所花費的成本和代價,可能比帶來的好處還要大。
怎麼應對這個挑戰?商湯的解法是,把AI三要素“算力、算法、數據”都基礎設施化,同時通過“大裝置-大模型-應用”這一三位一體的核心戰略,以應用驅動模型,以模型帶動算力優化,推動大模型迅速迭代,並降低推理成本。
2021年,商湯提出了“大裝置”的概念,是中國首個提出新一代AI基礎設施思考、並付諸行動的廠商。2022年,作爲商湯AI基礎設施重要載體的人工智能計算中心AIDC正式投入運營。
目前,SenseCore商湯大裝置已經搭建起了完善的AI基礎設施架構,包括AI原生算力基礎設施、大模型生產平臺、模型即服務等等。
比如圍繞大模型的訓練,SenseCore商湯大裝置對外提供專家服務,覆蓋大模型規劃和大模型訓練兩個階段。
在大模型規劃階段,商湯通過提供大模型開發諮詢服務和大模型代訓練服務,能讓客戶快速理解大模型開發訓練的關鍵節點和潛在痛點。
而在大模型訓練階段,商湯大裝置也提供了從數據、訓練到推理的大模型全生命週期服務,保障大模型開發成果落地。
在推理部署階段,商湯SenseCore MaaS(大模型即服務)萬象模型開發平臺,基於領先的商湯日日新千億級大模型,提供高效率和一站式大模型生產和應用全流程工具鏈,助力企業與開發者構建原生AI應用,提升業務效能。
目前,商湯大裝置萬象已廣泛服務於政務、運營商、金融、互聯網、汽車、泛科技等多個行業客戶,以高效的模型精調和推理部署,實現多種業務場景的提智增效。
根據IDC近日發佈MaaS報告《中國模型即服務(MaaS)及AI大模型解決方案市場追蹤,2024H1》。報告顯示,2024年上半年,商湯科技(商湯大裝置萬象)以14.8%的市場份額位居第二。
在SenseCore商湯大裝置這一AI基礎設施之上,客戶不僅能開發、訓練大模型,也可以調用平臺上豐富的模型資源庫,來生成特定的垂直行業模型,也能開發原生AI應用——SenseCore商湯大裝置,某種程度上已經成了各行各業做大模型、做生成式AI應用的“水電煤”。
從長遠視角來看,圍繞AI基礎設施的持續佈局,有望幫助商湯在AI 2.0時代佔據先發優勢。
一方面,過去十年裡,商湯其實一直在專注於AI底層基礎設施與模型應用,積累起了可觀的算力規模和技術資源。
徐立認爲,過去十年的AI 1.0時代的經驗,讓商湯更瞭解市場需要什麼樣的AI產品和服務。他說,商湯是最懂模型的算力服務商,最懂算力的模型服務商。
截至今年7月,商湯大裝置的總算力規模達到了20000PFLOPS,已有超過5.4萬塊GPU。
在AI基礎設施市場,商湯的影響力也在穩步提升。
IDC近期發佈的《中國智算服務市場(2023下半年)跟蹤》報告顯示,商湯科技在中國雲計算基礎設施廠商中脫穎而出,躋身中國GenAI IaaS服務廠商TOP3,居於GenAI IaaS領域第一梯隊。
圖源商湯科技官方微信公衆號
另一方面,商湯對AI基礎設施的持續投入,也會拓寬商湯在AI 2.0時代的商業化空間。
“電力和通信流量都是基礎設施,一套基礎設施就能服務千行百業,但是早期的成本也都居高不下,隨着技術的迭代以及使用人數的擴大,邊際成本就忽略不計了”,徐立認爲,現在AI基礎設施正處於這一轉折點。
2、從更多行業到更多AI應用,商湯將大模型能力加速落地
今年是商湯成立的第十年,不難發現的是,過去多年圍繞AI技術的持續投入和佈局下,商湯正在“雙輪驅動”:
不僅有深厚的傳統的AI業務,而且加速佈局生成式AI業務。
今年上半年,商湯收入爲17.40億元,同比增長了21.4%,其中最值得注意的是,從營收結構來看,生成式AI的收入爲人民幣10.51億元,同比大幅增長了255.7%,佔集團收入的佔比提升到了60.4%。
商湯的這一切換進程中,不容忽視的一點是,商湯不只是搭建起了以SenseCore商湯大裝置爲核心的AI底層基礎設施,而是在進一步深化其與大模型的深度協同。
商湯今年將“無縫集成數字基礎設施、人工智能模型和應用”定爲核心戰略,思路和目標也很明確,即面向未來,商湯不僅要成爲AI基礎設施提供商,也要成爲AI 2.0時代的AI模型提供商。
背後的邏輯在於,一方面,如我們上文所述,“大裝置+大模型”的深度協同,很大程度上能夠推動AI產業高效率、低成本、規模化的AI創新和落地。
另一方面,AI基礎設施之上,如何將大模型的能力、生成式AI的能力加速下沉到爆發式增長的長尾細分場景,纔是關鍵。
對商湯而言,自己做大模型就變得越發重要。
自2023年4月首次發佈“日日新SenseNova”大模型體系以來,商湯在大模型領域的迭代速度和落地進程,一直在加快。
圖源商湯科技官方微信公衆號
一邊,是商湯已經打造出了愈發豐富的基座大模型,包括語言大模型(SenseChat-5)、多模態大模型(SenseChat-Vision)、語音大模型(Nova-tts-1)、文生圖大模型(SenseMirage)、向量大模型(Nova-Embedding),等等。
今年7月,商湯科技發佈了國內首個具備流式原生多模態交互能力大模型“日日新SenseNova 5.5”,綜合性能較之前的“日日新5.0”提升了30%。
據介紹,在多模態能力上,“日日新SenseNova 5.5”在大部分核心測試集指標上,都對標甚至超過了Open AI的GPT-4o。
另一邊,商湯科技還加速迭代出了面向不同場景、不同行業的垂直行業大模型和解決方案,實際落地進展也在加快。
舉個例子,基於“商量”這一大語言模型,商湯科技迭代出了面向醫療行業的醫療大模型“大醫”,在多個醫療任務評測集上,“大醫”的能力同樣超越了GPT-4o。
今年6月,基於“大醫”,商湯科技與上海人工智能實驗室合作,攜手多家單位,共同發起了創新項目“漸凍症知識問答助手”,後者擁有專業的醫療知識庫基礎,可以爲漸凍症患者提供全天候、全面的漸凍症互動答疑。
近日,在中國計算機大會上,“大醫”從近百個項目中脫穎而出,憑藉着在公益領域的突出貢獻,成功入選了2024“CCF十大技術公益優秀案例”。
在其他領域和場景,商湯也在加速將大模型能力,轉化爲能落地到實際場景的產品應用,比如代碼小浣熊、辦公小浣熊、秒畫、擬人大模型等等。
今年上半年,已經有超過3000家行業頭部企業使用了商湯的大模型及智算服務,“日日新”大模型的整體調用量,實現了400%的增長。
3、結語
近兩年,從大模型浪潮的爆發 ,到基於大模型技術的生成式AI,AI產業的技術變革正不斷加速,而以商湯科技爲代表的一衆AI企業,正努力縮短從技術變革到場景拓寬的距離。
某種程度上,這讓商湯既能着眼於當下,也爲未來做好了準備。
徐立表示,商湯科技目前是“兩條腿”走路:
一條腿是傳統AI,基於技術的不斷成熟,商湯能不斷降低成本、加速海內外市場拓展,聚焦利潤貢獻;另一條腿則是新一代的AI大模型,商湯的目標是儘快實現盈虧平衡,這條腿增長很快,且能看得到未來。前者保證商湯“走得夠快”,後者保證“走得夠遠”。
不難發現,當幾乎所有玩家都在期待AGI時代到來時,正沿着這條全棧佈局的路徑紮實走下去的商湯科技,實際上已經拿到了通向AGI的船票。