清華系一公司加入AI戰局,要幫大模型公司降低算力成本

3月31日,清華系創業公司無問芯穹在上海發佈了大模型開發與服務平臺“無穹Infini-AI”,公司發起人汪玉攜聯創團隊首次集體公開亮相。這是一家主要做大模型軟硬件一體化計算加速解決方案的公司,成立不到一年,背後已有豪華陣容加持。

天眼查信息顯示,上海無問芯穹智能科技有限公司去年5月才成立,12月時曾發生工商信息變更,新增多名股東,包括百度、騰訊和智譜AI。紅杉中國、金沙江資本、徐匯資本和無限基金此前也入股了這家公司。

界面新聞了解到,無問芯穹的發起人汪玉是清華大學電子工程系長聘教授、系主任,長期從事智能芯片、高能效電路與系統研究,他的另一身份是AI芯片公司深鑑科技聯合創始人。無問芯穹聯合創始人兼CEO夏立雪曾任阿里雲用戶增長產品技術負責人,汪玉是其導師。

選擇大模型算力成本優化的創業方向,和他們對於市場缺口的洞察及過往經驗有關。

2022年底,大模型引發社會廣泛關注後,夏立雪和汪玉認爲,國內整體算力情況距離國際先進水平有明顯差距,光靠芯片工藝提升或是多元芯片的迭代已遠遠不夠,需要建立一個大模型生態系統,讓不同模型能自動部署到不同硬件上,促使各種算力得到有效利用。

此外,無問芯穹聯合創始人兼CTO顏深根爲原商湯科技數據與計算平臺部執行研究總監,幫助商湯搭建了兩萬片GPU的大規模高性能AI計算平臺。聯合創始人兼首席科學家戴國浩現任上海交通大學長聘教軌副教授,清源研究院人工智能設計自動化創新實驗室負責人。

人工智能對算力資源的需求及高昂成本,是大模型落地的公認難題。這或許是前述入股者在光環之外,向無問芯穹拋出橄欖枝的重要原因之一。

市場諮詢機構IDC和浪潮信息發佈的數據顯示,預計2022到2027年期間,中國智能算力規模年複合增長率達33.9%。中信證券研報指出,隨着業界對超長文本的支持需求不斷提升,預計硬件基礎設施也將隨之升級,以滿足海量文本數據的存儲和計算要求,因此持續看好AI算力層面的投資機會。

算力貴、算力少、不會用,這是目前大模型落地的三個關鍵難點。夏立雪指出,各個公司對於AI技術的掌握能力不一樣,獲取適合自己業務規模和需求的算力能力也不相通。此外,各家公司面臨的共同難題是如何控制大模型的“性價比”。

例如,行業軟件公司具有穩定的業務基礎和一定的軟件開發實力,但隨着業務深入探索,他們需要與業務增長速度匹配的訓練和推理資源。當應用場景突然出現爆款時,公司立刻需要彈性算力,這時遇到的難點就是靈活性和性價比——一個具有100萬DAU(日活)的應用,每年要承擔的成本達到千萬級。

當下的大模型產業包含大模型公司、軟件和應用公司及下游解決方案公司,而解決方案公司所做的就是控制算力成本。

無問芯穹處於模型和芯片之間的“中間層”。汪玉曾指出,我國AI大模型的發展在芯片和算法上存在挑戰。在模型層和芯片層之間,如何做高效的部署,通過統一的中間層解決異構芯片的適配問題會是一條重要途徑。該公司在努力做這樣的中間層,在雲端優化不同的算力,以此支撐更多不同的模型。

爲解決大模型落地“最後一公里”的問題,近兩年已有不少“中間層”公司的探索浮出水面,但方向不盡相同。

成立於2021年的潞晨科技,主要通過分佈式AI開發和部署平臺降低大模型落地成本。今年,潞晨科技旗下的國內開源團隊Colossal-AI開源Sora復現架構方案Open-Sora,據稱可降低46%復現成本。有頭部AI和RPA(機器人流程自動化)背景的瀾碼科技則基於底層大語言模型制定⾃動化平臺,協助企業實現人機交互。

近一年,無問芯穹主要在“優化”上進行逐步突破。2023年11月,其宣佈了在英偉達GPU和AMD等芯片上取得的優化效果,據稱取得了當時最好的計算加速效果,實現大模型任務2到4倍的推理速度提升。目前,無穹Infini-AI已支持20多個模型及10餘種計算卡。

具體而言,該公司對大模型成本的優化包含算法創新、模型計算優化、平臺優化和硬件推理優化四個方面。已有的落地案例是,同道獵聘在一個月前發佈了AI驅動的數字人面試官等AI應用,其中部分應用使用了無問芯穹提供的彈性算力方案,在推理加速和成本上實現了進步。

發佈平臺的同時,無問芯穹宣佈“無穹Infini-AI”自3月31日起正式開放全量註冊,給所有實名註冊的個人和企業用戶提供百億tokens(文本處理過程中的最小單位)免費配額。如何加速拓展商業化,將是這家新AI初創公司面臨的重要節點。

不過這僅僅是開始。如今大模型行業已經“明星”雲集,有了資本支持之後,在不同缺口着力的創業公司如何建立長久的商業模式,決定了誰能在淘汰賽中留到最後。