☰

清華系一公司加入AI戰局，要幫大模型公司降低算力成本

3月31日，清華系創業公司無問芯穹在上海發佈了大模型開發與服務平臺“無穹Infini-AI”，公司發起人汪玉攜聯創團隊首次集體公開亮相。這是一家主要做大模型軟硬件一體化計算加速解決方案的公司，成立不到一年，背後已有豪華陣容加持。

天眼查信息顯示，上海無問芯穹智能科技有限公司去年5月才成立，12月時曾發生工商信息變更，新增多名股東，包括百度、騰訊和智譜AI。紅杉中國、金沙江資本、徐匯資本和無限基金此前也入股了這家公司。

界面新聞了解到，無問芯穹的發起人汪玉是清華大學電子工程系長聘教授、系主任，長期從事智能芯片、高能效電路與系統研究，他的另一身份是AI芯片公司深鑑科技聯合創始人。無問芯穹聯合創始人兼CEO夏立雪曾任阿里雲用戶增長產品技術負責人，汪玉是其導師。

選擇大模型算力成本優化的創業方向，和他們對於市場缺口的洞察及過往經驗有關。

2022年底，大模型引發社會廣泛關注後，夏立雪和汪玉認爲，國內整體算力情況距離國際先進水平有明顯差距，光靠芯片工藝提升或是多元芯片的迭代已遠遠不夠，需要建立一個大模型生態系統，讓不同模型能自動部署到不同硬件上，促使各種算力得到有效利用。

此外，無問芯穹聯合創始人兼CTO顏深根爲原商湯科技數據與計算平臺部執行研究總監，幫助商湯搭建了兩萬片GPU的大規模高性能AI計算平臺。聯合創始人兼首席科學家戴國浩現任上海交通大學長聘教軌副教授，清源研究院人工智能設計自動化創新實驗室負責人。

人工智能對算力資源的需求及高昂成本，是大模型落地的公認難題。這或許是前述入股者在光環之外，向無問芯穹拋出橄欖枝的重要原因之一。

市場諮詢機構IDC和浪潮信息發佈的數據顯示，預計2022到2027年期間，中國智能算力規模年複合增長率達33.9%。中信證券研報指出，隨着業界對超長文本的支持需求不斷提升，預計硬件基礎設施也將隨之升級，以滿足海量文本數據的存儲和計算要求，因此持續看好AI算力層面的投資機會。

算力貴、算力少、不會用，這是目前大模型落地的三個關鍵難點。夏立雪指出，各個公司對於AI技術的掌握能力不一樣，獲取適合自己業務規模和需求的算力能力也不相通。此外，各家公司面臨的共同難題是如何控制大模型的“性價比”。

例如，行業軟件公司具有穩定的業務基礎和一定的軟件開發實力，但隨着業務深入探索，他們需要與業務增長速度匹配的訓練和推理資源。當應用場景突然出現爆款時，公司立刻需要彈性算力，這時遇到的難點就是靈活性和性價比——一個具有100萬DAU（日活）的應用，每年要承擔的成本達到千萬級。

當下的大模型產業包含大模型公司、軟件和應用公司及下游解決方案公司，而解決方案公司所做的就是控制算力成本。

無問芯穹處於模型和芯片之間的“中間層”。汪玉曾指出，我國AI大模型的發展在芯片和算法上存在挑戰。在模型層和芯片層之間，如何做高效的部署，通過統一的中間層解決異構芯片的適配問題會是一條重要途徑。該公司在努力做這樣的中間層，在雲端優化不同的算力，以此支撐更多不同的模型。

爲解決大模型落地“最後一公里”的問題，近兩年已有不少“中間層”公司的探索浮出水面，但方向不盡相同。

成立於2021年的潞晨科技，主要通過分佈式AI開發和部署平臺降低大模型落地成本。今年，潞晨科技旗下的國內開源團隊Colossal-AI開源Sora復現架構方案Open-Sora，據稱可降低46%復現成本。有頭部AI和RPA（機器人流程自動化）背景的瀾碼科技則基於底層大語言模型制定⾃動化平臺，協助企業實現人機交互。

近一年，無問芯穹主要在“優化”上進行逐步突破。2023年11月，其宣佈了在英偉達GPU和AMD等芯片上取得的優化效果，據稱取得了當時最好的計算加速效果，實現大模型任務2到4倍的推理速度提升。目前，無穹Infini-AI已支持20多個模型及10餘種計算卡。

具體而言，該公司對大模型成本的優化包含算法創新、模型計算優化、平臺優化和硬件推理優化四個方面。已有的落地案例是，同道獵聘在一個月前發佈了AI驅動的數字人面試官等AI應用，其中部分應用使用了無問芯穹提供的彈性算力方案，在推理加速和成本上實現了進步。

發佈平臺的同時，無問芯穹宣佈“無穹Infini-AI”自3月31日起正式開放全量註冊，給所有實名註冊的個人和企業用戶提供百億tokens（文本處理過程中的最小單位）免費配額。如何加速拓展商業化，將是這家新AI初創公司面臨的重要節點。

不過這僅僅是開始。如今大模型行業已經“明星”雲集，有了資本支持之後，在不同缺口着力的創業公司如何建立長久的商業模式，決定了誰能在淘汰賽中留到最後。

清華系一公司加入AI戰局，要幫大模型公司降低算力成本

相關資訊