搞AI,這些龍頭和上市公司花了多少錢和人?

今年2月中旬,OpenAI發佈了人工智能文生視頻大模型Sora。從2月中旬到現在,可以說是人工智能領域動態發佈最密集的一個時期:英偉達躍升全球市值第三大科技公司並在GTC大會上發佈了令人矚目的突破性成果,Groq、Cerebras發佈了最新的AI芯片,谷歌、蘋果等大廠和Anthropic、Mistral、Inflection等獨角獸也在這個時間內發佈了最新的大模型。

圖片來源:NVIDIA GTC 2024 主題演講,NVIDIA官網

無論是從AI芯片、AI“三算”,還是從AI模型看,似乎美國的這些進展都讓人不得不感慨它相較於中國在人工智能領域的先發優勢。AI產業鏈中游主要包括基於各類識別技術構建的軟件產品、解決方案和技術平臺,是產業鏈中創新價值、產業價值最高的環節,而其中的大模型板塊,是最受大衆關注和中美AI領域競爭的焦點。

2023年9月,鈦媒體國際智庫發佈了產生一定行業影響力的《2023 AI大模型應用中美比較研究》報告。報告指出,中美在AI大模型方向領先其他各國,雙方競爭在各方面各有優勢,美國科技巨頭長期投身基礎理論研究,使美國得以引領全球人工智能發展,在基礎大模型上能夠保持領先優勢。同時,大額投資也爲美國研發工作提供了有力支撐。而中國由於人才、資本和技術的制約,更傾向於利用龍頭企業的開源模型來做應用落地的創業。

不過,雖然國內大模型一直扮演着追隨者的角色,但在基礎模型方面,中美之間的差距並不大,國內“重應用輕基礎”的研發理念以及龐大的下游需求,讓國內機構更加專注於落地應用的研究,可以說在AI大模型應用方面更勝一籌。

當前,國內研發基礎大模型的企業較少,僅有百度、華爲、騰訊、阿里等,同時,有許多企業依託在各自行業的深耕,或外接基礎模型,或利用開源模型自研模型,來研發應用於所處行業的AI大模型。

據不完全統計,國內已發佈大模型近190個,涵蓋盤古、悟道、文心一言、通義千問、星火認知等一批具有行業影響力的預訓練大模型,也包括“軒轅”金融大模型、“知海圖AI”中文大模型、“言犀”產業大模型、WorkMagic Copilot、WPS AI等應用於垂直領域的行業大模型。

科技競爭最終比拼的是人才密度和行業積累,我們試着從AI大模型相關的比較突出的概念股入手,由研發數據管窺國內相關上市企業的競爭優勢。目前,國內AI大模型上市公司生態包含百度生態、騰訊生態、華爲生態、阿里生態、小米生態等,同時有三六零、崑崙萬維等自研大模型公司。

總的來說,研發投入的巨大差異,不僅體現在基礎大模型研發公司與垂直行業的應用層研發公司之間,也體現在應用層研發公司所屬的不同行業和主營業務之間。例如,聚焦數字閱讀和出版的中文在線、垂直於數字營銷的浙文互聯、更注重法院訴訟服務的金橋信息等,明顯研發投入遠小於絕大多數AI大模型應用層研發公司。

注:根據能夠找到的最新數據,上表中百度、騰訊、華爲、小米爲2023年數據,阿里巴巴爲2023財年數據,字節跳動爲2022年數據。瀾舟科技未上市,未能找到相關數據。

注:根據能夠找到的最新數據,上表中百度、華爲、小米爲2023年數據,騰訊爲2022年數據,阿里巴巴爲2021年數據,字節跳動未披露相關數據。瀾舟科技未上市,未能找到相關數據。

部分AI大模型應用層研發公司研發費用及人員數據(根據最新披露數據)

01百度生態

據財報數據,2023年全年,百度研發投入高達242億元,同比增加4%,佔全年營收比例約18%,主要由於支持生成式AI研發投入開支增加。百度在過去十年中,累計研發投入超過1000億元,研發強度始終位於中國大型科技互聯網公司前列。然而,由於百度這幾年進行的本地生活、電商、遊戲等業務探索的結果並不盡如人意,員工數量也在不斷變化中,研發人員數量自2021年的27500人下降至2023年的21800人,減少了5700人。

百度對競爭趨勢的判斷是,短期的競爭圍繞基礎大模型展開,長期的競爭則會圍繞AI原生應用展開。因此,百度在研發自有大模型的同時,成爲了推動大模型加速進入應用側速度最快的廠商之一。

百度直接持股【每日互動】【漢得信息】【中文在線】等公司,這些公司在百度文心一言大模型的基礎上,研發了自己的AI大模型或AI產品。

1. 每日互動

每日互動是國內專業的數據智能服務商,2023年年底發佈了公司在品牌營銷領域的大模型應用創新成果——AITA智選人羣工具。該產品將大模型的強大能力和公司的數智能力深度融合,實現了用AI定向TA(AI-Targeting Audience),能夠通過簡單的自然語言對話,快速爲品牌廣告主生成符合需求的目標投放人羣。

據2023年三季度數據,每日互動研發投入1.1億元,佔營收的35.48%;2021年每日互動研發人員數量爲459人,佔員工人數的60.08%。

2. 中文在線

中文在線是中國數字出版的開創者之一,也是全球最大的中文數字出版機構之一。2023年10月,中文在線發佈了AI大模型“中文逍遙”,首席技術官吳疆將它的技術優勢總結爲“三個一”:一鍵生成萬字小說,一張圖片寫一部小說,和一次讀懂一百萬字小說。

2023年前三季度,中文在線的研發費用爲6764萬元,同比下降32%,佔營收的6.67%。中文在線解釋爲合併範圍變更所致。截至2022年底,中文在線共有研發人員189名,佔員工人數的29.1%。

3. 漢得信息

漢得信息是業務流程管理軟件供應商,打造了“漢得AIGC中臺”,致力於幫助企業快速落地AI,提供多模型對接能力,內置智能對話應用、可自配置的多分類智能知識問答應用等,幫助企業高效自定義實現各種業務流程+AI能力。

雖然沒有推出大模型,但在研發上,漢得信息的投入比較大,2023年三季度報告披露的研發費用達2.04億元,佔營收的9.06%;據2019年的數據,漢得研發人員數量爲7918人,佔員工人數的82.74%。

02騰訊生態

2023年9月,騰訊自研的混元大模型發佈,通過騰訊雲的API向國內企業正式開放。騰訊大模型支持廣泛功能,包括圖片生成、文案創作、文字辨識以及客戶服務等。2023年6月,騰訊推出的模型即服務(MaaS)讓企業可以訓練自己獨有的大模型,而混元讓企業有能力打造出功能強大的工具。

自2018年至2023年六年期間,騰訊的累計研發投入超過了2696.54億元人民幣,2023年全年研發投入達到640.78億元;2022年(沒有2023年數據),騰訊員工超10萬人,而研發人員佔比達到了74%,這意味着平均每四個騰訊員工中,就有三個人從事研發工作。

騰訊概念股包括浙文互聯、博思軟件、泛微網絡、常山北明、長亮科技等。

1. 浙文互聯

浙文互聯主營業務爲數字營銷,形成了以汽車廣告和效果營銷業務爲主、積極拓展其他利潤增長點的業務格局。在創新業務方面,浙文互聯搭建了圖片及場景等多模態的AIGC數字工具矩陣,完成了虛擬人、虛擬空間、虛擬物等元宇宙創新業務基建,推出AIGC繪畫工具“米畫”、元宇宙場景生成工具“數字戰士”等工具應用。

2022年,浙文互聯研發投入爲5402萬元;2023年前三季度研發投入2604萬元,同比增長5.17%。至2022年底,研發人員191人,佔員工總數的16.3%。

2. 博思軟件

博思軟件聚焦數字票證、智慧財政財務、數字採購三大領域,提供財政信息化管理及互聯網相關軟件產品及服務。

根據3月4日投資者平臺官方回覆,博思軟件已經將AI賦能於AI+財稅服務、AI+非稅票據、AI+商保、AI+採購、AI+績效,創新應用“數據+算法+AI”打造的“採購機器人”在國內人工智能價格監測領域處於行業領先。

2023年前三季度,博思軟件研發費用爲3.1億元,同比增長42.41%,佔營收的28.16%。截至2022年,員工總數逾6000人,其中70%以上爲研發技術人員。

3. 泛微網絡

泛微網絡專注於協同管理軟件領域,爲客戶提供數字化場景應用軟件,如人事管理、知識管理和營銷管理等。

泛微網絡推出了智能小e中間件平臺,利用泛微的千里聆模型與大語言模型分工合作,主要有AI問答、AI辦公、AI工具等功能。去年10月,泛微網絡還發布了e-builder低代碼平臺,客戶能夠通過拖拉拽組合,像積木一樣搭建應用。

泛微產品生態體系

2023年,泛微網絡研發投入3.54億元,同比增長4.23%,佔營收的14.8%。公司的研發人員由2017年的387人增長至2022年的1075人,佔員工總數比例由40.27%增長至55.38%,但2023年研發人員數量下降,剩餘880人,佔員工總數的52.63%。

4. 常山北明

常山北明是智慧城市、平安城市的解決方案及運營服務提供商。騰訊持有常山北明全資子公司北明軟件的股份,同時,北明軟件與騰訊雲簽署了框架合作協議書,在雲計算、大數據、人工智能等領域開展產品與技術的全方位合作,共同推動在線矛盾糾紛多元化解平臺運營。北明軟件還是華爲鯤鵬生態的深度參與者及鯤鵬計算產業首批認證夥伴之一。

常山北明2023年前三季度研發投入爲1.3億元,同比減少3.69%,佔營收的2.8%。2022年研發人員爲2117人,同比減少12.41%,佔員工總數的46.29%。

5. 長亮科技

長亮科技專注金融科技領域,提供諮詢、金融科技產品、金融IT服務,以及覆蓋數字金融、智慧金融、智慧財務等業務的全棧領先解決方案。截至23年三季度,騰訊爲長亮科技第二大股東,佔流通股比2.29%。

公司在覈心繫統上雲方面與華爲雲、阿里雲、騰訊雲等均有合作,並已經在涉及金融科技行業的人工智能領域成立了相關的研究機構,開展了部分產品的研發與基礎應用工作,如智能客服。

2023年前三季度,長亮科技在業績承壓之下仍舊加強了對於研發投入力度,報告期內公司的研發費用爲1.1億元,佔營收的9.34%。但從歷年數據上來看,2020年至2022年,長亮科技研發投入金額逐年下滑,分別爲17984.17萬元、14801.47萬元和14779.74萬元,在營業收入中的佔比從11.60%下滑至7.83%。2022年,長亮科技的研發人員數量出現大幅變動,由2021年的977人下降至772人,變動比例達-20.98%,佔員工總數的11.22%。長亮科技回覆投資人稱,其中,主要是學歷爲本科、30歲以下的研發人員減少的幅度較大。

03華爲生態

華爲長期致力於人工智能核心技術的研發,去年推出了盤古大模型3.0,堅持“AI for Industries”理念,將人工智能技術深度融合至各個行業。作爲中國首個全棧自主、安全可靠的AI大模型,盤古大模型包括 “5+N+X”三層架構,採用完全的分層解耦設計,企業用戶可以基於自己的業務需要選擇適合的大模型開發、升級或精調,從而適配千行萬業多變的需求。

根據公開數據,華爲在2023年的研發投入達到了1615億元人民幣,研發費用率爲25.1%。近十年來,華爲累計投入的研發費用超過9773億元。截至2023年底,華爲有20.7萬名員工,其中研發員工約11.4萬名,約佔員工總數的55%。

目前,盤古大模型已經在10多個行業得到應用,並與多家公司產品和業務深入綁定。

1. 拓維信息

拓維信息是軟硬一體化產品及解決方案提供商,也是華爲雲首批同舟共濟合作伙伴、華爲“大模型+鯤鵬+昇騰AI+開源鴻蒙”全方位戰略合作伙伴,

拓維信息推出垂直行業大模型——交通CV大模型,根據公司介紹,交通CV大模型在盤古大模型的基礎上進行適配開發,使得模型精度提升了 6.21%,開發時間節約了24倍左右,大大降低了開發成本和難度,目前已在高速公路稽覈等場景得到了正式應用。

2023年前三季度,拓維信息研發費用1.46億元,同比增加36.45%,佔營收的7.79%。根據年度數據,拓維信息研發費用率從2018年開始呈現出逐年下降的趨勢,2018年爲11%,到2023年,預計佔總營收比例不足9%。2022年公司研發人員數量1122人,佔總員工數的27.9%。

2. 神州數碼

神州數碼主營業務爲雲計算和數字化轉型、信息技術應用創新、信息技術應用創新,深度綁定華爲,基於“鯤鵬+昇騰”生態打造神州鯤泰產品體系。

神州數碼推出了人工智能產品——“神州問學”平臺產品,該產品不是一款大模型,而是大模型集成和運營平臺,從模型、數據、算力、應用四個角度打通各項資源,協助企業投產和運營自己的大模型應用。

2019年至2023年,神州數碼研發費用分別爲1.46億元、1.82億元、2.40億元、2.91億元、3.44億元,同比增長幅度分別爲50.37%、24.92%、32.21%、21.15%、18.21%,近5年累計投入12.03億元研發費用。截至2022年底,公司研發人員數量爲791人,佔員工總數的14.98%。

3. 賽意信息

賽意信息面向通信、電子、家電、家居等23個重點行業提供產品及解決方案,攜手華爲雲聯合創新,基於盤古大模型的自然語言大模型和視覺大模型,共建盤古制造行業大模型。

去年10月,賽意信息發佈業界首個聚焦企業服務大模型的AIGC中臺(善謀GPT),能夠爲企業提供多模型對接、向量管理、私有模型預訓練與應用等能力,有多種應用場景,包括數字員工(智能引導)、智能單據(智能輔助)、企業知識庫(智能問答)、AI自動報價(智能報價)等。

根據公開信息,2018-2022年,賽意信息研發投入穩步增加,2022年研發費用達到2.69億,同比增長35.37%,研發費用率達11.84%;23年前三季度研發費用2.3億,同比增長27.21%,佔營收的13.67%。研發團隊人員數量從2017年末的412人增加到2022年末的2927人,研發人員佔比也突飛猛進,從2018年末的15.11%增加到2022年末的47.49%。

4. 超圖軟件

超圖軟件是聚焦地理信息軟件與空間智能領域的基礎軟件與應用軟件廠商,與華爲合作十分緊密,公司GIS基礎軟件全面支持鯤鵬、openguass、歐拉、鴻蒙、昇騰及AI等方面的技術。

在2023地理信息軟件技術大會上,超圖正式發佈SuperMapGIS系列產品的最新版本——SuperMapGIS2023,同時發佈了多個產品,包括跨平臺遙感影像處理桌面軟件、跨平臺電子海圖生產桌面軟件、Web端三維地理設計App、三維WebGPU客戶端等。

超圖軟件近年來研發投入逐年提高,2020年、2021年、2022年的研發投入金額分別爲2.53億元、2.68億元和3.12億元,分別佔營業收入比例15.7%、14.28%和19.53%;23年前三季度研發投入爲1.72億元,同比增長2.21%,佔營收的13.53%。2022年,研發人員數量1568人,佔員工總數的37.1%,同比增加21.55%。

04阿里生態

阿里巴巴聚焦於做好“AI時代的雲”,爲國內大模型提供AI算力底座。國內目前有超過一半的AI大模型公司跑在阿里雲上。同時,爲推動大模型在千行百業落地,阿里雲發佈了8大行業模型——通義聽悟、通義曉蜜、通義智文、通義星辰、通義靈碼、通義法睿、通義仁心、通義點金,讓大模型在金融、醫療、法律、編程、個性化創作等行業和場景中更易被集成。

阿里新發布的千億級參數規模的自研基礎大模型通義千問2.0,性能明顯提升,在10個權威測評中全面超越GPT-3.5和Llama2,加速追趕GPT-4。

2022年,阿里巴巴的技術相關成本費用超過了1200億元人民幣。這筆費用用於增強阿里雲在中國雲市場的領先地位,支撐消費者業務的先進技術需求,並推進對下一代技術的探索。近幾年,阿里巴巴每年在技術和研發上的投入都超過人民幣1000億元。僅就研發費用而言,阿里巴巴2023財年(2022年二季度-2023年一季度)研發費用567.44億元,佔營收的7%。

截至2023年一季度,阿里巴巴擁有23.5萬名員工。2021年7月,時任阿里雲智能總裁、達摩院院長張建鋒在鈦媒體峰會,談到阿里巴巴開發人員爲5至6萬人;按此計算,阿里巴巴研發人員佔比約25%。

1. 衛寧健康

衛寧健康專注於醫療健康和衛生領域整體數字化解決方案與服務,與螞蟻集團、阿里體系各公司已經開展了多項合作。

去年年底,衛寧健康發佈了醫療垂直領域大模型WiNGPT,基於通用大模型的技術,結合高質量醫療數據,針對醫療場景優化和定製,爲醫療行業各個場景提供智能知識服務。此外,衛寧健康還發布了基於WiNGPT的醫護智能助手 WiNEX Copilot,以及迭代升級後的WiNEX 產品與解決方案。

衛寧健康2023年前三季度研發投入2.23億元,同比增加5.18%,佔營業收入的11.73%。2022年,公司研發人員2487人,同比增長9.9%,佔員工總數的36.03%。

2. 金橋信息

金橋信息面向政務、司法、教育、醫療健康、金融等國計民生行業,爲客戶打造智慧空間信息化解決方案。金橋司法Saas業務目前全國3500家法院全覆蓋,與螞蟻集團已在執行、訴訟服務和智能庭審三大業務方向上擁有人工智能的行業解決方案。

金橋信息2023年3月在互動平臺表示,公司專注於政法行業的數字化轉型,積極佈局智慧法院尤其是人工智能方向的創新應用,目前主要是基於主流的大模型結合OCR、NLP、知識圖譜、語義分析、機器學習等人工智能技術,爲法院的數字化改革提供具有開創性、引領性的整體解決方案。

2023年前三季度,金橋信息研發費用2464萬,同比減少1.31%,佔營收的4.15%;2022年全年研發費用3990萬,同比增加14.26%。根據2022年年報數據,金橋信息研發人員數量273人,佔員工總數的35.18%。

3. 恆生電子

恆生電子聚焦金融行業,爲證券、基金、銀行等客戶提供金融科技解決方案。恆生電子已與阿里通義千問大模型在財富管理領域進行深度合作,雙方未來將在包括智能問答、智能外呼、智能助手等業務應用場景進行合作測試,將通義千問強大的自然語言理解和生成能力與恆生電子財富管理域的數據、場景、服務相結合,助力客戶服務體驗提升。

恆生電子自2014年正式啓動AI研究工作,目前已發佈20多款人工智能產品,打造了NLP、OCR、CV、知識圖譜等能力,同時將AI技術能力賦能到智能客服、智能投研、智能運營、智能營銷、智能投顧以及數據與風險相關的業務系統。

2023年,恆生電子研發費用爲26.61億元,同比增長13.42%,佔營收的36.55%;研發人員7,191人,佔員工總數的54.52%。

05瀾舟科技

瀾舟科技成立於2021年6月,是國內最早一批下場進行大模型創業的團隊。去年3月,瀾舟發佈了孟子GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公衆開放。

近期,瀾舟團隊完成了Mengzi3-13B的大模型訓練,並公佈了自己的“一橫N縱”體系。“一橫”是模型層,是孟子大模型技術基礎上研發的各個模型;“N縱”則是基於孟子大模型的面向ToB應用最重要的技術和產品。目前,瀾舟科技重點投入到了金融行業,輔助編程等領域,旨在通過更加全面、專業、優質的領域數據,打造更加貼近行業場景的垂直大模型。

瀾舟科技尚未公佈具體的研發費用數據,然而,從2021年成立以來,瀾舟科技一直致力於預訓練模型的研發與應用,並且在不到一年的時間裡完成了數億元人民幣的融資,這些融資主要用於自然語言處理(NLP)核心產品的開發和前瞻性研究。由於瀾舟科技與上市公司雲從科技、創新奇智達成戰略合作,市場上經常將雲從科技、創新奇智歸爲瀾舟科技孟子大模型相關概念股,不過,這兩家公司也同時擁有自研的通用或行業大模型。

1. 雲從科技

雲從科技孵化於中國科學院,圍繞AIGC、智慧金融、智慧治理、智慧出行及智慧商業等四大業務領域,是首家在科創板上市的人工智能平臺企業。伴隨着AI大模型時代來臨,雲從科技依託自主的預訓練大模型和在預訓練層調優模型的能力,於去年5月正式推出自研多模態大模型——“從容大模型”,成爲“百模大戰”中的一員。

從容大模型包含但不限於語言大模型、視覺大模型、語音大模型、代碼生成大模型以及圖像生成大模型等,它通過實時學習並同步反饋結果,可以解決諸多AI應用的痛點,從而有利於快速普及個性化應用。上個月,雲從科技還發布了3D行爲識別基礎大模型。

雲從科技和瀾舟科技已經在文檔自動化分析和理解領域開展聯合開發,針對銀行、保險等金融行業、房地產等行業的應用場景,通過OCR和多模態的NLP技術,對合同、文書等類型的文檔進行自動化的分析和理解,旨在提高相應領域的自動化程度,幫助傳統行業進行數字化轉型,提高生產力和企業運行效率。

2019年至2021年,雲從科技研發費爲4.54億元、5.78億元、5.34億元,同比增速206.47%、27.29%、-7.60%,佔當期總營收比56.25%、76.59%、49.67%;23年前三季度,雲從科技的研發費用爲3.15億元,雖然同比下降了26.74%,但營收佔比高達91%。

歷史數據顯示,雲從科技研發人員在逐年減少,2020年至2022年雲從科技研發人員分別爲997名、575名、552名;2023年上半年,研發人員522名,較2022年同期減少87名,但佔員工總數比例升至60.42%。

2. 創新奇智

創新奇智是國內最早一批投入工業製造數智化轉型的人工智能創新企業,不斷探索用前沿AI技術解決工業生產難題。依託在AI製造業的多年積累,在對開源免費大模型進行知識蒸餾的基礎上,創新奇智設計了適合工業場景的大模型神經網絡結構,推出了面向工業製造領域的百億參數量級行業大模型“奇智孔明AInnoGC工業大模型”。

上個月,創新奇智發佈了升級後的奇智孔明工業大模型2.0版本(AInno-75B)及多款大模型原生應用。本次升級後的奇智孔明工業大模型在參數量級上實現了新突破,達到750億以上,同時增強了海量知識管理、複雜邏輯推理、長流程任務編排、Agent智能體以及更多工業模態的生成能力。

去年3月,瀾舟科技與創新奇智攜手,發揮各自在計算機視覺、機器學習和自然語言處理技術領域的優勢,構建完整AI2.0技術版圖,共同探索類ChatGpt、AIGC等前沿技術在製造和金融等領域的技術創新並進行商業化落地嘗試。

2023年,創新奇智的研發投入爲4.5億元,同比下降8.17%,佔營收的25.7%;2022年,其研發投入同比增長27%至4.16億元,研發費用率由2021年的38.1%降至26.7%。截至2021年底,公司共擁有259名技術人員,佔公司員工數量的56.7%。

06字節跳動生態

與其他國內自研大模型相比,字節跳動的大語言模型雲雀大模型有些姍姍來遲,在2023年8月首發。這是一個基於字節跳動機器學習平臺開發的自然語言內容生成和內容理解的AI大模型。今年4月,雲雀大模型將發佈重要版本的升級更新。

與國內外大模型公司“先通用大模型,後產品應用”的思路不同,素有“應用工廠”之稱的字節跳動選擇在雲雀大模型的基礎上,打造十幾款AI原生應用,包括AI對話產品“豆包”、AI應用平臺“釦子”、AI角色互動產品“小悟空”等,目前主要應用於字節跳動旗下產品中。

據界面報道,字節跳動旗下剪映已在數月前組建封閉團隊,秘密研發AI產品。目前,該團隊仍處於嚴格保密階段,研發的產品還未上線。

字節跳動在2022年的研發支出爲87億美元(約629億人民幣),這一數字低於2021年的146億美元(約1039億人民幣),佔2022年營收的10.21%。目前,字節跳動的員工已超10萬人,研發人員數量暫未披露。

截至去年9月,字節跳動持有掌閱科技股份比例爲7.29%。前不久,掌閱宣佈正式接入市場上的主流AI大模型,將其運用於內容生成的Prompt Engineering工作,進一步提高了內容創作的效率和質量。目前,相關產品仍處於小範圍用戶測試階段,推廣時間尚不確定。

2023年前三季度,掌閱科技研發費用1.78億,同比增加17.9%,佔營收的9.07%;2022年全年研發費用爲2.19億,同比增加28.6%。據2022年數據,公司研發人員293人,佔員工人數的35%。

07小米生態

2023年4月,由小米集團AI實驗室主任、自然語言處理(NLP)首席科學家王斌牽頭負責,小米技術委員會AI實驗室大模型團隊負責人欒劍帶隊,在小米內部正式成立了一支自研大模型團隊。2023年8月,雷軍在年度演講中透露,小米大模型的主力方向是輕量化和本地部署,讓大模型在手機端就可以應用落地。在團隊成立到年度演講的四個月中,小米大模型團隊迭代了13億參數和60億參數兩代產品,截至2023年8月14日,小米60億參數的自研大模型在C-EVAL權威榜單上取得同參數量級排名第一,在CMMLU中文向大模型取得排名第一。

不同於百度的文心一言、科大訊飛星火等通用大模型,小米自研大模型更強調跟產品的結合和場景的驅動,更多地考慮大模型和小米應用場景的結合,當前主要應用於小米手機、小米汽車、小米智能家居等公司內部業務場景。“人車家全生態”是小米全新升級的未來戰略,小米希望通過大模型這樣的基礎設施,支撐未來智能生活場景服務。

其實在2016年AlphaGo發佈後,小米就開始大力投入AI視覺領域,後來逐漸拓展到其他領域。小米有3000多人在做AI相關的研發工作,在視覺、聲學語音、NLP、知識圖譜、機器學習等方向都有技術積累。目前,小米正在和芯片公司合作,共同推動端側大模型的落地。

同時,小米也與金山辦公密切合作。去年10月,WPS AI在小米14系列手機新品發佈會上亮相,展示了WPS 的“隨手拍”和“一鍵生成PPT”兩項AI 功能。小米與WPS邀請用戶申請體驗移動智能辦公,小米14系列手機用戶可通過小米社區下載搭載WPS AI功能的專屬版WPS。

2023年,小米研發費用191億元,同比增長19.2% ,佔營收的7.05%;研發人員總計達17800人,涉及多個部門,佔員工總數的52.93%。

從大模型技術外輸上看,此前有消息稱,小米AI大模型的“AI+智能家居”將在趣睡科技實現首個商用落地。小米旗下的順爲科技,是趣睡科技的第二大股東,截至2024年2月8日,持有趣睡科技7.65%的股權。2024年1月,小米與趣睡科技聚焦牀上用品品類達成戰略合作協議。

然而,主打堅持“科技提高體驗”產品觀念的趣睡科技,卻一直因科技含量低飽受詬病。2022年,公司研發人員僅42人,佔員工總數的28.38%,研發人員數量較少、整體學歷不高、流動性大。從研發費用來看,趣睡科技與同行相比也是墊底。2021年、2022年及2023年前三季度,趣睡科技研發費用分別爲804.4萬元、683.61萬元及478.57萬元,分別同比減少30.83%、15.02%及6.46%,研發投入佔營業收入比例分別爲1.7%、2.12%及2.44%。

08自研大模型1. 崑崙萬維崑崙萬維是集精品自研遊戲研發、全球精品遊戲發行商、平臺和軟件商店三者爲一體的綜合性互聯網平臺公司,與奇點智源合作自研“天工”大模型。

“天工”具備強大的自然語言處理和智能交互能力,能夠實現個性化AI搜索、智能問答、聊天互動、文本生成、編寫代碼、語言翻譯等多種應用場景。基於“天工”,崑崙萬維已構建起AI大模型、AI搜索、AI音樂、AI Story、AI遊戲等AI業務矩陣。

爲全面落實公司“All in”AGI與AIGC的戰略佈局,崑崙萬維2023年前三季度研發費用提升至6.2億元,創上市以來同期新高,佔營收的16.85%;2022年,研發投入金額爲7.36億元,較2021年的6.8億元增長約17.2%。崑崙萬維的研發人員2022年數量爲1266人,佔員工總數的72.55%。

2. 三六零

作爲國內唯一兼具數字安全和人工智能雙重能力的企業,三六零基於近二十年在安全和AI領域的技術積累,總結出新一代安全大模型核心戰法,3月20日正式推出360安全大模型3.0。

三六零稱,基於類腦分區協同設計的安全大模型框架,三六零安全大模型3.0不僅可以解決任務衝突問題,達到多任務最優性能,而且實現了能力突破,在多個專業任務效果上超過了GPT4。

2023年前三季度,三六零研發費用爲23.14億元,同比下滑8.25%,佔營收的34.34%,繼續保持研發投入高佔比。截至2022年底,公司研發人員數量爲3602人,佔員工人數的55.58%。

3. 科大訊飛

科大訊飛作爲國內知名的智能語音技術提供商,發佈了“星火認知大模型”,對標ChatGPT,具備跨領域的知識和語言理解能力,能夠基於自然對話方式理解與執行任務。科大訊飛佈局“1+N”戰略體系,“1”是通用認知智能大模型,“N”則是應用於教育、辦公、汽車、數字員工、醫療等多個行業的應用成果。

2023年前三季度,科大訊飛研發費用爲24.98億元,較去年同期增長超過1億元,佔營收的19.8%;22年全年研發費用31.11億元,同比增長9.95%。2022年,研發人員9,281人,同比增長10.92%,在整體員工中的佔比提升至61.68%。

4. 金山辦公

2023年初,金山辦公宣佈All in AI,將LLM能力全面引入產品,發佈基於大語言模型的智能辦公助手WPS AI。2023年9月,在每年一度的技術開放日上,金山辦公首次對外展示了自研模型的最新進展。該模型基於開源底座,進行參數量爲7B、13B的小模型訓練調優,以滿足應用端的細分化場景需求。

據金山辦公高級副總裁畢曉存介紹,在與國產大模型平臺合作的過程中,由於各家API(應用程序編程接口)不同,金山辦公做了一個統一的接入層,去調用不同的大模型,而基於大模型的介入成本考慮,小衆場景則需要金山辦公的自研模型補充滿足需求。

目前金山辦公合作的通用大模型平臺包括MiniMax、百度文心一言、智譜AI,基於大語言模型的智能辦公助手WPS AI已接入金山辦公全線產品,輔助WPS實現覆蓋文檔、PPT、表格等形式的內容生成能力。

2024年3月底,金山辦公聯合華科大推出文字多模態大模型TextMonkey,在多項文檔理解任務上取得國際領先,向通用文字識別邁出堅實的一步。金山辦公CEO章慶元曾表示,未來金山辦公一定會解決大模型自主可控的問題。未來金山辦公是否會推出全自研的大模型,值得我們期待。

2023年,金山辦公研發費用14.72億元,同比增長14.72%,佔營收的32.3%;研發人員3087人,佔總員工數比例約68%。

09總結

技術創新高度依賴研發投入。根據上文中的數據,我們可以發現,在AI大模型行業,相關上市公司的研發投入有巨大差異,季度研發費用支出從百萬級至破數百億,研發人員數量從數百至上萬,這與公司規模、市場定位、模型特點、業務需求以及企業戰略規劃等多種因素有關。縱觀AI大模型相關上市企業,基礎大模型研發企業、尤其是多模態企業研發投入巨量,而站在基礎大模型肩膀上研發應用端大模型的企業,研發投入相比之下有斷層式的距離。不同行業的AI應用層企業,也因主營業務的不同,研發投入大相徑庭。

放眼全球範圍,從研發支出總額看,國內企業和國際相比,不僅差距仍大且還在拉開差距。例如,亞馬遜在2021年的研發支出爲560億美元,而華爲、阿里、騰訊、百度、中興、美團、京東、快手、本站、小米10家企業2021年研發支出總和爲575億美元,僅比亞馬遜高15億美元。

在經濟波動的逆流中,穩定而有效地平衡研發投資及其成果產出,是各個企業確保在未來經濟週期中保持競爭優勢、追趕國際先進水平的關鍵策略。