AI明星企業血戰小模型,成本暴降還更省電費,加速AI普及

智東西(公衆號:zhidxcom)編譯 孟強編輯 雲鵬

智東西7月22日消息,據Venture Beat報道,上週,Hugging Face、Mistral AI和OpenAI於7月16日和18日相繼推出各自研發的小模型(SLM),承諾將先進的自然語言處理能力普及化。在過去,科技公司競相在大語言模型賽道上追求規模更大、更復雜的神經網絡,Venture Beat認爲,這些小模型開闢了新的賽道,還可能影響企業使用AI解決方案的方式。

小模型,顧名思義,是相對於大語言模型(LLM)而言的,它們一般來說具有較少的參數和較低的計算資源需求。與參數量動輒上千億甚至萬億規模的大語言模型相比,三個新的小模型:SmolLM、Mistral NeMo和GPT-4o mini的參數量可以在幾億到百億不等,從訓練量到能耗都低於大語言模型。三個模型雖然使用不同的方式實現AI普及化,但它們都有一個共同目標:將強大的語言處理能力帶給更多設備和應用。

一、小模型如何改變邊緣計算

Venture Beat認爲,Hugging Face的SmolLM是三者中最具革新性的。它專爲在移動設備上運行設計,擁有三種規格:1.35億、3.6億和17億參數量,方便邊緣設備進行AI處理,解決了數據隱私和延遲的關鍵問題。

SmolLM的意義遠遠不只是提升效率。讓邊緣設備也能用上AI處理,能夠讓設備應用在低延遲和高隱私保護的基礎上運行。在過去,很多複雜的AI功能因隱私或連接問題無法實現,有了SmolLM,這些功能或能走進現實。

此外,Mistral AI推出了Mistral NeMo模型,擁有120億參數量,上下文窗口可長達128k。Mistral NeMo面向臺式電腦,定位介於雲端大模型和超緊湊型移動AI之間,前者是在雲計算平臺上訓練和運行的大規模AI模型,後者是在資源受限的移動設備(如手機和可穿戴設備)上運行的高效、緊湊的AI系統。

Venture Beat稱,Mistral NeMo的計算方法可能會給企業領域帶來不小的改變。該模型有潛力利用消費級硬件將複雜的AI功能普及化,這些功能曾經只是科技巨頭和資金充足的研究機構的專屬研究對象。這可能能幫助各行業普及AI驅動應用,比如優化客戶服務、提供更復雜的數據分析工具。

二、OpenAI的高效小模型GPT-4o mini價格美麗

OpenAI也推出GPT-4o mini,加入了小模型的競爭,該模型被稱爲市場上最具成本效益的小模型。輸入每百萬token僅需15美分,輸出每百萬token僅需60美分,Venture Beat稱GPT-4o mini大大降低了AI集成資金准入。

除此之外,GPT-4o mini的定價策略可能會催生出一波新的AI驅動創新,尤其是在初創企業和小型企業中。通過顯著降低AI集成的成本,該模型有效地降低了採用AI驅動解決方案的准入門檻。Ventrue Beat認爲,這可能會加速多行業的技術創新和改革。另外,這一向小模型的轉變反映了AI社區的新趨勢:研究人員和開發人員越來越關注效率、可及性和細分應用。這一趨勢可能會催生更有針對性和更高效的AI解決方案,優化特定任務和行業。

三、小模型推動綠色科技創新,減少技術碳足跡

向小模型轉變的趨勢也與對AI環境影響的日益關注相一致。小模型訓練和運行耗能更小,可能會減少AI技術的碳足跡。隨着各科技公司在可持續方面面臨越來越大的壓力,Venture Beat認爲,小模型的低能耗和低排放可能成爲一個重要的賣點。

這種向小模型的轉變的環境影響可能是深遠的。隨着AI變得越來越普及,更高效模型的普及所帶來的節能效益可能是巨大的。這或許能讓AI在綠色創新方面起到領導作用,而不是繼續加劇全球變暖。

然而,小模型的崛起也並非沒有挑戰。隨着AI變得越來越普及,偏見、問責制和倫理使用的問題變得更加緊迫。如果不加以監管,通過小模型普及AI可能會放大現有的偏見或產生新的倫理困境。對於小模型的開發者和用戶來說,除了技術能力之外,還必須優先考慮倫理問題。

結語:AI發展的未來指向多元化、專業化

雖然小模型在效率和普及性方面具有優勢,但由於參數量限制,它們在許多的任務上的處理能力可能無法與大語言模型匹敵。Venture Beat表示,這表明未來的AI發展格局中,將有各種規模的語言模型,而規模較小的模型將有自己所擅長的具體方面。

展望未來,我們期待看到AI模型的發展百花齊放,無論是大語言模型還是小模型,一刀切的方法都不可取,關鍵在於找到模型規模、性能和具體應用要求之間的平衡。對於企業和技術決策者來說,這三款小模型代表了向更高效、更專業、可部署的AI解決方案的轉變,爲AI在企業環境的整合提供了新的可能性。至於小模型是否能取代雲端大模型目前的主導地位,現在下結論還爲時尚早。

來源:VentureBeat