百川大模型內測,王小川的話比模型更有噱頭

王小川坐在偌大的沙發中,被記者圍在中間,帶着他招牌式的笑容不緊不慢地語出驚人:大模型的機會不一定落在大廠裡。

這是8月8日百川智能的Baichuan-13B百川大模型發佈現場。而王小川的言外之意是,大廠那點玩意兒,我們幾個月就能搞定。

確實,從4月宣佈下場做大模型後,百川智能太快了——6月發佈70億參數開源大模型Baichuan-7B,7月發佈130億參數開源大模型Baichuan-13B,他說這話的時候才8月8號了,Baichuan-53B的參數已經達到530億。

不僅叫囂了大廠,Baichuan-53B發佈那天,王小川還順便提了一句王慧文:他是國內做這麼多大模型企業中,唯一一個沒有技術背景的。

王小川這句話其實還有後半句:做大模型需要做大量的技術決策,如招什麼人、走什麼技術路線、需要多少計算資源,沒有技術背景做大模型壓力會大很多,但是技術足夠的話,其實是件挺愉悅的事情。

話說沒有技術的王慧文,在今年初ChatGPT大潮涌動時,攜千萬資金和頂級VC創立了大模型公司北京光年之外,後因抑鬱症不得不退出,公司則由好友王興收購,成爲一段互聯網兄弟情的佳話。

光年之外同百川智能同屬於創業型“小廠”,而王小川和王慧文又都屬於清華系畢業。怎麼說呢,王小川的這句“王慧文沒有技術背景”,在發佈會那天實在有些喧賓奪主。

但又因爲這句話,讓這場平淡的大模型發佈會多出一些“色彩”——起碼不至於太無聊。

要知道,大模型實在太多了。

今年上半年,從百度發佈文心一言開始,國內各互聯網、科技公司就排着隊的發佈大模型產品,開源的、閉源的、通用的、垂直的,到今天“大模型”這三個字足以讓人的情緒從新鮮變噁心。

而Baichuan-53B從實測來看,也只能說是一個衆多大模型中的合格產品。

從內測生成的結果看來,作詩、寫文章、理解語義、邏輯推理以及基礎算術,都達到了一個合理的範疇。因爲沒有聯網,近期的信息並不能精準地獲取,這一點來說,還需要接下來的版本迭代。

總的來說,Baichuan-53B模型並不會讓人眼前一亮,但也沒有什麼大的紕漏——大模型技術經過這半年的飛速迭代,普遍都能做到不再“胡說八道”, Baichuan-53B亦如此。

但話說回來,排在隊尾的“小廠”百川智能,如果不在發佈會上喊出什麼驚世駭俗的話,Baichuan-53B百川大模型的內測發佈,又怎能博得眼球呢?

以下爲AI藍媒匯對Baichuan-53B百川大模型的部分測試:

我們給出“我把肉桂放進冰箱化成小鳥”這樣無厘頭的題目,Baichuan-53B生成的詩看起來還不錯,能將肉桂、冰箱、小鳥這三個毫不相干的詞彙聯繫起來。

很遺憾,Baichuan-53B掌握的信息比較滯後,對於這一屆年輕人,上面列出的偶像非常具有“年代感”了。

Baichuan-53B沒有接入互聯網,並不知道8月14日將舉辦的雷軍演講,但是這種情況下,大模型不應給出去年的答案來誤導提問者。

在做“AI男友”方面,Baichuan-53B很“爽快”和“貼心”,甚至展示了“人性”的一面。

Baichuan-53B準確地分析了《石壕吏》的寫作背景和意圖,以及作者的核心價值觀。

寫一篇自測短文,Baichuan-53B開啓“自誇”模式。

來源|AI藍媒匯 作者|黑羊