承認、道歉、刪除!斯坦福AI團隊抄襲中國大模型

5月29日,斯坦福一AI團隊發佈了一個名爲Llama3-V的多模態大模型,宣稱只需500美元就可訓練出一個性能可與GPT4-V媲美的模型。但隨後,該團隊發佈的模型被指抄襲,其與國內清華系大模型相似度極高。面壁智能CEO李大海和聯合創始人劉知遠先後發文迴應,表示這是一種受到國際團隊認可的方式,但希望大家共建開放、合作、有信任的社區環境。目前,該團隊已公開道歉,並刪除了相關庫和官宣推文。

斯坦福AI團隊抄襲,成員公開道歉

斯坦福大學AI團隊在2024年5月29日發佈了一個名爲Llama3-V的多模態大模型,聲稱只需500美元就能訓練出一個性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速躥紅,還一度衝上了HuggingFace趨勢榜首頁。

圖片來源:X

然而,一名細心且熱心的網友發現,該團隊發佈的Llama3-V和國內大模型MiniCPM-Llama3-V 2.5有極高的相似度,後者是由國內大模型初創企業“面壁智能”和清華大學自然語言處理實驗室聯合推出的。

網友還在在面壁智能GitHub的項目下放出了一系列證據。

該網友表示,這兩個模型的結構、代碼、配置文件都一模一樣,只有變量名被替換了。

兩個模型的代碼對比圖片來源:GitHub

隨後,面壁智能首席科學家、清華大學長聘副教授劉知遠在知乎上回應,MiniCPM-Llama3-V 2.5在研發時內置了一個彩蛋,就是對“清華簡”的識別能力,而Llama3-V模型居然也有一模一樣的能力。

清華簡是清華大學於2008年7月收藏的一批戰國竹簡,爲戰國中晚期文物。劉知遠透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓練圖像是最近從出土文物中掃描並標註,且尚未公開發布。

關鍵性證據這不就來了!

圖片來源:知乎

而兩個模型在識別的表現上,正確的結果上基本一致,錯誤的情況也頗爲相似。

遭到大量質疑後,該斯坦福團隊成員已刪除他們在X上官宣模型的推文,並將該項目在Github和HuggingFace上的庫一併刪除。

圖片來源:X

最新消息,4日,斯坦福Llama3-V團隊的兩位作者森德哈斯·沙瑪(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平臺上就這一學術不端行爲向面壁MiniCPM團隊正式道歉,並表示會將Llama3-V模型悉數撤下。

阿克沙表示,“首先,我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪,以及穆斯塔法(Mustafa)一起發佈了Llama3-V,穆斯塔法爲這個項目編寫了代碼,但從昨天起就無法聯繫他。我與森德哈斯·沙瑪主要負責幫助穆斯塔法進行模型推廣。我們倆查看了最新的論文,以驗證這項工作的新穎性,但並未被告知或意識到OpenBMB(清華團隊支持發起的大規模預訓練語言模型庫與相關工具)之前的任何工作。我們向作者道歉,並對自己沒有努力驗證這項工作的原創性感到失望。我們對所發生的事情承擔全部責任,並已撤下Llama3-V,再次致歉。”

此外,斯坦福人工智能實驗室主任克里斯托弗·大衛·曼寧(Christopher David Manning)也發文譴責這一抄襲行爲。

圖片來源:X

面壁智能迴應:“技術創新不易”“深表遺憾”

據第一財經報道,6月3日,面壁智能CEO李大海及其聯合創始人劉知遠相繼公開發聲,就他們公司的開源模型被斯坦福大學AI團隊疑似抄襲的問題作出了迴應。

李大海在聲明中表達了對此事的深切遺憾,並指出,儘管從某種程度上看,這種模仿可以被視爲他們的成果得到了國際團隊的某種認可,但他更強調應該構建一個開放、協作且充滿信任的技術社區環境。他進一步強調,他們希望團隊的努力和優秀工作能夠吸引更多人的關注和認可,但並非以這種被模仿甚至抄襲的方式。

圖片來源:第一財經

面壁智能首席科學家、清華大學長聘副教授劉知遠也表示,人工智能的飛速發展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作爲語言模型基座。而開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑後已在Huggingface刪庫,該團隊三人中的兩位也只是斯坦福大學本科生,未來還有很長的路,如果知錯能改,善莫大焉。

天眼查APP顯示,北京面壁智能科技有限責任公司成立於2022年8月,法定代表人爲曾國洋,董事長爲李大海,註冊資本約52.46萬人民幣,經營範圍包括軟件開發、人工智能基礎軟件開發、人工智能理論與算法軟件開發、信息系統集成服務等。股東信息顯示,該公司由北京清語啓航科技中心(有限合夥)、曾國洋、李大海等共同持股。知識產權信息顯示,該公司已申請了多項專利,如“基於人工智能自適應的NLP大模型分析系統”“深度學習模型統一應用方法、裝置、服務器及存儲介質”“基於人工智能的對話預測方法、裝置及存儲介質”,當前部分專利已獲授權。此外,該公司還登記了“CPM模型能力展示平臺”“面壁智能模力表格文本生成系統”等多個軟件著作權。

面壁智能目前已完成兩輪融資。去年4月,公司完成由知乎、智譜AI投資的數千萬人民幣天使輪融資;今年4月,公司宣佈完成新一輪數億元融資,由春華創投、華爲哈勃領投,北京市人工智能產業投資基金等跟投,知乎作爲戰略股東持續跟投支持。

據其官網顯示,面壁智能聯合創始人、CEO李大海,碩士畢業於北京大學數學系,畢業後加入Google,成爲Google中國創始員工之一,後在云云網任工程總監,在豌豆莢任搜索技術負責人,連續12年創業經驗。2015年加入知乎,任知乎合夥人、CTO。

面壁智能聯合創始人、首席科學家劉知遠,是清華大學計算機系長聘副教授,智源青年科學家。主要研究方向爲自然語言處理、知識圖譜和社會計算。在人工智能領域著名國際期刊和會議發表相關論文200餘篇,Google Scholar統計引用超過3.1萬次。曾獲教育部自然科學一等獎、中國中文信息學會錢偉長中文信息處理科學技術獎一等獎、入選國家青年人才計劃、《麻省理工科技評論》中國區35歲以下科技創新35人榜單。

圖片來源:面壁智能官網

每日經濟新聞綜合第一財經、公開消息