☰

承認、道歉、刪除！斯坦福AI團隊抄襲中國大模型

5月29日，斯坦福一AI團隊發佈了一個名爲Llama3-V的多模態大模型，宣稱只需500美元就可訓練出一個性能可與GPT4-V媲美的模型。但隨後，該團隊發佈的模型被指抄襲，其與國內清華系大模型相似度極高。面壁智能CEO李大海和聯合創始人劉知遠先後發文迴應，表示這是一種受到國際團隊認可的方式，但希望大家共建開放、合作、有信任的社區環境。目前，該團隊已公開道歉，並刪除了相關庫和官宣推文。

斯坦福AI團隊抄襲，成員公開道歉

斯坦福大學AI團隊在2024年5月29日發佈了一個名爲Llama3-V的多模態大模型，聲稱只需500美元就能訓練出一個性能可與GPT4-V媲美的模型。Llama3-V不僅在社交媒體上迅速躥紅，還一度衝上了HuggingFace趨勢榜首頁。

圖片來源：X

然而，一名細心且熱心的網友發現，該團隊發佈的Llama3-V和國內大模型MiniCPM-Llama3-V 2.5有極高的相似度，後者是由國內大模型初創企業“面壁智能”和清華大學自然語言處理實驗室聯合推出的。

網友還在在面壁智能GitHub的項目下放出了一系列證據。

該網友表示，這兩個模型的結構、代碼、配置文件都一模一樣，只有變量名被替換了。

兩個模型的代碼對比圖片來源：GitHub

隨後，面壁智能首席科學家、清華大學長聘副教授劉知遠在知乎上回應，MiniCPM-Llama3-V 2.5在研發時內置了一個彩蛋，就是對“清華簡”的識別能力，而Llama3-V模型居然也有一模一樣的能力。

清華簡是清華大學於2008年7月收藏的一批戰國竹簡，爲戰國中晚期文物。劉知遠透露，識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能，訓練圖像是最近從出土文物中掃描並標註，且尚未公開發布。

關鍵性證據這不就來了！

圖片來源：知乎

而兩個模型在識別的表現上，正確的結果上基本一致，錯誤的情況也頗爲相似。

遭到大量質疑後，該斯坦福團隊成員已刪除他們在X上官宣模型的推文，並將該項目在Github和HuggingFace上的庫一併刪除。

圖片來源：X

最新消息，4日，斯坦福Llama3-V團隊的兩位作者森德哈斯·沙瑪（Siddharth Sharma）和阿克沙·加格（Aksh Garg）在社交平臺上就這一學術不端行爲向面壁MiniCPM團隊正式道歉，並表示會將Llama3-V模型悉數撤下。

阿克沙表示，“首先，我們要向MiniCPM原作者道歉。我、森德哈斯·沙瑪，以及穆斯塔法（Mustafa）一起發佈了Llama3-V，穆斯塔法爲這個項目編寫了代碼，但從昨天起就無法聯繫他。我與森德哈斯·沙瑪主要負責幫助穆斯塔法進行模型推廣。我們倆查看了最新的論文，以驗證這項工作的新穎性，但並未被告知或意識到OpenBMB（清華團隊支持發起的大規模預訓練語言模型庫與相關工具）之前的任何工作。我們向作者道歉，並對自己沒有努力驗證這項工作的原創性感到失望。我們對所發生的事情承擔全部責任，並已撤下Llama3-V，再次致歉。”

此外，斯坦福人工智能實驗室主任克里斯托弗·大衛·曼寧（Christopher David Manning）也發文譴責這一抄襲行爲。

圖片來源：X

面壁智能迴應：“技術創新不易”“深表遺憾”

據第一財經報道，6月3日，面壁智能CEO李大海及其聯合創始人劉知遠相繼公開發聲，就他們公司的開源模型被斯坦福大學AI團隊疑似抄襲的問題作出了迴應。

李大海在聲明中表達了對此事的深切遺憾，並指出，儘管從某種程度上看，這種模仿可以被視爲他們的成果得到了國際團隊的某種認可，但他更強調應該構建一個開放、協作且充滿信任的技術社區環境。他進一步強調，他們希望團隊的努力和優秀工作能夠吸引更多人的關注和認可，但並非以這種被模仿甚至抄襲的方式。

圖片來源：第一財經

面壁智能首席科學家、清華大學長聘副教授劉知遠也表示，人工智能的飛速發展離不開全球算法、數據與模型的開源共享，讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作爲語言模型基座。而開源共享的基石是對開源協議的遵守，對其他貢獻者的信任，對前人成果的尊重和致敬，Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑後已在Huggingface刪庫，該團隊三人中的兩位也只是斯坦福大學本科生，未來還有很長的路，如果知錯能改，善莫大焉。

天眼查APP顯示，北京面壁智能科技有限責任公司成立於2022年8月，法定代表人爲曾國洋，董事長爲李大海，註冊資本約52.46萬人民幣，經營範圍包括軟件開發、人工智能基礎軟件開發、人工智能理論與算法軟件開發、信息系統集成服務等。股東信息顯示，該公司由北京清語啓航科技中心（有限合夥）、曾國洋、李大海等共同持股。知識產權信息顯示，該公司已申請了多項專利，如“基於人工智能自適應的NLP大模型分析系統”“深度學習模型統一應用方法、裝置、服務器及存儲介質”“基於人工智能的對話預測方法、裝置及存儲介質”，當前部分專利已獲授權。此外，該公司還登記了“CPM模型能力展示平臺”“面壁智能模力表格文本生成系統”等多個軟件著作權。

面壁智能目前已完成兩輪融資。去年4月，公司完成由知乎、智譜AI投資的數千萬人民幣天使輪融資；今年4月，公司宣佈完成新一輪數億元融資，由春華創投、華爲哈勃領投，北京市人工智能產業投資基金等跟投，知乎作爲戰略股東持續跟投支持。

據其官網顯示，面壁智能聯合創始人、CEO李大海，碩士畢業於北京大學數學系，畢業後加入Google，成爲Google中國創始員工之一，後在云云網任工程總監，在豌豆莢任搜索技術負責人，連續12年創業經驗。2015年加入知乎，任知乎合夥人、CTO。

面壁智能聯合創始人、首席科學家劉知遠，是清華大學計算機系長聘副教授，智源青年科學家。主要研究方向爲自然語言處理、知識圖譜和社會計算。在人工智能領域著名國際期刊和會議發表相關論文200餘篇，Google Scholar統計引用超過3.1萬次。曾獲教育部自然科學一等獎、中國中文信息學會錢偉長中文信息處理科學技術獎一等獎、入選國家青年人才計劃、《麻省理工科技評論》中國區35歲以下科技創新35人榜單。

圖片來源：面壁智能官網

每日經濟新聞綜合第一財經、公開消息

承認、道歉、刪除！斯坦福AI團隊抄襲中國大模型

相關資訊