在地化的繁中AI語言模型TAME發表 精準解釋買東西「很盤」

「繁體中文專家模型開源專案TAiwan Mixture of Experts」(Project TAME)是由多家企業聯合發起,與臺大資工系副教授陳縕儂合作,NVIDIA提供技術支持,今日舉行成果發表。記者李芯/攝影

多家企業今日共同發表繁體中文AI大型語言模型「Project TAME」,該模型藉由企業所提供電子業、石化業、醫療、法律等各專業領域資料,進行5000億字的預訓練,發展出在地化特色,可以精準解釋「很盤」等繁中語境下的特定用法,甚至在國考、升高中大學的題目上,能拿到的分數也遠高於GPT-4o、Gemini等其他語言模型。

今日舉行成果發表的「繁體中文專家模型開源專案TAiwan Mixture of Experts」(Project TAME)是由多家企業聯合發起,與臺大資工系副教授陳縕儂合作,NVIDIA提供技術支持,總共預訓練5000億個字。Project TAME是基於Llama 3 8B、70B的版本,訓練框架爲NVIDIA NeMo Megatron,推論框架爲NVIDIA TensorRT-LLM,演算法及算力的支持則來自NVIDIA Taipei-1的DGX H100。

Project TAME使用多家企業所提供的各領域專業資料進行訓練,因此參與專案的臺大資工系博士班學生林彥廷強調其具有在地化的特色,避免模型以美國爲主的意識形態、文化觀點。舉例來說,若詢問語言模型何謂買東西「很盤」,GPT-4o回答「價格合理」,Project TAME則精準給出「買東西吃了虧」的正解。而讓幾個模型考臺灣國考、高考及升高中、大學的考試時,總共37個題目,Project TAME拿到的分數遠高於GPT-4o、Gemini等其他模型。

和碩聯合科技研發經理朱仕任指出,和碩在過去10幾年,一直在不同階段的軟體系統開發工作流程,目標是讓企業用更低成本追求更高的自主營運。長春集團則透過公司內部的AI「iGenie」作爲集團工安問題、產品資訊的知識庫,並能做請假、預約會議室等庶務申請,未來希望能打造通用機器人,代替人進入石化業工作場所的危險場域。

長庚醫院分享,醫院內部已經完成5項生成式AI的落地應用,包含護理會診、行政規章、專科照會等等。律果科技則協助Project TAME加入臺灣法律語料進行訓練,目前已經在臺灣律師考試題目上試用。欣興電子透過公司內部資料庫,把模型調校成內部專用的產業專家模型,預計未來可提供更符合公司內部作法的準確建議,提升工作效率。

長春集團董事長林顯東表示,符合臺灣文化的語言模型,將爲繁中使用者帶來更精準的本地AI應用,除了提升用戶體驗,也將提升臺灣在AI技術領域的競爭力,因此發表會後將開源模型給全球使用,不僅是技術共享、更是文化的傳承與發揚。

延伸閱讀