在地化繁中AI 能理解「很盤」

多家企業昨共同發表繁體中文AI大型語言模型「Project TAME」,藉由企業提供的電子業、石化業、醫療、法律等各專業領域資料,進行五千億字符(token)的預訓練,發展出在地化特色,可精準解釋「很盤」等繁中語境下的特定用法,現在已開放民衆跟企業使用,並導入產業應用。

「繁體中文專家模型開源專案TAiwan Mixture of Experts」(Project TAME)是擁有產業專業知識的開源模型,由多家企業聯合發起,與臺大資工系副教授陳縕儂合作、NVIDIA提供技術支持,總共預訓練五千億字符,目標是以在地化文化及用語,協助臺灣產業快速導入生成式AI落地應用。

參與專案的臺大資工系博士班學生林彥廷解釋,有三個需要臺灣在地化模型的原因,首先是針對繁體中文最佳化,其次是不讓文化、觀點及意識形態,集中在美國科技公司所開發的主流模型產品上,把臺灣文化放入自己的模型;第三點則希望進一步加強在地文化,精準推薦臺灣事物及細節。

林彥廷舉例,若詢問語言模型何謂買東西「很盤」,GPT-4o回答「價格合理」,Project TAME則精準回「買東西吃了虧」;若提供超商店員詢問「刷載具」的生活情境時,Project TAME也回答正確,GPT-3.5卻回答「使用信用卡」。

另外,Project TAME在臺灣的「大學學測、律師/中醫考試、導遊證照、駕照、臺灣在地化測驗」都分數優異,例如以去年律師考試第一試成績換算,TAME贏過近九成考生。