【財眼觀兩會】程京:構建中醫藥多模態大模型迫在眉睫

中新經緯3月9日電 題:構建中醫藥多模態大模型迫在眉睫

作者 程京 全國人大代表,中國工程院院士、生物芯片北京國家工程研究中心主任

2023年,ChatGPT的出現標誌着人工智能行業進入到了以大模型爲代表的快速發展階段。2024年初Sora所產出的視頻更是加速了AGI發展的步伐。未來基礎大模型與行業大模型的結合將會成爲AGI時代的操作系統,爲各行業領域開啓第四次產業革命。

大模型已經從ChatGPT文本信息對話、DALL.E文本生成圖片走到了最近的Sora文本生成視頻。而英偉達CEO黃仁勳、中國工程院院士張亞勤、360集團創始人兼董事長周鴻禕等認爲AI大模型的下一站是生命健康,解碼生命語言編碼,最大限度接近人類“永生”的夢想。

生命現象本質也是一種自然進化的精密語言編碼,尤其是生命科學領域中微觀世界的分子序列數據,這種語言編碼與自然語言具有許多相似之處,例如,蛋白質可以通過一個代表着氨基酸的字符序列表示,這與自然語言具有語法限制類似。

近年來,AI已經具備了理解真實世界的能力,AI製藥也將會迎來新的飛速發展。但殘酷的現實是,目前全球範圍內還未有AI開發的藥物能夠成功穿越臨牀Ⅱ期試驗的“死亡之谷”。據不完全統計,2023年全球至少有6條已進入臨牀階段的AI藥物管線停止研發,且都倒在了關鍵性臨牀Ⅱ期。這可能是因爲目前可供AI訓練的生命信息數據不夠多,理解還不夠聰明。

在創新藥物領域,中國90%以上的原創藥物來自國外,90%以上的藥品標準來自國外,一旦遭遇極端封鎖的情況,我們極有可能在這個事關人民健康和生命安全的醫療領域被別人“卡住脖子”,這勢必影響到國家的安全和穩定。

幸運的是,中國擁有自己的醫學寶庫,歷史悠久的中醫藥對人體、疾病、藥物的認識積累了龐大的實踐經驗,然而這座蘊含了中華民族幾千年的生命健康經驗的中醫藥寶庫正在被其他發達國家搶佔,中醫藥原創理論“鍼灸與經絡”是被搶佔的典例。在醫學四大頂刊及Cell、Nature、Science主刊發表的24篇鍼灸論文中,哈佛大學醫學院發表數量13篇位列首位。

除此之外,國際醫藥界也正利用其資金、技術、人才等優勢,積極開展中醫藥研究,開發高附加值產品,瑞士的羅氏製藥以八角、茴香中藥作爲原料生產磷酸奧司他韋,從1公斤八角、茴香到生產“達菲”附加值躍升逾1100倍。中國傳統中藥冬蟲夏草,瑞士諾華製藥將其開發爲價值達1萬元人民幣/盒的芬戈莫德,國外醫藥界以此攫取了中藥的高附加價值。

大模型的快速發展使其已經具備了理解模擬世界的能力,大模型與醫藥行業的結合有望革新藥物研發範式,而數據是大模型變得“聰明”的關鍵,中醫藥幾千年積累的知識寶庫作爲優質數據資源需要儘快佔領,構建中醫藥多模態大模型,搶佔中醫藥大模型高地迫在眉睫。

而目前國內提出的中醫藥大模型普遍以中醫藥傳統經驗知識圖譜作爲訓練數據,缺乏與生命底層語言的作用聯繫和顛覆性創新。由於生命是核酸和蛋白質等物質組成的分子體系,它具有不斷繁殖後代以及對外界產生反應的能力。當人患病服用中藥後,藥物成分就會與體內的分子物質,如核酸、蛋白質、糖等產生作用而發揮療效,過程中涉及人體疾病生命語言靶標發現、中藥對人體生命分子作用功能的大規模底層實驗數據、中醫藥算力算法等複雜計算和實驗、臨牀論證過程等。爲了促進中藥傳承創新,現建議如下:

在十四五計劃科技研發專項中,儘快設立重大專項,支持大學和企業聯合開展“用顛覆性技術構建中醫藥AI大模型”重大系統化工程,打造從底層中醫藥知識數據和實驗數據、中藥功能評價算法工具、中藥新產品開發智能平臺綜合解決方案的大模型賦能產業生態。開發符合中國人生命語言特點的原創中國藥,用創新中藥守住中國人生命健康紅線。(中新經緯APP)

中新經緯版權所有,未經授權,不得轉載或以其它方式使用。

責任編輯:宋亞芬