大模型時代,一個胰腺癌病人用AI造夢丨AI羣像①

南方財經全媒體記者江月 上海報道

2024年上半年,林逸飛一直在爭取用大模型改造他的一款醫學問答RAG產品,與此同時,他是一名胰腺癌手術預後病人。“胰腺癌的五年生存率只有7%到10%,而我已經用掉了一年。”林逸飛向南方財經全媒體記者稱。

林逸飛相信,人工智能的應用可以幫助胰腺癌新患者做更好的療程安排乃至心理建設。大語言模型在2023年的盛行,給他似乎帶來了一個良好的契機,它們帶來體驗感很好的自然語言問答和檢索調取。

這期間,大模型開發熱潮有些降溫,冷靜下來的人們都在等待:AI到底能在什麼樣的場景裡做出什麼樣的事?AI應用的落地,比人們想象得要慢一些。

有人直言:這只是個夢想計劃。在資本堆疊的人工智能市場裡,不追求商業變現的想法看起來太夢幻、太不實際了。

“我很理解公益項目從商業變現上說不清楚。”林逸飛向南方財經全媒體記者表示,然而,人們不是一直都說“科技讓生活更美好”嗎?

林逸飛幸運地在項目運營了快一年之際,遇到了願意幫助他的人。在大模型公司零一萬物運營開源生態團隊的林旅強,目前在用開源的資源支持林逸飛做這個醫學問答產品。

林逸飛和林旅強接受南方財經全媒體記者的採訪,講述了這個在資本浪潮裡用AI造夢的故事。

小胰寶

和把照片AI化、用逼真擬人語氣對話的機器人相比,小胰寶看起來太不“炸裂”了。對話框裡的回覆光標持續閃爍的幾秒鐘裡,它彷彿在慢速思考,而胰腺癌病人在焦急地等待它告訴自己: “請問,出現腹水該如何處理?”“內鏡下膽管支架置入術後併發症的預防和管理策略有哪些?”“化療後引起腳麻,都是怎麼處理的,吃什麼藥?”等等。提問者往往正處在身心的巨大痛苦中。

胰腺癌是全球發病率排名第九位的癌症,每年大約有幾十萬新發病例。這種病通常在晚期才被發現,也導致惡性率高、預後效果差。可以想象,每個面對確診消息的病人都將無法接受。

作爲一個已經和胰腺癌抗爭了一年的病人,林逸飛將自己生命可能是最後一段的時光投入到了自救中,但同時也將自己所蒐集到的病患知識用一種程序員的方式分享了出來。

2023年,林逸飛被醫生告知存在胰腺癌的風險,他感到這個預言有可能是真的。

他上網搜索“胰腺”。胰腺,脊椎動物具有的擔當外、內分泌功能的腺體,產生幫助消化食物的酶和幫助管理血糖的胰島素;高等脊椎動物的胰由腸上皮細胞特化,人胰橫臥於腹後壁和胃後,胰頭位於十二指腸彎內,胰體佔據大部,胰尾延伸到脾,重約90克。

對一種疾病的瞭解旅程自此開始,新靶點claudin 18.2、埃克替尼/厄洛替尼/吉非替尼/阿法替尼/奧希替尼、腹水、超進展基因、腹腔轉移後腹膜癌……這些新鮮的醫學名詞,隨着一次次手術和治療從陌生知識海洋裡跳出來,一個個砸向林逸飛。

“久病成醫”這個詞,描述了很多癌症患者患病後的狀態。不過,這是針對慢性病人的,對於那些需要爭分奪秒、和死神搶時間的病人而言,沒有機會給他們“久病”,他們需要在很短的時間(例如幾個月)內與醫生做出很多決定,這些決定往往是生死決定。

在林逸飛手術後第四個月,他有一種劫後餘生的感覺。這段時間裡,他獲得了確診的病理報告,但已經在一定知識瞭解的前提下接受醫生給出的詳細治療方案。逐步平復了心情、決心長期抗爭病魔之後,他萌生了一個知識分享的想法,作爲一個前企業級信息解決方案工程師,他在兩週時間之內使用開源資源,以自己學習的資料、病友羣的經驗和醫生信息作爲知識庫,整合了一個RAG。

“如果掌握科學的治療知識,患者可以和主治醫生、家屬商量,確定先做什麼、後做什麼,他就可以有更長的生存期,可以多陪陪家人、可以少受點痛苦。”林逸飛告訴南方財經全媒體記者,他指出雖然這個時間看起來不長,但對於胰腺癌病人來說“每一天都特別有價值”。“全球每年新增數十萬例胰腺癌病患,對他們而言,合適的療程就是在和時間賽跑。”林逸飛說。

這個RAG被命名爲“小胰寶”。林逸飛在小胰寶設置了一個置頂問題,即“胰腺癌的治療路線圖我該怎麼設計,才能少走彎路?”這是因爲腫瘤治療通常不是一次或者幾次的對症治療組合,而是按照時間、按照病情進展情況形成的複雜路徑,除了內外科治療,還包括營養支持、心理支持等綜合治療。對於正在和命運之神搶跑的病人而言,幾乎不可能掌握路線圖設計知識。

林逸飛告訴南方財經全媒體記者,胰腺癌知識其實“是用人命堆積起來的經驗”,而“病人的每一次選擇都是以生命爲代價的”。他引述了一個案例,2024年初,林逸飛在網上偶爾結識了一位外國的胰腺癌病友。這個病友沒有接受常規治療路徑,而是激進地優先嚐試了一種臨牀試驗方案,但在這個方案宣告失敗後,他不再具有回到二、三階段方案的可能性。

大模型

在應用大模型的初步階段,小胰寶被在投放到病友羣,效果比林逸飛預期得要差。

2023年,大模型爆發式進入開發期。大模型以前所未有的龐大語料庫作爲數據輸入、以龐大算法構建、用巨大算力推動,被認爲是一項人工智能具有革命性、劃時代的技術。不少人都認爲,大模型可以讓人工智能產品實現跨越式的功能改善。

但在實際應用開發中,大模型沒有想象中那麼神奇。

RAG(Retrieval-Augmented Generation)是一種將檢索和大語言模型(LLM)結合的人工智能系統,可以被理解爲一種大模型的垂直領域應用。

例如首先呈現在眼前的問題是數據依賴性。小胰寶性能很大程度上依賴於檢索到的信息相關性和質量。隨着用戶規模的擴大,病友對疾病產生方方面面的問題,知識庫的回答暫時無法面面俱到,甚或與醫生面診意見發生衝突。

很顯然,這個簡單的小工具還存在其他諸多潛在問題。例如,如果訪問量增大,是否檢索相關信息可能需要較長的時間、影響使用感?在檢索到大量相關信息時,是否能有效地整合這些信息,避免過多的信息導致生成文本的冗餘或不連貫?能否做出連貫的解讀,將多次檢索的信息整合進行完整的解讀?

“病人羣體的千變萬化,決定着這個小工具還有很多改進的空間,而我個人很難完成。”林逸飛向南方財經全媒體記者坦言。眼下,他仍需要接受定期化療。

小胰寶上線初期,有人在後臺投訴,有人在微信病友羣中謾罵。林逸飛稱:“用戶對這種產品的容錯率顯然幾乎是零。再這樣下去,小胰寶根本無法繼續運作了。”自然,這樣的負面評價讓原本就是病患本身的林逸飛遭受了身心雙重打擊。

此外,林逸飛考慮了小胰寶的長期運作問題,他希望能把成本降低至“零”。這主要因爲,他對自己生命的預期並不樂觀。“我希望未來仍能讓其他人無負擔地運營小胰寶。”林逸飛坦言。

考慮到壓縮成本,林逸飛去掉了“私有化部署”的環節,不購置算力顯卡。不過,使用大模型API要爲消耗token付費,這是繞不過去的一個付費環節。

爲了壓縮費用,林逸飛向多家大模型開發公司發出了請求。“我向很多家大模型公司都發了郵件,內容是介紹小胰寶產品,需求是請對方開放更多的token給我。”林逸飛稱。這個AI造夢計劃,得到了大模型開發商零一萬物的迴應。

零一萬物給林逸飛的回覆,在林逸飛看來非常慷慨。零一萬物不僅免費提供了所有API token,還有一位團隊負責人願意幫助林逸飛。

2024年5月初,零一萬物開源及開發者生態部的兩名同事在上海面見了林逸飛,兩週後,該部門負責人林旅強在工作彙報過程中將此事彙報給了零一萬物的人資負責人,其轉述給了李開復。

“開復博士已經知曉此事,並表示支持。”林旅強告訴南方財經全媒體記者。他表示,他計劃推動小胰寶以開源社區的形式開發下一個版本,而這將在零一萬物對其工作許可的前提下進行。南方財經全媒體記者向零一萬物確認了項目得到的內部支持。

給科技一點溫度

截至2024年6月初,小胰寶2.0版本仍然在技術籌備當中。小胰寶是否終將成長爲一款理想的醫療垂直AI工具?市場如何爲科技落地的過程買單?一場轟轟烈烈的科技浪潮除了能掀起金錢涌動,還能否順便帶給人間一些有溫度的美好?

上海億琪軟件有限公司CEO褚建琪向南方財經全媒體記者表示,他此前已經聽聞小胰寶,很佩服林逸飛與命運搏鬥的精神,但他坦言,小胰寶更接近夢想計劃,成功的可能性並不高。事實上,他認爲大模型討論過熱,而應用落地則要比人們想象要難得多。

“大模型太熱了,但應用變現遲遲不出現,市場太浮躁了。”他稱。

在褚建琪看來,醫療領域的人工智能應用開發成本比較高。“像這樣一款醫療領域知識庫,需要非常專業吧?那你得讓真正的醫學一線、頂級專家參與,這可能嗎?”

除此以外,大模型本身就是一項資本堆疊的投資。他指出,應用落地還需要模型調優、本地部署,意味着龐大的算力投入、技術人員投入。“現在買卡(算力芯片)有多不容易、多昂貴,可以想見投資之巨。”他稱。

但ROI投資回報率分析不能擊退所有的AI造夢計劃。

“我不尋求在市場上一枝獨秀,我只尋求對需要的人提供他們易獲得的產品。”林逸飛稱。“另外,會有大公司做這件事嗎?我個人是懷疑的。”

由於小胰寶的垂直領域十分狹窄,林逸飛感受到了大公司的壁壘。從他一次次的對外求助中,他稱:“你能感受到那種不對等性是做公益的最大阻礙。”他感到需要幫助的自己、醫患羣體是多麼渺小,而具備幫助能力的大公司是多麼龐大。

儘管也有大模型公司在幫助外部創業團隊打造垂直領域智能體,但小胰寶的需求並未被太多人聽見。

目前,開源世界的力量被林逸飛看作一條出路。“開源精神可以打破這種不對等性。”林逸飛稱。一些技術達人正在林旅強的號召下認識小胰寶。“我需要找到一些願意穩定爲小胰寶貢獻時間的人。”林逸飛表達了他的需求。

而對於林旅強而言,他也願意爲小胰寶儘量做多一些。“我們加入到小胰寶開源項目中,從開源項目治理來真的幫助到項目能更健康的持續成長。畢竟,當前這個項目就是林逸飛一個人搭建起來的,如果我們單純給到token,但林逸飛如果接下來無法繼續投入這個項目了,其實小胰寶也就停滯甚至停止了。”林旅強向南方財經全媒體記者表示。

如果小胰寶能向前走得更遠一些,也許會號召更多開發者使用大模型進行應用開發。“這可以成爲零一萬物Yi模型的use case。”林旅強稱。

而林逸飛還有更多規劃,他稱:“在胰腺癌領域的探索不會只成就一個產品,如果成功了,未來我們還希望向乳腺癌等更多的癌種擴展,這將獲得更多的市場需要。”

資本屬性仍然趨勢科技以冰冷的面孔前行,然而在這場全民關注的科技熱潮中,以人爲本的理念不應該被忘卻。科技本身是客觀、沒有溫度的,但使用科技的人心是有溫度的。

(小胰寶創始人在開發者社區使用英文名和真名活動,但其仍然希望在大衆媒體中保持匿名,爲了尊重他的意願,本文采用了林逸飛這個化名)