螞蟻集團續興中:保險科技新範式是領域大模型跟專業小模型的協同智能

來源:睿見Economy

2024年服貿會專題活動之一——“第六屆中國金融科技論壇”9月12日-13日在北京舉行,主題爲:科技賦能——金融業數字化轉型與應用。螞蟻集團保險智能科技部總經理續興中出席並演講。

續興中認爲,大模型技術很好地解決了,知識、邏輯推理和表達三方面的挑戰,讓高質量的保險服務普惠成爲了一種可能。

他表示,保險行業在大模型時代確實需要一個嚴謹可靠的領域大模型,但大模型並不是全部,並不是對過往積累的很多小模型專業工具的替代,需要的是大小模型能夠一起工作的範式。

他指出,保險科技新範式是領域大模型跟專業小模型的協同智能。

以下爲演講實錄:

各位來賓,大家上午好,我是來自螞蟻集團保險智能科技部的續興中,很榮幸能夠有機會向各位領導彙報螞蟻集團保險科技在大模型時代的一些心得和體會。

螞蟻保是螞蟻集團旗下的保險代理平臺。科技一直是我們平臺的核心基因, AI伴隨着我們的業務共同成長。 我們把螞蟻保的業務大致分成三個階段:前兩個階段平臺後推出了好醫保、全民保等普惠爆款產品,並圍繞這些產品建立了相應的風控、營銷、理賠等關鍵平臺服務能力。我們在技術上將這一時期,定義爲前大模型時代。其主要的工作是以判別式AI模型和優化模型爲主,針對具體的我們定義的一百多個業務子場景,持續迭代優化。過程中我們累積了500多個AI模型,幫助業務取得了顯著的降本增效成果。2023年以來,大模型橫空出世,讓我們的平臺進入了3.0智能時代。相比於上一個時代,我們這一波技術革命帶來的最大變革,是從降本增效型的工作轉移到了新的服務和新的質量。2C端我們藉助於對話式AI向客戶提供媲美專家的智能保險服務。在2P層面,我們面向公司內外的各個業務專家提供了相應的智能業務解決方案。

我們知道保險行業並不缺乏服務營銷人員,但爲什麼感覺高質量的保險服務非常稀缺呢?我們自己總結了三個原因:一是說保險行業本身是一個知識相對密集的行業,包含了大量醫學知識、保險知識和金融知識。以我們螞蟻保自身爲例,爲了做核賠理賠,僅我們內部的知識圖譜就累積了七千多種不同的疾病,這麼大量的知識光靠人,甚至是醫生,也是沒辦法學會和掌握的。二是保險服務本身是一個重決策,和流程相對複雜的行業,比如我們要對客戶進行風險的分析,對它的財務或者健康狀況進行相應的保險配置,甚至是針對某一個具體的保險合同做覈保、核賠相關的諮詢,這均需要專家的知識和推理。三是服務溝通的挑戰。保險的售賣流程相對較長,好的保險服務,往往需要長時間、多輪數的反覆溝通,過程之中不僅僅要體現出專業價值還要體現出情緒價值。

我們認爲大模型技術很好的解決了,知識、邏輯推理和表達三方面的挑戰,讓高質量的保險服務普惠成爲了一種可能。

但這並不是說我們把通用大模型直接應用到保險金融行業就可以了,我們的實踐中,抽象了三種挑戰。一是領域知識的挑戰。對於保險條款的具體問題,如果我們直接問通用大模型。通用大模型往往泛泛而談。在這個例子上,說了很多,最後還是建議客戶查閱保險相關的合同,沒有直接明確的解決客戶的問題。第二個是安全合規上的挑戰。保險行業是一個非常注重合規的行業。在這個例子裡面,通用大模型將壽險定義成了一種理財產品,如果我們直接使用這樣的回答,會對我們的經營產生不必要的合規風險。第三個是專業技能上的挑戰。保險並不是一個只需要說的行業,實際上在整個流程之中有很多專業的任務與服務。以理賠爲例,客戶會上交很多材料,比如在這個例子是住院記錄的材料,我們需要對這個材料進行相應的識別、提取跟推理。即使我們使用現在最先進的多模態大模型,6個提取的任務錯了3個,這是遠遠沒辦法滿足我們自動化理賠要求的。但事實上在小模型階段,如果使用OCR模型,就可以很好的解決這類問題。

總結一下,保險行業確實在大模型時代需要一個嚴謹可靠的領域大模型。同時我們也注意到大模型也並不是全部,並不是對過往我們積累的很多小模型專業工具的替代,我們需要的是大小模型能夠一起工作的範式。

首先解決第一點,螞蟻集團自身經驗表明如何爲保險行業兩定製一款嚴謹可靠的大模型。我們重點有兩方面的增強。一個是領域知識的增強,在持續訓練階段和對齊階段我們分別引入了百億Tokens的保險、醫學相應的知識,自身沉澱和準備了500萬條精標的指令數據。另一方面是安全可靠的增強,我們準備了200萬條金融價值觀對齊的指令集,長期維護了300人以上的專家標註隊伍,持續對我們的訓練數據、模型的表現進行安全合規跟對抗方面的標註。基於這兩方面的努力,我們的領域大模型-鳳凰大模型,相比於通用大模型,在保險專業、安全和合規等多個方面,有顯著的增強。

再一個問題,保險行業累積了大量的小模型和工具,如何將大模型,跟這些相應的工具和小模型能夠協同起來。螞蟻的經驗是使用多智能體的協同框架。我們自身也開源了這樣的一個框架叫Agent Universe,本質上是教會大模型在合適的時候, 使用合適的工具或者調用相應的模型。舉個例子,還是以理賠爲例,客戶上傳一張發票,大模型需要正確識別這是一張發票,然後調用相應的提取模型或者工具,如果說面有二維碼,相應的識別這個二維碼並且訪問它,最後對整體這張發票進行反欺詐的模型檢驗,這樣才能完成一個典型的複雜專業任務。

我們認爲保險科技新範式是領域大模型跟專業小模型的協同智能。針對這個新的範式,螞蟻保全面升級了保險的新服務,在2C端發佈了螞小財的智能保險和理財助理。2P層面我們針對保險各個環節,比如客戶服務營銷等環節,面向業務專家提供相應的智能解決方案。

首先簡單介紹一下螞小財。上週正好在外灘大會做了整體的升級,包括模型層面和品牌層面。 大家可以通過支付寶的螞蟻保直接就使用智能對話助理。這個例子表明,當用戶對一些具體的條款和自身的情況進行詢問的時候,我們的螞小財能夠實時準確的回答用戶的問題,並適時的推出相應的售賣推薦服務。事實上螞小財已經覆蓋了客戶的全生命週期,包括選配和投賠等多個不同環節,全網一千多個保險產品和內部的60多個工具,累積服務了4800萬用戶。在模型的表現方面,在保險通識問答準確率上,我們達到了92%的準確率,對於更加專業和嚴謹的兩核:核賠和核保類問題,我們進一步優化,達到了95% 以上的準確率。

第二是業務增長層面,AI一直以來,不管是在小模型還是大模型時期,對於保險的業務增長均非常關鍵。在營銷方面, 我們率先落地了多模態大模型在創意和文案生成方面的工作,再結合小模型比較擅長的個性化推薦,我們整體爲業務帶來了10%+的年均複利增長。在服務層面,上週我們向保險行業推出了AI+人工的服務解決方案, 其背後也是大小模型的協同框架。比如在售前,我們的小模型會對客戶進行分析,提供相應的智能線索。售中我們使用大模型的對話理解,適時的推薦銷售話術,事後對整體的對話進行質檢和覆盤。三者疊加,我們AI加持下的人工坐席其服務半徑相比傳統方式有3-5倍的提升。

相比於業務增長,我們認爲保險行業穩健經營更加重要。

風控層面,我們以小模型爲主,再加上運籌優化,覆蓋了保險產品的全鏈路,從產品定價到精算、覈保審覈、理賠的案件調整等。相比於行業來,我們在賠付率和減損方面有10%以上的優勢。

合規層面是我們今年新增的大模型實踐。大模型本身比較適合長文本的理解和多模態的理解, 而合規往往需要對大段條款進行理解,對不同的合規審覈點進行逐一校驗,我們認爲這樣的場景比較適合大模型。我們的合規智能體, 對我們平臺上售賣這些產品的銷售頁面,跟它對應的條款進行逐一、逐條的合規校驗。通過這種方式讓我們在經營之中發現所有的合規隱患。現在合規智能體,已經覆蓋了全平臺大概一千多款產品,平均每一款產品都要有200多個智能合規的校驗點。

最後講一下理賠,理賠是客戶對於保險感受最深的一個服務點,一直以來也是螞蟻保險科技投入的重點。過去依賴小模型,我們推出了安心賠的服務,當用戶提交了理賠申請之後我們承諾2日賠付。 在新的範式加持之下。我們突破了兩個難點:一個是高精度的信息提取,我們達到了99%的準確率,這個依賴於多模態大模型跟整體生成式提取的技術進步。再一塊是專家級的理賠審覈,我們知道理賠是個多步思考過程,我們同審覈專家進行步驟對齊,在審覈步驟的準確率上達到了98%的準確率。兩者疊加,再加上過去我們在小模型和自動化理賠鏈路的積累,使得規模化和端到端的秒級賠付成爲可能。上個月底,我們跟合作的保司進行秒賠服務的品牌上線,大概82%門診險客戶、51%的住院險,已經獲得了秒賠的服務體驗。

最後,新的科技範式在大模型時代纔剛剛開始,螞蟻保希望攜手各個行業夥伴,一起構築保險科技的新服務,謝謝大家。