釋放更多數據動能!聯邦學習搭建隱私保護屏障,提升金融風控效率

(原標題:釋放更多數據動能聯邦學習搭建隱私保護屏障,提升金融風控效率

2020年,我國數字經濟規模達到39.2萬億元,佔GDP比重爲38.6%,目前位居於世界第二,其增速是GDP的三倍以上。

這一組數據來自於中國信息研究院發佈的《中國數字經濟發展白皮書(2021)》。按前述所言,可毫不誇張地說,數字經濟時代已然到來,成經濟增長的主要動力。

不過,數字經濟要想行穩致遠,核心前提是維護好安全這一“基石”。畢竟虛擬數字世界不斷擴張之時,現實生活中存在着泄露個人隱私的風險。

且於9月1月實施的《數據安全法》中明確,“鼓勵數據要依法合理有效利用,保障數據依法有序自由流動,促進以數據爲關鍵要素的數字經濟發展。”

而在科技賦能金融數字化轉型過程中,金融機構如何在保護個人隱私的前提下推動數據間協作?這成爲擺在行業面前的一道坎。

值得一提的是,對於解決“數據孤島”的難題,在行業普遍認知中,聯邦學習技術成爲有力的“武器”。

圖片來源於網絡

挖掘“跨域”數據價值

近些年,越來越多的企業意識到數據分析的重要性。在大數據“餵養”下,人工智能得以快速發展。換言之,深度學習的代表——人工智能之所以應用到各行各業,離不開數據支持。

不過,企業若不想囿於私域數據,被限制在“一隅”,且又要滿足數據合規問題的話,需要採用聯邦學習技術,方能挖掘“跨域”數據價值。

而所謂的“聯邦學習”是一種分佈式機器學習技術,在不交換數據樣本的情況下,在多個分散的邊緣設備和服務器訓練算法,以達到在數據“可用不可見”的基礎上進行安全聯合建模

簡單來說,聯邦學習具有衆籌和協作之意,搭建的系統具有聚合功能,其在推動數據融合,解決“數據孤島”難題上,釋放更多數據動能。

於企業而言,除私域數據之外,其還可將維度外域數據作爲參考,並以此爲基礎做出更爲準確的決策

且目前,聯邦學習已在醫療、金融、物聯網等領域有所應用。

其中,醫療行業中,國內三甲醫院保存的醫療數據量非常可觀,可涉及隱私問題,科技公司想要直接採集多家醫院的數據用於訓練並不現實。而聯邦學習解決人們最爲關心的隱私安全問題,醫療機構也才能放心將醫療數據用於AI訓練,突破了隱私的圍城

另外,聯邦學習已在金融行業中一些關鍵領域上取得了進展,聯合反洗錢建模、聯合信貸風控建模、聯合權益定價建模、聯合客戶價值建模等。

提升金融機構運營、風控效率

薩摩耶數科爲例,作爲與衆多流量方、金融機構有着業務往來的公司,其充分利用自身合作方優勢,可對獲客、運營、風控等效果提升有顯著幫助。

基於業界開源聯邦學習框架Fate,薩摩耶數科構建起了聯邦學習平臺。該平臺上各個參與方信息保留在本地,不泄露隱私也不違反法規。且在聯邦學習的體系下,各個參與者的身份和地位相同,建模效果與將整個數據集中放在一起的建模效果相同。

此外,該平臺將聯邦學習集成到了薩摩耶數科AI平臺,可以更容易地實現聯邦模型的訓練、上線以及模型管理等功能,使聯邦學習更簡單易用。兩者結合後還獲得了可視化聯邦拖拽建模、模型管理及模型監控

具體來講,薩摩耶數科AI平臺統一了從特徵工程、算法建模、模型訓練、模型評估、模型發佈等全流程,實現界面配置,便於模型的統一管理和維護,節省模型從訓練到發佈的上線週期。同時,參考了業界主流AI平臺設計思想,用組件化開發實現各個業務功能流程,做到自定義可配置可擴展,同時也用Kubernetes實現容器化彈性快速部署。

且薩摩耶數科的AI平臺還具有私有化開放性、組件化的算法庫、代碼和組件相互轉換、進行自定義預處理、靈活定製不同模型的監控指標、支持Spark、TensorFlow等分佈式框架、自動機器學習功能(Auto ML)、跨平臺(Windows、Linux)使用、線上線下統一特徵管理等亮點

值得一提的是,開源版聯邦學習Fate提供了豐富的縱向與橫向開源算法及優秀的調度Fate_Flow,可在易用性上給用戶造成很大的影響,即使用者在使用開源版幾個月後仍不能熟悉和快速地使用Fate進行聯合建模。

而聯邦學習算法集成到薩摩耶數科AI平臺主要從兩個方面入手:一是改進Fate易用性,從上傳數據、訓練模型到在線預測上線模型三大主要階段,通過簡單前端操作一鍵執行,並且對訓練模型這個主要的模塊進行前端拖拽建模,在線預測模塊進行一鍵發佈、停止、跑批等功能,並和薩摩耶數科AI平臺保持一致

聯邦學習集成到薩摩耶數科AI平臺的第二階段,將開發自動建模平臺AUTOMAN算法聯邦化,目前Fate聯邦學習的算法是一些常用算法組件,相比AUTOMAN在風控建模方面的算法還是相對較少,後面將部分AUTOMAN算法進行聯邦化,並集成到AI平臺。

據瞭解,薩摩耶數科旗下的AUTOMAN自動建模平臺是將人工智能應用在模型設計領域,使模型開發週期減少60%-80%,最短可在1周內完成千萬級樣本建模任務,極大地縮短原始樣本與經營決策的距離,實現整體降本增效

未來,薩摩耶數科聯邦學習平臺將實現AUTOMAN自動建模平臺的聯邦化,以此提供更加豐富的模型。同時,結合使用聯邦學習商業版FDN技術支持軟件,提供更多模型維度,使得模型準確度大幅提升。