大變革已來,數據驅動,金融數據與模型深度融合

財聯社10月24日訊(記者 李翀)隨着大模型時代來臨,數據要素的變革在深刻影響金融業務生態的發展。10月18日,在“全球資產管理中心 上海國際活動周2024”第五屆1024資管科技開發者大會(ITDC2024)上,多位業內人士就大模型技術賦能金融數據業務創新發展接受了財聯社的採訪。

大模型技術助力數據要素的變革

數據作爲新時代信息革命的“石油”,其重要性不言而喻。

天雲數據CEO雷濤接受財聯社採訪時表示,關於大模型與數據之間的關係,核心在存量數據和增量數據。關於存量數據,核心需要關注的技術是大模型to DB,去解決如何跟上萬張表且高價值密度的企業數據庫的數據發生關係;關於增量數據,去解決如何持續的供給大模型以及大模型真正的算力出口在哪裡,是提供服務還是提供新興的生產資料。供給我們更多的數據資源,也就是合成數據的概念。

“大模型需要連接價值密度高、邏輯性強、動態且鮮活的數據,這些數據都跟生產經營的交易相關,比如股票信息、金融賬戶、醫院裡掛號信息”,雷濤表示,這些數據都不在靜態的文檔、文獻或報告裡,而是在數據庫裡。但是目前大模型所依賴的數據資源侷限於靜態文獻中的知識,這在一定程度上限制了其對於高價值數據的全面獲取,尤其是那些存儲在客戶私域中的寶貴數據。

在雷濤看來,“目前普遍採用的RAG技術將信息檢索和生成兩個階段結合起來,通過檢索數據庫中的相關信息來輔助生成過程,解決大模型數據滯後帶來的幻覺問題,提高生成內容的質量”,作爲側重於構建高效的交易系統,利用先進的人工智能技術來提升交易效率和準確性的數據服務商,天雲數據在實踐中也探索瞭如何將大模型與金融應用場景相結合。

“服務於券商的數字人,播報的內容是來自於實時交易系統的數據和研報文本內容的結合。針對這樣的場景,就需要把大模型的模糊意圖匹配和精確的SQL操作形成連接。這種連接不是一對一的,面涉及到非常複雜的工程技術”, 雷濤表示。

烯牛數據CEO李錦香接受財聯社採訪時也表示,大模型在處理具體業務時往往需要與現有的系統和服務進行集成,“這是一項具有挑戰性的任務,目前烯牛數據主營業務核心還是做垂直領域的數據加工”,李錦香表示,作爲專注於在股權投資領域提供專業的金融數據服務商,烯牛數據的客戶羣體也逐漸從VC投資機構擴展至銀行、券商等各類金融機構,並且還包括政府引導基金。

此外,上海特高信息技術有限公司創始人兼CEO崔建軍向財聯社記者表示,區塊鏈技術因其脫媒介、防篡改及可追溯等技術特性,被稱爲互聯網上的“信任機器”,與證券行業天然契合。“區塊鏈技術解決了證券行業的數據可信、隱私保護、多方協同以及健全數據標準等痛點,也爲證券數據防僞和存證、信息跨地域跨機構共享以及行業數字化轉型打開了想象空間。”

大模型技術賦能金融行業的發展

隨着人工智能技術的快速發展,特別是大模型的出現,以其強大的數據處理能力和廣泛的應用場景,大模型正在逐漸改變金融行業的運作方式。

“比如大模型帶來的多態視覺與空間計算能力的大幅提升,使得金融服務能夠更加直觀、生動地呈現給用戶”,雷濤表示,“現在互聯網每天約80%的流量來自視頻,在這麼多視頻碎片裡,大模型架構可以對視覺做直接管理,能夠自動提取視頻的關鍵信息,將長達一個小時的採訪壓縮成幾分鐘的核心摘要,實現視覺和語言的統一”。

此外在生成數字人內容方面,天雲數據也可以實現通過大模型技術,將精準的金融數據表達與宏觀分析相結合,創造出更具吸引力的營銷材料。

與此同時,李錦香表示,隨着大模型技術的進步,尤其是在金融領域,數據的質量和準確性變得愈發重要。“這不僅要有強大的數據處理能力,還需要具備將數據轉化爲實際價值,應用於具體的業務場景的能力”。

“這也是目前烯牛數據打造核心競爭力的所在,烯牛數據也在通過對企業的細緻標籤化處理,結合行業研究及資本動態,引入大模型技術爲用戶提供更爲深入的企業畫像”,李錦香對財聯社表示,此外大模型技術高效的數據處理能力帶來了金融領域更加智能化的產品形態,烯牛數據也可以實現比如通過對話式的交互方式獲取關於特定企業或行業的詳盡分析報告的能力。

值得注意的是,儘管大模型帶來了諸多便利,但在實際應用過程中仍存在一些問題。例如,如何確保模型的理解能力和記憶功能,使其能夠在處理複雜問題時保持準確性和一致性;如何通過不斷的學習和優化來提高模型的表現;以及如何在模型中融入人類的專業知識和經驗,使其更加貼近實際業務需求等。

受訪人士均表示,金融行業人工智能化應用場景豐富,隨着國家對科技金融的重視程度不斷提升,國內科技公司也在積極擁抱大模型技術所帶來的機遇,提升數據處理能力,改善用戶體驗,爲實現金融行業智能化轉型貢獻自己的力量。