百度申請文檔圖像還原及多模態大模型訓練方法和裝置專利,可編輯文件還原文檔內容
金融界2024年10月29日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“文檔圖像還原及多模態大模型訓練方法和裝置”的專利,公開號 CN 118823798 A,申請日期爲2024年6月。
專利摘要顯示,本公開提供了文檔圖像還原及多模態大模型訓練方法和裝置,涉及計算機視覺、深度學習以及大模型等人工智能領域。其中的方法可包括:獲取待處理的目標文檔圖像;將目標文檔圖像作爲多模態大模型的輸入,得到輸出的第一文件,第一文件爲符合預定表示格式的超文本標記語言文件;根據第一文件生成作爲還原結果的第二文件,第二文件爲可編輯的文件,且第二文件中包括目標文檔圖像中的文檔內容。
本文源自:金融界
作者:情報員
相關資訊
- ▣ 微衆銀行申請反欺詐模型的生成方法及裝置專利,提高模型的訓練速度
- ▣ 北京大學申請中文醫學大語言模型訓練方法及裝置專利,提高大語言模型在醫學領域回答的準確度
- ▣ 百度申請文本檢測及文本檢測模型訓練方法專利,可獲得待檢測文本的目標粒度的目標檢測結果
- ▣ 華爲申請圖像文件編解碼方法專利,提高圖像文件壓縮率
- ▣ OPPO申請圖像編輯方法專利,提高圖像編輯效率
- ▣ 威海藍海銀行申請基於多模態融合的文檔圖像篡改檢測方法專利,解決圖像篡改檢測的技術問題
- ▣ 青島道可雲申請物體模型展示方法及系統專利,能夠更真實地還原模型細節
- ▣ 騰訊科技申請一種模型處理方法專利,提高文生圖模型的圖像生成質量
- ▣ 騰訊公司申請圖片生成方法及裝置等專利,能夠使得文生圖模型的應用更加便捷
- ▣ 中建工程申請一種基於大語言模型的文檔標籤生成方法專利,實現優質文檔標籤篩選
- ▣ 山東矩陣軟件取得一種模型訓練的改進方法及裝置專利
- ▣ 寧波博登智能科技申請基於多模態大模型的通用圖像標註系統及方法專利,標註精度高
- ▣ 百度取得融合文本和自動駕駛數據進行模型訓練的方法和車輛專利
- ▣ 南京際舟電子科技申請智能化多模態信息識別與分類管理系統及方法專利,實現多模態文檔的準確分類
- ▣ 上海華築申請基於竣工檔案的BIM模型和圖紙比對方法及系統專利,提高了BIM模型生成和圖紙比對的精度和效率
- ▣ 國網河南電力與安徽大學申請多模態大模型感知量化訓練專利,實現有效降低多模態大模型的計算複雜度和內存佔用
- ▣ 通用文檔理解新SOTA,多模態大模型TextMonkey來了
- ▣ 中國工商銀行取得文檔處理方法及裝置專利
- ▣ 九章雲極申請多模態大模型圖像處理專利,提高機器學習模型處理圖像的效率
- ▣ 智源發佈原生多模態世界模型Emu3,實現圖像、文本、視頻大一統
- ▣ 騰訊公司申請模型訓練專利,提升模型訓練效果
- ▣ 百度申請圖像處理專利,對圖像和文本進行高效匹配
- ▣ 中國鐵塔申請算法模型的授權方法及裝置專利,實現算法模型的安全授權
- ▣ 東風集團股份申請模型軟件的自動化測試方法及裝置專利,提高模型軟件 MIL 測試效率
- ▣ 中移互聯網申請文檔處理方法等專利,提高文檔傳輸效率
- ▣ 書行科技申請圖像生成方法及裝置相關專利,能準確轉換圖像風格並保持內容
- ▣ 日聯科技申請X射線圖像分割模型訓練專利,提高模型的泛化能力
- ▣ 海信視像申請顯示設備、方法及可讀存儲介質專利,能夠更加真實地還原圖像
- ▣ 百度申請一種文件管理方法等專利,提高文件管理的效率