百度申請文本檢測及文本檢測模型訓練方法專利,可獲得待檢測文本的目標粒度的目標檢測結果
金融界2024年10月31日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“文本檢測及文本檢測模型訓練方法、裝置和設備”的專利,公開號CN 118840756 A,申請日期爲2024年6月。
專利摘要顯示,本公開提供了一種文本檢測及文本檢測模型訓練方法、裝置和設備,涉及人工智能技術領域,尤其涉及計算機視覺、深度學習、大模型等技術領域,可應用於OCR等場景。文本預測方法包括:對目標圖像進行特徵提取,以獲得所述目標圖像的圖像特徵;所述目標圖像中包含待檢測文本;基於所述圖像特徵進行多個文本粒度的檢測處理,以獲得多種候選檢測結果;所述多種候選檢測結果與所述多個文本粒度一一對應;基於所述多種候選檢測結果獲取目標粒度的待處理檢測結果;基於所述圖像特徵和所述待處理檢測結果的目標位置特徵進行分割處理,以獲得所述待檢測文本的所述目標粒度的目標檢測結果。
本文源自:金融界
作者:情報員