南方智媒申請基於人工智能技術的媒體多模態內容審覈方法及系統專利,能夠高效、準確地檢測和識別違規內容
金融界2024年12月5日消息,國家知識產權局信息顯示,廣東南方智媒科技有限公司申請一項名爲“基於人工智能技術的媒體多模態內容審覈方法及系統”的專利,公開號CN 119068399 A,申請日期爲2024年11月。
專利摘要顯示,本發明涉及一種基於人工智能技術的媒體多模態內容審覈方法及系統,包括接收待審覈媒體內容並判斷媒體類型,當判斷媒體內容爲視頻時,將音頻與視頻分離,並採用基於梯度變化檢測的算法抽取視頻的關鍵幀;採用目標檢測模型對視頻的關鍵幀進行目標檢測,採用人臉識別模型對視頻的關鍵幀進行人臉識別,以及採用語音識別模型對音頻進行轉文本處理;基於目標檢測結果、人臉識別結果和轉文本處理結果,通過預設的違規信息庫和自然語言處理算法,分析違規信息並輸出審覈結果。本發明通過結合目標檢測、人臉識別和語音識別技術,實現對不同媒體內容的全面分析,能夠高效、準確地檢測和識別違規內容,提升審覈效率和準確性,適用於多種媒體內容審覈場景。
本文源自:金融界
作者:情報員