騰訊公司申請評價詞提取專利,提高了對預訓練任務的豐富知識的利用率及評價詞的提取效果

金融界2024年2月19日消息,據國家知識產權局公告,騰訊科技(深圳)有限公司申請一項名爲“評價詞提取方法、裝置、設備、介質及程序產品“,公開號CN117556823A,申請日期爲2023年11月。

專利摘要顯示,本申請公開了一種評價詞提取方法、裝置、設備、介質及程序產品。本申請,獲取目標實體關聯的評論文本和對應的候選評價詞;根據預設提示模版、候選評價詞和評論文本,構建目標掩碼語句,其中,目標掩碼語句中標記了掩碼位置;基於已訓練的掩碼語言模型對掩碼位置的輸出進行預測,得到預測詞;若預測詞爲預設標籤詞,則提取候選評價詞作爲目標實體關聯的目標評價詞。本方案通過設計提示模版來改造掩碼語言模型的訓練任務和推理任務,將評論文本和評價詞構建成相應的掩碼語句作爲模型輸入,將原分類任務修改爲預測掩碼語句中掩碼位置的輸出,保證了上下游任務的一致性,提高了對預訓練任務的豐富知識的利用率及評價詞的提取效果。

本文源自金融界