浙江君同智能申請基於條件擴散模型的語音轉換對抗音頻生成專利,提高語音轉換對抗音頻生成效率效果

金融界2024年12月19日消息,國家知識產權局信息顯示,浙江君同智能科技有限責任公司申請一項名爲“基於條件擴散模型的語音轉換對抗音頻生成方法和裝置”的專利,公開號 CN 119132309 A,申請日期爲2024年11月。

專利摘要顯示,本發明公開了基於條件擴散模型的語音轉換對抗音頻生成方法和裝置,包括:準備參考音頻樣本,基於參考音頻樣本並採用白盒攻擊方式在語音轉換任務中生成對抗音頻樣本,將參考音頻樣本和對抗音頻樣本組成樣本對;以樣本對中的對抗音頻樣本作爲輸入,並在樣本對中參考音頻樣本作爲引導條件下,對條件擴散模型進行基於對抗音頻生成任務的訓練;利用訓練好條件擴散模型的逆向生成過程,在參考音頻樣本的引導下生成與參考音頻樣本相關且用於黑盒語音轉換的對抗音頻,以解決現有黑盒場景中語音轉換對抗音頻生成的效率與效果不足的技術問題。

本文源自:金融界

作者:情報員