研究:對話機器人錯誤詞彙 77%會成使用者記憶

生成式AI(人工智慧)逐漸普及,臺大團隊研究發現,對話機器人的訊息中有77%的錯誤詞彙會成爲參與者的記憶,加註警語也難以避免,提醒人類應對AI輸出內容保持適度懷疑。

臺灣科技媒體中心發佈新聞訊息指出,隨着生成式AI普及,大家對使用AI越來越熟悉,但不可避免AI系統與使用者互動時,會產生錯誤資訊來回答使用者;若生成式AI帶有錯誤資訊,是否會在人機互動時,潛移默化的影響使用者,是大家必須重視的事。

根據臺灣大學心理學系副教授黃從仁的團隊於11月20日在「美國心理學家」期刊發表最新研究指出,對話機器人的訊息中有77%的錯誤詞彙會成爲參與者記憶,即使加註一次性警語,也無法減少錯誤的記憶,就算相對頻繁、針對特定項目的預先警告參與者,也無法阻止特定項目錯誤資訊被參與者記憶。

黃從仁表示,團隊使用人工可編輯程式的人形機器人RoBoHoN與臺灣大學生對話,檢查機器人提供情感及價值中立但內容錯誤的訊息中,是否有預告的警語,並檢查這些訊息中有多少比例會在之後的認知測驗中,變成一個人記憶的錯誤資訊。

研究結果顯示,機器人提供的錯誤資訊中,有77%會變成人們的記憶,即便機器人在提供錯誤資訊前已抱持自我懷疑並提出警告,但這些警告只能增加人們的戒心,並無法真正避免錯誤資訊成爲記憶。

黃從仁認爲,無論有無形體的聊天機器人,都應儘量不要輸出錯誤的資訊,可透過人工檢核剔除學習資料中的錯誤資訊,或讓聊天機器人透過網路搜尋,先對答案進行事實查覈,人類也應對聊天機器人的輸出內容保持適度懷疑,不要照單全收。

受臺灣科技媒體中心邀請分析此研究的臺灣大學資訊工程學系副教授陳縕儂提到,生成式AI系統在與使用者互動時,不可避免的會產生錯誤的腦補資訊來回答使用者,這種錯誤資訊的內容,是否會在人機互動中潛移默化地影響使用者,是規範當代AI產品非常重要的考量。