爲使語音助理更聰明 亞馬遜僱用一個團隊聆聽使用者對Alexa的要求

▲亞馬遜在全球僱用了數千名員工,聆聽智慧音箱Echo從使用者家中辦公室捕捉到的錄音。(圖/達志影像美聯社

科技中心/綜合報導

有些人不願購入智慧音箱是因爲懷疑背後可能有人竊聽,事實上,還真的有人在聽。美國電商龍頭亞馬遜(Amazon)在全球僱用了數千名員工,聆聽智慧音箱Echo從使用者家中及辦公室捕捉到的錄音,經轉錄、註釋後反饋至軟體中,以改進Alexa語音助理,消除Alexa對人類語言理解的差距並協助它更有效地響應使用者的語音命令

彭博報導,根據參加過該團隊工作人士透露,Alexa的語音審查過程突出了培訓軟體演算法中經常被忽略的人類角色。就像其他從經驗中學習而建構的軟體工具一樣,人類也正爲Alexa的學習做努力。知情人士透露,該團隊由承包商及亞馬遜全職員工組成,他們在從波士頓柯斯大黎加、印度及羅馬尼亞等各分支機構中工作,並簽署了保密協議,禁止公開談論這項計劃內容

據2名在亞馬遜分支機構工作人員的說法,他們每天工作9小時,每位審聽人員需分析多達1000個語音片段。這項工作十分枯燥,波士頓的一名聽審人員表示,他會將特定語言資料累積起來並對這些數據進行註釋,如Taylor Swift這樣一個單一詞語,以向搜索者表明其是一名音樂藝術家

有時審聽人員也會聽到一些Echo使用者寧願保持隱密的東西,如一位在淋浴唱歌狂走音的女人,或一個尖叫着尋求幫助的孩子。團隊內部會使用聊天室來共享那些有趣的文件,不過偶爾也會聽到一些令人沮喪的錄音,甚至可能是犯罪過程。

亞馬遜發言人透過電子郵件迴應指出:「我們認真對待每位客戶的個人訊息及隱私安全,我們只會註釋一小部分Alexa錄音,以便改善用戶體驗。這些訊息有助於我們訓練語音識別及自然語言理解系統,讓Alexa可以更好理解使用者的需求並確保服務適合每個人。」發言人也強調,亞馬遜有嚴格的技術及操作保障措施,「對濫用我們系統者採取零容忍政策。員工無法在工作過程中識別該名使用者或知曉該名使用者的帳戶及訊息。所有訊息都具有高度機密性,我們使用多重身分驗證來限制查詢,透過加密及審覈的操作系統來保護這些資訊。」

▲除非Echo聽到喚醒詞或被按下按鈕喚醒,不然平時並不會錄音儲存。(圖/達志影像/美聯社)

亞馬遜並未在其行銷隱私權政策文件中明確表示,將有人類員工收聽他們的對話錄音,僅在常見問題中寫道:「我們使用您對Alexa的要求來訓練我們語音識別及自然語言理解系統。」在Alexa地隱私設定中,亞馬遜爲用戶提供了在開發新功能時禁止用其錄音的選項。根據彭博獲取的截圖,發送給Alexa審聽人員的錄音並沒有用戶的全名及地址

據一位熟悉該工作流程的知情人士透露,亞馬遜對語音資料的審查過程始於Alexa隨機抽取一小部分用戶的錄音,並將這些錄音資料發送給審聽人員或承包商。部分Alexa審聽人員的工作是轉錄這些使用者的命令,將錄音與Alexa的自動轉錄文本進行比較。有時候審聽人員會聽到使用者提及自己的姓名或銀行資訊,在這種情況下,他們會勾選紀錄表上「關鍵資訊」的欄目打勾,然後直接換下一個錄音。

亞馬遜官網顯示,除非Echo聽到喚醒詞或被按下按鈕喚醒,不然平時並不會錄音儲存。不過偶爾也會出現莫名被喚醒的情況,通常會因此錄到一些聽不懂的噪音,但無論該錄音的內容如何,審聽人員都會將其轉錄,一名知情人士說,審聽人員每天至少會聽到100段這種被意外觸發的錄音。

曾研究過智慧音箱及其相關隱私問題的密西根大學(University of Michigan)教授紹布(Florian Schaub)說:「你不一定會想到會有另一個人聽了你告訴智慧音箱的那些話。我們已經習慣於假定這些機器正在進行神奇的機器學習,但事實是,這其中仍涉及手動處理。」紹布指出,這是否屬於隱私問題取決於亞馬遜及其他公司對他們手動註釋的訊息類型的謹慎程度,以及他們如何向他人提供這些訊息。

2名在亞馬遜擔任審聽人員的說,全球都有使用者猜測Echo智慧音箱背後有人在聽,他們偶爾會聽到使用者問「你爲美國國安局工作嗎?」、「Alexa,有人在聽我們說話嗎?」這種問題。