1+1+1+1+1+1+1=6?Google旗下AI數學不及格 因「題目看嘸」

▲AI無法通過高中數學測驗最主要的原因就是AI「看不懂」題目。(圖/取自免費圖庫pixabay)

科技中心綜合報導

「1+1+1+1+1+1+1=?」如果你的答案是7,那恭喜你比Google的AI還聰明。Google旗下DeepMind團隊日前公佈一項新的研究結果,讓AI接受英國高中程度的數學測試,最終測驗成績僅拿到「E」也就是不及格。

Google旗下DeepMind團隊本月初發表了一份名爲《分析神經模型的數學推理能力》(Analysing Mathematical Reasoning Abilities of Neural Models)的研究報告,該團隊試圖訓練神經網絡算數學,怎知AI雖能打敗世界棋王,卻無法通過高中程度的數學測驗。這40題數學題中,AI僅答對了14題,正確率僅35%,實實在在的不及格。

事實上,AI在此測驗之前已做過充足的訓練。DeepMind爲其建立一個包含200萬個題目的題庫題型包括算數、代數機率微積分等。同時也派出循環神經網路(Recurrent Neural Network, RNN)及Transformer兩大性能最優異的模型參與測試。

爲什麼AI無法通過高中數學測驗呢?其中最主要的原因就是AI「看不懂」題目。DeepMind旗下的AI雖已擁有強大的機器翻譯能力,但面對數學題目的複雜性語言多樣性仍是敗下陣來。如研究發現,AI最多隻能計算出現次數爲6次以下的數值,因此像「1+1+1+1+1+1+1=?」這樣出現次數超過6次的數值,它就計算不出來,不過在計算更常更大的數字(如:-34+53-936),它仍能給出正確答案,對此,研究人員無法給出一個很好的解釋,不過相信可能是因爲AI神經網路會不斷察看每道問題而做出正確解答。

人類來說,要解決數學問題,除需應用計算能力外,最重要的仍是理解題目、將文字圖像轉換爲運算符號,因此依賴大數據尋求解題規律的AI碰上文字、加減乘除符號、函式等組成的問題時,會因看不懂題目而無法作答。另外,AI的推理能力也不及人類,面對數學題,人類會經由推理,從已知公式中找到最佳策略實際的運算過程也須經過工作記憶完成。簡而言之,人類解數學題需動用許多知識技能,包括分類、演算等,而擅長模式比對、機器翻譯的AI彈性遠不及人腦

雖然現階段要成爲數學老師對AI來說極度困難,但目前AI已稱霸相當多的領域。如DeepMind旗下的AI AlphaGo已接連打敗圍棋棋王李世乭、柯潔。去年AlphaZero又在《星海爭霸2》(StarCraft II)的測試競賽中以5比0強壓世界頂尖職業選手。