專家傳真-由通膨、升息、美股下跌 看人工智慧預測的能耐
圖/摘自Pixabay
近月以來,美國通膨嚴重,聯準會不得不啓動升息的腳步。過程中,大家討論到底會升1碼,升2碼還是3碼,造成市場浮動,股票因而上沖下洗。不同的機構會有不同的預測,於是大家就先看多數人的想法如何。當多數人預期不好時,就會造成一些恐慌。
因此還沒開始升息,股票就開始下跌。之後又反轉上漲,好像就此風平浪靜了,但沒多久又再次暴跌。於是有人就形容,股價好像樹上的松鼠一樣到處亂竄,沒有人搞得清楚其中的邏輯。財經節目的主持人只好到處訪問業界人士,希望從中得到一些對現狀和未來趨勢的看法。最重要的大概還是想抓來問,現在到底該買還是該賣。
這幾天美國公佈當月通膨數字,比預期的還高一點,股價立刻暴跌,讓美股正式進入熊市。現實市場全憑羣衆心理操控,很多時候的下跌或上漲並不是因爲這個訊息的好壞,而是這些訊息跟預期間的差距。比預期好就上漲。比預期差就下跌。所以纔有利空出盡或利多出盡的說法,而不是看訊息本身是利空還是利多。
因爲很難掌握,所以每當事情發生的時候,大家往往就會去翻過去的歷史,看看過去相同狀況發生的時候,它的結果是怎麼樣。此外,很多人也希望讓人工智慧來預測未來的走勢,以便告訴投資人,現在是要買還是要賣。
要用人工智慧預測未來股價的走勢,首先需要拿歷史資料來訓練模型。訓練久了,它就能記住過去各種情況,並告訴你未來的結果。問題就是影響價格的因素很多,如果單從價格本身來訓練,往往不能夠反映現在所處的狀況。所以只有加入不同的特徵值,如利率、匯率、油價、通膨、就業等資料一起訓練,才能真正確實掌握現況。
近年來人工智慧,大多用模擬大腦結構的類神經網路ANN來處理各種事情。只要先把模型建好,資料準備好,經過訓練之後,類神經網路就可以做數值迴歸,分類和分羣的工作。資料先要把正確的答案標示好,經過長時間的重複訓練,類神經網路就能預測出如標示的結果。除做影像辨識與物件偵測的CNN外,同時有另一類的類神經網路RNN,可用來訓練語言模型。它能將人類各種語言模式,抽取並記錄下來。
同屬RNN的長短期記憶模型LSTM,這幾年大家常常用來預測股價。同時一併還可以把新聞內容加在一起,跟股價一起來訓練,嘗試一併從新聞中找出對股價影響的蛛絲馬跡。通常這些記憶模型都能回顧過去的現象,很快地連結到相同狀態的位置。但拿來做日後真實狀況的預測,表現往往卻不如預期。對樣本內資料表現好,但對未來樣本外資料就不行了,這就是所謂過擬合的問題。
現在問題就在,當同樣事情再次發生時,也會有相同的結果嗎?而相同的事件發生很多次時,它的結果也常常不同,那又要如何處理?就因爲很難判斷,於是有人就會統計各個不同結果的發生機率,讓大家自行決定哪一種情況比較可能發生。如果一定要從中選出這次的結果,就只好每次都猜機率最高的那個,這樣也許命中率還比較高。
過去就有人說讓電腦預測未來股價的走勢,其結果就像拿飛鏢射輪盤一樣,全憑運氣。或許到最後只能做到像預測颱風路徑一樣,顯示出可能路徑的喇叭圖,離起點愈遠愈不準,所以喇叭口就愈寬。至於未來真正會落在哪一點,就只好大家自行判斷了。