《國際產業》字節跳動訓練新AI模型 傳採華爲晶片

自從美國在2022年開始限制輝達(Nvidia)晶片的出口,字節跳動已經對國內人工智慧晶片供應商進行了多元化發展,並加快自己的研發。

知情人士表示,字節跳動在人工智慧競賽中的下一步,是利用華爲的Ascend 910B晶片來訓練大語言AI模型。

另一位消息人士說,字節跳動正計劃推出新的AI模型,但他無法說出,是否會使用華爲晶片。

字節跳動已將Ascend 910B用於計算強度較低的推理工作,這些工作主要涉及讓預先訓練好的AI模型做出預測。

而去訓練AI模型,要求則高得多,而且需要大量資料,因此需要使用超高效能晶片,例如輝達的高階圖形處理器。

其中一名知情人士表示,依照計算參數來衡量,新模型的效能和複雜性將低於字節跳動現有的AI模型豆包(Doubao)。

TikTok在華盛頓的發言人Michael Hughes代表字節跳動表示:「這裡整個前提都是錯誤的,沒有開發任何新模型」。

一位消息人士說,字節跳動今年訂購了超過10萬顆Ascend 910B晶片,但截至7月,收到的還不到3萬顆,速度太慢,無法滿足公司需求。

兩名知情人士表示,與輝達在中國銷售的晶片相比,華爲供應受限、運算能力有限,已使字節跳動無法爲款模型設定時間表。

字節跳動目前的AI技術爲2023年8月啓動的大語言模型,並被更名爲「聊天機器人豆包」,以及其它應用程式,包括文字轉視訊工具「即夢」(jimeng)。

此外在六月有新聞報導傳出,字節跳動正在與博通合作,開發5奈米AI晶片,製造工作將交給臺積電進行。