物理AI大時代,一場“視覺數據爭奪賽”將上演

隨着人工智能從數字世界走向物理世界,競爭焦點將轉向視覺數據。

在21日發佈的研報中,摩根士丹利分析師Adam Jonas、Daniela M Haigian等指出,正如聊天機器人需要文本數據來訓練大語言模型(LLM)一樣,物理機器人需要數據來訓練其視覺-語言-動作模型(VLA)。摩根士丹利認爲,AI正在從純數字領域向物理世界擴展,例如自動駕駛、人形機器人和電動垂直起降飛行器(eVTOLs)等領域。

報告引用了馬斯克在今年早些時候發表的觀點,即“三到四年內,AI將可以解決任何不涉及物理世界的認知任務”。大摩預計,隨着算力規模不斷擴展且效率提升,AI公司需要大量的視覺數據來創建物理世界的“數字孿生”,即通過高精度的視覺數據構建一個虛擬的物理世界模型,全球範圍內將展開一場爭奪光學數據的“光子競賽”。

報告還將光子數據比作“Fat tuna”(肥金槍魚),認爲如果無法捕捉或利用數據,那麼這些數據就像海中的金槍魚一樣毫無價值;而一旦具備捕捉和處理這些數據的能力,其價值將大幅提升。這意味着,當AI技術成熟後,視覺數據將成爲極其寶貴的資源。

大摩認爲,這種數據需求將涵蓋生活的各個方面,包括倉庫、工廠、醫院、學校、商店、車輛、機場、礦山、家庭和森林等,甚至生物體的視覺數據也將成爲重要的資源。

報告還特別提及特斯拉在這個進程中起到的關鍵作用,認爲該公司處於“技術寒武紀大爆發的中心地帶”,其投資故事已經遠遠超出了電動汽車的範疇,馬斯克旗下“DREAMS”(數據、機器人、能源、AI、製造和太空)的龐大商業帝國將推動特斯拉價值的進一步釋放。

報告表示,隨着馬斯克在構建推理羣(汽車、機器人)和AI基礎設施方面取得進一步進展,通用AI和LLM可能成爲解鎖特斯拉作爲AI巨頭價值的“關鍵鑰匙”。