36氪獨家|理想智能駕駛圍繞“端到端”變陣,加速AI大模型上車
文丨李安琪
編輯丨李勤 楊軒
在智能駕駛行業,“端到端”正引領着一場技術變革。這最先由特斯拉引起,國內華爲、蔚小理等玩家紛紛跟進。技術之外,組織變動也接踵而至。
36氪汽車獨家獲悉,理想汽車近期成立了“端到端自動駕駛”的實體組織,整體200人出頭;同時公司其他團隊一些成員也在靈活支援項目。
理想不是唯一這樣做的企業。此前蔚來汽車已經率先做出組織變革,成立了專門負責端到端的大模型部門。
理想智能駕駛團隊主要分爲算法研發、量產研發兩個大組,團隊約800人。“端到端”的研發主力部署在算法研發組,由理想智能駕駛技術研發負責人賈鵬負責。
具體來看,算法研發下設感知算法、行爲智能、認知智能等組。“感知算法”由常黎主導;“行爲智能”包含端到端架構、端到端模型、控制模型等,由楊毅負責;“認知智能”包含認知模型、雲端模型等,實際由詹錕負責。
如果要打個比方,端到端三個主力小組的職責,分別對應智駕系統的感知能力、行走能力,和認知世界的能力。這基本與理想的端到端方案模塊呼應。
前不久,理想公開了其端到端自動駕駛技術方案,其方案分爲端到端模型、VLM(即Vision-Language Model,視覺語言模型)視覺語言模型、世界模型三部分。
此外,與算法研發組平行,量產研發組由量產負責人王佳佳負責,包含智能行車、智能泊車、智能安全等。賈鵬與王佳佳均向理想智能駕駛負責人郎鹹朋彙報。
針對上述信息,36氪汽車向理想汽車求證,截至發稿,未獲迴應。
CEO李想公開表示,到今年底或明年初,理想就會推出端到端+VLM的自動駕駛方案,方案將由超1000萬clips(視頻片段)訓練而成。理想還打算將參數達22億的視覺語言大模型搬上車。
組織架構的實體化,也將從人力調度方面加速理想“端到端”計劃的落地。
理想智駕,曲折自研
所謂端到端,就是把傳感器數據作爲輸入,車輛控制指令作爲輸出,中間環節過程都靠AI神經網絡模型來完成。這已經成爲智能駕駛行業下一代共識方案。
但“端到端”方案的起勢並不容易。據特斯拉計算,完成一個端到端自動駕駛的訓練至少需要100萬個、分佈多樣、高質量的 clips (視頻片段)才能正常工作。
馬斯克曾強調過數據在自動駕駛方面的重要性:“用100萬個視頻case訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow(驚歎);到了1000萬個,就變得難以置信了。”
對於剛剛轉入端到端方案的車企而言,需要耗費一段時間才能看到成果。
然而當下國內的智駕行業競爭激烈,疊加特斯拉FSD(即Full-Self Driving,指特斯拉全自動駕駛軟件包)入華、華爲智駕的“鮎魚效應”,小鵬、蔚來等玩家都在積極追擊。
理想一直都扮演着智駕追趕者的角色。爲了高效追趕,理想內部分成了兩隊人馬。
一是在智駕系統AD Max上選擇自研,搭載英偉達Orin芯片與激光雷達,提供城市領航輔助駕駛功能(具備城市道路點到點輔助駕駛能力);
二是在智駕系統AD Pro上與供應商合作,搭載地平線征程5芯片,無激光雷達,能提供記憶行車、城市LCC(車道居中輔助)等功能。
此前據36氪汽車報道,智駕AD Pro方案啓用了智能駕駛供應商輕舟智航。輕舟有300多人,從去年末開始幾乎全員駐場在理想的順義總部。隨着近日AD Pro版本車型功能升級,開發任務告一段落,輕舟主要人力已經撤出理想項目。
而在自研方案上,理想的城市領航輔助功能追趕幾乎從2023年纔開始。一年半多時間裡,理想數次切換了智駕的技術路線。
2023年4月,理想喊出了城市NOA落地100城的目標,但“主要是爲了應對華爲和小鵬的智能駕駛衝擊,口號先行”。近半年後,理想主動將“城市NOA100城”改成了“通勤NOA100城”(通勤NOA指在用戶高頻路段開啓點到點輔助駕駛),因爲前者“難度太大”。
然而“通勤NOA”的路同樣不好走,有理想智能駕駛人士向36氪汽車解釋,通勤方案的本質是預先建圖,仍然依賴高精地圖,不符合行業技術趨勢。實際落地擴張效果也不好,“原定目標是一天開拓1條路線,但實際上三個月只構建了2-3條路線,效率很低”。
意識到不對,理想在去年轉而全力追擊“無圖NOA”(指不依賴高精地圖的城區點到點輔助駕駛)功能。
不過由於理想純電車型MEGA失利,理想整體放棄80萬輛的銷量目標後,公司進入裁員節奏,智能駕駛團隊也被波及。目前理想智能駕駛團隊人數約800人,與年初的1300人相比已經大幅裁減。
而理想無圖智駕方案的推送,也從原本的4月推遲到了7月。直到近日理想才向AD Max用戶推送了無圖NOA功能,號稱全國範圍內、可導航的城市道路都可使用功能。
在端到端的效果可檢驗之前,當下推送的功能版本,是理想智能駕駛佔領市場、獲得用戶口碑的關鍵。
端到端是一場資源戰
在端到端方案的實踐中,先行者特斯拉FSD v12版本在北美地區已經取得了令人驚豔的效果。
而國內的玩家也從特斯拉的驗證中,找到了通關秘籍:在積累海量的駕駛行爲數據、更大雲端算力的訓練下,端到端方案會更加擬人。
今年4月,馬斯克表示,對英偉達H100 AI芯片的採購量將從3.5萬增加到8.5萬,並計劃投資100億美元用於汽車的聯合訓練和推理人工智能。此外,特斯拉自研的訓練芯片Dojo近期也開始在臺積電投入量產。
同樣,理想在走上端到端方案之後,也在籌謀更大訓練算力。有內部人士告訴36氪,理想認爲智能駕駛的下一個競爭點,一定是超算中心。
有知情人士告訴36氪,去年秋季雁棲湖會議上,美團CEO王興、Y Combinator中國創始人陸奇都勸李想,在雲端訓練GPU領域加大投入。
據36氪汽車瞭解,除了去年向火山引擎購買的300多臺英偉達服務器外,目前理想還跟阿里雲、百度雲等雲廠商都有合作。“現在在高價收購英偉達的卡。”
同行也預判到了超算的重要性。從雲端算力來看,目前華爲是國內智能駕駛訓練算力最大的玩家。華爲表示,6月其智能駕駛訓練算力將達3.5EFLOPS。小鵬、蔚來智駕中心算力分別是0.6EFLOPS、1.4 EFLOPS,而據36氪瞭解,理想的智算中心算力爲1.4 EFLOPS。甚至老牌車企長城也在加入戰局,超算中心算力爲1.64EFLOPS。
端到端之戰,不僅是車企智能駕駛技術路線的一次變更,更考驗着車企們長期的兵馬糧草供給。這將是一場耐力比拼。