英偉達上線人形機器人開發工具包,黃仁勳爲產業前景興奮

當地時間7月29日,英偉達在美國丹佛的計算機圖形技術大會SiGGRAPH上宣佈,將爲機器人廠商提供一系列開發套件,加速人形機器人的開發訓練。

產品套件中,NIM微服務和框架用於機器人仿真學習——微服務(Microservices)是一種開發軟件的架構和組織方法,可以使應用程序更易於擴展和更快開發。英偉達聲稱,NIM微服務提供了由NVIDIA推理軟件提供支持的預構建容器,使開發者能夠將部署時間從數週縮短到幾分鐘。

英偉達此次帶來兩款面向機器人廠商的新NIM微服務。MimicGen NIM微服務可根據Apple Vision Pro等頭顯設備採集的遙操作數據,生成合成運動數據;Robocasa NIM微服務則可生成機器人任務和準備就緒的仿真訓練環境。

操作者戴着Apple Vision Pro遙操作採集數據。來源:英偉達官網

另一款產品爲用於運行多階段機器人工作負載的OSMO編排服務,開發者藉此對包括合成數據生成、模型訓練、強化學習以及大規模的人形機器人測試等任務,進行編排、可視化和管理。官方稱,OSMO編排服務大大簡化了機器人訓練和仿真工作流程,將部署和開發週期從數月縮短到一週內。

NIM微服務和OSMO編排服務兩款產品,被嵌入英偉達搭建的一套機器人基礎模型訓練數據捕捉的工作流(Workflows)。

人形機器人智能的提升,離不開用大量數據訓練基礎模型。但當前行業面臨數據短缺的瓶頸,僅靠物理環境的遙操作去採集數據,成本昂貴且耗時長。英偉達稱,其搭建的數據捕捉工作流(Workflows),使得開發者使用極少量遙操作採集的人類演示數據,即可生成大量合成的運動和感知數據。

據英偉達對這套工作流程的介紹,首先,開發者使用Apple Vision Pro捕獲少量遙操作演示畫面,進而在Isaac Sim計算平臺中對這些錄像進行仿真,並使用前述MimicGen NIM微服務生成合成數據集。

基於採集到的真實數據和合成數據,開發者再對英偉達自研的人形機器人基礎模型Project GR00T展開訓練。接着,開發者可以使用前述Robocasa NIM微服務來生成經驗,以重新訓練機器人模型。整個工作流程中,OSMO編排服務扮演分配運算任務的角色。

英偉達提供了三個計算平臺來簡化人形機器人的開發,包括用於訓練模型的NVIDIA AI超級計算機;使機器人在仿真世界中學習和完善技能的Isaac Sim平臺;以及用於模型運行的Jetson™ Thor人形機器人計算機。

加入英偉達旗下人形機器人開發者計劃的公司,可以提前獲取這些新產品和服務。據介紹,目前,字節跳動ByteDance Research、傅利葉、銀河通用、逐際動力、星動紀元等中國大陸的人形機器人公司及開發機構已加入這項計劃。

英偉達創始人兼CEO黃仁勳表示:“AI的下一波浪潮是機器人,其中最令人興奮的發展之一是人形機器人。我們正在推進整個英偉達機器人技術棧的發展。”

黃仁勳此前在諸多場合表達過對人形機器人產業的看好。今年6月接受採訪時,他預測機器人技術將在未來兩到三年內取得重大進展,未來人形機器人將像汽車般普及。

採寫:南都見習記者 楊柳