NVIDIA公佈名為LATTE3D的研究技術 透過文字描述即可快速生成完整3D模型

NVIDIA在此次GTC 2024期間公佈名爲LATTE3D的3D模型自動生成技術,讓使用者能直接透過自然語言文字描述,即可產生完整的3D模型。

此研究是由NVIDIA位於多倫多的AI實驗室團隊提出技術,透過自動生成式人工智慧,配合文字描述即可創建可用於虛擬視覺環境的3D模型,藉此加速電玩遊戲、廣告活動、設計項目,或是用於建構機器人虛擬訓練場域。

過去已經有類似技術提出,但往往需要1小時或更久時間進行渲染,但當前技術僅需10到12秒即可生成,同時也能產生品質更高的模型內容。

此外,相較過往需要更高顯示加速運算效能才能達成相同成果,目前的技術僅需透過單張NVIDIA RTX A6000專業繪圖卡,即可在極短時間內生成3D模型,讓使用者能隨時透過文字命令方式產生內容,藉此加速內容創作或機器學習訓練建置時間。

目前NVIDIA主要針對動物及日常物體兩大類型進行密集訓練,並且讓生成內容能以通用場景描述 (OpenUSD)格式應用在諸如Omniverse平臺等環境使用,而開發人員也能針對生成需求訓練不同類型內容。

至於LATTE3D是透過NVIDIA A100加速運算元件完成訓練,同時也搭配使用ChatGPT生成文字提示進行訓練,藉此讓模型更容易理解使用者以文字輸入時所代表意涵,避免在生成過程產生誤判。

除了分享LATTE3D技術應用,NVIDIA研究團隊也強調本身投入各方面領域研究,藉此在軟體技術、半導體電路、儲存、材料、人工智慧模型等領域探索公司未來可能發展機會,以及未來產品技術突破可能性,而研究團隊目前則是位於北美、臺灣等全球地區。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》