“意念”控制機器人!創新奇智新模型AInno-75B放大招,能看視頻能畫CAD,還外接腦機接口

智東西(公衆號:zhidxcom)作者香草編輯李水青

智東西3月27日報道,今日,國內“AI+製造”解決方案供應商創新奇智宣佈其“奇智孔明AInnoGC”工業大模型產品矩陣升級。

創新奇智CTO張發恩發佈了升級後的工業大模型AInno-75B,以及三款全新ChatX系列生成式AI應用:包括生成式企業私域視覺洞察應用ChatVision、生成式輔助工業設計應用ChatCAD、基於非侵入式腦機接口的工業機器人任務編排應用ChatRobot Pro。

▲奇智孔明工業大模型升級發佈

此次發佈是創新奇智工業大模型矩陣時隔半年以來的重要升級。

創新奇智於去年9月發佈了自研工業大模型AInno-15B,基於該模型的大模型服務引擎,以及三款生成式AI應用產品:ChatRobot、企業私域數據分析應用ChatBI、企業私域知識問答應用ChatDoc。本次發佈,大模型服務引擎和ChatX系列應用也基於750億參數的模型進行了升級。

現場,創新奇智副總裁郭江亮、創新奇智高級技術總監溫哲立、創新奇智高級研究員高達輝分別演示了ChatVision、ChatCAD和ChatRobot Pro,其中,腦機接口“意念取物”的演示令人印象深刻。

▲工作人員在現場通過外接式腦機接口“意念”操作機器人

一、750億參數、多模態輸入輸出,ChatX系列產品全線升級

張發恩首先發布了750億參數的工業大模型AInno-75B,相比半年前發佈的Ainno-15B,參數提升至5倍,模型性能也相對升級。

AInno-75B還新增了多模態處理能力,支持輸入文本、圖像、視頻、EEG(腦電波)以及工業場景中的特定模態,如CAD(計算機輔助設計)等。

輸出方面,AInno-75B支持輸出文本、圖像、視頻、CAD,以及工業領域特色的Action(行爲)模態。

▲工業大模型AInno-75B技術特色

在能力指標方面,AInnoGC工業大模型已獲得中國信通院可信AI工業評測的最高等級4+級,也是截至今天唯一通過該等級評測的工業大模型。

在去年12月麻省理工科技評論發佈的15個“中國AI大模型先進應用案例”中,AInnoGC榜上有名。SuperCLUE工業大模型第一名。

3月21日,中文語言理解測評基準SuperCLUEC發佈首箇中文原生的工業大模型測評基準SC-Industry,奇智孔明AInno-15B僅次於GPT-4 Turbo和GPT-4,在國內工業領域大模型中位列第一。

▲奇智孔明工業大模型獲得成就

基於AInno-75B,創新奇智ChatX系列產品也進行了重要升級。

生成式企業私域知識問答應用ChatDoc針對性優化了知識構建、問答、溯源和推薦能力,整體問答效果提升28.8%;生成式企業私域數據分析應用ChatBI新增支持Excel、CSV等數據格式,生成SQL語句和分析報告的準確率提升15%。

▲創新奇智工業大模型產品矩陣升級

大模型服務引擎Engine則新增支持交互式生成Agent應用,其RAG(檢索增強生成)能力引擎也增加內置針對性優化策略,模型服務新增內置大模型推理加速引擎。

二、三大ChatX新品發佈,針對視覺、CAD和“意念控制”

會上,張發恩還發布了三款新的ChatX系列產品,分別是生成式企業私域視覺洞察應用ChatVision、生成式輔助工業設計應用ChatCAD,以及基於非侵入式腦機接口的工業機器人任務編排應用ChatRobot Pro。

1、生成式企業私域視覺洞察應用ChatVision

據介紹,ChatVision以自然語言交互形式,對視頻/圖片進行交互式智能分析,並且基於Agent能力自主進行任務規劃和技能編排。

▲生成式企業私域視覺洞察應用ChatVision

創新奇智副總裁郭江亮現場演示了ChatVision的場景洞察能力,其能夠進行實時視頻流分析、理解用戶的複雜任務指令,也能離線進行視頻長文件分析。

▲ChatVision能力及工作流程

首先,兩位工作人員在現場扮演工人的角色,通過攝像頭拍攝實時視頻流輸入ChatVision後,郭江亮通過語音輸入指令“觀察當前畫面,告訴我這可能是什麼地方”。隨後,ChatVision迅速給出答案,通過分析場景中的人物和穿着,判斷這可能是一個建築工地、車間或倉庫。

▲ChatVision判斷畫面是什麼場景

隨後郭江亮追問,讓ChatVision找出畫面中的電源插座和白色安全帽,它也很快就完成並進行了實時跟蹤。

▲ChatVision識別出白色安全帽並實時跟蹤

郭江亮又提出分析畫面中有什麼潛在的危險行爲併發送給管理員,ChatVision在畫面中標出了玩手機等3項違規操作,並截圖發送了警告郵件。

▲ChatVision識別危險行爲

除了在線分析視頻流,ChatVision也能離線分析視頻長文件。郭江亮上傳了一個車間實拍視頻,並詢問ChatVision這是什麼場景,很快就得到了正確的回答。

▲ChatVision離線識別視頻流

隨後郭江亮輸入指令“識別是否有人吃飯”,ChatVision通過分析,指出在視頻0-15秒有工人在車間吃飯的行爲,還詳細描述了“用筷子”“喝湯”等具體動作。

▲ChatVision識別吃飯行爲

最後,郭江亮輸入“退出”回到視頻流模式,並將攝像頭轉向現場的觀衆,讓ChatVision識別出正在微笑的人,ChatVision很快在畫面中畫出一個個紅框圈出目標。

▲ChatVision識別現場微笑的人

2、生成式輔助工業設計應用ChatCAD

接觸過工業製造的讀者應該知道,CAD幾乎是整個工業的基礎。面向CAD設計場景,創新奇智退出ChatCAD,支持以語言交互的方式生成機械、電氣設計,變革了設計方式並提升設計效率。

▲生成式輔助工業設計應用ChatCAD

創新奇智高級技術總監溫哲立現場演示了ChatCAD,通過簡單的自然語言輸入就能得到複雜的工業設計模型,還能進一步提出提出修改要求,生成模型兼容多種主流CAD格式。

▲ChatCAD功能和流程

ChatCAD界面基於AI原生原理打造,沒有複雜的菜單,其左邊是設計區,右邊是對話區。

溫哲立首先讓ChatCAD生成一個工業滑輪,給出了具體的參數。不出一分鐘ChatCAD就生成了相應的模型。

▲ChatCAD生成工業滑輪

隨後溫哲立接連提出兩個要求,讓ChatCAD修改滑輪中心軸半徑、邊緣凸出部分長度,很快便得到了滿足要求的生成結果。

▲ChatCAD根據追加要求修改模型

溫哲立又讓ChatCAD設計了一個直流電機,並再次提出2個追加要求,ChatCAD均正確生成。

▲ChatCAD設計直流電機

第三個演示中,溫哲立提出了一個極爲複雜的需求,要求ChatCAD生成一個渦輪機,對其扇葉數量、渦輪軸直徑、旋轉軸軸帽長度等多項參數都進行了具體數據要求。

▲ChatCAD生成渦輪機

在此基礎上溫哲立又要求ChatCAD將扇葉改爲8個,修改引擎罩長度等。

▲ChatCAD將扇葉改爲8個

最後溫哲立選擇STEP格式下載了該模型,它可以在相應CAD軟件中完美兼容。

▲在CAD軟件中打開生成的模型

3、工業機器人任務編排應用ChatRobot Pro

ChatRobot Pro在ChatRobot的基礎上,採用非侵入式腦電採集,對人腦電波進行解碼,實現通過意念控制機器人完成多樣化任務。

▲工業機器人任務編排應用ChatRobot Pro

創新奇智高級研究員高達輝演示了ChatRobot Pro,由一位現場工作人員連接外接腦機接口裝置,抓取目標商品並由機器人完成任務設定。

▲ChatRobot Pro功能和工作流程

在ChatRobot Pro工作界面中,左邊顯示腦電信號實時狀態,右邊是交互頁面。

▲ChatRobot Pro交互界面

據介紹,該任務的主要難點在於非侵入式腦機接口反映的是整體腦電波,無法直接反映局部意念,大模型需要從中解碼用戶的具體意圖。

首先,工作人員通過大腦“意念”控制光標移動,選擇了一種飲料,系統將命令下發給機器人。

▲工作人員“意念”選擇飲料

得到指令後,ChatRobot Pro自動完成了任務解析和步驟編排,並驅動機器人前往貨架選擇飲料。

▲機器人拿取飲料

隨後,機器人在ChatRobot Pro的控制下,通過視覺解析找到目標位置,前往高達輝面前,將飲料交到他手裡。

▲機器人將飲料交給高達輝

完成任務後,高達輝向ChatRobot Pro輸入“讓機器人歸位”的指令,ChatRobot Pro便規劃了任務規劃並驅動機器人回到初始位置。

▲ChatRobot Pro規劃機器人行動

結語:響應“人工智能”行動,創新奇智推動AI解放製造業

就在昨天,工信部在國新辦新聞發佈會上提到,加快推動以大模型爲代表的AI賦能製造業發展。今年將開展“人工智能+”行動,促進AI與實體經濟深度融合,推動AI賦能新型工業化。

創新奇智堅持深耕“AI+製造”領域,着眼於AI解放製造業,其工業大模型產品矩陣的行業價值正在逐步展現,爲企業實現數字化轉型提供了有力支撐。可以預見到,此次發佈的模型升級與三款新產品,將在工業領域產生更多創新場景,爲製造行業提供豐富的生成式AI解決方案。