數智早參|國內首個純自研視頻大模型推出;純電驅擬人奔跑機器人“天工”發佈

每經記者:李少婷 每經編輯:文多

丨 2024年4月29日 星期一 丨

NO.1 國內首個純自研視頻大模型推出

4月27日,在中關村論壇未來人工智能先鋒論壇上,生數科技聯合清華大學正式發佈中國首個長時長、高一致性、高動態性視頻大模型Vidu。據悉,該模型採用Diffusion(擴散概率模型)與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。生數科技方面介紹,與Sora一致,Vidu能夠根據提供的文本描述直接生成長達16秒的高質量視頻。

點評:Vidu的推出是中國在人工智能視頻生成領域的重要里程碑,提升了中國在全球人工智能領域的競爭力和影響力,展現了中國科研實力和創新能力。就技術細節而言,Vidu在時長上取得了突破,但與Sora相比,Sora的最長視頻生成時長可達60秒,Vidu目前的16秒,仍有提升空間。在人物動作的協調性方面,儘管整體效果已經非常接近,但Vidu與Sora相比還是稍弱一些。

NO.2 純電驅擬人奔跑機器人“天工”發佈

4月27日,北京人形機器人創新中心在北京經開區發佈全球首個純電驅擬人奔跑的全尺寸人形機器人“天工”,它能以6公里/小時的速度穩定奔跑。“天工”高163釐米,輕量化體重43公斤。“天工”配備多個視覺感知傳感器,具有每秒550萬億次操作算力,並配備高精度的慣性測量單元和3D視覺傳感器。它已解決基本運動控制問題,是具身智能場景應用和研究的最佳平臺。此外,“天工”還配備了高精度的六維力傳感器,以提供精確的力量反饋。

點評:“天工”能夠以6公里/小時的速度穩定奔跑,顯示了運動控制和平衡技術的進步,這也表明機器人技術正在向更高級別的自主性和動態穩定性發展。“天工”具備開源開放性和兼容擴展性,提供開放調用通信接口,允許靈活擴展軟件和硬件功能模塊,這爲廣泛的應用場景提供了可能。人形機器人產業鏈較長,涉及傳感器、電機、減速器等多個環節,“天工”的成功研發和應用,可能會帶動相關產業鏈的技術進步和市場擴大。

NO.3 科大訊飛發佈首個長文本、長圖文、長語音大模型

科大訊飛於近日發佈首個長文本、長圖文、長語音大模型,它不僅能夠對各種信息來源的海量文本、圖文資料、會議錄音等進行快速學習,還能夠在各種行業場景給出專業、準確回答。此外,科大訊飛還進一步升級星火語音大模型,首發多情感超擬人合成,具備情緒表達能力,並推出一句話聲音復刻功能。同時,面向企業應用場景,科大訊飛推出星火智能體平臺,幫助企業解決大模型落地的“最後一公里”難題。

點評:科大訊飛在語音識別和自然語言處理領域具有較強的技術積累,這使得其大模型產品在處理複雜語言和語音任務時更爲精準和高效。能夠同時處理文本、圖像和語音的多模態大模型,爲用戶帶來更爲豐富和直觀的交互體驗。具備情緒表達能力的語音合成技術,使得機器合成的聲音更加自然,更能滿足用戶對情感交互的需求。不過,在實際應用中,大模型需要展現出高穩定性和可靠性,以贏得用戶的信任。

NO.4 中國移動已初步建成算力網絡

4月28日的2024中國移動算力網絡大會上,中國移動董事長楊傑在演講中表示:中國移動已初步建成了基礎設施、技術能力、產品服務業界領先的算力網絡,其中,算力併網平臺接入蘇州崑山超算中心、玻色量子等數十家合作伙伴的多樣化算力。算網大腦研發於去年10月正式啓動全網試商用,實現日均調度次數達億級。

點評:數字化、雲計算、大數據、人工智能等技術的發展對算力提出了更高的需求,算力網絡成爲支撐未來數字經濟發展的關鍵基礎設施,中國移動通過建立算力網絡,能夠更好地滿足市場和用戶的需求。作爲運營商,中國移動在網絡基礎設施、用戶規模、數據資源、服務能力等方面具有天然優勢,這些優勢有助於其在算力網絡的建設和運營上取得領先地位。