微軟開源多模態AI Agent

《科創板日報》26日訊,今天凌晨3點,微軟在官網開源了多模態AI Agent基礎模型——Magma。與傳統Agent相比,Magma具備跨數字、物理世界的多模態能力,能自動處理圖像、視頻、文本等不同類型數據,此外,Magma還能內置了心理預測功能,增強了對未來視頻幀中時空動態的理解能力,能夠準確推測視頻中人物或物體的意圖和未來行爲。