階躍星辰首次開源Step系列多模態大模型
財聯社2月18日電,階躍星辰和吉利汽車集團聯合宣佈,將雙方合作的階躍兩款Step 系列多模態大模型向全球開發者開源。其中,包含目前全球範圍內參數量最大、性能最好的開源視頻生成模型階躍Step-Video-T2V,以及行業內首款產品級開源語音交互大模型階躍Step-Audio。階躍Step-Video-T2V模型的參數量達到 300 億,可以直接生成204幀、540P分辨率的高質量視頻。階躍Step-Audio是行業內首個產品級的開源語音交互模型,能夠根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地高質量對話。模型生成的語音具有超自然、高情商等特徵,同時也能實現高質量的音色復刻。用戶即日起可在躍問APP內體驗新功能。