智譜攜清言視頻通話功能亮相2024服貿會 開啓AI新體驗

9月12日至9月16日,2024年中國國際服務貿易交易會(服貿會)在國家會議中心和首鋼園區盛大舉辦,本屆服貿會的主題是“全球服務,互惠共享”。在北京首鋼會展中心2號館,智譜展示了多款最新產品,包括旗下清言App近期重磅推出的“視頻通話”功能、清影AI生成視頻功能,以及大模型開放平臺bigmodel.cn等,諸多AI黑科技亮相引發廣泛關注。

清言作爲首批上線的C端大模型產品,過去一年中以文字和語音形式與用戶互動。如今,清言迎來重大升級,解鎖了“眼睛”, 這是全球首個面向大衆用戶開放的視頻通話功能,讓用戶體驗到目前最前沿的AI/大模型技術,正式進入視頻通話時代。

清言視頻通話功能跨越文本、音頻和視頻三大模態,具備實時推理能力。用戶可以打開攝像頭,通過視頻通話窗口與清言交流,清言不僅能“看”到用戶畫面,還能聽懂指令並準確執行。即使用戶頻繁打斷,清言也能迅速反應,帶來如同真人視頻通話的流暢體驗。另外可以用右下角小畫筆在畫面上劃重點,清言可以知道你着重讓它看的地方是哪。

使用方法也十分簡單,只需下載智譜清言APP, 點擊右下角的通話按鈕,進去之後再切換到視頻,就能開啓一個全新的世界與小智愉快暢談。

清言視頻通話功能可以成爲你生活、學習和工作中的得力助手。在生活方面,小智可以提供穿搭技巧、機器的使用方法、識別場景講述背景故事。

當大語言模型解鎖了“看見”和“說話”的能力,AI在學習和生活中的應用更廣泛了。

首先,清言變身成了一位隨身的英語翻譯,以及能夠隨時隨地開展情景教學的英語老師。清言不僅能夠即時翻譯中英文,還能根據用戶所處的環境信息進行英語對話,並且協助糾正用戶的語音和語法錯誤。

其次,清言還可以是孩子們的“大眼百科”。孩子們可以用視頻拍攝環境,並且讓清言解釋環境中陌生的物體叫什麼、能做什麼、英語怎麼說等等。此外,清言還可以爲孩子們閱讀繪本故事、玩你畫我猜等遊戲,成爲孩子們益智啓蒙的最佳玩伴。

當然,有了視頻通話功能後,清言還可以成爲旅遊時隨時講解景點故事的導遊,也能爲視障人士提供識別環境的幫助。還有更多場景和功能,等待大家一同發現。

在工作當中,小智可以提供面試指導、會議中完成紀要和總結、分析複雜的數據圖表、實時解讀電腦屏幕的代碼。

小智還能成爲你的學習搭子,爲你提供學科作業輔導。

無聊時小智還能是你的知心朋友,與你聊天玩遊戲。

見證了視頻通話功能的強大之外,智譜近期推出的視頻生成模型CogVideoX以及在智譜清言App上線的“清影”功能也吸引了不少觀衆駐足打卡。據瞭解,清影面向所有用戶開放,只需輸入文本或上傳圖片,30秒內即可生成6秒視頻。今年7月,清影上線清言App,六天時間用戶生成超過100萬支視頻。

實際上最近一段時間以來智譜動作頻頻,稱得上是技術動作最密集的大模型公司:一週前,智譜剛剛在 KDD 上發佈了升級版基座大模型GLM-4-Plus,以及CogView-3-Plus 和 CogVLM 在內的多模態模型,展示智譜對圖像、視頻等更多模態方面的研究進展,這正是業界公認的大模型的下一步。同時,類 GPT-4o 的視頻通話功能在 C 端產品智譜清言上率先上線。7 月,智譜生視頻功能清影 Ying 上線智譜清言,並很快將其背後的生視頻模型 CogVideoX 開源。通過大模型鏈接物理世界億級用戶,智譜致力於爲千行百業帶來持續創新與變革,加速邁向通用人工智能時代。