美圖不想在文生視頻領域和巨頭們“硬碰硬”

6月12日,美圖公司(01357.HK)一口氣發佈及更新了6款產品,包括美圖雲修V2、開拍V2、美圖設計室V3、站酷設計服務、奇覓及MOKI,覆蓋商業攝影、遊戲營銷、視頻生成等多個領域。

MOKI是該公司新發布的AI短片創作平臺,主要輔助創作者製作動畫短片、網文短劇、故事繪本和MV。該平臺將於7月31日推出。

據界面新聞了解,目前美圖產品所需的AI模型能力,均由美圖奇想大模型(MiracleVision)提供。該模型已迭代到V5版本,採用自研DiT技術架構,涵蓋圖像大模型、視頻大模型、音頻大模型和文本大模型。

美圖公司創始人、董事長兼首席執行官吳欣鴻認爲,AI應用將經歷點、線、面三個階段,美圖正嘗試把AI單點功能串聯起來,以運用到電商、廣告、遊戲、影視、動漫等行業。 例如在MOKI上,輸入一個簡單的故事劇本後,模型可將短片操作流程進行結構化拆解,然後生成短片。

這並非美圖首創。早在今年2月,OpenAI發佈的Sora便在文生視頻領域掀起了一輪巨浪,此後有多家大模型相關公司跟進。但美圖方面表示,用類似的文生視頻模型輔助內容創作,故事成片難,可控性較差。

在吳欣鴻看來,文生視頻領域涉及蒙太奇等多種剪輯效果,可控性遠比時長更重要,它意味着AI需要完成各種各樣的複雜工作。

文生視頻的另一難題還在於,用戶輸入一整篇小作文才能輸出短片,且要考慮場景、人物、運動軌跡以及各種精細化的視頻內容呈現。但現實情況是,很多內容難以用文字去描述清楚。

即便Sora仍有種種不足,要在短期內追上它的技術能力和生成效果並不容易。對此,美團的策略是“不在模型側一味硬碰硬”。

吳欣鴻指出,如果在文生視頻領域“硬剛”,其競爭對手會是全球巨頭。無論在資金投入還是算法層面,美圖與巨頭們都存在一定差距。但在應用層,該公司希望通過提供一站式的內容創作方案來搶佔更多市場。

爲了能更好地“控制”其應用,這家公司選擇自研大模型。“如果我們用外部API或者開源大模型,很難在底層進行深度開發。 ”吳欣鴻向界面新聞表示,目前AI技術領先於AI應用,將AI概念轉化爲優秀產品的並不多。

不少大模型公司都在追求參數量、打榜,以證明自己的技術實力和資金投入,背後卻是高昂的成本,以及由此帶來的商業化挑戰。

美圖試圖在投入和盈利之間尋求平衡。“搞模型軍備競賽不是美圖的核心戰略,我們會在保證應用競爭力的前提下,控制模型的投入。”他還強調,過去很長時間美圖都是常年虧損,所以會更看重落地場景和商業模式。”

吳欣鴻認可“模型即應用是大趨勢”,也注意到國內很多大模型公司都在往應用方向走,或快或慢。他相信應用會是十倍於模型本身的市場空間。

從此次發佈的產品可知,這家公司有意迴歸最爲熟悉的影像領域,且正在設法爭取更多企業用戶。

近年來,其曾做過多元化嘗試,涉足手機制造、電子商務、金融科技等領域,但頻頻受挫。當下着力的AI應用,也同樣面對來自字節跳動、騰訊、快手等大型互聯網公司,以及新晉大模型獨角獸們的圍追堵截。

該公司2023年財報顯示,其企業端業務收入爲5.7億元,佔總營收的21%,消費端業務佔比近50%,營收達13.3億元。企業端要超過消費端營收,美圖仍有很長的一段路要走。

截至6月12日收盤,美圖公司收盤價爲2.78港元,下跌9.74%,總市值126.08億港元。