中信證券:Sora發佈 關注算力+應用+AI監管

(原標題:AIGC|Sora發佈,關注算力+應用+AI監管)

來源:中信證券研究

文|劉易 侯蘇洋 田鵬 王濤 胡爽 王丹

OpenAI再次推出行業顛覆級新產品,我們認爲Sora爲目前文生視頻領域SOTA模型,在時長、分鏡、物理引擎、視頻格式、語義理解等文生視頻重點指標均大幅優於同類別產品,Sora的發佈標誌着文生視頻領域實現跨越式發展。展望行業未來發展趨勢,我們認爲Sora仍遵循當下AI大模型行業的規模效應,算力仍爲AIGC行業發展“底座”,以AI芯片爲核心的算力產業鏈仍具備空中加油的潛力。隨着未來Sora正式商業化落地,我們綜合梳理三條投資主線:受益於算力產業鏈景氣的支撐硬件,受益於AI大模型升級的AI應用,AIGC內容濫用風險擴大帶來豐富的AI監管需求。

▍OpenAI發佈Sora,重新定義文生視頻。

近期,OpenAI發佈文生視頻大模型Sora,再次點燃AIGC行業。根據OpenAI官網信息,Sora可生成時長爲1分鐘的高清視頻,初步具備對通用物理世界進行建模的能力。2023年以來,AIGC在文字、圖片以及視頻生成領域均迎來跨越式發展,我們認爲Sora爲目前文生視頻領域SOTA(state-of-the-art)模型,在時長、分鏡、物理引擎、視頻格式、語義理解等領域均大幅優於同類別產品:

1)時長方面,根據新京報貝殼財經數據,在相同的提示詞下,Sora可生成近1分鐘的視頻,Pika僅能生成3秒的視頻,Gen-2video可以生成4秒的視頻;

2)分鏡方面,我們認爲Sora具備媲美人類的場景設計能力,可直接輸出多角色、多場景和運鏡的視頻;

3)物理引擎方面,根據OpenAI官網公開的樣例,我們認爲Sora已初步具備模擬物理世界運行方式的能力,尤其對物體紋理以及物體運行軌跡模擬優於同類別產品;

4)視頻格式方面,Sora可支持多樣式視頻格式,可以採樣寬屏1920x1080p視頻、豎屏1080x1920視頻以及介於兩者之間的所有視頻格式,具備更高的可用性;

5)語義理解方面,Sora對提示詞有更深入的理解,能夠準確理解用戶意圖,在同一視頻的不同畫面可保持一致的視覺風格,保持較強的邏輯性。

▍融合多類型技術方案,OpenAI引領AIGC升級。

OpenAI持續推動AIGC行業發展,Sora橫空出世體現了OpenAI已將其在文字以及圖片生成領域的領先優勢延展至視頻領域。根據OpenAI官網技術文檔,OpenAI應用了諸如時空補丁(Spacetime Patches)、擴散轉換器(Diffusion Transformers)等技術,可將各類可視化數據轉化爲統一表示,從而達成生成式模型的大規模訓練,並最終實現生成不同持續時間、縱橫比和分辨率的視頻和圖像。另外,OpenAI也在Sora中借鑑或應用了DALL·E3和GPT技術,藉助其綜合AI大模型能力實現文生視頻SOTA模型。Sora借鑑DALL·E3中的re-captioning技術,對高度描述性的視頻轉譯進行訓練,顯著提高文本保真度和視頻的整體質量。同時,OpenAI還利用GPT技術將簡短的用戶提示轉換爲更長的詳細轉譯,使得Sora能夠精確地按照用戶提示生成高質量的視頻。

▍規模效應(Scaling Law)持續有效,算力產業鏈仍具備空中加油的潛力。

AI大模型具有“涌現能力”,當訓練量超過某個閾值時,模型精度會突然暴增。根據OpenAI官網技術文檔,Sora研發團隊發現擴散轉換器在視頻生成領域具有巨大的潛力,展示了不同訓練階段下,使用相同種子和輸入的視頻樣本對比,結果發現隨着訓練量的增加,樣本質量有着明顯的提高。我們認爲Sora實現現象級文生視頻效果再次證明,在現有的AI模型框架下,規模效應仍爲最有效方案之一,提供更爲充沛的算力基礎繼而提升模型訓練量爲升級AI大模型表現的重要途徑。因此,隨着AIGC行業技術發展,AI大模型向着泛化及特化兩條路徑持續發展,我們認爲算力仍爲AIGC行業發展“底座”,頭部科技企業仍將進行“算力軍備競賽”以推進AI大模型能力持續升級,以AI芯片爲核心的算力產業鏈仍具備空中加油的潛力。

▍我們預計文生視頻將在短視頻行業率先應用,2025年潛在市場空間中值達80億元。

Sora模型出色的語義理解、視頻編輯和擴展能力爲創作者提供了靈活和廣泛的創意空間,我們認爲有望加速文生視頻應用在各行業的滲透率。短視頻的時長普遍在60秒及以下,Sora的內容生成能力充分適配短視頻時長及應用場景,可以大幅提高創作效率並降低創作門檻。目前,我國短視頻行業仍處在快速發展階段,根據《2023中國網絡視聽發展研究報告》(中國互聯網絡信息中心),2022年我國短視頻市場規模接近3000億元。我們假設視頻創作成本佔短視頻市場規模的10%,在AI+視頻滲透率5%-35%、短視頻中視頻創作市場規模340-460億元的假設下,我們測算國內文生視頻應用在短視頻領域2025年潛在市場空間中值達80億元。

▍AIGC內容濫用風險擴大,AIGC監管重要性提升。

隨着Sora逐步推廣,大衆利用AI合成高質量視頻的難度將會進一步降低。因此,AIGC濫用生成包含有害內容或虛假信息的文本、照片、視頻,對個人、機構、社會帶來了新的安全問題。根據量子位智庫預測,中國AIGC市場規模有望在2030年達到11491億元。信息化投入中,安全投入佔比一般在5%-10%以上。由於AI大模型的特殊性,AI安全將會貫穿從數據標註、模型訓練和開發、內容生成、應用開發的全過程,投入佔比較高。我們假設AIGC監管在整個產業鏈中的佔比爲5%-10%,則測算出2030年我國AIGC監管市場規模將達到575-1149億元。

▍風險因素:

Sora等文生視頻模型商業化進展不及預期;Sora等文生視頻模型實際使用體驗不及預期;算力成本優化不及預期;政策監管持續收緊;行業競爭持續加劇;AI監管發展不及預期;地緣政治風險。

▍投資策略:

近期隨着Sora橫空出世,我們認爲其標誌着AI大模型保持高速迭代升級,AI大模型在泛化以及特化兩條發展路徑取得了長足進步。OpenAI再次推出行業顛覆級新產品,Sora爲目前文生視頻領域SOTA模型,在時長、分鏡、物理引擎、視頻格式、語義理解等文生視頻重點指標均大幅優於同類別產品。

展望行業未來發展趨勢,我們認爲Sora再次驗證當下AI大模型行業的規模效應規律,算力仍爲AIGC行業發展“底座”,以AI芯片爲核心的算力產業鏈仍具備空中加油的潛力。同時,我們認爲Sora有望在短視頻領域率先應用,短視頻的時長普遍在60秒及以下,Sora的內容產出能力充分適配短視頻時長與使用場景,可以大幅提升創作效率並降低創作門檻。此外,Sora等AI工具將大幅降低大衆利用AI合成高質量視頻的難度,AIGC內容濫用風險或將持續擴大,因此我們認爲AIGC監管重要性也將持續提升。

我們綜合梳理三條投資主線:1)受益於算力產業鏈高景氣的支撐硬件;2)受益於AI大模型升級的AI應用;3)AIGC內容濫用風險擴大帶來豐富的AI監管需求。