OpenAI:Sora當前版本仍是研究項目,不會很快發佈

·在“可預見的未來”Sora不會被髮布,目前的版本仍是一個研究項目,不能在ChatGPT或其他地方使用。“對於什麼時候把它變成一個產品,我們目前甚至沒有任何時間表。我們正處於獲取反饋階段。”

OpenAI的Sora團隊在一檔播客中接受採訪。胡逸璠 來源:澎湃新聞(03:03)

OpenAI文生視頻大模型Sora不會很快發佈。

Sora團隊日前在一檔播客中接受採訪時表示,在“可預見的未來”Sora不會被髮布,目前的版本仍是一個研究項目,不能在ChatGPT或其他地方使用。“對於什麼時候把它變成一個產品,我們目前甚至沒有任何時間表。我們正處於獲取反饋階段。我們肯定會改進它,但我們應該如何改進它是一個懸而未決的問題。”OpenAI的Sora項目研究負責人蒂姆·布魯克斯(Tim Brooks)說。

“要聽聽安全專家的意見,如何讓這項技術對世界更安全。聽聽藝術家的意見,如何讓這項技術在工作流程中發揮作用。”布魯克斯表示,早期的反饋是,用戶希望對視頻生成有更多的控制,而不僅僅是文本提示。2月16日,OpenAI推出新的AI大模型Sora,該文生視頻大模型可通過快速文本提示創建“逼真”和“富有想象力”的60秒視頻。研究人員表示,Sora是在公開可用數據和OpenAI授權數據的組合上進行訓練的。目前Sora在生成手部、複雜的物理過程,以及隨時間發生的運動或軌跡方面存在侷限。

而在Sora生成視頻中添加音頻並不直接出現在開發路線圖上,但這是一種選擇。OpenAI的Sora項目負責人比爾·皮布爾斯(Bill Peebles)表示,對於目前的Sora版本,OpenAI聚焦推進視頻生產模型的能力,因爲在此之前,很多AI生成視頻的時長只有4秒,質量也不高。添加音頻確實會讓AI生成視頻更加沉浸式,這是團隊考慮的事情,但目前Sora主要是一個視頻生成模型。

AI可能會生成與真實視頻無法區分的視頻。爲了遏制虛假的人工智能視頻,Sora團隊負責人阿迪亞·拉梅什(Aditya Ramesh)表示,OpenAI計劃爲Sora調整OpenAI圖像生成工具DALL-E 3的分類器。圖像分類器可以可靠識別圖像是否使用DALL-E 3創建。“這本身不是一個完整的解決方案,但可以看作是第一步。”

他們還提到了Sora在創意產業中潛在的革命性作用:通過降低生產成本,Sora可以實現以前由於資金問題而無法實現的創新內容。布魯克斯表示,“通過創造全新的工具,讓有創造力的人推動創意的邊界,是非常令人激動的。”