Sora根本不懂電影！有影視公司反應這個AI極其原始

今年二月，OpenAI推出了AI生成視頻大模型Sora，爲該領域引起轟動。盡管尚未公開測試，已有少量視覺藝術者、設計者獲得訪問權限，並發布了Sora生成的優秀視頻短片。其中，來自加拿大的Shy Kids團隊憑借對Sora的深入了解，拍攝了1分21秒的短片《氣球人》，成功將Sora視爲攝像機替代品。

談到制作過程，他們表述AI直接從文本生成理想大片尚屬幻想。實踐證實，OpenAI可能誤導觀衆以爲所有樣本皆由Sora獨立完成，而實際情況是，樣本背後包含大量人工專業制作，如分鏡、剪輯、調色和特效等，目前AI難以勝任。

制作電影仍需大量人工參與

Shy Kids，來自加拿大多倫多的專業影視創作團隊，因其獨特且創新的媒體表現手法聞名于世，被譽爲“朋克搖滾皮克斯”。該團隊曾榮獲美國電視藝術家協會（Emmy Award）獎項的提名，以及奧斯卡金像獎的入圍資格。此外，他們還爲迪士尼、Netflix、HBO等知名平台制作過衆多優秀作品，在業內享有盛譽。

然而，即使是如此專業的團隊，在使用Sora制作視頻過程中，也遭遇了一些挑戰。他們發現，傳統的劇本分鏡制作流程在Sora上難以實現。

據本片導演介紹，他們所使用的Sora仍沿用傳統的文本輸入生成視頻模式，並不支持當前廣泛應用的多模態輸入。這使得他們無法直接向Sora展示分鏡圖，從而無法生成連貫的視頻，只能逐個分鏡單獨生成視頻再進行拼接。

然而，這又帶來了新的問題。盡管AI能夠根據導演的需求生成相應的素材，但由于其對事物的理解與人類存在差異，因此無法保證每個片段都能准確複現所需元素。

導演舉例說明：如果要求Sora在廚房內拍攝一張桌上放著香蕉的長鏡頭，那麽它會基于對“香蕉”這一概念的理解生成視頻。雖然經過訓練，它可以識別出香蕉的顔色、形狀等特征，但由于缺乏實際的香蕉圖像或圖片庫，每次生成的香蕉可能有所不同，這對長視頻的拍攝産生了很大困擾。

爲了確保視頻的連貫性，團隊不得不對Sora生成的片段進行裁剪和拼接。同時，由于AI無法穩定生成特定的角色或道具，這也給《氣球人》的制作帶來了諸多傳統影視制作中未曾面臨的難題。

AI拍電影竟缺乏“鏡頭概念”？

這部短片的主角是一個黃色氣球頭的人物，由于AI無法穩定生成此類角色，故在這部僅有1分21秒的作品中，幾乎每一秒都需經大量後期調整才能保證角色的統一。

爲了解決此問題，Shy Kids決定采取大膽策略，通過大量生成相關片段，篩選出相對統一且有用的部分，進而組成完整影片。這使得原本計劃拍攝的電影轉變爲類似紀錄片的拼接形式。

負責後期制作的帕德裏克表示：“短片雖有劇本，但團隊需靈活應對”，“我們只是獲取了大量鏡頭，並嘗試以有趣的方式將其剪輯給旁白。”他透露，爲了完成這部影片，每一秒鍾的成片都需要約300倍的素材。

渲染這些原始素材成爲影片制作中最爲耗時的環節之一，團隊表示每次得到的素材長度在3-20秒之間，但渲染時間卻長達10-20分鍾。即使渲染出最終采用的素材，仍然需要大量的人工後期處理。

Shy Kids提供的信息顯示，即使每次都要求生成黃色氣球，Sora有時仍會生成紅色氣球，由于無更合適素材可用，後期團隊只能借助PS和AE將其塗成黃色。

當前的人工智能Sora在理解和實現這些概念方面仍存在困難。對此，Shy Kids表示：“關于如何描繪電影場景中的某個鏡頭，九個人可能會有九種不同的看法。我們在開發這款工具時，並未真正站在電影制作者的立場去思考問題。”盡管Shy Kids團隊深知他們所體驗到的Sora版本尚處于初級階段，但他們仍然對混亂無序的攝像機位置和視角感到驚訝。

此外，Shy Kids團隊還指出，他們曾嘗試在文本中強調固定機位或鏡頭語言的重要性，但他們並不確定這是否是因爲Sora無法理解他們的輸入方式，抑或是Sora本身缺乏相關的概念。

Sora作爲一款基于深度學習的人工智能平台，能夠通過機器學習和自然語言處理等技術，實現高效的視頻制作。此次《氣球人》的成功，無疑證明了這一點。

然而，在贊賞之余，也有人提出了不同的看法。部分網友認爲，雖然Sora的表現令人矚目，但其背後仍然需要大量的人力支持。這些人力投入了數百小時的工作，卻往往被人們忽視。此外，還有人對OpenAI等公司過度強調AI技術的營銷方式表示反感。

但索菲亞認爲，Sora給電影制作者們開啓了全新世界的大門，對電影制作行業造成了深遠影響。Sora 是當之無愧的電影制作行業的革新者，它的出現，不僅改變了電影制作的方式，也改變了觀衆對電影的期待。

娛樂新聞吧

Sora根本不懂電影！有影視公司反應這個AI極其原始

機器人索菲亞