Sora根本不懂電影!有影視公司反應這個AI極其原始

機器人索菲亞 2024-05-05 11:15:17

今年二月,OpenAI推出了AI生成視頻大模型Sora,爲該領域引起轟動。盡管尚未公開測試,已有少量視覺藝術者、設計者獲得訪問權限,並發布了Sora生成的優秀視頻短片。其中,來自加拿大的Shy Kids團隊憑借對Sora的深入了解,拍攝了1分21秒的短片《氣球人》,成功將Sora視爲攝像機替代品。

談到制作過程,他們表述AI直接從文本生成理想大片尚屬幻想。實踐證實,OpenAI可能誤導觀衆以爲所有樣本皆由Sora獨立完成,而實際情況是,樣本背後包含大量人工專業制作,如分鏡、剪輯、調色和特效等,目前AI難以勝任。

制作電影仍需大量人工參與

Shy Kids,來自加拿大多倫多的專業影視創作團隊,因其獨特且創新的媒體表現手法聞名于世,被譽爲“朋克搖滾皮克斯”。該團隊曾榮獲美國電視藝術家協會(Emmy Award)獎項的提名,以及奧斯卡金像獎的入圍資格。此外,他們還爲迪士尼、Netflix、HBO等知名平台制作過衆多優秀作品,在業內享有盛譽。

然而,即使是如此專業的團隊,在使用Sora制作視頻過程中,也遭遇了一些挑戰。他們發現,傳統的劇本分鏡制作流程在Sora上難以實現。

據本片導演介紹,他們所使用的Sora仍沿用傳統的文本輸入生成視頻模式,並不支持當前廣泛應用的多模態輸入。這使得他們無法直接向Sora展示分鏡圖,從而無法生成連貫的視頻,只能逐個分鏡單獨生成視頻再進行拼接。

然而,這又帶來了新的問題。盡管AI能夠根據導演的需求生成相應的素材,但由于其對事物的理解與人類存在差異,因此無法保證每個片段都能准確複現所需元素。

導演舉例說明:如果要求Sora在廚房內拍攝一張桌上放著香蕉的長鏡頭,那麽它會基于對“香蕉”這一概念的理解生成視頻。雖然經過訓練,它可以識別出香蕉的顔色、形狀等特征,但由于缺乏實際的香蕉圖像或圖片庫,每次生成的香蕉可能有所不同,這對長視頻的拍攝産生了很大困擾。

爲了確保視頻的連貫性,團隊不得不對Sora生成的片段進行裁剪和拼接。同時,由于AI無法穩定生成特定的角色或道具,這也給《氣球人》的制作帶來了諸多傳統影視制作中未曾面臨的難題。

AI拍電影竟缺乏“鏡頭概念”?

這部短片的主角是一個黃色氣球頭的人物,由于AI無法穩定生成此類角色,故在這部僅有1分21秒的作品中,幾乎每一秒都需經大量後期調整才能保證角色的統一。

爲了解決此問題,Shy Kids決定采取大膽策略,通過大量生成相關片段,篩選出相對統一且有用的部分,進而組成完整影片。這使得原本計劃拍攝的電影轉變爲類似紀錄片的拼接形式。

負責後期制作的帕德裏克表示:“短片雖有劇本,但團隊需靈活應對”,“我們只是獲取了大量鏡頭,並嘗試以有趣的方式將其剪輯給旁白。”他透露,爲了完成這部影片,每一秒鍾的成片都需要約300倍的素材。

渲染這些原始素材成爲影片制作中最爲耗時的環節之一,團隊表示每次得到的素材長度在3-20秒之間,但渲染時間卻長達10-20分鍾。即使渲染出最終采用的素材,仍然需要大量的人工後期處理。

Shy Kids提供的信息顯示,即使每次都要求生成黃色氣球,Sora有時仍會生成紅色氣球,由于無更合適素材可用,後期團隊只能借助PS和AE將其塗成黃色。

當前的人工智能Sora在理解和實現這些概念方面仍存在困難。對此,Shy Kids表示:“關于如何描繪電影場景中的某個鏡頭,九個人可能會有九種不同的看法。我們在開發這款工具時,並未真正站在電影制作者的立場去思考問題。”盡管Shy Kids團隊深知他們所體驗到的Sora版本尚處于初級階段,但他們仍然對混亂無序的攝像機位置和視角感到驚訝。

此外,Shy Kids團隊還指出,他們曾嘗試在文本中強調固定機位或鏡頭語言的重要性,但他們並不確定這是否是因爲Sora無法理解他們的輸入方式,抑或是Sora本身缺乏相關的概念。

Sora作爲一款基于深度學習的人工智能平台,能夠通過機器學習和自然語言處理等技術,實現高效的視頻制作。此次《氣球人》的成功,無疑證明了這一點。

然而,在贊賞之余,也有人提出了不同的看法。部分網友認爲,雖然Sora的表現令人矚目,但其背後仍然需要大量的人力支持。這些人力投入了數百小時的工作,卻往往被人們忽視。此外,還有人對OpenAI等公司過度強調AI技術的營銷方式表示反感。

但索菲亞認爲,Sora給電影制作者們開啓了全新世界的大門,對電影制作行業造成了深遠影響。Sora 是當之無愧的電影制作行業的革新者,它的出現,不僅改變了電影制作的方式,也改變了觀衆對電影的期待。

0 阅读:14

機器人索菲亞

簡介:全球首位機器人公民,“一帶一路 ”科技創新大使