《賣身契》修複記:AI重現“打工人”喜劇魅力,留住老電影的黃金時代

新眸 2024-04-22 20:19:00

作者|鹿堯

電影修複是一個世界性課題,讓一部橫跨世紀的老電影重回大銀幕,這件事的意義不僅僅是爲了讓經典重現,也是對當年文化的一種拾遺。

拿北京國際電影節來說,它每年都會有一個特殊的展映單元“致敬·修複”,收錄當年被精心修複過的老電影在活動中公映。今年的北影節也不例外,片單中包含了兩部4K修複版本的電影《A計劃》和《賣身契》,這是由火山引擎提供技術支持、並與中國電影資料館共同完成修複的兩部作品。

秉持著“修舊如舊,尊重原創”的原則,《A計劃》和《賣身契》曆經物理、數字、AI等多重技術修複,最終以更清晰、更流暢、更還原本色的4K效果呈現在觀衆面前。一位80後女觀衆表示,看完全片,雖然自己對劇情和台詞已經熟悉,但相比小時候的錄像帶,4K修複後的影片更有視覺沖擊力。

《A計劃》、《賣身契》海報

從具體的修複過程來看,如果說電影是每秒24幀的藝術,那麽電影修複則是一幀一幀的技術挑戰。事實上,早在去年,在這項由抖音、火山引擎和中國電影資料館共同發起的“經典香港電影修複計劃”中,技術人員就曾首次將AIGC視覺大模型引入到影片修複,對大模型進行了生成質量和效率等方面的算法優化。

如今隨著Sora等大模型在視覺領域的發展,視覺大模型不僅運用在視頻生成、修改、融合和延伸等多種場景,還可以應用到剪輯和特效制作等影視産業的流程中。在這樣的背景之下,火山引擎的修複工作,既讓老片重現了光彩,同時也是AI大模型實際應用落地的一次檢驗和展示。

01

把一部老電影重新搬上銀幕

究竟有多困難 ?

《A計劃》與《賣身契》都是上世紀港片黃金時代的經典作品,不過和《A計劃》充滿了硬橋硬馬的特效和實戰風格不同,《賣身契》作爲一部許氏喜劇,更強調對香港社會現實的寫照:

藝人薛志文因賣身契束縛于電視台,無法跳槽。他與弟弟志英、好友朱世傑聯手策劃解除合約,期間上演了一幕幕笑料橫生的戲碼。電影不僅僅刻畫了一個和權勢鬥爭的打工人形象,導演許冠文更以幽默筆觸,犀利諷刺了社會中的人情淡薄與金錢至上。

時隔多年,當你再打開這部《賣身契》,個中意味仍然深長。就像同名主題曲中講述一個人從嬰兒到成家立業的種種瑣事,這同樣也照進了今天無數人的人生。

遺憾的是,這部46年前的作品受限于當時的技術和設備,電影膠片曆經歲月,已出現偏色、變形,直接影響了畫面清晰度和穩定性,對焦不准更使得原片中出現不少模糊畫面。而在現實情況裏,這些都並不鮮見,甚至已經成了整個行業困境的縮影。

在電影誕生初期,膠片都是硝酸片基,溫度超過40度就會存在自燃風險。後期雖然換了醋酸片基,但仍面臨著酸化、變質等問題。除此以外,保存、運輸不當,潮濕、高溫環境,機械磨損、頻繁使用及清潔不當,也都會給影像質量産生負面影響。

一部老電影要想從修複間走上銀幕,經曆的困難遠比想象多。一般情況下,電影修複分爲物理、數字、藝術修複三個步驟:物理修複涉及膠片接補、清潔等,爲數字化掃擋做准備;數字修複則逐幀處理各種瑕疵;藝術修複還原影片原色,力求“修舊如舊”。這些都需要專業的設備和人員來進行操作。

受損的膠片更需要專人手工修複,經過反複的試驗和調整,方能達到最佳還原效果。

對于受損非常嚴重的膠片,修複師需要進行細致的手工修複,幀對幀地精確分析處理,調整色彩亮度等參數。據了解,一部影片大概有12萬到15萬幀,往往需要十來個人進行反複的試驗和調整。普通的2K修複依靠人工大概用兩到三周完成,而4K畫質更好、觀感更清晰細膩,修複時間起碼在兩個月以上,甚至半年之久。

你很難想象,自20世紀初,這樣的老電影已經積攢了近3萬部。換句話說,它們會不會消失,就看修複的速度能不能趕上膠片衰退的速度。

隨著深度學習等AI技術的飛速發展,以火山引擎爲代表的技術公司給行業帶來了一些新的解法。比如針對《賣身契》的色偏問題,火山引擎利用AI技術預測並糾偏畫面白點的校色矩陣;對于畫面老化、模糊等挑戰,工程師運用先進的神經網絡模擬清晰化過程,使畫面更加細膩真實。

修複前VS修複後

AI不僅能解決很多的重複性工作,還可以自動識別和修複影片中的缺陷,噪點、黑色缺陷、抖動等損傷都能通過學習大量數據進行修複。除此以外,用降噪算法減少視頻中的噪聲、用去霧算法消除惡劣天氣對畫面的影響,還有插幀技術提高視頻的流暢度和清晰度,AI正在讓影片修複這件事變得更有看頭。

02

如何衡量一部老電影的現代修複標准?

作爲脫胎于字節跳動的技術中台,成立至今,火山引擎多媒體實驗室每天都要對抖音、西瓜視頻等平台上的海量投稿進行畫質處理,尤其是對低配機型拍攝的低畫質素材進行優化,使得它不僅掌握了海量的數據處理經驗,還擁有了大量先進的視頻處理技術。

早在2021年,火山引擎就曾聯合西瓜視頻在一年內對百余部經典動畫作品進行4K修複,後續還與抖音合作,完成了Beyond演唱會的修複工作。就在去年,團隊又聯合抖音、中國電影資料館共同發起了“經典香港電影修複計劃”,利用AI+人工的技術對上百部影片開展修複。

對修複人員來說,這門工作是一個講究長期性的過程,只有大規模的實踐和技術的持續叠代,才能夠取得技術上的突破。

舉個例子,不同于以前的算法,火山引擎的工程師們在經典香港電影修複計劃中首次應用了視覺大模型,借助Stable Diffusion的生成能力,讓畫面的細節表現更加自然;在學習了海量數據對後,大模型的生成空間也更豐富,能夠應對更複雜的修複場景。

不過這種方式也會帶來風險,例如在圖像轉換或處理時,尤其是進行降噪、銳化等操作,一旦模型設計、調優、訓練數據不足,或有不同場景下的光照、物體反射等影響,圖像中的某些特征就會被過度強化或削弱,進而生成僞影和虛假紋理,影響到視頻多幀場景的穩定性。

另一方面,在面對極低畫質下人像模糊的考驗時,和普通的回歸模型相比,Diffusion擴散模型雖然能夠捕捉到更多的人像細節,但它同樣可能會導致重建時可能讓圖像變得不那麽真實。

面對以上問題,火山引擎在算法和工程上又進行了一系列優化,提升了大模型在4K場景下的處理效率並兼顧算力成本。隨著修複工作的深入,他們並不簡單粗暴地提升畫面效果,而是更注重還原那個年代電影的原汁原味,在這樣的認知下,團隊研發了一種自適應的質感增強方案。

這個方案會根據不同區域的亮度自適應生成顆粒融合曲線,增加一些隨機斑點和老式的顆粒狀外觀,模擬老電影真實的拍攝噪聲,這些顆粒隨機分布,與影片融合,讓電影的質感瞬間提升。

除了人像和畫面,影片中的一些文字修複也被團隊考慮到,比如一些字幕、場景中的文字,這些細枝末節會隨著影片老化而退化。火山引擎團隊針對大文字、小文字分別設計了不同的技術方案,達到對文字的有效重建。

修複前VS修複後

對于影片修複的工程師來說,比起通過更高超的算法技術,將畫面的效果變得更寫實、更鮮豔,實際上他們面臨的最大挑戰,是保留影片原有的藝術風格:

在這一過程中,火山引擎和中國電影資料館進行了多輪溝通和討論,經過不斷的測試和反複地調優,努力達到算法服務于藝術的理想效果。

修複團隊還找到原來的主創人員,包括導演、攝影師等,深入交流後收集他們的意見和建議;這些寶貴的意見,能夠指導修複團隊進一步訓練單獨的算法,從而再反哺到畫面的修複中。

倘若發現通過模擬退化獲取的匹配數據,並不能反映真實的損傷情況,修複人員甚至會用大模型來評估圖像的質量,通過提示來控制增強的效果。

不過以上又延伸出另一個問題:技術之外,工程師如何建立一個新的標准,在不破壞質感的前提下,把老電影修得更現代,更容易讓現代年輕人接受?

經典影片往往承載著特定時代的文化和審美觀念,但現代觀衆的主觀感受也是修複方案的重要一環。據中國電影資料館事業發展部主任黎濤介紹,在指導《武狀元蘇乞兒》的修複過程中,陳嘉上導演表示,希望把這部片子修得更現代,更容易讓現代年輕人接受。

因此,今年一月,針對港片和畫質相關的問題,火山引擎從各個平台篩選50多位影迷對不同技術方案的4K修複版《開心鬼》進行測評,背後就是基于其“面向用戶體驗”的數據體系:QoS(技術質量)和QoE(體驗質量)。

這套數據體系的意義在于,它將技術質量和用戶體驗緊密結合,通過客觀和主觀兩方面的評估,爲修複人員提供了全面的優化方向。相當于火山引擎建立了一個新的修複標准,通過適度的創新和調整,使修複後的影片既符合曆史價值,又能夠滿足現代觀衆的審美需求。

03

影視修複

視覺大模型應用落地的新思路

今年Sora給整個視頻行業帶來了前所未有的地震,基于Transformer架構,它能夠根據文字、靜態圖像生成長達60秒的高質量視頻,無論是複雜的攝像機運動,還是多個角色的情感表現,Sora的視頻效果顛覆了人們對以往AI能力的想象。

但事實上,相比僅僅去關心Sora的生成作品,人們更能夠注意到,大模型的出現,一旦真正落地到某一個具體的産業,它可以用更低的成本和更高的時效,生産出相應高質量的內容,在改變遊戲規則的同時,提升整個行業的運轉效率。

仍以Sora爲例,它在生成不同風格和畫幅的高清視頻,同時,也可以根據圖像及語義填充視頻的缺失幀,這其實能夠給影片修複行業帶來一定的啓示:利用大模型將老舊影片轉化爲高清版本;通過AI的學習能力彌補影片的丟幀,對拍攝時技術限制導致的畫面缺陷,通過智能分析進行針對性修複。

而這些,正是火山引擎影片修複團隊在探索的事情。

就在前不久,火山引擎在NTIRE CVPR 2024盲壓縮圖像增強賽道的挑戰賽中獲得冠軍,再次驗證了AI在影片修複中發揮的價值。而這項技術,針對的正是修複過程中最難的一個點:如何解決老片修複過程的大量不可預知的損害。

老電影的膠片在轉換成數字格式時,經常會因爲壓縮而變模糊或失真,如果說傳統的修複技術是在原有畫面基礎上縫縫補補,那麽盲壓縮圖像恢複(CIR)的方案則借鑒了AI大模型中的提示詞學習概念。簡單來說,就是給AI一個“提示”,讓它知道哪裏需要修複,怎麽修複,通過設計基于提示學習的網絡,動態地感知圖像的內容和失真情況,來恢複不同壓縮級別的圖像。

這種方法的優點在于非常輕,不需要太多的計算資源就能工作。這樣一來,它就能適應不同壓縮級別的圖像,而且不用占用太多的存儲空間。同時,它的處理速度比傳統的AI大模型要快很多,但修複效果卻不相上下。

類似的例子還有很多,在火山引擎進行影片修複的同時,不斷叠代升級出的新技術,其實也會對其他行業産生借鑒意義,比如同樣的AI技術如果能夠用于修複電影,那麽同樣的原理也可以應用到其他需要進行圖像處理的領域。

換句話說,也許當下所做的影片修複,並不僅僅是爲了現在的技術去彌補藝術的遺憾,用更深遠的眼光來看,這也是AI大模型應用落地的一次酣暢淋漓的實驗:AI如何更好地商業化,如何變得更加實用,在人們都在尋找答案的時候,火山引擎已經給出了一些參考。

0 阅读:3

新眸

簡介:看見商業另一面。