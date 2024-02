一名身穿黑色皮樓、紅色長裙與黑色皮靴的女子,戴著太陽眼鏡,在掛滿霓虹燈招牌的東京街頭漫步。這段看似平平無奇的短片,甫推出即引起轟動,全因它是由OpenAI新推出的影片生成模型「Sora」產製出來。用戶只需輸入提示詞,它就可以生成包含精細場景、複雜運鏡的1分鐘電影級短片,躍居業界標竿。但如此逼真的AI生成影片效果,卻可能對數碼娛樂產業帶來一定衝擊,甚至加劇深偽假影片的泛濫。

影片呈現細膩場景、複雜運鏡手法

目前市場上的影片生成AI模型,頂多只能產製構圖簡單、鏡頭固定的十幾秒短片,例如較多人使用的Runway可以輸出4至18秒影片。OpenAI於2024年2月15日發表全新AI模型「Sora」,可根據用戶輸入的文字提示詞或靜態圖片,生成長達60秒的連貫流暢影片,猶如一石激起千重浪,震撼整個AI業界。

OpenAI在官網上架設了Sora專頁,講解該模型的運作原理,並展示40多段由Sora產製的演示影片。(圖片來源:翻攝OpenAI官網)

利用Sora所生成的東京女子街頭漫步短片,輸入AI提示詞為「A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.」

(圖片來源:翻攝OpenAI演示影片)

Sora的厲害之處在於,所輸出的1080p影片呈現出細膩精緻場景、生動角色表情,並加入複雜運鏡手法,產生有動態視角變化的畫面;當拍攝角度變換時,影片人物和事物皆能在立體空間中連貫移動。

即使影片中的人物與事物被擋住或移出畫面,Sora仍能保持這些人與事存在於畫面範圍以外,當拍攝視角轉換到能看到時,就會將這些人與事重新呈現出來,並保持外觀和風格一致。科技網媒《Wired》盛讚,Sora生成的影片非常逼真,這是從未在其他AI模型作品中看過的真實感。

Sora生成的模擬航拍影片:一對情侶在櫻花道上行走,航拍機緊隨其後拍攝,視角產生多樣變化,而畫面一直保持著連貫性,影像逼真流暢。(圖片來源:翻攝OpenAI演示影片)

生成影像符合現實世界物理定律

OpenAI表示,Sora能夠深入理解人類的語言,不但能準確地呈現提示詞所描述的各種事物,還可知曉這些事物是如何存在於現實世界,並要遵循那些物理規律。輝達(NVIDIA)資深研究科學家Jim Fan以咖啡杯內海盜船大戰的Sora影片為例,指出AI模擬兩艘海盜船在杯內互相追逐和對戰的場景,呈現出符合流體力學原理的咖啡液體流動。因此,他直言Sora是一個以數據驅動的物理引擎,能夠模擬真實或虛擬世界。

Sora生成的咖啡杯內海盜船大戰短片,對咖啡液體流動與光影變化處理均十分逼真,完全符合物理規律。(圖片來源:翻攝OpenAI演示影片)

不過OpenAI坦承,Sora尚有不少待改進之處。它無法完全模擬複雜場景裏的物理規律,而且不太理解具體事例的因果關係,例如影片中人物吃了一口餅乾,惟餅乾卻依然完整無缺。再者,它有時會搞混了提示詞所述的空間細節,譬如左右不分,並且難以精確呈現隨著時間變化的事物。

降影片製作門檻人人皆可做導演

儘管如此,Sora已大幅降低影片製作的門檻了。就算閣下沒有拍攝器材,又不懂得拍片和剪片技巧,只要用文字寫出你的想法,Sora即可將之轉化成短片,邁向「全民皆可做導演」的黃金年代。市調機構ABI Research高級分析師里斯·海登(Reece Hayden)認為,Sora這種影片生成模型將對數碼娛樂產業造成重大影響。

若說Sora真正威脅到電影製作行業,可能還有一段很長的路要走。因為即使輸入完全相同的提示詞,AI每次生成的影片內容總會有所差異,所以不可能簡單地把120段1分鐘短片拼接起來,就可以合併成一齣劇情和畫面連貫的電影。

YouTuber擔憂被Sora完全取代

觀乎Sora可以生成1分鐘短片的能耐,它很有機會成為顛覆社交媒體平台的新工具。近年Instagram Reels、YouTube Shorts、TikTok等短視頻格式相繼冒起,成為年輕網民最喜歡在社交媒體上收看的新類型內容。現在有了Sora,任何人都能用AI技術生成高質短片,這將進一步加快短視頻的普及。海登指出,未來針對不同受眾的客製化短片,將會在不同數碼渠道上廣泛傳播。

然而,這樣卻令不少YouTuber和內容創作者擔憂,自己可能會否被AI完全取代。擁有逾1,800萬名訂戶的科技YouTuber馬克斯·布朗里(Marques Brownlee)表示,看到AI正在做他的工作,讓他感到恐懼,並覺得受到威脅。

OpenAI正開發AI影片檢測工具

更嚴重的是,AI愈來愈逼真的影片生成能力,可能會令以深偽(Deepfake)技術製作的假影片變得更多,兼且更難以辨別。有鑑於此,逾400名來自學術界、政界、演藝界的知名人士聯署一封公開信,呼籲加強對深偽製品的監管,包括:要求AI公司預防其工具被用來生成有害的深偽成品、把深偽兒童色情製品全面定為犯罪、以及對任何故意生成或促進散播有害深偽作品的個人判處刑罰。

正因為Sora可能會帶來巨大的潛在風險,所以OpenAI只將該模型定為研究預覽版本,暫未全面開放給公眾使用。除攻擊模擬團隊(Red Team)與有關AI專家外,目前Sora僅提供給少數受邀藝術家、設計師與電影製作人試用。

OpenAI現正積極開發能夠檢驗AI生成影片的工具,並擬在Sora輸出影片中加入C2PA後設資料(Metadata),以便查證影片生成來源和相關資料。同時,Sora也會像圖片生成工具Dall-E般拒絕產製暴力、性或仇恨內容,以及名人相關影像。由此可見,OpenAI應該會在做好防範措施後,始會全面推出Sora服務。