OpenAI Sora模型的問世:影像生成的躍進與社會信任的挑戰

創新科技的雙重意涵:賦權創造力或加劇亂序

· 巨頭戰爭,科技與AI,人權社會-數位人權

撰稿人:Lia / 責任編輯:Zaphyra

2024年2月15日,人工智慧研究機構OpenAI發表了其最新的生成式模型Sora,這款能夠將簡單的文字描述轉換為長達一分鐘、具備高度擬真感與敘事連貫性的影片,標誌著人工智慧在理解與模擬物理世界方面取得了驚人的進展。Sora的展示影片-從東京街頭的雪景、加州淘金熱的歷史影像,到充滿奇幻色彩的動畫角色-其精緻程度與流暢性,幾乎達到了專業影視製作的水平。此一技術的公布,不僅在科技界與創意產業引發了廣泛的討論,更將關於人工智慧潛在風險,特別是不實資訊傳播與智慧財產權的辯論,推向了前所未有的高度。

Sora的出現,一方面被視為創意工具的巨大革新。它大幅降低了高品質影像製作的門檻,讓缺乏龐大預算或專業技術團隊的獨立創作者,能有機會將腦中的奇思妙想轉化為生動的視覺作品,無疑是對內容創作領域的一次巨大賦權。然而,這項技術的強大能力也伴隨著顯著的隱憂。最直接的威脅,來自於其被用於製造幾可亂真的偽造影片,以進行惡意的政治宣傳、詐騙或散播謠言。在一個日益依賴視覺資訊來感知世界的社會中,分辨真實與虛構的能力將面臨嚴峻考驗。雖然OpenAI表示將在公開發布前採取嚴格的安全措施,包括與專家進行對抗性測試、開發檢測工具,並禁止其平台用於政治競選活動,但外界對於這些措施能否有效遏制濫用,仍抱持懷疑態度。

目前,Sora生成的影片並非完美無瑕。細究之下,仍可發現其在理解複雜物理法則與邏輯因果上的破綻。例如,影片中的人物肢體可能會出現不自然的扭曲,物件會憑空出現或消失,或者場景中的物理現象-如海浪的方向、火焰的燃燒方式-會違背常理。這些「瑕疵」成為了當前辨識AI生成影片的重要線索。此外,Sora的訓練數據來源也引發了嚴重的版權爭議。如同其兄弟模型ChatGPT與DALL-E,Sora的開發同樣面臨著未經授權使用受版權保護的影音內容進行訓練的法律訴訟。這場關於數據使用權的爭辯,將深刻影響未來生成式AI產業的發展路徑。Sora的問世,不僅是一次技術展示,更是一個重要的社會節點,迫使我們必須加速思考如何建立新的規範、法律框架與媒體素養,以應對一個「眼見不一定為憑」的未來。

全文

Lia. Independent Media 台北報導

當一位慈祥的祖母在廚房中忙碌,陽光溫暖地灑落,一切看似尋常而溫馨,但下一秒,她手中的湯匙卻憑空消失,又再度出現。這並非電影中的魔幻情節,而是人工智慧模型Sora在模擬現實時,無意間留下的一絲破綻。這個由OpenAI開發的文生影片(Text-to-video)工具,能夠僅憑幾行文字,便創造出令人驚嘆的視覺世界。然而,也正是這些細微的、違背物理常理的瑕疵,成為了我們在這個真假難辨的影像時代中,賴以區分現實與虛構的珍貴線索。

一、技術的躍進:從文字到世界的創造

Sora的出現,代表了生成式人工智慧從靜態圖像向動態世界的決定性跨越。在此之前,AI繪圖工具已能生成精美的圖片,但Sora所展現的,是對物理空間、物體互動與時間連續性的深層次理解。使用者只需輸入一段描述性文字,例如「一位時尚女性走在充滿溫暖霓虹燈與動態城市標誌的東京街頭」,Sora便能生成一段視覺上高度連貫、充滿電影感的短片。它不僅能模擬攝影機的運動,還能維持角色與場景的一致性,甚至在一定程度上理解光影、反射與流體等複雜的物理效果。

除了寫實風格,Sora在動畫與超現實創作領域同樣展現了巨大潛力。一個由使用者想像出的「紙藝珊瑚礁世界」,在Sora的演繹下,變得生機勃勃、細節豐富。這種能力,為藝術家、設計師與獨立製片人提供了一個前所未有的創作畫布。過去需要龐大動畫團隊與高昂製作成本才能實現的視覺概念,如今可能僅需數分鐘的算力即可初步成形。從這個角度看,Sora無疑是創意領域的一項「賦權工具」,它將視覺敘事的能力,從少數專業人士手中,解放給了更廣泛的大眾。

二、模擬世界的破綻:如何辨識AI的痕跡

儘管Sora的能力令人印象深刻,但目前的模型距離完美模擬現實仍有相當的距離。由於AI尚未能完全掌握現實世界運作的所有物理法則與因果邏輯,其生成的影片中時常會出現各種不合常理的細節。辨識這些破綻,需要觀看者調動自身的常識與敏銳的觀察力。

首先是物理法則的違背。在一段模擬加州淘金熱的歷史影片中,Sora雖然成功還原了舊時代的顆粒質感,但其中一匹馬的動態卻在中途崩解,彷彿融入地面。在另一段風景影片裡,壯闊的海浪不是湧向岸邊,而是朝著反方向退去。跑步者的肢體擺動可能與其前進方向不符,導致其平衡在物理上不可能成立。

其次是邏輯與空間的錯亂。影片中的物件可能不具備「恆存性」,例如前述的「魔法湯匙」,或是穿過樹叢後便消失無蹤的汽車。建築結構也可能出現謬誤,例如一段模擬義大利海岸的影片中,美麗的階梯在仔細觀察下,會發現它們通往虛無,或以不合邏輯的方式堆疊在一起。

最後是細節的缺失與不一致。在動畫場景中,角色的眼睛可能無法準確反射出其面前的景物。在模擬人群的場景中,個體行為可能缺乏真實的互動與隨機性。這些微小的失真,雖然不一定會立刻被察覺,但它們共同構成了一種「恐怖谷」效應-看似真實,卻在潛意識中讓人感到一絲不對勁。

三、深層的挑戰:不實資訊、版權與倫理困境

Sora所帶來的真正挑戰,遠超技術本身,而延伸至社會、法律與倫理層面。其中最急迫的,無疑是其在製造不實資訊方面的潛力。一段偽造的政治人物演說、一場虛構的災難現場,或是一則用以抹黑特定群體的假新聞影片,其說服力與傳播力將遠勝於文字或圖片。隨著2024年全球多國迎來重要選舉,Sora這類工具的出現,為意圖操縱輿論的惡意行為者提供了前所未有的利器。儘管OpenAI承諾將與各界合作,防止其技術被濫用,但道高一尺、魔高一丈的數位攻防戰,未來勢必會更加激烈。

智慧財產權的爭議則是另一項根本性難題。Sora的強大能力,建立在對海量影音數據的學習之上。這些數據中包含了大量受版權保護的電影、電視節目與網路影片。內容創作者與版權所有方認為,OpenAI在未經許可或支付費用的情況下,使用他們的作品來訓練商業模型,構成了侵權行為。目前,已有多起針對OpenAI的集體訴訟正在進行中。這場法律鬥爭的結果,不僅關係到創作者的權益,也將為整個生成式AI產業的發展模式,劃定出關鍵的法律邊界。

此外,隱私權的隱憂也不容忽視。如果訓練數據涵蓋了大量上傳至網路的個人影片,模型在理論上便有可能重現或拼接出特定個人的影像特徵,這為深度偽造(Deepfake)技術用於身份盜竊或惡意騷擾,打開了方便之門。

四、前路展望:在創新與規範之間尋求平衡

面對技術帶來的衝擊,OpenAI採取了相對謹慎的發布策略。Sora目前僅向少數研究人員與創意工作者開放,旨在正式公開前,能更充分地評估其風險並建立防護措施。然而,技術的發展並不會停下腳步。可以預見,隨著模型的持續迭代,目前存在的各種瑕疵將被逐漸修復,生成影片的品質將越來越逼近真實,使得肉眼辨識的難度大增。

因此,僅僅依賴使用者端的媒體素養教育是遠遠不夠的,建立一套涵蓋技術、法律與平台責任的綜合治理框架,已是刻不容緩。這可能包括強制性的數位浮水印技術,以便從源頭標記AI生成內容;制定明確的法律,規範生成式AI的使用邊界與侵權責任;以及要求社群媒體平台承擔起更積極的內容審核與標示義務。

Sora的問世,將人類帶到了一個全新的影像紀元入口。在這個即將到來的世界裡,影像的創造將變得極度便捷,但影像的信任度也將面臨空前瓦解。如何在享受技術賦予的無限創意的同時,守護社會賴以運作的真實性基礎,將是我們這個世代必須共同面對與回答的艱難課題。

資料來源

OpenAI: Sora: Creating video from text
https://openai.com/sora

The New York Times: OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos
https://www.nytimes.com/2024/02/15/technology/openai-sora-videos.html

The Verge: OpenAI’s Sora is a powerful text-to-video generator — and a potential misinformation machine
https://www.theverge.com/2024/2/15/24074151/openai-sora-text-to-video-ai-model-elections-deepfakes

Reuters: OpenAI's Sora stuns viewers, worries creators and ethicists
https://www.reuters.com/technology/disruptors/openais-sora-stuns-viewers-worries-creators-ethicists-2024-02-16/

The Guardian: ‘Astounding and terrifying’: OpenAI’s Sora turns text into video
https://www.theguardian.com/technology/2024/feb/16/openai-sora-text-to-video-model-ai

Wired: OpenAI’s Sora Turns AI Prompts Into Photorealistic Videos
https://www.wired.com/story/openai-sora-text-to-video-generator/

Bloomberg: OpenAI’s Sora Is a Dream for Making Videos. It’s a Nightmare for the Truth

https://www.bloomberg.com/opinion/articles/2024-02-16/openai-s-sora-is-a-dream-for-making-videos-it-s-a-nightmare-for-the-truth