跳到主要內容

OpenAI 發表 Sora:文字轉影片的 AI 技術,效果相當令人驚艷


OpenAI 最近公布了一項名為 Sora 的 Text to Video AI。Sora 這個模型能夠將文字指令轉化為栩栩如生、充滿創意的影片,這個工具目前尚未開放到大眾使用,只有部分測試人員可以進行測試,不過看官網 Sora 的影片效果實在令人驚艷。


Sora

Sora 是一款能夠根據簡單的文字描述建立長達一分鐘影片的 AI 模型,相對於市面上其他類似 AI 僅能生成約 30 秒的影片,差異非常大。Sora AI 理解和模擬動態物理世界方面的能力,可說是突飛猛進。Sora 能夠生成包含多個角色、特定動作類型,以及對主題和背景的精確細節的複雜場景,這證明 Sora 針對動作跟物理模型部分下了不少訓練功夫。




技術基礎與能力

Sora 的核心是一個基於 transformer 架構的 diffusion 模型,讓它能夠處理複雜的影片生成任務,並且具有卓越的擴展性能。這個模型不僅能夠一次性生成整個影片,還能延長已生成的影片,確保即使主體一時消失在畫面之外,也能保持一致性。Sora 還能夠將靜態圖像賦予生命,並在現有影片中填補遺失的畫面,這進一步凸顯了它在創意應用上的多功能性和潛力。




安全措施與限制

在將 Sora 納入其產品線之前,OpenAI 已經採取了數項重要的安全措施。這包括與資安專家合作,以及開發用於檢測誤導內容的工具,看起來要做瑟瑟的內容是不太可能的...。目前,根據官網說明, Sora 仍在準確模擬複雜場景物理和理解特定因果關係方面還有待提高。OpenAI 表示通過與全球的政策制定者、教育工作者和藝術家合作,致力於解決這些問題,並尋找 Sora 的正面應用場景。


影響與未來展望

Sora 的發表轟炸了整個 AI 界。它的未來潛力相當大,可能會徹底改變影片創作和故事講述的方式,以後短影片可能再也不需要演員了。同時,這項技術也帶來了挑戰,尤其是在處理錯誤資訊和 AI 生成內容的倫理使用方面,是的,目前根據官網的說明,針對創作內容應該會有一定的限制了。隨著 OpenAI 持續改進 Sora 並釋放給一般大眾使用,這項技術對未來影響,包括對影片創作產業的衝擊以及如何管理 AI 生成的錯誤資訊,都將是關注的焦點。




創意與倫理的新未來

Sora 的能力為電影製作人、視覺藝術家和設計師帶來了新的可能性,他們現在可以僅憑文字提示,就創造出高度詳細和充滿想像力的影片。這可能使得影片製作變得更加普及,即使是沒有豐富資源或專業技能的人也能輕鬆創作。然而,這項技術濫用的風險,例如製作誤導性或有害內容,也凸顯了制定倫理準則和強化檢測機制的重要性。


寫在後面

OpenAI 的 Sora 是生成式 AI 發展中的一個重要里程碑,它是目前文字生產影片表現最為驚艷的 AI 模型。它的出現將會開啟影片創作新時代,同時也帶來了需要我們謹慎考量和負責任管理的挑戰。特別是怎麼管理生成內容這塊,同時小編也期待可以有解鎖 18+ 的選項,以拓展更多的應用,嘿嘿。


參考資料

留言

這個網誌中的熱門文章

Reddit 超強文章:使用 ChatGPT 的 Custom Instruction 提升回答品質

ChatGPT 的 GPTs 筆記 (4):GPTs Konwledge 知識庫的限制與風險

Glarity Chrome 擴充套件:使用 ChatGPT 生成 Youtube/bilibili, Google/Bing, Page Summary, Comment Summary 摘要

Forefront Chat:自由切換 GPT-3.5 和 GPT-4 聊天,現在免費!

提高投資決策效率:利用 ChatGPT 分析資產負債表

ChatGPT 可以顯示美觀數學公式:Tex All the Tings Chrome Extension

TRIZGPT:解決問題的小顧問

當未來和過去交錯:AI 翻譯古老楔形文字 Cuneiform

ChatGPT Sidebar: 全方位 AI 助手 (Chrome Extension)

Grammarly 推出 GrammarlyGo:創新的生成式 AI 寫作助手