跳到主要內容

Boximator:ByteDance 推出新 AI 影片工具


TikTok 的母公司 ByteDance 最近推出了一項名為 Boximator 的 AI 工具,這項技術為了提升 AI 生成影片中的動作控制精準度而設計,預計將為影片創作領域帶來不小變化。


Boximator 的獨特功能

Boximator 不僅讓用戶能夠將圖像動畫化,還能在影片中精確控制物體的運動,其關鍵功能包括:


精準的動作控制:透過 Hard box 與 Soft box 的設計,用戶能夠精確定位物體,並靈活地規劃其在影片中的運動路徑。

直觀的操作介面:Boximator 的介面設計人性化,即使是沒有豐富技術背景的創作者也能輕鬆上手,自由創作動畫。

無縫整合能力:作為現有影片生成模型的插件,Boximator 能夠輕鬆整合進現有系統,同時保留基礎模型的原有功能。

卓越的性能表現:透過自我追蹤機制,Boximator 簡化了訓練過程,提升了對物體運動的理解,達到了業界領先的影片品質和運動控制能力。




技術細節

Boximator 透過讓用戶在參考圖像中選擇物體,並使用盒子和線條來定義它們在連續框架中的運動,從而實現其功能。


Box Constraints:透過 Hard box 和 Soft box 的設計,Boximator 精確控制物體的位置和運動範圍。

自監督預訓練:採用自監督預訓練方法,模型能夠在每個框架中生成並最終移除物體周圍的可見邊界盒,從而培養出空間-時間推理的能力。

實證驗證:經過 Boximator 增強的模型不僅保持了原始影片的品質,還通過 Fréchet Video Distance (FVD) 分數證明了其精確的運動控制能力,顯著提升了基礎模型的性能。


寫在後面

Boximator 目前仍處於研究階段,未完全商業化,但其對內容創作的潛力不容小覷,有望為創作者提供全新的表達工具,將創意和夢想轉化為生動的故事。隨著技術的不斷成熟,Boximator 預計將 Tiktok 短影片造成不小影響。


參考資料

留言

這個網誌中的熱門文章

Reddit 超強文章:使用 ChatGPT 的 Custom Instruction 提升回答品質

ChatGPT 的 GPTs 筆記 (4):GPTs Konwledge 知識庫的限制與風險

Glarity Chrome 擴充套件:使用 ChatGPT 生成 Youtube/bilibili, Google/Bing, Page Summary, Comment Summary 摘要

Forefront Chat:自由切換 GPT-3.5 和 GPT-4 聊天,現在免費!

提高投資決策效率:利用 ChatGPT 分析資產負債表

ChatGPT 可以顯示美觀數學公式:Tex All the Tings Chrome Extension

TRIZGPT:解決問題的小顧問

當未來和過去交錯:AI 翻譯古老楔形文字 Cuneiform

ChatGPT Sidebar: 全方位 AI 助手 (Chrome Extension)

Grammarly 推出 GrammarlyGo:創新的生成式 AI 寫作助手