TikTok 的母公司 ByteDance 最近推出了一項名為 Boximator 的 AI 工具,這項技術為了提升 AI 生成影片中的動作控制精準度而設計,預計將為影片創作領域帶來不小變化。
Boximator 的獨特功能
Boximator 不僅讓用戶能夠將圖像動畫化,還能在影片中精確控制物體的運動,其關鍵功能包括:
精準的動作控制:透過 Hard box 與 Soft box 的設計,用戶能夠精確定位物體,並靈活地規劃其在影片中的運動路徑。
直觀的操作介面:Boximator 的介面設計人性化,即使是沒有豐富技術背景的創作者也能輕鬆上手,自由創作動畫。
無縫整合能力:作為現有影片生成模型的插件,Boximator 能夠輕鬆整合進現有系統,同時保留基礎模型的原有功能。
卓越的性能表現:透過自我追蹤機制,Boximator 簡化了訓練過程,提升了對物體運動的理解,達到了業界領先的影片品質和運動控制能力。
技術細節
Boximator 透過讓用戶在參考圖像中選擇物體,並使用盒子和線條來定義它們在連續框架中的運動,從而實現其功能。
Box Constraints:透過 Hard box 和 Soft box 的設計,Boximator 精確控制物體的位置和運動範圍。
自監督預訓練:採用自監督預訓練方法,模型能夠在每個框架中生成並最終移除物體周圍的可見邊界盒,從而培養出空間-時間推理的能力。
實證驗證:經過 Boximator 增強的模型不僅保持了原始影片的品質,還通過 Fréchet Video Distance (FVD) 分數證明了其精確的運動控制能力,顯著提升了基礎模型的性能。
寫在後面
Boximator 目前仍處於研究階段,未完全商業化,但其對內容創作的潛力不容小覷,有望為創作者提供全新的表達工具,將創意和夢想轉化為生動的故事。隨著技術的不斷成熟,Boximator 預計將 Tiktok 短影片造成不小影響。
留言
張貼留言