Apple 發表 AI 圖像編輯技術:MGIE
Apple 發表了 MGIE 技術,這是一個結合了人工智慧與影像編輯技術。MGIE,全名為 MLLM-Guided Image Editing,是與加州大學聖塔芭芭拉分校的研究團隊合作打造的。這項 AI 系統讓使用者能夠用自然語言來指令編輯圖片,這項技術的出現,可能會大大的改變未來的圖像編輯習慣,每個人未來都可以不用動手就可以修圖了!
MGIE 的重點功能
MGIE 最吸引人的特色,就是它能理解並執行使用者用自然語言下達的影像編輯任務。比如說,你對 MGIE 說「讓天空更藍一點」,它就能懂你的意思,自動調整圖片的色彩飽和度,讓天空變得更藍。這種人性化的操作介面,讓沒有專業編輯技巧的人也能輕鬆上手。想像這個技術放在 Siri 等行動裝置上會有多麼的方便!
多模態大型語言模型(MLLMs)
MGIE 的核心在於它的多模態大型語言模型(Multimodal Large Language Models,MLLMs),這些模型能同時處理文字和圖像。這讓 MGIE 能夠對使用者的指令做出正確的視覺反應,確保影像編輯效果真正符合使用者的期待。
MGIE 不僅能進行全面的照片調整,像是亮度、對比度和清晰度的改善,還能精準編輯圖片中的特定細節。這樣的彈性讓我們可以搞定簡單修圖到複雜變化。
開放原始碼
Apple 將 MGIE 開放原始碼項目並放在 GitHub 上,包括了程式碼、數據和預先訓練好的模型。這樣的做法鼓勵了開發者社群的參與和進一步的開發,未來的影像編輯能力可期。這可能造成未來的 App 遍地開花。
對未來產業的影響,影像編輯變得人人可玩
MGIE 的使用者友好設計,讓沒有專業背景的人也能製作出高品質的圖片編輯,這可能會在社交媒體、電商和數位藝術等平台上掀起一股浪潮。
MGIE 能夠融入現有的創作流程,無論是作為流行設計軟體的插件,還是提供給開發者 API ,都能讓專業人士的編輯工作更加流暢。
在教育領域,MGIE 可以用來創造互動式學習體驗;MGIE 的多用途性,讓它成為跨領域不可或缺的工具。
此外 Apple將 MGIE 開源,對 AI 研究和開發的貢獻不言而喻。這讓全球的研究者和開發者都能參與進來,共同推動這項技術的與進步。
寫在後面
Apple 的 MGIE 它透過自然語言指令和 MLLMs 讓影像編輯變得簡單直觀。開放原始碼讓 MGIE 成為可能改變數位影像操作面貌的關鍵工具。據小編了解,目前市面上好像確實沒有結合口說自然語言的影像編輯方式,滿期待未來這種技術放在行動裝置上的發展的。
參考資料
New Apple AI Model Edits Images Based on Natural Language Input - MacRumors
Apple, UC Santa Barbara researchers detail new MGIE image editing AI - SiliconANGLE
Apple Releases MGIE, an AI Model for Instruction-Based Image Editing - Slashdot
Apple releases 'MGIE', a revolutionary AI model for instruction-based image editing | VentureBeat Apple made an AI image tool that lets you make edits by describing them - The Verge
Apple's MGIE Unveiled: Editing Images with Words Becomes Reality
留言
張貼留言