跳到主要內容

如何用說的輕鬆編輯圖片?Apple 發表 MGIE AI 新技術


Apple 發表 AI 圖像編輯技術:MGIE

Apple 發表了 MGIE 技術,這是一個結合了人工智慧與影像編輯技術。MGIE,全名為 MLLM-Guided Image Editing,是與加州大學聖塔芭芭拉分校的研究團隊合作打造的。這項 AI 系統讓使用者能夠用自然語言來指令編輯圖片,這項技術的出現,可能會大大的改變未來的圖像編輯習慣,每個人未來都可以不用動手就可以修圖了!


MGIE 的重點功能

MGIE 最吸引人的特色,就是它能理解並執行使用者用自然語言下達的影像編輯任務。比如說,你對 MGIE 說「讓天空更藍一點」,它就能懂你的意思,自動調整圖片的色彩飽和度,讓天空變得更藍。這種人性化的操作介面,讓沒有專業編輯技巧的人也能輕鬆上手。想像這個技術放在 Siri 等行動裝置上會有多麼的方便!


多模態大型語言模型(MLLMs)

MGIE 的核心在於它的多模態大型語言模型(Multimodal Large Language Models,MLLMs),這些模型能同時處理文字和圖像。這讓 MGIE 能夠對使用者的指令做出正確的視覺反應,確保影像編輯效果真正符合使用者的期待。


MGIE 不僅能進行全面的照片調整,像是亮度、對比度和清晰度的改善,還能精準編輯圖片中的特定細節。這樣的彈性讓我們可以搞定簡單修圖到複雜變化。



開放原始碼

Apple 將 MGIE 開放原始碼項目並放在 GitHub 上,包括了程式碼、數據和預先訓練好的模型。這樣的做法鼓勵了開發者社群的參與和進一步的開發,未來的影像編輯能力可期。這可能造成未來的 App 遍地開花。


對未來產業的影響,影像編輯變得人人可玩

MGIE 的使用者友好設計,讓沒有專業背景的人也能製作出高品質的圖片編輯,這可能會在社交媒體、電商和數位藝術等平台上掀起一股浪潮。


MGIE 能夠融入現有的創作流程,無論是作為流行設計軟體的插件,還是提供給開發者 API ,都能讓專業人士的編輯工作更加流暢。


在教育領域,MGIE 可以用來創造互動式學習體驗;MGIE 的多用途性,讓它成為跨領域不可或缺的工具。


此外 Apple將 MGIE 開源,對 AI 研究和開發的貢獻不言而喻。這讓全球的研究者和開發者都能參與進來,共同推動這項技術的與進步。


寫在後面

Apple 的 MGIE 它透過自然語言指令和 MLLMs 讓影像編輯變得簡單直觀。開放原始碼讓 MGIE 成為可能改變數位影像操作面貌的關鍵工具。據小編了解,目前市面上好像確實沒有結合口說自然語言的影像編輯方式,滿期待未來這種技術放在行動裝置上的發展的。


參考資料

留言

這個網誌中的熱門文章

Reddit 超強文章:使用 ChatGPT 的 Custom Instruction 提升回答品質

ChatGPT 的 GPTs 筆記 (4):GPTs Konwledge 知識庫的限制與風險

Glarity Chrome 擴充套件:使用 ChatGPT 生成 Youtube/bilibili, Google/Bing, Page Summary, Comment Summary 摘要

Forefront Chat:自由切換 GPT-3.5 和 GPT-4 聊天,現在免費!

提高投資決策效率:利用 ChatGPT 分析資產負債表

ChatGPT 可以顯示美觀數學公式:Tex All the Tings Chrome Extension

TRIZGPT:解決問題的小顧問

當未來和過去交錯:AI 翻譯古老楔形文字 Cuneiform

ChatGPT Sidebar: 全方位 AI 助手 (Chrome Extension)

Grammarly 推出 GrammarlyGo:創新的生成式 AI 寫作助手