新語言模型提詞邏輯:Meta-Prompting
來自 Stanford 的 Mirac Suzgun 跟 OpenAI 的 Adam Tauman Kalai 在 2024 年 1 月發表了一項名為 Meta-Prompting 的新技術。這項技術能將單一的語言模型(LM)轉化為一個多功能的指揮中心,巧妙地協調和整合多個獨立查詢任務。Meta-Prompting 透過高階指令,引導語言模型將複雜的任務細分為較小的子任務,再由專門訓練的“專家”模型分別處理。簡單來說,就是設定一個 AI Leader 指揮並協調各個專家模型來解決問題,類似 AI project management 的概念。
Meta-Prompting 操作框架
在 Meta-Prompting 的操作框架中,一個高層次的 “meta”(就是 AI PM) 會指揮語言模型:
(i) 把繁複的任務或問題拆解成更小、易於管理的單元
(ii) 將這些單元指派給擁有精確自然語言指令的“專家”模型
(iii) 監控這些專家模型間的溝通
(iv) 在整個過程中運用批判性思考、推理和驗證技巧
語言模型的中心作用
Meta-Prompting 策略的核心在於語言模型本身,它作為協調者的 AI project manager,可以確保專家模型的輸出能夠有效地溝通和整合。此外,它還利用自身的批判性思維和堅實的驗證流程來提升最終成果的品質。
簡化未來的 Prompt 提詞難度
Meta-prompting 是一種使用 AI 的全新方式,它讓我們可以給 AI 一個大致的想法,而不需要提供許多具體指令。這讓它變得非常容易使用,就算我們不確定如何準確地告訴 AI 我們想要什麼。因為 AI PM 會找尋對應的 AI 專家並且討論出問題的解答。
例如,假設我們想要 AI 寫一個關於貓的故事。透過 Meta-prompting,我們可以只說像是「寫一個關於貓的故事」,AI 就能夠為我們生成一個故事。我們不需要提供任何更多資訊,如貓的名字、年齡或性格。
Meta-prompting 尤其對於那些提供具體指令會很困難或耗時的任務特別有幫助。例如,如果我們想要 AI 生成世界上所有國家的列表,我們可以只說「列出世界上所有的國家」,AI 就能夠做到。我們不需要逐一輸入每個國家的名字。
外部工具整合能力
研究顯示,Meta-Prompting 能夠將外部工具,例如 Python ,無縫融入其框架,進一步拓大應用範圍和實用性。這使得 Meta-Prompting 能夠更全面、更靈活地應對各種任務和查詢。
Meta-Prompting 的實證優勢
透過對 GPT-4 的深入測試,研究者們證明了 Meta-Prompting 在多項任務上,相較於傳統的支架方法,具有明顯的優勢。無論是解決 Game of 24, Checkmate-in-One, 或是 Python Programming Puzzle,Meta-Prompting 結合 Python 的功能後,在所有任務上的平均表現超越了標準提詞 17.1%,專家 (expert (dynamic) 提詞 17.3%,以及多角色 (multipersona prompting) 提詞 15.2%。
寫在後面
Meta-Prompting 為語言模型技術帶來了重大進步,不僅提升了整體性能,還在多樣的任務中展現出靈活性和效率。整合 Python 的能力,進一步加大了 Meta-Prompting 的應用範圍,使語言模型能夠更加高效率的處理各種任務。隨著語言模型技術的持續發展,Meta-Prompting 的潛力可能會不斷增強。
Meta-Prompting 是一種新的方法,它給了了傳統語言模型動態多功能的新能力。它能夠將複雜任務分解、動員專家處理各個部分,並將多元成果無縫整合,已在從數學謎題到創意寫作等一系列任務中取得了明顯的進步。
留言
張貼留言