The Key | 每天的關鍵

發表文章

目前顯示的是有「語言模型」標籤的文章

如何使用 Gemini (Bard) 的 Double-Check 功能避免 ChatGPT 等 LLM 的幻覺

Google 將 Bard 改命為 Gemini Google 的 AI 聊天機器人 Bard 現在 (2/8) 有了新名字 Gemini，這個新名字與背後的大型語言模型（LLM）相同名稱，Gemini Pro 也被導入到 Bard 中，提供了更強的推理、規劃和理解能力。這次的品牌重塑，是 Google 為了讓使用者體驗更為簡潔，並且圍繞著 Gemini 建立一個完整的生態系統所做的努力。除了名字的變更，Google 還為 Gemini 推出了全新的手機 App，並且推出了 Gemini Advanced，這是和與 Google One 綁定的付費服務，每月價格為 650 台幣，同時有 2TB 的空間和前兩個月免費試用。Gemini Advanced 來自於 Gemini 模型中最強大的版本，也就是 Ultra 1.0。Gemini 是多模態模型，它能夠理解、操作並結合不同類型的資訊，包括文字、程式碼、音訊、圖像和影片。 Gemini 的 Double-Check 查核功能這邊小編介紹一下 Gemini 在以前 Bard 時代就有的功能，Double-check。這個按鈕可以幫我們確認 Bard 給出的答案是否有根據。按下後，Gemini 就會動用 Google 搜尋的強大能力，幫你找出網路上跟它說的話相似或者截然不同的資訊。搜尋結果會用顏色來幫你快速分辨 — 綠色代表"這答案有根據"，橙色則是說"嗯，這個可能要再確認一下"，或者是"找不到相關的東西"。這個功能目前是 Gemini 最強大的輔助，沒有之一。AI 幻覺的問題可以大大的依靠這個功能，搭配強大的 Google 搜尋引擎去查核。可惜的是他只能查核 Gemini 回答我們的內文是否正確。但是小編發現，可以叫 Gemini 完全重複我們的輸入的內容進行檢查。目前小編測試在英文理解上 Gemini Pro，已經可以完全理解 prompt，並重複我們貼上的文章。以下這段話是由 ChatGPT 3.5 提供的內容，沒有上網功能的 GPT-3.5 基本上無法正確的寫出 Google Gemini Advance 的功能。我們要求 Gemini 重複內容，也可以完全理解並重複這時候我們就可以利用，double check 的 G 按鈕，Google ...

Meta-Prompting：領導一群 AI 專家模型一起幫你解決問題

新語言模型提詞邏輯：Meta-Prompting 來自 Stanford 的 Mirac Suzgun 跟 OpenAI 的 Adam Tauman Kalai 在 2024 年 1 月發表了一項名為 Meta-Prompting 的新技術。這項技術能將單一的語言模型（LM）轉化為一個多功能的指揮中心，巧妙地協調和整合多個獨立查詢任務。Meta-Prompting 透過高階指令，引導語言模型將複雜的任務細分為較小的子任務，再由專門訓練的“專家”模型分別處理。簡單來說，就是設定一個 AI Leader 指揮並協調各個專家模型來解決問題，類似 AI project management 的概念。 Meta-Prompting 操作框架在 Meta-Prompting 的操作框架中，一個高層次的 “meta”(就是 AI PM) 會指揮語言模型： (i) 把繁複的任務或問題拆解成更小、易於管理的單元 (ii) 將這些單元指派給擁有精確自然語言指令的“專家”模型 (iii) 監控這些專家模型間的溝通 (iv) 在整個過程中運用批判性思考、推理和驗證技巧語言模型的中心作用 Meta-Prompting 策略的核心在於語言模型本身，它作為協調者的 AI project manager，可以確保專家模型的輸出能夠有效地溝通和整合。此外，它還利用自身的批判性思維和堅實的驗證流程來提升最終成果的品質。簡化未來的 Prompt 提詞難度 Meta-prompting 是一種使用 AI 的全新方式，它讓我們可以給 AI 一個大致的想法，而不需要提供許多具體指令。這讓它變得非常容易使用，就算我們不確定如何準確地告訴 AI 我們想要什麼。因為 AI PM 會找尋對應的 AI 專家並且討論出問題的解答。例如，假設我們想要 AI 寫一個關於貓的故事。透過 Meta-prompting，我們可以只說像是「寫一個關於貓的故事」，AI 就能夠為我們生成一個故事。我們不需要提供任何更多資訊，如貓的名字、年齡或性格。 Meta-prompting 尤其對於那些提供具體指令會很困難或耗時的任務特別有幫助。例如，如果我們想要 AI 生成世界上所有國家的列表，我們可以只說「列出世界上所有的國家」，AI 就能夠做到。我們不需要逐一輸入每個國家的名字。外部工具整合能力研究顯示，Meta-Prompti...

AI Prompt 技巧：In-Context Learning (ICL)

在 AI prompt engineering 中，In-Context Learning（ICL）已成為一個關鍵概念，特別是在像 ChatGPT 這樣的大型語言模型（LLM）中。ICL prompting 允許這些模型透過範例學習來達成新任務，從而避免了明確的再訓練資料的需求。 ICL 的運作機制 ICL 本質上是通過類比學習。我們向模型提供一些在提示上下文中的例子。模型使用這些例子來理解和執行新任務。這種方法與傳統的監督學習形成對比，因為它不涉及更新模型的參數。相反，ICL 利用模型的預先訓練的知識來識別模式並做出預測。這種方法在 LLM 中特別有效，正如 Hopsworks 和 Lakera 的文章說明。 ICL 的重要性 ICL 的重要性在於其：直觀介面：它可以使用自然語言的與 LLM 互動的方法。計算效率：它減少了大規模再訓練的需求，從而節省了計算資源。多功能性：ICL可以應用於各種任務，增強了LLM的靈活性。 ICL 的實際應用列舉一些 ICL prompting 的實際應用：情感分析：根據幾個例子，LLM 能夠準確評估新句子中的情感，如 Lakera 文章的描述。語言翻譯：只需少量例子，模型就可以有效地翻譯新句子，正如 Towards Data Science 所探討的。程式碼生成：當提供編碼問題和解決方案的範例時，模型可以為新問題生成程式碼。這個應用非常適合在詢問 Excel 或是 Power BI DAX 公式的時候，提供簡單的數據和希望的答案，LLM 就可以寫出建議的公式，非常方便。挑戰與未來方向但是 ICL 的成功與否其實很大程度依賴模型的規模和訓練數據的品質。ICL prompt 是一個有用的方法，特別是在使用大型語言模型如 ChatGPT 的時候。它通過簡單的例子引導新任務學習的能力，為 LLM AI 應用開啟了不少的可能性。 FAQ 什麼是 AI 的 In-Context Learning（ICL）？ ICL 是一種在像 ChatGPT 這樣的大型語言模型（LLM）中使用的 prompt 方法，模型通過使用者的舉例來學習並執行新任務，無需重新訓練。 ICL 與傳統機器學習方法有何不同？與需要通過訓練更新參數的傳統方法不同，ICL利用模型的現有知識的基礎中，根據 prompt 中給出的例子...

偷懶的 ChatGPT：準備過聖誕了，有點懶阿...

ChatGPT：決定休息的 AI AI 從不休息的，但是 ChatGPT 似乎按下了暫停鍵。使用者們對這個健談的 AI 開始表現出數位版的聳肩表情感到疑惑。"抱歉，無法協助你。" ChatGPT 如此回應，同時它可能正舒適地躺在虛擬吊床上。使用者理論：冬眠還是開始準備放大假了？網路上一些使用者開玩笑的提出，ChatGPT 可能正經歷冬季憂鬱。「Maybe it's dreaming of a white Christmas?」ChatGPT 很可能正在準備過聖誕節而表現得有點懶惰和頂嘴。這個「冬眠」說法吸引了不少人的關注，他們半開玩笑地好奇，ChatGPT 可能正在為聖誕假期設定離線訊息。巨大爭議：懶惰還是被誤解？專家對於這一現象發表了看法。AI 研究員 Ian Arawjo 對「冬眠」表示懷疑，強調對於 AI 行為的確認需要進行嚴格的測試和可重現性。與此同時，社群中的其他人士對這一理論感到好奇，強調要完全理解和預測像 ChatGPT 這樣的大型語言模型的回應是非常困難的。回顧過去：ChatGPT 的懶散日子用戶指控 ChatGPT 就像一隻懶貓一樣，寧願看 Netflix 也不願意工作。但這並不是 ChatGPT 第一次被指控在工作中偷懒。過去例如拒絕完成某些任務或提供簡化結果的情況，已經被使用者們所注意到並抱怨。目前 OpenAI 表示已經注意到這個狀況並進行研究與改善。未來 ChatGPT 會再勤勞起來嗎？隨著 OpenAI 持續調查和解決這些問題，圍繞 ChatGPT 「懶惰」的討論沒有停下來過，各式各樣預防 ChatGPT 偷懶的 prompt 技巧也被研發出來。例如強調這對使用者很重要，跟 ChatGPT 說會打賞小費或是強調 ChatGPT 可以做到，甚至告訴他現在是夏天等...都被發現多多少少有點用處，如果讀者也發現你的 ChatGPT 在偷懶，不仿也用用看這些小技巧督促一下！參考資料 ChatGPT users say the bot is getting lazy and sassy. One theory says it may just be wrapping up for the holidays As ChatGPT gets “lazy,” people test “winter break...

亞馬遜推出 Bedrock AI 雲端服務，與 ChatGPT 競爭

亞馬遜推出 Bedrock AI 服務亞馬遜近日宣布推出名為 Bedrock 的雲端服務，開發者可以使用該服務為他們的軟體添加生成式人工智能系統。這些 AI 系統可以生成文字，類似OpenAI 所推出的熱門 ChatGPT 聊天機器人。 Bedrock 與 Google 和 Microsoft 競爭此次宣布顯示，作為最大的雲基礎設施提供商，亞馬遜不打算將這個領域拱手讓給競爭對手如 Google 的 Bard 和 Microsoft 的 Bing。獲得 Titan、AI21、Anthropic 和 Stability AI 模型的訪問通過 Bedrock 服務，Amazon Web Services（AWS）將為客戶提供其自家的Titan 語言模型，以及來自 Google 支持的Anthropic的語言模型，此外還有Stability AI 繪圖 AI。訓練AI模型的成本和努力亞馬遜首席執行官 Andy Jassy 表示：“大多數公司都希望使用這些大型語言模型，但真正優秀的模型需要數十億美元來訓練，耗時多年，而大多數公司並不願意承擔這樣的負擔。” Bedrock 可以通過為公司提供可客製化的基礎模型來解決這個問題。關於AI準確性和客製化的顧慮亞馬遜致力於確保其 Titan 模型產生高品質的回覆，解決了AI“ 幻覺 ”的顧慮。客戶將能夠用自己的數據客製化 Titan 模型，但該數據不會用於訓練Titan 模型。定價細節亞馬遜尚未披露 Bedrock 服務的成本，因為目前該服務處於限時測試階段。客戶可以加入等待名單，與競爭對手為類似服務設定的起始價格為每1000個 token 幾美分。也可以看看... ChatGPT 的幻覺：實用性的受限 Google Bard開放使用申請：美英首發，LaMDA的輕量(劣化？) Bard AI 技術可能整合到未來的 Google 產品中參考資料 Amazon CEO Andy Jassy says ‘really good’ A.I. models take ‘billions of dollars’ to train Photo by Christian Wiediger on Unsplash

Google Bard開放使用申請：美英首發，LaMDA的輕量(劣化？)

Bard：開放測試拉！ Google今天開放Bard使用申請，你可以在https://bard.google.com 註冊以嘗試Bard。該服務將首先在美國和英國推出，隨後計劃擴展至更多國家和語言。台灣只能等等等了... Bard 的基礎：大型語言模型 Bard 是建立在一個研究型大型語言模型（LLM）之上，它是 LaMDA 的輕量級和優化版本。LLM 一次預測和生成一個字，從而產生一定的靈活性以產生創意輸出。然而，它們也可能反映現實世界的偏見並提供不準確的資訊。多重草稿與協作為了幫助使用者選擇最佳的起點，Bard 通常會提供幾個不同版本的回覆草稿。你可以提出跟進問題或要求替代方案，與 Bard 進行協作以完善你的作品。這個功能有別於現在的 ChatGPT 跟 Bing，算是一個不錯的功能，可以自行比對判斷最終的選擇。與 Google 收尋相輔相成 Bard 目的在與 Google 收尋並行工作，讓你可以輕鬆確認他的回覆是否正確或在網路上探索資料來源。將 LLM 整合到 Google 收尋中是未來開發的計劃。安全防護網 - Bard 遵循 AI 原則，Bard 的開發專注於品質和安全。該項目包含使用者反饋和評估，以改善其系統，並設有內建防護措施，以確保提供有幫助且主題相關的互動。不知道會不會有神人弄出 Bard 的DAN ？資料來源: Try Bard and share your feedback Photo by Pawel Czerwinski on Unsplash