The Key | 每天的關鍵

ChatGPT 的幻覺：實用性的受限

根據 IEEE 網頁上的一篇文章，討論到了幻覺(hallucination)。ChatGPT 因其令人印象深刻的知識深度和對各種問題的流利回答而備受著稱。但是，長期使用者其實會發現 ChatGPT 一本正經胡說八道的機率非常高，尤其當我們沒提供相關文件供其參考的的時候更嚴重。人們越來越擔心 ChatGPT 的幻覺傾向可能會削弱它的實用性。在這裡，“幻覺”一詞指的是生成文字中的錯誤，這些錯誤在語義上或語法上是合理的，但最終是不正確或無意義的。結果是，用戶不能信任 ChatGPT 的回應的準確性，這可能在醫學、教育和法律等領域產生嚴重後果。 OpenAI 正在採取行動幸運的是，OpenAI 意識到這個問題並正在採取措施解決它。OpenAI 的首席科學家之一，也是 ChatGPT 的創造者之一的 Ilya Sutskever 表示，這個問題會隨著 LLMs 學會根據現實答話而消失。OpenAI 正在開創一種稱為強化學習與人類反饋（RLHF）的技術來塑造其模型的行為。 Reward predictor 為了幫助 ChatGPT 能更好地與人交談，製作這個程式的人使用了一種被稱為「Reward predictor」的東西。Reward predictor 就像是一位老師，根據 ChatGPT 的表現給它一個分數。如果 ChatGPT 表現得好，它就會得到高分。如果 ChatGPT 犯了一個錯誤，它就會得到較低的分數。但 Reward predictor 並不完美，所以有時候真正的人類必須檢查 ChatGPT 的工作，以確保它做的事情是正確的。當這個人看到 ChatGPT 做得好時，他們會告訴 Reward predictor 給 ChatGPT 更高的分數，以此類推。當他們看到 ChatGPT 做得不太好時，他們會告訴 Reward predictor 給它更低的分數。這有助於 ChatGPT 學習它應該做什麼，不應該做什麼。隨著時間的推移，製造 ChatGPT 的人認為它將能更好地與人交談，不會再犯那麼多錯誤了。真的是這樣嗎? 然而，一些專家認為，ChatGPT 的幻覺可能是大型語言模型的固有缺陷。深度學習先驅 Yann LeCun 認為，模型可能擅長模仿人類的語言，但它們並不真正「理解」語言的含義或在現實世界中的運作方式。他認為，大部分人類知識都是非語言的，計算...

The Key | 每天的關鍵

搜尋此網誌

發表文章

ChatGPT 的幻覺：實用性的受限