為什麼AI會「說謊」？——AI幻覺（Hallucination）解釋

「請問你知道某某科學家嗎？」

「當然！他是著名的物理學家，1965年出版了……」

然後你一搜索，根本沒有這個人。

這就是 AI幻覺（Hallucination）——AI信誓旦旦地說出完全錯誤甚至虛構的信息。

為什麼AI會「說謊」？

首先，澄清一點：AI不是「故意」說謊。它沒有謊言的概念，更沒有「想欺騙你」的動機。

AI幻覺的原因，跟AI的工作原理有關。

大型語言模型（LLM）本質上是一個超級強大的「下一個詞預測機器」。

它看過海量的文字（幾乎整個互聯網），學會了「在某個上下文後面，什麼詞最可能出現」。

當你問它一個問題，它不是「查找答案」，而是「預測最可能的回答文字序列」。

這就是問題所在： 它生成的是「聽起來像正確答案的文字」，而不是「被驗證過的事實」。

想像一個從來沒學過數學的人，只靠讀了大量數學題和答案。

當你問他一道新題目，他不是「計算」，而是「根據見過的模式，生成一個看起來像答案的東西」。

有時候碰巧對了，有時候就完全錯了——但他說答案的語氣同樣自信。

這就是AI幻覺的本質。

1. 不常見或偏門的事實 AI訓練數據對常見知識覆蓋好，對偏門知識（小人物、特定地區的事件、罕見科學領域）覆蓋差，更容易捏造。

2. 需要精確數字的問題 「這本書的出版年份」「這個公司的市值」「這場戰役的傷亡人數」——這類需要精確數字的問題，AI容易給出「差不多正確但不完全準確」的數字。

3. 最近發生的事件 訓練數據有截止日期，對截止日期後的事件，AI可能胡亂推測。

4. 你問了一個「應該有答案」的問題，但答案不存在 比如你問「這個作者的第三本書叫什麼？」，如果那位作者只出版了兩本書，AI可能直接「創造」出一本不存在的書名。

幾個警示信號：

黃金法則：越重要的信息，越要自己核實。

1. 要求AI提供來源 「你的依據是什麼？請給我可以查證的來源。」

AI有時會生成假來源，但這個習慣能讓你多一個核實步驟。

2. 對精確數字保持懷疑 日期、名字、數字——AI給的精確信息，先Google一下確認。

3. 用AI做摘要和分析，不要直接用AI做事實核查 讓AI幫你分析你已經知道是真實的資料，比讓AI「告訴你事實」要安全得多。

4. 告訴AI「如果你不確定，就說不確定」 你可以直接在提示詞（Prompt）裡加上：「如果你不確定某件事，請說明你不確定，而不是猜測。」

好的AI模型確實能更好地表達不確定性——但這需要你明確要求。

有的。最新一代模型在減少幻覺上有明顯進步，主要方式是：

但幻覺問題不可能完全消除——這是當前語言模型的基本架構限制。

底線：AI是強大的工具，但不是可靠的事實來源。 了解這一點，才能用好AI，而不被AI誤導。