AI 助理突然開始鬼打牆、答非所問，是模型變笨了嗎？

幾乎都不是。根據我實際 debug 的經驗，助理發瘋八成是它外面那一圈出問題——某個工具壞了逼它即興硬幹、設定指錯地方、或是記憶塞爆「忘了」前面講什麼。模型（引擎）其實好好的，壞的是車子的其他部分。先查外圈，再懷疑模型，省下你大把冤枉時間。

什麼是 harness？跟模型有什麼不一樣？

harness 是模型外面那一整圈：它能用的工具、各種設定、記憶怎麼存怎麼壓縮、給它的提示。打個比方，模型是引擎，harness 是車子的其他部分——方向盤、輪胎、油路、儀表板。引擎再好，輪胎沒氣車子一樣開不動。多數「助理很爛」的體感，問題其實出在 harness。

助理出問題，我該照什麼順序檢查？

先 harness 再模型。順序：① 工具——它最近在用的工具是不是壞了、一直失敗？② 設定——它連的東西是不是指錯地方、指到一個其實沒開的服務？③ 記憶——對話是不是太長塞爆了，它開始「忘記」前面的事？這三關都查過沒事，才輪到懷疑模型本身。換更強的模型通常是最後手段，不是第一招。

[Agent 進階 #13] 助理開始發瘋？先別怪它笨——八成是「車子」壞了，不是「引擎」壞了

TL;DR

你的 AI 助理開始鬼打牆、亂跑、卡住、答非所問，第一反應通常是「這模型真笨，是不是該換一個」。先別急著怪它。 根據我一路 debug 的經驗，助理發瘋八成不是模型的問題，而是它外面那一圈——工具、設定、記憶——出了狀況。模型是引擎，外面那一圈（我們叫它 harness）是車子的其他部分。車子開不動，常常不是引擎壞，是輪胎沒氣、油路堵了。這篇給你一個能省下大把時間的除錯心法：先查車子，再查引擎。

白話導讀：別一遇到問題就怪那顆「腦」

你把助理養起來了（前面的入門系列帶你裝好、接 LINE、讓它自動跑任務）。用著用著，某天它開始不對勁：

同一件事翻來覆去做，鬼打牆；
你問東它答西，答非所問；
突然卡住不動，半天沒回應；
或是莫名亂跑，做一堆你沒叫它做的事。

這時候九成的人會冒出同一個念頭：「這 AI 是不是變笨了？」「是不是該換個更聰明的模型？」

我想跟你講一件反直覺、但我親自踩過很多次才學會的事：助理發瘋，八成不是那顆腦笨，是它外面那一圈壞了。 換句話說——問題通常不在引擎，在車子。

這篇不是手把手教學，是一篇除錯心法：當你的助理出問題，該往哪裡看、用什麼順序看。

對照圖：左邊一台車引擎好好的，卻因為輪胎沒氣、油管打結而開不動；右邊把外圈修好後，同一台車順順地跑起來

前言：我以為模型笨，結果是工具壞了

先講一個真實的故事，這篇所有結論都從它來。

我手上有兩個用同一套框架（Hermes）、同一顆腦跑的助理。其中一個負責比較多「生圖、生影片」的雜事，另一個少碰這些。

用一陣子之後，那個常生圖生影片的助理開始明顯發瘋：要它做一張圖，它會反覆嘗試、東戳西戳、做到一半懷疑自己「這次到底成功了沒」，然後重來，再重來。旁邊那個少碰媒體的助理，看起來「正常多了」。

我的第一個結論跟你大概會想的一樣：「是不是這顆腦比較笨？」 甚至開始認真考慮要不要花好幾天、重新訓練它，讓它「學乖一點」。

幸好我沒急著動手，而是先去翻它的工作紀錄，一筆一筆看它到底在幹嘛。結果讓我傻眼——

兩個助理用的是一模一樣的腦。 笨的不是腦。真正的兇手，是它手上有一個壞掉的工具。

下面我把這件事拆開講，順便給你一套自己也能用的判斷順序。

助理發瘋，先別怪模型笨

最重要的一句話，先放這裡：

當助理鬼打牆、亂跑、卡住、答非所問——先假設「不是它笨」，去查它外面那一圈。

為什麼要先這樣假設？因為「模型笨」這個結論，會害你走上最貴、最慢的冤枉路：換模型、重新訓練、花一堆錢試更大的腦。而真相往往是某個又快又便宜就能修好的小東西——一個壞掉的工具、一個指錯的設定、一段塞爆的記憶。

你可以這樣記：模型笨 = 最貴的解釋。 既然最貴，就該放到最後再考慮，而不是第一個跳出來。

而且有個很實際的觀察：同一顆腦，換到不同的環境、做不同的任務，表現可以差很多。我那兩個助理就是鐵證——一樣的腦，一個正常、一個發瘋，差別只在它們各自踩到的工具好不好用。 笨的從來不是腦，是腦被塞了什麼爛工具在手上。

什麼是 harness？引擎 vs 車子

要會 debug，得先看懂「模型」跟「模型外面那一圈」是兩件事。後面那一圈，技術上叫 harness（你不用記這個詞，記比喻就好）。

最好懂的比喻：

模型 = 引擎。 會思考、會生成的那顆核心。
harness = 車子的其他所有部分。 方向盤、輪胎、油路、油箱、儀表板、後照鏡——把引擎變成一台你真的能開的車的，全部都是。

以 AI 助理來說，harness 就是：

工具：它能呼叫的那些手腳——上網查資料、生圖、傳訊息、讀檔案。（= 車子的輪胎跟手）
設定：它連到哪、用哪個服務、各種開關怎麼調。（= 油路怎麼接、儀表怎麼設）
記憶 / 壓縮：怎麼記住前面講過的話，對話太長時怎麼「濃縮」。（= 油箱跟油量管理）
提示：你給它的指令、它被交代的規矩。（= 你踩油門打方向的方式）

一張拆解圖：中間是一顆「引擎=模型」，外面一圈標著「工具、設定、記憶、提示」，合起來組成一台車=harness

關鍵體悟在這：一台車開不動，最常見的原因不是引擎壞，是車子其他部分出問題。 輪胎沒氣、油路堵了、油箱漏了——引擎好好的，車子一樣動不了，甚至會抖、會熄火、會原地空轉。

你的助理「發瘋」，多半就是這種——引擎沒事，是車子其他部分壞了。

真實案例一：一個壞掉的工具，逼它即興硬幹到發瘋

回到前面那個生圖助理。我翻它的工作紀錄，看到的是這樣一齣戲：

它想生一張圖，照規矩去呼叫那個「生圖工具」。
那個工具壞了，失敗。它再試，又失敗。連續失敗了十幾次。
它放棄那個工具，決定自己硬幹——繞過工具，手動把整條生圖流程一步步拼出來（送出、等、下載、回傳……）。
這條臨時拼湊的流程又長又亂，做到一半它搞丟了自己做到哪：剛剛那張到底生好了沒？下載過了嗎？於是它重複下載、重複送出，還反覆自我懷疑「這次是不是新的？」
從外面看，就是一個助理在那邊鬼打牆、亂跑、不斷重來。

你看出問題了嗎？它沒有變笨。它是被一個壞掉的工具,逼著去做一件根本不該它做的苦工。 一個能力正常的人，手上的電動工具壞了，被迫改用螺絲起子硬鎖一百顆螺絲，當然會手忙腳亂、會數錯、會重來——你不會說「這個人笨」，你會說「給他一支能用的工具」。

那個少碰媒體的助理之所以看起來正常，純粹是它沒怎麼踩到那個壞工具而已。同一顆腦，命好命壞的差別。

修法也印證了這點： 我沒去動那顆腦，只做了一件事——把那個壞掉的工具拿掉，換上一個乾淨、一次就能搞定的工具（按一下就生好、直接告訴它結果，不用它自己拼）。換完之後，原本要戳二十幾次才弄出一張圖的助理，叫一次就好了。 腦完全沒變,人就「不笨」了。

心法：助理開始硬幹、即興、把簡單的事做得很複雜——先去看它手上的工具是不是壞了。 它不是愛找麻煩，是被逼的。

真實案例二：記憶塞爆，它開始「忘記」你說過什麼

第二個案例是另一種發瘋，兇手換成了「記憶」。

AI 助理跟你聊久了，對話會越來越長。長到一個程度，框架得做一件事：把前面的對話「濃縮」一下（專業講法叫壓縮），不然會塞爆它的記憶上限。這個濃縮，是請另一顆小模型幫忙把舊對話摘要成精簡版。

我有一個助理，這個「濃縮」步驟一直默默失敗。原因很技術，但結果很好懂——那個負責濃縮的角色被指派得不對，每次都做超過六分鐘還做不完，直接超時放棄。

放棄的後果是什麼？對話沒被濃縮成功，於是越積越長、越來越肥，最後塞爆。一塞爆，助理就開始「忘記」前面講過的事，答非所問、前後兜不起來——又是一種發瘋。

一個機器人助理頭上頂著滿出來的記憶箱子，紙張掉了一地，表情困惑，旁邊一個還沒打開的「濃縮」工具靜靜躺著沒運作

注意這裡——從頭到尾，那顆腦都沒問題。 它「忘記」不是因為記性差，是因為負責整理記憶的那道步驟壞了，前面的話根本沒被好好收進來。這是百分之百的「車子」問題：油箱的油表壞了，車子以為沒油就熄火，但油其實一直都在。

修法一樣不碰腦： 把「濃縮」這份工作，從那個會超時的角色，改交給一顆又快又專門的小模型去做。換完之後，原本六分鐘做不完、每次都失敗的濃縮，一分鐘出頭就搞定——記憶不再塞爆，助理也就不「忘事」了。

心法：助理開始忘記前面的對話、前言不對後語——先去看它的記憶是不是塞爆了，負責濃縮的那道步驟是不是其實一直在默默失敗。

除錯順序：先查 harness，再懷疑模型

把上面兩個案例收斂成一套你能直接用的順序。下次助理發瘋，照這個次序往下查，不要跳關：

第 ① 關：工具壞了嗎？ 看它最近在用什麼工具、是不是一直失敗。一個壞掉的工具，會逼它即興硬幹、鬼打牆。這是我遇過最常見的兇手，所以放第一個。

第 ② 關：設定指錯了嗎？ 它連的服務、它被指到的地方，是不是其實沒開、或指錯了？很多「卡住、沒回應」是因為它在跟一個根本不存在的東西講話——像油管接到一個空油箱。

第 ③ 關：記憶塞爆了嗎？ 對話是不是太長、濃縮是不是默默失敗了？這會讓它「忘事」、答非所問。

第 ④ 關（最後才到）：真的是模型笨嗎？ 前面三關都查過、都沒事，才輪到懷疑腦本身。而且就算到這一關，「換更強的模型」通常也比「重新訓練」便宜——但九成情況，你根本走不到這一關。

一張流程圖：助理發瘋 → 查工具 → 查設定 → 查記憶 → 三關都沒事才懷疑模型；前三關用綠色（便宜快），最後一關用紅色（貴又慢）

為什麼順序這麼重要？因為前三關又快又便宜，最後一關又慢又貴。把便宜的解法排前面，你大多數時候第一、二關就解決了，根本不用走到「重訓一顆腦」那種會花掉你好幾天又未必有用的路。

我那兩次發瘋，沒有一次是腦的問題，全部在前三關就修好了。這不是巧合，是常態。

收穫

一個會幫你省超多時間的預設心態

把「先別怪模型」設成你的反射動作。助理一出包，腦中第一個念頭不該是「換個聰明的」，而是「它外面那一圈是不是壞了」。光是把這個順序顛倒過來，你就能省下大量瞎換模型、瞎重訓的冤枉功夫——因為最貴的解釋，幾乎都不是真正的答案。

同一顆腦，環境決定它「聰不聰明」

我最深的體悟是：同一顆腦，可以表現得很聰明，也可以表現得像智障，差別常常只在它被放進什麼環境、手上拿到什麼工具。 一個能力正常的人，工具壞了、資料亂了，也會手忙腳亂。所以與其執著於「找一顆更聰明的腦」，不如先確認「我給這顆腦的環境，乾不乾淨好不好用」。環境，往往才是真正的關鍵。

給好工具，比換好腦更有用

兩個案例的修法都一樣：沒動腦，只把外圈整理乾淨。 壞工具換成一鍵就好的乾淨工具；會超時的記憶步驟，換成又快又專門的小幫手。給一顆普通的腦一套乾淨好用的環境，它就會表現得很「聰明」；給一顆好腦一堆爛工具，它照樣會發瘋。你能掌控的、CP 值最高的，是環境，不是腦。

結論

助理鬼打牆、亂跑、卡住、答非所問——先別怪模型笨，八成是它外面那一圈（工具、設定、記憶）壞了。
模型是引擎，harness 是車子的其他部分。車子開不動，多半不是引擎壞，是輪胎沒氣、油路堵了。
真實案例一：一個壞掉的工具，逼助理即興硬幹、搞丟進度、發瘋。換成乾淨工具，叫一次就好。
真實案例二：記憶濃縮默默失敗，對話塞爆，助理開始「忘事」。換個又快又專的小幫手做濃縮就修好。
除錯順序：① 工具 → ② 設定 → ③ 記憶 → ④ 才懷疑模型。 前三關又快又便宜，先查；換腦、重訓是最後手段，而且九成走不到那一關。
⚠️ 誠實提醒：這篇是除錯心法、經驗談，不是逐步教學——我給你的是「往哪看、什麼順序看」的判斷力。每個人的助理設定不同，實際怎麼修還是要對著你自己的情況查；但「先 harness、再模型」這個順序，普遍適用。

同系列：

入門 #1–#7：從「助理是什麼」到「裝起來、接 LINE、自動跑任務」
進階 #9：讓助理看得到、聽得到——幫文字腦接上眼睛跟耳朵
本篇（進階 #13）：助理發瘋先別怪它笨——先查「車子」（harness），再查「引擎」（模型）