從 0 開始的 AI Agent 生活 · part 13
[Agent 進階 #13] 助理開始發瘋?先別怪它笨——八成是「車子」壞了,不是「引擎」壞了
❯ cat --toc
TL;DR
你的 AI 助理開始鬼打牆、亂跑、卡住、答非所問,第一反應通常是「這模型真笨,是不是該換一個」。先別急著怪它。 根據我一路 debug 的經驗,助理發瘋八成不是模型的問題,而是它外面那一圈——工具、設定、記憶——出了狀況。模型是引擎,外面那一圈(我們叫它 harness)是車子的其他部分。車子開不動,常常不是引擎壞,是輪胎沒氣、油路堵了。這篇給你一個能省下大把時間的除錯心法:先查車子,再查引擎。
白話導讀:別一遇到問題就怪那顆「腦」
你把助理養起來了(前面的入門系列帶你裝好、接 LINE、讓它自動跑任務)。用著用著,某天它開始不對勁:
- 同一件事翻來覆去做,鬼打牆;
- 你問東它答西,答非所問;
- 突然卡住不動,半天沒回應;
- 或是莫名亂跑,做一堆你沒叫它做的事。
這時候九成的人會冒出同一個念頭:「這 AI 是不是變笨了?」「是不是該換個更聰明的模型?」
我想跟你講一件反直覺、但我親自踩過很多次才學會的事:助理發瘋,八成不是那顆腦笨,是它外面那一圈壞了。 換句話說——問題通常不在引擎,在車子。
這篇不是手把手教學,是一篇除錯心法:當你的助理出問題,該往哪裡看、用什麼順序看。

前言:我以為模型笨,結果是工具壞了
先講一個真實的故事,這篇所有結論都從它來。
我手上有兩個用同一套框架(Hermes)、同一顆腦跑的助理。其中一個負責比較多「生圖、生影片」的雜事,另一個少碰這些。
用一陣子之後,那個常生圖生影片的助理開始明顯發瘋:要它做一張圖,它會反覆嘗試、東戳西戳、做到一半懷疑自己「這次到底成功了沒」,然後重來,再重來。旁邊那個少碰媒體的助理,看起來「正常多了」。
我的第一個結論跟你大概會想的一樣:「是不是這顆腦比較笨?」 甚至開始認真考慮要不要花好幾天、重新訓練它,讓它「學乖一點」。
幸好我沒急著動手,而是先去翻它的工作紀錄,一筆一筆看它到底在幹嘛。結果讓我傻眼——
兩個助理用的是一模一樣的腦。 笨的不是腦。真正的兇手,是它手上有一個壞掉的工具。
下面我把這件事拆開講,順便給你一套自己也能用的判斷順序。
助理發瘋,先別怪模型笨
最重要的一句話,先放這裡:
當助理鬼打牆、亂跑、卡住、答非所問——先假設「不是它笨」,去查它外面那一圈。
為什麼要先這樣假設?因為「模型笨」這個結論,會害你走上最貴、最慢的冤枉路:換模型、重新訓練、花一堆錢試更大的腦。而真相往往是某個又快又便宜就能修好的小東西——一個壞掉的工具、一個指錯的設定、一段塞爆的記憶。
你可以這樣記:模型笨 = 最貴的解釋。 既然最貴,就該放到最後再考慮,而不是第一個跳出來。
而且有個很實際的觀察:同一顆腦,換到不同的環境、做不同的任務,表現可以差很多。我那兩個助理就是鐵證——一樣的腦,一個正常、一個發瘋,差別只在它們各自踩到的工具好不好用。 笨的從來不是腦,是腦被塞了什麼爛工具在手上。
什麼是 harness?引擎 vs 車子
要會 debug,得先看懂「模型」跟「模型外面那一圈」是兩件事。後面那一圈,技術上叫 harness(你不用記這個詞,記比喻就好)。
最好懂的比喻:
- 模型 = 引擎。 會思考、會生成的那顆核心。
- harness = 車子的其他所有部分。 方向盤、輪胎、油路、油箱、儀表板、後照鏡——把引擎變成一台你真的能開的車的,全部都是。
以 AI 助理來說,harness 就是:
- 工具:它能呼叫的那些手腳——上網查資料、生圖、傳訊息、讀檔案。(= 車子的輪胎跟手)
- 設定:它連到哪、用哪個服務、各種開關怎麼調。(= 油路怎麼接、儀表怎麼設)
- 記憶 / 壓縮:怎麼記住前面講過的話,對話太長時怎麼「濃縮」。(= 油箱跟油量管理)
- 提示:你給它的指令、它被交代的規矩。(= 你踩油門打方向的方式)

關鍵體悟在這:一台車開不動,最常見的原因不是引擎壞,是車子其他部分出問題。 輪胎沒氣、油路堵了、油箱漏了——引擎好好的,車子一樣動不了,甚至會抖、會熄火、會原地空轉。
你的助理「發瘋」,多半就是這種——引擎沒事,是車子其他部分壞了。
真實案例一:一個壞掉的工具,逼它即興硬幹到發瘋
回到前面那個生圖助理。我翻它的工作紀錄,看到的是這樣一齣戲:
- 它想生一張圖,照規矩去呼叫那個「生圖工具」。
- 那個工具壞了,失敗。它再試,又失敗。連續失敗了十幾次。
- 它放棄那個工具,決定自己硬幹——繞過工具,手動把整條生圖流程一步步拼出來(送出、等、下載、回傳……)。
- 這條臨時拼湊的流程又長又亂,做到一半它搞丟了自己做到哪:剛剛那張到底生好了沒?下載過了嗎?於是它重複下載、重複送出,還反覆自我懷疑「這次是不是新的?」
- 從外面看,就是一個助理在那邊鬼打牆、亂跑、不斷重來。
你看出問題了嗎?它沒有變笨。它是被一個壞掉的工具,逼著去做一件根本不該它做的苦工。 一個能力正常的人,手上的電動工具壞了,被迫改用螺絲起子硬鎖一百顆螺絲,當然會手忙腳亂、會數錯、會重來——你不會說「這個人笨」,你會說「給他一支能用的工具」。
那個少碰媒體的助理之所以看起來正常,純粹是它沒怎麼踩到那個壞工具而已。同一顆腦,命好命壞的差別。
修法也印證了這點: 我沒去動那顆腦,只做了一件事——把那個壞掉的工具拿掉,換上一個乾淨、一次就能搞定的工具(按一下就生好、直接告訴它結果,不用它自己拼)。換完之後,原本要戳二十幾次才弄出一張圖的助理,叫一次就好了。 腦完全沒變,人就「不笨」了。
心法:助理開始硬幹、即興、把簡單的事做得很複雜——先去看它手上的工具是不是壞了。 它不是愛找麻煩,是被逼的。
真實案例二:記憶塞爆,它開始「忘記」你說過什麼
第二個案例是另一種發瘋,兇手換成了「記憶」。
AI 助理跟你聊久了,對話會越來越長。長到一個程度,框架得做一件事:把前面的對話「濃縮」一下(專業講法叫壓縮),不然會塞爆它的記憶上限。這個濃縮,是請另一顆小模型幫忙把舊對話摘要成精簡版。
我有一個助理,這個「濃縮」步驟一直默默失敗。原因很技術,但結果很好懂——那個負責濃縮的角色被指派得不對,每次都做超過六分鐘還做不完,直接超時放棄。
放棄的後果是什麼?對話沒被濃縮成功,於是越積越長、越來越肥,最後塞爆。一塞爆,助理就開始「忘記」前面講過的事,答非所問、前後兜不起來——又是一種發瘋。

注意這裡——從頭到尾,那顆腦都沒問題。 它「忘記」不是因為記性差,是因為負責整理記憶的那道步驟壞了,前面的話根本沒被好好收進來。這是百分之百的「車子」問題:油箱的油表壞了,車子以為沒油就熄火,但油其實一直都在。
修法一樣不碰腦: 把「濃縮」這份工作,從那個會超時的角色,改交給一顆又快又專門的小模型去做。換完之後,原本六分鐘做不完、每次都失敗的濃縮,一分鐘出頭就搞定——記憶不再塞爆,助理也就不「忘事」了。
心法:助理開始忘記前面的對話、前言不對後語——先去看它的記憶是不是塞爆了,負責濃縮的那道步驟是不是其實一直在默默失敗。
除錯順序:先查 harness,再懷疑模型
把上面兩個案例收斂成一套你能直接用的順序。下次助理發瘋,照這個次序往下查,不要跳關:
第 ① 關:工具壞了嗎? 看它最近在用什麼工具、是不是一直失敗。一個壞掉的工具,會逼它即興硬幹、鬼打牆。這是我遇過最常見的兇手,所以放第一個。
第 ② 關:設定指錯了嗎? 它連的服務、它被指到的地方,是不是其實沒開、或指錯了?很多「卡住、沒回應」是因為它在跟一個根本不存在的東西講話——像油管接到一個空油箱。
第 ③ 關:記憶塞爆了嗎? 對話是不是太長、濃縮是不是默默失敗了?這會讓它「忘事」、答非所問。
第 ④ 關(最後才到):真的是模型笨嗎? 前面三關都查過、都沒事,才輪到懷疑腦本身。而且就算到這一關,「換更強的模型」通常也比「重新訓練」便宜——但九成情況,你根本走不到這一關。

為什麼順序這麼重要?因為前三關又快又便宜,最後一關又慢又貴。把便宜的解法排前面,你大多數時候第一、二關就解決了,根本不用走到「重訓一顆腦」那種會花掉你好幾天又未必有用的路。
我那兩次發瘋,沒有一次是腦的問題,全部在前三關就修好了。這不是巧合,是常態。
收穫
一個會幫你省超多時間的預設心態
把「先別怪模型」設成你的反射動作。助理一出包,腦中第一個念頭不該是「換個聰明的」,而是「它外面那一圈是不是壞了」。光是把這個順序顛倒過來,你就能省下大量瞎換模型、瞎重訓的冤枉功夫——因為最貴的解釋,幾乎都不是真正的答案。
同一顆腦,環境決定它「聰不聰明」
我最深的體悟是:同一顆腦,可以表現得很聰明,也可以表現得像智障,差別常常只在它被放進什麼環境、手上拿到什麼工具。 一個能力正常的人,工具壞了、資料亂了,也會手忙腳亂。所以與其執著於「找一顆更聰明的腦」,不如先確認「我給這顆腦的環境,乾不乾淨好不好用」。環境,往往才是真正的關鍵。
給好工具,比換好腦更有用
兩個案例的修法都一樣:沒動腦,只把外圈整理乾淨。 壞工具換成一鍵就好的乾淨工具;會超時的記憶步驟,換成又快又專門的小幫手。給一顆普通的腦一套乾淨好用的環境,它就會表現得很「聰明」;給一顆好腦一堆爛工具,它照樣會發瘋。你能掌控的、CP 值最高的,是環境,不是腦。
結論
- 助理鬼打牆、亂跑、卡住、答非所問——先別怪模型笨,八成是它外面那一圈(工具、設定、記憶)壞了。
- 模型是引擎,harness 是車子的其他部分。車子開不動,多半不是引擎壞,是輪胎沒氣、油路堵了。
- 真實案例一:一個壞掉的工具,逼助理即興硬幹、搞丟進度、發瘋。換成乾淨工具,叫一次就好。
- 真實案例二:記憶濃縮默默失敗,對話塞爆,助理開始「忘事」。換個又快又專的小幫手做濃縮就修好。
- 除錯順序:① 工具 → ② 設定 → ③ 記憶 → ④ 才懷疑模型。 前三關又快又便宜,先查;換腦、重訓是最後手段,而且九成走不到那一關。
- ⚠️ 誠實提醒:這篇是除錯心法、經驗談,不是逐步教學——我給你的是「往哪看、什麼順序看」的判斷力。每個人的助理設定不同,實際怎麼修還是要對著你自己的情況查;但「先 harness、再模型」這個順序,普遍適用。
同系列:
- 入門 #1–#7:從「助理是什麼」到「裝起來、接 LINE、自動跑任務」
- 進階 #9:讓助理看得到、聽得到——幫文字腦接上眼睛跟耳朵
- 本篇(進階 #13):助理發瘋先別怪它笨——先查「車子」(harness),再查「引擎」(模型)
常見問題
- AI 助理突然開始鬼打牆、答非所問,是模型變笨了嗎?
- 幾乎都不是。根據我實際 debug 的經驗,助理發瘋八成是它外面那一圈出問題——某個工具壞了逼它即興硬幹、設定指錯地方、或是記憶塞爆「忘了」前面講什麼。模型(引擎)其實好好的,壞的是車子的其他部分。先查外圈,再懷疑模型,省下你大把冤枉時間。
- 什麼是 harness?跟模型有什麼不一樣?
- harness 是模型外面那一整圈:它能用的工具、各種設定、記憶怎麼存怎麼壓縮、給它的提示。打個比方,模型是引擎,harness 是車子的其他部分——方向盤、輪胎、油路、儀表板。引擎再好,輪胎沒氣車子一樣開不動。多數「助理很爛」的體感,問題其實出在 harness。
- 助理出問題,我該照什麼順序檢查?
- 先 harness 再模型。順序:① 工具——它最近在用的工具是不是壞了、一直失敗?② 設定——它連的東西是不是指錯地方、指到一個其實沒開的服務?③ 記憶——對話是不是太長塞爆了,它開始「忘記」前面的事?這三關都查過沒事,才輪到懷疑模型本身。換更強的模型通常是最後手段,不是第一招。