從 0 開始的 AI Agent 生活 · part 3
[Agent 入門 #3] 我們的固定組合:ChatGPT 當大腦、Hermes 當身體
❯ cat --toc
TL;DR
一個 AI 助理可以拆成兩塊:大腦(會思考的 AI 模型)和身體(把腦袋裝起來、給它記憶跟手腳的那層工具)。這系列幫你固定一套:大腦用你已經在付的 ChatGPT、身體用 Hermes——不用挑、不用比,照抄就好。動手裝之前,你只要準備一台電腦和一個付費的 ChatGPT 帳號。
白話導讀:與其給你一堆選擇,不如給你一套能動的
很多教學會跟你說「市面上有 A、B、C 好幾種模型、好幾套框架,你可以這樣選那樣配……」然後你看到一半就關掉了。
這系列反過來。我直接幫你選好一套固定組合,你照抄就會動。等你裝起來、用熟了,自然會知道哪裡想換、要怎麼換。但那是以後的事——現在,先讓一個助理在你面前跑起來最重要。
這篇先把這套組合講清楚,順便列一下動手前要準備的東西。
前言:一個助理,是一顆腦袋加一副身體
打個比方。
一個 AI 助理,像一個人:要有腦袋會思考,也要有身體——手腳能做事、記性能記住事情、嘴巴能跟你講話。
- 腦袋就是 AI 模型本身。你平常跟 ChatGPT 聊天,講話的就是這顆腦袋。
- 身體是把這顆腦袋裝起來的那層工具:幫它接上記憶、接上你的 Telegram、讓它能定時自己跑。這層,就是上一篇講的 agent 框架。
光有腦袋,一般聊天模式下大多就是坐著回答你;裝上身體,它才變成會幫你做事、找得到你的助理。我們要做的,就是幫一顆現成的腦袋,配上一副現成的身體。

大腦:直接用你的 ChatGPT,不用挑
AI 模型百百種,但你不用去研究。
理由很簡單:你很可能已經在付 ChatGPT 的錢了。 那就直接拿它當助理的大腦——月費一毛不多花,也省下「到底哪顆模型好」這種會讓新手卡住的問題。
Hermes 支援用你自己的 ChatGPT 帳號登入當大腦(透過 OpenAI 官方的登入授權,不是把密碼交出去)。等於你原本花在 ChatGPT 的訂閱,現在多了一個會幫你做事的分身在用。
之後你要換更強、或換成跑在自己電腦上的免費模型,都可以。但第一次,先用你手邊就有的 ChatGPT,最省事。
身體:就用 Hermes
身體(agent 框架)也一樣——上一篇已經說過,這系列直接選好 Hermes,不比較、不糾結。
你只要知道它幾個對新手很友善的點:
- 免費、開源:不用月費,程式碼也公開。
- 跑在你自己的電腦上:資料在你這邊,不是租來的服務。
- 內建記憶、能接通訊軟體、能定時自己跑:上一篇講的那些「身體」功能,它都幫你準備好了。
把 Hermes 這副身體,接上 ChatGPT 這顆腦袋,一個屬於你的助理就成形了。
為什麼「固定一套」對新手最好
你可能會想:把選擇權交給我不是比較好嗎?
對新手來說,剛好相反。一開始選項越多,越容易卡在「選擇」這關,遲遲跨不出第一步。先用一套能動的,把整個流程走過一遍,你才會真的懂這些東西在幹嘛——到時候要不要換、想換什麼,你心裡自然有譜。
所以這套「ChatGPT+Hermes」不是「最強組合」,而是「最好上手的組合」。先求有、再求好。
裝好之後,它能做到什麼程度
一開始,你大概會讓它做些小事:每天幫你整理新聞、盯個降價、查個資料回你。
但同一套助理,往上加一點設定,能做的事比你想的多。舉兩個「要花點功夫、但完全做得到」的例子:
- 自動回訊息:把它接上你的 Telegram,讓它幫你先回一些例行訊息,或在你忙的時候先頂著。
- 自己顧一個網站:讓它定時檢查你的網站有沒有掛掉、有狀況先處理,甚至幫你排程更新內容。
這些進階玩法要多花一點設定的功夫,但重點是——它做得到,而且做完這些,整套還是跑在你自己這邊、是你的。 這系列會先帶你把基礎跑起來;進階的玩法,等你用熟了自然會想試。
動手裝之前,準備這兩樣
下一篇就要實際動手了。在那之前,你只要備好兩樣東西:
- 一台你自己的電腦——平常在用的那台就行,助理會跑在上面。
- 一個有付費的 ChatGPT 帳號(Plus 或 Pro)——這是助理的大腦來源。
就這樣。其他像 Telegram 帳號(之後想用手機隨手使喚助理才需要)不急,等接的時候再說。
備好這兩樣,下一篇我們就把 Hermes 裝起來,讓你的第一個助理跑起來。
這個系列:
- Part 1:AI 助理跟 ChatGPT 差在哪
- Part 2:什麼是 agent 框架?為什麼別自己拼程式
- Part 3:我們的固定組合——ChatGPT 大腦 + Hermes 身體(本篇)
- Part 4:手把手裝好桌面版,跟第一個助理對話(撰寫中)
- Part 5:叫助理自己接上 LINE + 讓它自己跑任務(撰寫中)
常見問題
- AI 助理的「大腦」和「身體」是什麼意思?
- 大腦就是 AI 模型本身(會思考、會回答的那顆),例如 ChatGPT 背後的模型。身體則是把這顆腦袋裝起來、給它記憶和手腳的那層工具(也就是 agent 框架,這系列用 Hermes)。同一顆腦袋,配上身體,才會變成會幫你做事的助理。
- 為什麼用 ChatGPT 當大腦,不另外選別的模型?
- 因為你很可能已經在付 ChatGPT 的月費了。直接拿它當助理的大腦,不用多花錢、也不用研究一堆模型。對新手來說,少一個要煩惱的選擇,最快上手。
- 動手裝之前要準備什麼?
- 兩樣就夠:一台你自己的電腦,和一個有付費的 ChatGPT 帳號(Plus 或 Pro)。其他像 Telegram 帳號是之後想接才需要,不急。