~/blog/ai-agent-vs-chatbot

從 0 開始的 AI Agent 生活 · part 1

[AI 入門] AI 助理跟 ChatGPT 差在哪?一個回答你,一個用你的工具幫你做事

cat --toc

TL;DR

你平常用 ChatGPT,多半是打開它、問一句、它答一句。AI 助理(英文叫 agent)是在同一顆 AI 大腦外面再包一層,讓它用你自己的工具把事做完、跑在你這邊、還能接上你天天在用的軟體。ChatGPT 後來也加了記憶、排程這些功能,但都關在它自己的 App 裡;自己養一個助理,是把這些搬到你自己的地盤。這個系列會帶你從零開始,用你已經有的 ChatGPT 訂閱當大腦,裝一套屬於自己的助理。

白話導讀:為什麼我會想自己養一個 AI 助理

我家裡有一台不起眼的小電腦,上面跑著一個我自己的 AI 助理。我在手機的 Telegram 上丟一句「幫我把今天該看的整理一下」,過一會兒它就把東西整理好回傳給我;我說「生一張這樣的圖」,它自己去把圖畫好。

它用的「腦袋」其實就是我本來就在付錢的 ChatGPT。差別只在於——我不是打開那個聊天網頁跟它對話,而是讓它變成一個會主動幫我做事、而且記得我習慣的助理。

這個系列就是要帶你做到同一件事。但在動手之前,得先講清楚一個觀念:你天天在用的 ChatGPT,跟「AI 助理」不是同一個東西。 搞懂這個,後面才不會卡住。

前言:聊天框像客服櫃台,助理像你的私人秘書

打個比方。

你平常打開 ChatGPT 來問東西,像是走到百貨公司的服務台。你問一句,櫃台小姐回答你一句,很有禮貌也很厲害。但她的活動範圍就在那個櫃台:你問什麼她答什麼,不會拿著你家鑰匙幫你跑回家把瓦斯關掉——能幫你動到的,都還在她櫃台的範圍裡。

AI 助理,比較像你的私人秘書。一樣聰明,但她記得你、知道你的習慣,你交代一件事她會自己去辦,辦完回來跟你說,甚至你還沒開口她就先把例行的事做好了。

兩者背後其實是同一顆腦袋(同一個 AI 模型)。差別在於外面包的那一層——是讓它「只能站櫃台回答」,還是給它手腳、讓它能自己去做事。這篇我會把這層差別拆開講。

一個情境,你馬上會感覺出差別

假設你看上一台相機,但現在的價格你嫌貴,想等它降價再買。

同一件事兩種結果:問 ChatGPT,提醒留在 ChatGPT 自己那套流程裡;交給自己的助理,它每天幫你查、一降價就傳到你的 Telegram

你問 ChatGPT: 它會很熱心地告訴你這台相機的行情、歷史低價、建議你去哪幾個網站比價。就算你用它比較新的「排程任務」叫它每天幫你看一次,那個提醒也是走 ChatGPT 自己的通知或 email——結果都還在 ChatGPT 那套流程裡。

你交給自己的助理: 你只要說一次「幫我盯這台相機,降到 X 元就通知我」。它每天自己去查,一降到你要的價,就直接傳一則 Telegram 訊息給你:「降了!現在 X 元,連結在這。」——傳到你平常就掛在上面的地方,你不用特地去哪開、去哪看。

看到差別了嗎?同一件事,ChatGPT 把答案和提醒都留在它自己的地盤;你自己的助理,是把結果送到你這邊、你天天在用的工具上。它記得你交代的事、會自己跑、會用工具去查,最後還主動送到你手機——而且這一整套都是你自己的。下面就把這些差別一個一個拆開講。

助理會用你自己的工具把事做完,不只是回答

你問 ChatGPT「台北明天會不會下雨」,它會給你一段很漂亮的回答。ChatGPT 現在也能上網查、甚至幫你做些線上小任務——但這些動作都發生在它自己的地盤裡。

你自己養的助理不一樣:它能用你自己的工具把事做完。你說「幫我查台北明天天氣,會下雨就提醒我帶傘」,它會去查,然後把提醒設進你自己的手機行事曆、做完傳一句到你的 Telegram——是接到你天天在用的東西,不是停在某個對話框裡等你回去看。

關鍵差別就一句話:ChatGPT 給你答案,自己的助理用你的工具幫你把事做完。

助理的記憶是你的,不是關在別人 App 裡的

你可能會說:ChatGPT 現在不是會記得我嗎?沒錯,它後來確實加了記憶功能。但那份記憶是「它的」——你能管理一部分,可是它不是一個放在你自己這邊、能整包搬走的記事本,也只在你跟它聊天時才用得到。

AI 助理的記憶是另一回事:它有一本自己的記事本,放在你這邊。你做什麼工作、喜歡怎樣的回答、上週交代到一半的事,它都記著;而且這本記事本你看得到、改得動,還能跟你的其他工具串在一起。

所以差別不在「記不記得」,而在這份記憶是誰的、你能不能真的拿來用

助理可以自己跑,做完還會主動找你

ChatGPT 後來也加了「排程任務」,能定時幫你跑一些提示、提醒你事情。但它能做什麼、結果送到哪,都還是被它自己的 App 框住。

你自己的助理不一樣:你可以叫它「每天早上七點,把昨晚的重要消息整理一份給我」,它就自己跑——而且整理好是送到你接好的地方(傳進你的 Telegram、寫進你的行事曆),不是只躺在某個對話框裡等你去開。

你自己的助理就從「等你開口的工具」,變成「會自己動、把結果送到你這邊的幫手」。你睡覺的時候,它也能把事辦好。

助理能接上你天天在用的工具

ChatGPT 主要還是透過官方網站或 App 來用,你想用它多半得特地打開來。

AI 助理可以接到你本來就在用的工具裡。最常見的就是接到通訊軟體——像我就是把助理接到 Telegram,平常傳訊息給朋友的同一個地方,順手就能使喚它,不用另外開網頁。它也能接上行事曆、信箱這些你每天在用的東西。

簡單說,ChatGPT 要你特地去開它;助理則是直接出現在你平常就會用的地方。

那我要會寫程式嗎?不用——這就是下一篇的重點

看到這裡你可能會想:聽起來很厲害,但這種「會記憶、會自己跑、會用工具」的東西,是不是要工程師才搞得出來?

以前確實是。早年想要這種助理,得自己寫程式,把「收訊息 → 問 AI → 拿回答 → 存起來 → 自己跑」這些步驟一段一段接起來,壞了還要自己修。對沒寫過程式的人來說,門檻很高。

但現在不用了。有人已經把這些麻煩事整包做好,包成一個現成的工具,你照著裝就能用。這個系列會用的就是其中一套,叫做 Hermes

下一篇,我會講「為什麼直接用現成的就好,不要自己拼程式」,然後我們就開始動手。


這個系列接下來:

  • Part 2:什麼是 agent 框架?為什麼別自己拼程式(下一篇)
  • Part 3:我們的固定組合——Hermes + 你的 ChatGPT 訂閱
  • Part 4:手把手裝好,跑起你的第一個助理

常見問題

AI 助理(agent)跟 ChatGPT 有什麼不一樣?
ChatGPT 是聊天框:你問一句、它答一句,本身只專心回答。AI 助理是在這個聊天能力外面再包一層,讓它能自己動手用工具(傳訊息、查資料、排程)、把事做完,而且跑在你自己這邊、接你自己的工具。同樣一顆 AI 大腦,差別在外面那層『手腳』。
我要會寫程式才能擁有自己的 AI 助理嗎?
不用。早期確實要自己寫程式把每個步驟串起來,但現在有現成的工具(這系列用的是 Hermes)已經幫你把這些做好,你照著裝就能用。後面幾篇會手把手帶你裝。
自己的 AI 助理會很貴嗎?
這系列的做法是用你『已經訂閱的 ChatGPT 帳號』當助理的大腦,不用另外為每次回答付費。等於月費不變,多了一個會幫你做事的助理。