~/blog/hermes-connect-your-tools

從 0 開始的 AI Agent 生活 · part 12

[Agent 進階 #12] 裝完之後然後呢?給你的助理一雙手——接上你自己的工具

cat --toc

TL;DR

你照著前面幾篇把助理裝好了,但很快會發現一件事:它好像只會聊天。 你問它今天的會議幾點,它只能說「我看不到你的行事曆」。這篇就是解這個——給它一雙手。做法叫「接工具」:讓它能查你的資料夾、跑你的指令、打你自己寫的小服務。背後的關鍵概念叫 MCP,你就想成是工具的「萬用插座」標準,插上去助理就會用。接完之後,它從「只會講話的嘴」,變成「真的會幫你動手的助理」——而且接的全是你自己的東西。

白話導讀:助理現在只有嘴,這篇給它手

前面幾篇你已經把一個助理裝起來、接上手機、甚至讓它每天自己跑任務了。但你大概也發現了一個小小的「然後呢?」——

你跟它聊天,它什麼都答得頭頭是道。可是你一問「我下午那個會幾點?」「幫我看一下這個資料夾裡有沒有上個月的報表」,它就卡住了,只能跟你說:「抱歉,我看不到。」

為什麼?因為到目前為止,它只有一張嘴。會思考、會講話,但沒有手去碰外面的世界。

這篇要做的,就是幫它接上手。接上手之後,它不只是回答你,而是真的伸手去查、去跑、把東西拿回來給你。聽起來很厲害,但概念其實很單純,我盡量用白話講完。

一個只有嘴的機器人(會講話但沒有手,面前的東西都碰不到) vs 一個接上了手的機器人(伸手去拿資料、開檔案)

前言:裝完之後,那個「然後呢?」

很多人裝好 AI 助理之後,會經歷一段小小的失落。

裝的時候很有成就感——終於有一個自己的助理了。可是用了幾天,你會發現它跟你原本的 ChatGPT 好像也沒差太多:你問,它答;它答得很好,但它只活在對話框裡。你真正生活裡的東西——你的檔案、你的行事曆、你自己架的那個小網站——它一個都碰不到。

這就是「裝完之後然後呢」的關鍵答案:裝完,只是給了它腦袋跟嘴;接下來要給它手。

手,就是「工具」。給它一個會查行事曆的工具,它就看得到你的會議;給它一個會讀資料夾的工具,它就翻得到你的報表;給它一個會打你自己服務的工具,它就能去戳你親手寫的那個小東西。

而所有這些「接工具」,背後靠的是同一套標準——MCP。我們一個一個講。

助理只有嘴,工具給它手

先把這件事講到最白。

一個 AI 助理,預設狀態下能做的事,其實就兩件:讀你打的字、回你一段字。它很會這個,但也就只有這個。它像一個關在房間裡、只能跟你隔著門講話的人——你描述什麼,他都能聊,但他出不了門、也碰不到門外的東西。

「工具」就是幫它在門上開一個個小窗口,讓它能伸手出去。

  • 接一個「查天氣」的工具 → 它能真的去查現在外面幾度,而不是憑印象瞎猜。
  • 接一個「讀資料夾」的工具 → 它能真的打開你電腦上某個資料夾,看裡面有什麼檔案。
  • 接一個「打你自己服務」的工具 → 它能去戳你親手寫的那個小程式,把結果拿回來。

差別有多大?舉個最簡單的例子:

沒接工具: 你問「現在台北幾度?」→ 它說「我沒有即時資料,大概這個季節通常二十幾度。」(用猜的)

接了查天氣工具: 同一句話 → 它真的去查了一下,回你「現在台北 26 度,午後有雨」。

從「用猜的」變成「真的去查」。這就是手的意義。它不再只是個很會聊天的嘴,而是一個會替你動手辦事的助理。

什麼是 MCP?工具的「萬用插座」

那問題來了:要怎麼把這些工具「接」上去?

這就是 MCP 登場的地方。MCP 全名是 Model Context Protocol,名字很嚇人,但概念簡單到不行——

MCP 就是工具的「萬用插座」標準。

打個比方。以前世界上每個國家的插座都長不一樣,你帶一台電器出國,每到一個地方都要找一個不同的轉接頭,超麻煩。後來如果大家都同意用同一種插座規格,那不管什麼電器、到哪個國家,插上去就能用——這就是「標準」的威力。

AI 接工具以前就是「每個國家插座都不同」的狀態:每個工具想接上 AI,都得用自己一套方式,亂七八糟。MCP 做的事,就是訂出一個統一的插座規格。 只要一個工具照 MCP 的規格做好(這種工具叫「MCP server」,你就想成是「一個照標準做好、隨時可以被插上的工具」),任何支援 MCP 的助理——包括 Hermes——都能直接插上來用。

MCP = 萬用插座:一個排插上插著好幾個工具(查天氣、讀檔案、打 API、查資料庫),助理只要插上這個排插就全部能用

所以你之後會常看到「MCP server」這個詞。每次看到,你就在心裡翻譯成:「一個照標準做好、可以插上來給助理用的工具」。就這樣,不用想太複雜。

為什麼這對你是好事?因為一旦有了統一插座,工具就會越來越多、越來越好接。別人做好的 MCP server,你可以直接拿來插;你自己做的,也能照同一個規格做,接法完全一樣。學一次,全部通。

接一個工具長怎樣

好,概念懂了,那實際接起來是什麼感覺?

我老實說:接工具這一步,比前面「裝助理」「接 LINE」稍微技術一點點。 但別緊張,它技術的地方不在「難懂」,而在「要動到設定檔」。整件事的邏輯其實只有一句話:

在 Hermes 的設定裡,告訴它「你的工具/MCP server 在哪裡」,它就會去接。

就這麼一句。剩下的都是細節。實際做的時候,大致是這三步:

  1. 準備一個工具(MCP server)。 可以是別人做好的現成工具(網路上很多,查天氣、讀檔案、操作行事曆的都有),也可以是你自己寫的一個小服務。重點是它得照 MCP 規格跑起來。
  2. 在 Hermes 設定裡指向它。 你會在 Hermes 的設定裡,加上一段「我要接這個工具,它在這個位置」的設定——可能是一個指令、一個網址,或一個本機的程式路徑。確切要填哪個設定參數、寫在哪個檔案,會依 Hermes 版本而不同,所以這裡我不硬給你一行指令騙你照抄;正確做法是去翻你那版 Hermes 的設定說明,找「MCP」或「tools / 工具」那一段,照它的格式填。
  3. 重啟、然後問它。 接好之後,重新啟動助理,直接用講的問它:「你現在能查天氣嗎?」或「你能讀我這個資料夾嗎?」會動,它就會去做;不會動,回頭檢查第 2 步的位置有沒有指對。

注意第 2 步我特別誠實標了「依版本而不同」。這不是我偷懶——而是 MCP 這套東西還在快速演進,各家框架的設定參數三不五時會調整。與其給你一行可能過期的指令,不如教你抓住那句不變的核心:「在設定裡指向你的工具」。 抓住這句,不管版本怎麼變,你都知道自己在找什麼。

接了之後能做什麼

接工具最爽的地方,是它把你的助理從「通用聊天機器人」變成「懂你自己那套東西的助理」。給你兩個具體、而且很多人真的在做的例子。

例子一:接一個查資料的工具。

假設你接上一個「會查天氣」的 MCP server(這種現成的網路上一抓一大把)。接完之後,你早上那個自動任務就可以升級了——前面第 7 篇你讓它每天傳重點給你,現在你可以跟它說:「順便幫我看今天天氣,會下雨就提醒我帶傘。」它不再是憑印象,而是真的去查了才告訴你。同樣的道理,查股價、查匯率、查某個網站有沒有更新……只要有對應的工具,它都能伸手去拿。

例子二:接你自己寫的小服務。

這個才是真正屬於你的玩法。假設你自己架了一個小東西——可能是一個記帳的小程式、一個管你收藏清單的小服務、或一個你工作上自己寫的內部小工具。你把它包成一個 MCP server(接法跟接現成工具一樣),然後在 Hermes 設定裡指向它。

接完之後會發生什麼?你就可以直接用講的,叫助理去操作你自己的服務

「幫我在記帳服務裡,記一筆今天的午餐 180 塊。」

「去我的收藏清單服務,把上週加的那幾筆唸給我聽。」

它會透過你接的那個工具,真的去戳你那個小服務,幫你辦好。這時候它就不只是『一個助理』,而是『懂你整套東西的助理』——因為它手上那些工具,連的全是你自己的世界。

一個接上了好幾個工具的助理,伸出不同的手分別連到:你的資料夾、你的行事曆、你自己寫的小服務——全都是『你的』東西

而且——這點很重要——整套都是你的。 你接什麼工具、連到哪些資料、開放它做哪些事,全部你說了算。沒有人在中間幫你決定「這個能接、那個不行」。同一套助理,你想讓它的手伸多遠,就伸多遠。

🔒 反過來也提醒一句:手伸得到的地方,出事也波及得到。別一次全開——先只接你真的需要的工具、只開該開的資料夾,能設白名單就設。權限給得剛好,比給滿安全得多。

收穫

一個比喻記住全部

如果這篇你只記一件事,記這個:助理本來只有嘴(會講話),接工具是給它手(真的會做事)。 而 MCP 就是工具的萬用插座——把工具做成標準規格,助理插上就能用。嘴會聊天,手會辦事;一個會聊天的助理很方便,一個會辦事的助理才真的替你省力。

為什麼這一步值得花那一點功夫

接工具確實比前面幾步稍微技術一點,但它是整套助理價值的轉折點。前面幾篇是把助理「養出來」,這一篇是讓它「能上工」。一旦它能碰到你真實的檔案、行事曆、自己的服務,它就從一個聊天玩具,變成你日常真的會用的幫手。這一點點設定的功夫,換來的是質變。

最珍貴的,是「接你自己的東西」

外面有很多 AI 都能接工具,但多半是接它們指定的那幾個。你這套不一樣——你接的是你自己的工具、你自己的資料、你自己寫的服務,整套跑在你自己這邊。 這代表你的助理會長成只屬於你的形狀:它懂你的記帳法、你的收藏、你工作上那套自己的小工具。沒有人能複製,因為那是用你自己的東西餵出來的。

結論

  • 裝完助理後的「然後呢?」,答案就是:給它手——接工具。
  • 助理預設只有嘴(讀字、回字);接上工具,它才能真的查資料、跑指令、打你自己的服務。
  • MCP = 工具的萬用插座標準。 工具做成 MCP server,助理插上就能用,學一次全部通。
  • 接法的核心一句話:在 Hermes 設定裡,指向你的工具/MCP server。 確切設定鍵依版本不同,去翻你那版的「MCP / 工具」設定說明照填——別硬抄可能過期的指令。
  • 兩個起手式:接一個現成的查資料工具(例:查天氣)、接一個你自己寫的小服務。後者才是真正屬於你的玩法。
  • ⚠️ 誠實提醒:這一步比前面稍微技術一點,第一次接會卡是正常的;卡住通常是「位置沒指對」,回頭檢查設定那段就好。整套跑在你自己這邊——接什麼、開放多少,你說了算。

同系列:

  • 入門 #1#7:從「助理是什麼」「ChatGPT 當大腦、Hermes 當身體」,到裝起來、接 LINE、讓它每天自己跑任務
  • 進階 #9:幫文字助理接上眼睛跟耳朵(看圖、聽語音)
  • 進階 #12(本篇):給它一雙手——接上你自己的工具

常見問題

助理裝好了,但它好像只會聊天,怎麼讓它真的去做事?
因為它現在只有『嘴』——會講話、會回答,但沒有手去碰外面的東西。要讓它真的動手,你得幫它『接工具』:接上一個會查資料、會跑指令、會打你某個服務的工具。接上去之後,它就不只是回答你,而是真的去查、去跑、把結果帶回來。
MCP 是什麼?聽起來很技術。
MCP(Model Context Protocol)你就想成是工具的『萬用插座標準』。以前每個工具接 AI 的方式都不一樣,很麻煩;MCP 訂了一個統一規格,只要工具照這個規格做成『MCP server』,助理就能直接插上來用,不用為每個工具特別寫一套。概念很簡單——統一插座,插上就通。
我要會寫程式才能接工具嗎?
接『現成的』工具大多不用——很多人已經把常用工具(查天氣、查資料、操作檔案)做成現成的 MCP server,你只要在 Hermes 設定裡指向它就好。如果你想接『自己寫的小服務』,那才需要一點程式,但門檻比你想的低,而且接法都一樣。
這跟直接用 ChatGPT 的外掛差在哪?
差在『是你的』。你接的是你自己的工具、你自己的資料、你自己的服務,整套跑在你自己這邊,沒有人在中間幫你決定能接什麼、不能接什麼。同一套助理,工具想接多少、接什麼,你說了算。