從 Chatbot 到 Agent:吃飯時讓 AI 自動剪片的時代已經來了|Weekly AI Vlog EP15
逐字稿
開場:這周不一樣
大家好,這周我剛好有幸受台大 AI 社團邀請,跟台大的學子們進行了一場大約兩小時的演講。裡面講的蠻多的,包括 AI 的趨勢、未來就業方向,當然也講了一些 Agent 相關的東西。
所以這周的總結我就改成演講的精華內容,請大家開心地看一下,謝謝。
Chatbot → Copilot → Agent 三個時代
第一段主要講的是,從 Chatbot 一直到去年的 Copilot 模式,再到今年 Claude Code 出來之後出現的 Agent。基本上到了今年,都是 Agent 的時代了。
三個東西的定義
AI 這邊有三個東西:一個叫做 Chatbot,一個東西叫 Copilot,最後一個東西叫做 Agent。
Chatbot 其實是大家一開始在 2023 年 ChatGPT 剛出來的時候,帶了很多資料形式——一個網頁、一個問答機器人來做相關的東西。我在業界做了一段時間之後發現,到現在其實大部分企業都還是停留在 Chatbot 的階段。
但一直到今年,我們有了 Claude Code,然後有了 OpenClaw,我們才真正到了所謂的 Agent 時代。
在中間其實有個過渡期。我們一直用一些 AI 的工具來協助企業流程,用 AI 來輔導我們做相關的東西。這個東西叫做 Copilot。去年大家經常聽到 Workflow 能夠做什麼、AI 的自動化工作,尤其都是所謂 Copilot 這個時代。
但是今年如果有在持續關注的話就會發現,Copilot 越來越少聽到了。為什麼?因為現在已經真正進到所謂的 Agent 時代了。
後來大家慢慢走到 Copilot 的時候,有很多工具像 n8n、自動化工具,然後到了第二代幫助做這些事情。一直到去年年底跟今年年初,才進到 Agent 時代。Agent 最大的定義就是——他可以自主幫你做一些事情。
如果你想找一個最大的特色、最像 Agent 的存在,就是 Claude Code。
Agent 的運作方式
這三個東西的差別其實不太容易講清楚,因為每個東西都有點像。但現在這個時代,我們基本上都會在講 Agent。
Agent 真正在做的事情就是:我給他一個任務,然後他會自己來做,裡面的細節怎麼樣你都不太需要知道,他就給你結果。
所以在跟 Agent 做合作的時候,你很像在跟一個人合作。 就像你在指揮一個人說「哎,我請你做一件事情」,然後過了半天一天之後,他跟你講「我做完了」或「我沒做完」、「什麼事情需要你幫忙」、「我做完的結果是什麼樣子」。
那 Copilot 最大的差別就是——你在做的時候,你看得到他的內容,然後你會在裡面跟他一起來合作協助。
我在去年的時候認為人類都還處在 Copilot 時代,還沒有來得及進到 Agent 時代。不過沒想到今年就是橫空出世,有了 Claude Code,一下子就把大家打到了 Agent 時代。
吃飯時的 Agent 實測:5 分鐘自動剪 YouTube Shorts
我用自己第一天遇到 Claude Code 的例子,來跟大家講一下什麼叫做 Agent,什麼叫做「主動性」。
因為我自己又在做 YouTuber 了,那天在跟親戚吃飯。我那天的 YouTube 影片剛好已經丟上去了,然後我們剛買好 Mac Mini,就在 101 買了 Mac Mini 然後就去吃飯。
吃飯過程當中,我突發奇想想測試一下 Claude Code 有多厲害。所以我就丟了我的 YouTube 連結,跟他說:「你可以幫我去剪 Shorts 嗎?」
他就回答說「可以」,然後問「這是你要剪的 Shorts 嗎?」他說對,然後就開始剪。
然後他就進到了一個很神奇的 loop——他大概 5 分鐘不跟我講話,因為那時候我在吃飯我不管他。
5 分鐘之後,他就回傳給我說:
「嗨,你好,我已經做完了。幾件事情:第一,我從 YouTube 上面把你的影片下載下來。第二,我把你的聲音轉成逐字稿。第三,我去分析你的逐字稿裡面的東西,我判斷裡面有三段是最適合剪輯的,大概都是一分多鐘的。那請你看一下 OK 不 OK。然後並且,我已經幫你剪了第一段,剪好了你看一下,而且幫你上了字幕。如果你覺得我做的 OK 的話,我現在幫你剪第二段第三段。」

什麼叫主動?這叫主動。 我在工作管理的時候超喜歡這種主動的員工。這是徹底理解你要做什麼,而且不等命令,做完這件事情就再跟你講:這是我的結果,你看這樣做的話還有什麼能改進的。
這個就是 Agent 時代要做的東西。所以我現在在用 Claude Code 的時候,只要用過夠好的 Agent、夠好的大語言模型,基本上他能幫我做到很多事情。
Agent 的核心架構
Agent 其實就是一個「大語言模型 + 工具」,再加上工具調用跟指令自動化。
大語言模型目前做的事情是什麼?他是做「思考」跟「判斷」。像我剛才講,跟 Claude Code 說「幫我剪 Shorts」,首先他裡面的大語言模型會判斷我的意圖,然後開始拆解任務,然後去調用各種工具能力。調用完之後,再去檢查有沒有發生什麼問題。
Agent 常常失敗的原因是:在現實社會當中,很多時候會有突發狀況。但好的 Agent 跟壞的 Agent 最大差別,就是他能不能應對突發狀況。
他會去觀察結果,最後進行相關的調整。大概就是這個循環:觀察(Observe)→ 行動 → 檢查 → 調整。
Agent vs 傳統自動化:LINE 視窗的故事
我再舉個例子來講 Agent 的觀察力到底有多重要。
在有大語言模型之前,我會寫一種比較多的按鍵精靈——程式自動化,可以寫 UI 操作來做一些事情。最常做的就是對整個界面做 GUI 操作,去上面點這東西、那邊點東西,最後把結果輸出來。
但我們做過這種自動化的人都知道,這種東西很常壞掉。因為在現實社會中太多東西會發生。
比如說,如果請滑鼠點到這邊來,結果突然跳出什麼視窗擋住了,他就失敗了。這很容易發生。
但當大語言模型出來之後,我用大語言模型重啟了這個自動化。 發現比較厲害的大語言模型,他點到下一步的時候,那時候 LINE 的視窗突然跳出來擋住了。
然後我就想看他會怎麼做——他就看了一下 Error Message,發現「哎,我看不到這東西」,然後他就乖乖地移到 LINE 那個視窗的叉叉,按下去關掉之後,繼續做原本的事。
所以這就是 Agent 最大的差別:他可以連續執行大概一兩個小時沒什麼問題,中間遇到什麼問題他都有辦法自己想、自己解決。
為 Agent 打造的世界
另外一點,整個 Tool 的 UX 越來越好了。隨著 Agent 越來越流行、Model 越來越強,大家會發現我們開始要為 Agent 做相關的 Tool UX。
什麼叫 Tool 的 UX?去年有一個很紅的 MCP(Model Context Protocol)。那時候提出的第一個概念就是:我們之前用的是給人用的 API,但給 Agent 用的、給大語言模型用的,其實應該有另外一套協議。
我今年看到最大的差別就是——大家開始會去設計給 Agent 用的服務,而不是給人用的服務。
像我們公司最近推出了兩個新的產品,我們都特別在產品的服務上放一個文件頁面。但這個頁面其實不是給人看的,是給機器看的。我們標榜是任何中等程度的大語言模型,只要看到這個頁面,就可以立刻跟我們的東西做串接,基本上都沒問題。
我們現在開始打造產品的時候,已經漸漸在打造不只是給人的產品,而是給 Agent 看的相關產品。
另外像我自己在寫 Blog,去年就開始很有意識地做 SEO——每一個 Blog Post 都特別照著規範來寫。並且我知道,接下來看我的內容的,其實比較多是 AI 爬蟲而不是人。
做了大概兩個月,在今年農曆過年之後,突然一瞬間我的流量就飆了大概 4 倍。 為什麼?來的都是 Chatbot、Perplexity 這些 AI。當你到了某個臨界點,Agent 就知道你這邊有東西。
坦白說
這次演講總共大約兩小時,這支影片是上半場的精華——從 Chatbot → Copilot → Agent 的演進,以及 Agent 的實際能力展示。
坦白說,在講 Agent 三個時代的區分時,這個邊界確實不是那麼清楚。每個東西都有點像,Chatbot 跟 Copilot 有點像,Copilot 跟 Agent 也有點像。但我選擇用「他能不能自主做事、處理意外」來做最核心的區分標準,這是目前我覺得最實用的判斷方式。
下半場會講到 Claude Code 實戰、模型選擇、Computer Use,以及 Harness Engineering。如果大家喜歡的話,會再出下半集。謝謝。
關鍵重點整理
Chatbot → Copilot → Agent
| Chatbot | Copilot | Agent | |
|---|---|---|---|
| 時間 | 2023 | 2024 | 2025-2026 |
| 互動模式 | 你問他答 | 你做他輔助 | 你下任務他自主完成 |
| 代表工具 | ChatGPT 網頁版 | Cursor、n8n | Claude Code、OpenClaw |
| 核心能力 | 資料查詢 | 即時協作 | 自主執行 + 錯誤處理 |
Agent 核心循環
- 判斷意圖 — 大語言模型理解你要什麼
- 拆解任務 — 把大目標切成小步驟
- 調用工具 — 用各種 API/CLI 執行
- 觀察結果(Observe) — 檢查有沒有出錯
- 自主調整 — 遇到意外自己繞過去
Agent vs 傳統自動化
| 傳統自動化(按鍵精靈) | Agent | |
|---|---|---|
| 遇到意外 | 直接失敗 | 自己判斷並繞過 |
| 連續執行 | 幾分鐘就掛 | 一兩個小時沒問題 |
| 錯誤處理 | 需要人工介入 | 自動修正 |
為 Agent 打造服務的三個信號
- MCP 協議 — 給 Agent 用的 API,不是給人用的
- 產品文件頁面 — 不是給人看,是給機器看
- SEO for AI — 農曆年後流量飆 4 倍,來的都是 AI 爬蟲