Agent 時代，人人都應該有一個 AI 數字員工

你真正需要的，可能不是一個 Super Agent

2025 年 1 月，OpenAI 率先發布 Operator，大家湧進去讓它幫忙訂餐廳、填表格，結果它連日期選擇器都搞不定。兩個月後，Manus 邀請碼在某交易平臺上一度被炒至上萬元。隨後 7 月份，ChatGPT Agent 正式上線，Pro 用戶每月 400 條調用額度，Plus 用戶只有 40 條，不夠用就加錢。

半年之內，三款重磅 Agent 產品接連登場，所有人都在搶著用，又都在吐槽不好用。

Manus Ai

但不妨冷靜下來想想，你到底需要一個什麼樣的 Agent？

是一個能夠幫你自動比價 100 雙運動鞋、同時生成海報設計方案的全能選手？還是一個能幫你訂到週五晚上那家總約不上的餐廳的超級助理？

大概率都不是。

大多數人對 Agent 的真實需求，其實要樸素得多。

每天早上打開電腦前，有人幫你把昨晚發生的行業大事整理好；每週一開會前，有人幫你把上週的數據拉出來、排好版；每次寫週報前，有人幫你把本週的工作記錄匯成初稿。

這些需求不酷，不性感，上不了發佈會的 demo 演示環節。

但它們有一個共同特點：重複、固定、私人。沒有哪家公司會專門為你的晨間閱讀習慣開發一個產品，也沒有哪個通用 Agent 能精準理解「你關注的行業」到底是什麼意思。

換句話說，你不需要一個無所不能的 Super Agent，你需要的是一個只為你幹一件事、每天準時幹好的 Mini Agent。

而這件事，現在你自己就能做到。

Agent 到底是什麼

在成為科技圈頂流之前，Agent 在學術界已經安靜地躺了幾十年。

「Agent」一詞源自拉丁語「Agere」，意思是「行動」「做事」。

在 AI 領域，它有一個經典的學術定義：一個能夠感知環境、自主決策並執行行動的實體。 Stuart Russell 和 Peter Norvig 在 Artificial Intelligence: A Modern Approach 中，給出了更精確的描述——Agent 是通過傳感器感知環境、通過執行器作用於環境的任何事物。

Agents interact with environments through sensors and actuators

舉個例子：你家的掃地機器人就是一個 Agent。它通過傳感器感知房間佈局（感知），決定先掃客廳還是先掃臥室（決策），然後自己跑去掃（執行）。整個過程不需要你拿著遙控器一步步指揮。

但這個定義存在了幾十年，為什麼 Agent 偏偏在 2024 到 2025 年突然成了最火的概念？

答案不在定義本身，而在一塊關鍵拼圖被補上了。

傳統的 Agent，無論是掃地機器人還是工業流水線上的機械臂，它們的「決策」能力都極其有限——要麼靠預設規則，要麼靠統計模型，碰到規則之外的情況就抓瞎。它們能「自動」，但談不上「智能」。

大語言模型的出現，第一次給了 Agent 一顆真正的「大腦」。

這顆大腦能理解自然語言、能進行多步推理、能根據上下文靈活調整策略。當它被接入工具調用、網頁操作、代碼執行等能力後，一個能聽懂你說話、自己想辦法、調用各種工具把事情辦好的 Agent，就出現了。

所以，如果要用一句話區分 2025 年最容易混淆的兩個概念：

Chatbot 是你問它答，Agent 是你說目標它幹活。

你跟 ChatGPT 說「幫我寫一封郵件」，它會給你一段文字，然後等你自己複製粘貼發出去——這是 Chatbot。

你跟 ChatGPT Agent 說「幫我給老闆發一封請假郵件，週五到下週一，理由是家裡有事」，它會自己打開 Gmail、寫好內容、填好收件人，然後問你「要發嗎？」——這是 Agent。

一個負責生成，一個負責搞定。這就是大語言模型給 Agent 這個老概念注入的新靈魂。

Agent 的發展史

回頭看，它的進化經歷了三次明顯浪潮，每一次都在降低同一個門檻：讓 Agent 替你幹活，你需要懂多少技術？

最早替人幹活的 Agent，其實不叫 Agent，它們叫腳本、叫宏、叫 RPA（機器人流程自動化）。

邏輯簡單粗暴：你告訴它「如果收到標題含’發票’的郵件，就自動下載附件並存到指定文件夾」，它就老老實實照做。UiPath、Blue Prism 這類 RPA 工具一度是企業自動化的主力軍，銀行、保險、財務部門靠它們省下了大量人力。

Automation｜Introducing RPA

但它們有一個致命的侷限：每一步都要人來定義。流程一旦變了，規則就廢了。它們能執行，但不能理解。就像一臺精密的流水線——只要產品規格不變，效率極高；一旦換個型號，整條線得重新調。

2023 年 3 月，GPT-4 發佈後不到三週，一個叫 AutoGPT 的開源項目橫空出世，一個月內在 GitHub 上斬獲超過 10 萬顆 star，至今仍是該平臺歷史上增長最快的項目之一。

它的理念讓人興奮：給 AI 一個目標，它自己拆解任務、自己調用工具、自己執行，全程不需要人介入。BabyAGI、MetaGPT 等類似項目也在同一時期冒出。

AutoGPT GitHub

但很快，所有人都發現了一個問題：它們太不靠譜了。

AutoGPT 經常在執行到第三四步時跑偏，陷入死循環，或者做出匪夷所思的決策——比如你讓它調研一個行業報告，它會先花 20 分鐘試圖註冊一個新郵箱。

學術界用「hallucination（幻覺）」來形容大語言模型一本正經地胡說八道，而這一波 Agent 的問題更直接：它們一本正經地瞎幹活。

概念是超前的，但工程成熟度完全沒跟上。這一波浪潮來得快去得也快，留下的最大遺產不是某個完全可用的產品，而是一個被驗證的方向。

大語言模型驅動的 Agent，路是對的，只是還沒走到。

真正的轉折發生在 2025 年。

先是 Manus 在 3 月以一系列驚豔的 demo 引爆社交媒體，展示了一個 Agent 從理解任務、拆解步驟到調用瀏覽器和代碼執行器完成交付的完整鏈路。那種「你看著它一步步幹活」的透明感，讓用戶第一次覺得：Agent 真的能用了。

然後是 OpenAI 在年中把 Operator 和 Deep Research 合併進 ChatGPT，推出統一的 ChatGPT Agent。它能操作瀏覽器、運行代碼、調用 API，還支持任務中途打斷和修改——從「能幹活」進化到「能配合」。

OpenAI｜Introducing ChatGPT Agent

這一波和前兩波的根本區別在於：Agent 不再是實驗室裡的概念驗證，而是可以被付費使用的產品。它開始有了穩定性、有了用戶體驗設計、有了商業模式。

而搭建 Agent 的工具也在這一年加速成熟。

Claude Code、Cursor 等開發者平臺，正在把「造一個 Agent」這件事的門檻，從「你得是程序員」拉低到「你會說清楚需求就行」。

而 2026 年初的 OpenClaw 則從另一個方向印證了這股趨勢。

這個項目最初只是開發者的一個週末 side project，卻在短短兩個月內斬獲超過 10 萬顆 GitHub star。它做的事情並不複雜：讓你在自己的設備上跑一個私人 AI 助手，連接 Telegram、Slack 等主流聊天工具，隨時待命。

沒有發佈會，沒有融資 PPT，一個人、一個週末、一個開源項目，就構成了一個被幾十萬人使用的 Agent 產品。

三次浪潮，三次門檻下降。從「會寫代碼才能自動化」，到「會說話就能造 Agent」。

我們正站在第三次浪潮的起點。

用 Claude Code 搭建 Daily Ai News Agent

接下來，我會演示，通過 Claude Code，搭建一個 Daily Ai News Agent。

這個 Agent 要做的事很簡單：每天定時抓取你指定的信息源，篩選出跟 AI 行業相關的內容，按照指定格式整理成一份簡報。

打開 Windows PowerShell

安裝 Claude Code

1	irm https://claude.ai/install.ps1 \| iex

其他 OS 的安裝命令見 Claude Code Docs

安裝 Git

1	winget install --id Git.Git -e --source winget

定位到項目文件夾

1	cd your-project-path

初始化 Claude Code

claude

安裝 Claude Code 相關插件

# 安裝長期記憶插件
/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem

# 安裝定時任務插件
/plugin marketplace add jshchnz/claude-code-scheduler
/plugin install scheduler@claude-code-scheduler

下載 Agent 需求文檔，放到項目根目錄中

Agent 需求文檔

讓 Claude Code 讀取 Agent 需求文檔並執行