Article

个人对 Agent 各种工具与能力的理解

更新于：2026-01-26

我对当前 AI Agent 相关技术的理解如下。为了避免概念混乱，我使用一个统一的比喻来串联这些概念：
把智能体想象成「超市里的服务机器人」。

概念理解（超市类比）

用于约束机器人长期行为边界，定义什么可以做、什么绝对不能做，始终生效。

类比：

例子：

Rules 决定的是行为边界，而不是具体任务。

用户在当前场景下提出的具体需求，用来告诉机器人“这一次你要做什么”。

类比：

例子：

“帮我找到牛奶在哪里。”

机器人会根据 Prompt，理解目标并开始执行。

当机器人需要依赖真实、可更新的信息来完成任务时，通过查询外部资料或知识库来辅助回答，而不是凭模型自身记忆生成内容。

类比：

例子：

RAG 的核心价值是基于事实回答，而不是“额外推荐”。

Agent 拥有的一组可复用、结构化的能力模块，用于完成特定类型的任务。

类比：

特点：

机器人会先判断：

“这个需求属于哪一类技能？”

然后按对应流程执行，必要时调用脚本或工具完成任务。

用于打通模型与外部真实系统之间的安全通道，使 Agent 能够在受控前提下执行真实操作。

类比：

例子：

MCP 本身不负责“思考”，
而是决定 模型是否有权限接触和操作真实世界资源。

这些概念并非互相替代，而是在 Agent 系统中层层叠加、各司其职：

最终结果是：

Agent 在 Rules 约束下，根据 Prompt 决定目标，
通过 Skills 规划执行路径，
必要时借助 RAG 获取事实，
并通过 MCP 安全地完成真实操作。