Article

个人对 Agent 各种工具与能力的理解

更新于:2026-01-26

我对当前 AI Agent 相关技术的理解如下。为了避免概念混乱,我使用一个统一的比喻来串联这些概念:
把智能体想象成「超市里的服务机器人」。


概念理解(超市类比)

Rules(规则)

用于约束机器人长期行为边界,定义什么可以做、什么绝对不能做,始终生效。

类比:

  • 服务规范
  • 安全守则
  • 合规要求

例子:

  • 必须礼貌对待顾客
  • 不能提供错误或误导性信息

Rules 决定的是行为边界,而不是具体任务


Prompt(提示词)

用户在当前场景下提出的具体需求,用来告诉机器人“这一次你要做什么”。

类比:

  • 顾客对机器人说的话
  • 一次性的指令或请求

例子:

“帮我找到牛奶在哪里。”

机器人会根据 Prompt,理解目标并开始执行。


RAG(Retrieval-Augmented Generation)

当机器人需要依赖真实、可更新的信息来完成任务时,通过查询外部资料或知识库来辅助回答,而不是凭模型自身记忆生成内容。

类比:

  • 查询超市库存系统
  • 查看商品说明书或内部资料

例子:

  • 确认商品是否有货
  • 查询商品的成分、保质期

RAG 的核心价值是基于事实回答,而不是“额外推荐”


Agent Skills(技能)

Agent 拥有的一组可复用、结构化的能力模块,用于完成特定类型的任务。

类比:

  • “带路技能”
  • “查库存技能”
  • “生成清单技能”

特点:

  • 可复用
  • 有固定执行流程
  • 可根据任务动态选择和组合

机器人会先判断:

“这个需求属于哪一类技能?”

然后按对应流程执行,必要时调用脚本或工具完成任务。


MCP(Model Context Protocol)

用于打通模型与外部真实系统之间的安全通道,使 Agent 能够在受控前提下执行真实操作。

类比:

  • 员工工牌
  • 内部系统访问权限
  • 后台操作接口

例子:

  • 允许机器人进入仓库拿商品
  • 允许调用库存系统或订单系统

MCP 本身不负责“思考”,
而是决定 模型是否有权限接触和操作真实世界资源


总体理解与结论

这些概念并非互相替代,而是在 Agent 系统中层层叠加、各司其职

  • Rules:定义长期行为边界
  • Prompt:定义当下任务目标
  • RAG:提供基于真实数据的事实依据
  • Agent Skills:提供结构化、可复用的执行流程
  • MCP:连接并调用真实世界的系统能力

最终结果是:

Agent 在 Rules 约束下,根据 Prompt 决定目标,
通过 Skills 规划执行路径,
必要时借助 RAG 获取事实,
并通过 MCP 安全地完成真实操作。