跳到内容
Chris 的博客

AI Agent 是什么:从 ReAct 到工具调用

让大模型不只是聊天,而是会查资料、调 API、执行多步任务。

AI 1 分钟阅读

普通对话是”问一句答一句”。Agent 让 LLM 能自己规划、调用工具、看结果、再决定下一步

思考(Reason) → 行动(Act,调用工具) → 观察(Observe 结果) → 再思考 …

比如”查一下北京今天天气并提醒我带伞”:

  1. 思考:需要天气数据 → 行动:调天气 API
  2. 观察:返回”有雨” → 思考:该提醒带伞 → 行动:输出提醒

现代大模型支持结构化地”请求调用某个函数”。你定义工具(名字、参数 schema),模型决定何时用哪个、传什么参数,你执行后把结果回给它。

  • 简单任务别套 Agent 框架,一个带工具的 prompt 就够。
  • Agent 的失败往往来自步骤太多、误差累积。步骤越少越稳。
  • 给它明确的停止条件,否则可能在循环里空转(我就见过一个卡死的进程跑了 14 小时)。

这个博客背后的运维,就是 AI 通过工具调用 SSH 到 VPS 上完成的——Agent 的典型应用。