AI 工具与实践

AI Agent 工作流:从补全到多步任务

Agent 不止是会聊天的模型,而是能规划、调用工具、循环直到完成的系统。本文拆解 Agent 架构,并结合博客项目里的 Agent 模块说明落地要点。

2026-06-04T08:00:00.000Z

AI Agent 工作流:从补全到多步任务

AI Agent 工作流:从补全到多步任务

从 Chat 到 Agent

Chat:一问一答,模型不知道下一步 unless 你继续喂。

Agent

  1. 理解目标;
  2. 拆步骤;
  3. 调用工具(读文件、跑命令、HTTP、搜索);
  4. 观察结果,决定继续或结束。

Cursor Agent、Claude Code、Devin 类产品的本质都是 LLM + 工具循环

典型架构

User Goal
   ↓
Planner(可选)
   ↓
LLM ←→ Tools(file, shell, browser, MCP…)
   ↓
Memory / State
   ↓
Answer or PR

关键组件:

组件 作用
System prompt 角色、边界、输出格式
Tools schema 模型可见的能力列表
Context 仓库、会话、检索结果
Guardrails 限步数、限命令、审计

本博客里的 Agent

站点 /ai 路由对接后端 agent 模块,支持:

这是 产品化 Agent 而非本地 CLI:要处理会话持久化、鉴权、限流、审计。

自建 Agent 时建议 early 考虑:

设计工具的原则

  1. 粒度:一个 tool 做一件事(read_filegrep),不要 mega tool;
  2. 可观测:日志记录 tool name、参数摘要(脱敏);
  3. 幂等:写操作要想清楚重复调用后果;
  4. 人类闸门:删库、发邮件、部署要确认。

MCP 与 Agent

MCP(Model Context Protocol)让 Agent 以标准方式连接外部系统——数据库、Notion、GitHub。下一篇可专讲 MCP;这里只强调:Agent 的能力边界 = 你接了什么 tool

失败模式

小结

Agent 工作流 = 目标 + 工具 + 循环 + 护栏。日常开发用 Cursor/Claude Code 已是 Agent;做产品则要补会话、成本与合规。


结合本仓库 backend/src/modules/agent 实践总结。

标签