AI Agent 生产级架构：网关、队列、观测与成本控制

Demo 与生产的差距

本地 Agent 常是：单进程 + 单模型 Key + 无持久化。上线需要：

AI Agent 生产部署架构图

同步 SSE：适合聊天、短 tool 链（<30s）。

异步队列：适合报告生成、批量分析、多文件 RAG。

长任务异步处理流程图

用户提交 job → 返回 jobId → Worker 执行 → Webhook 或轮询结果。

当前个人博客生产部署（简化）：

Nginx (静态 + /api 反代)
  → NestJS (:3000)
  → MySQL / Redis
  → OpenAI 兼容网关（翻译、Agent）

RabbitMQ、Elasticsearch 在本地 profile 可关（.env RABBITMQ_ENABLED=false），体现 渐进式复杂度。

生产 Agent 架构 = API + Worker + 队列 + 观测 + 预算。先保证可关停（kill switch）、可追踪（requestId），再追求多 Agent 花活。

作者基于本博客 backend/src/infrastructure 与生产部署经验。