架构设计

AI Agent 生产级架构:网关、队列、观测与成本控制

从 Demo 到生产差的不只是模型。本文用部署架构图说明 API 网关、异步队列、向量库、日志追踪与预算护栏如何组合。

2026-06-04T13:12:57.454Z

AI Agent 生产级架构:网关、队列、观测与成本控制

AI Agent 生产级架构:网关、队列、观测与成本控制

Demo 与生产的差距

本地 Agent 常是:单进程 + 单模型 Key + 无持久化。上线需要:

AI Agent 生产部署架构图

推荐分层

职责 常见组件
边缘 TLS、WAF、限流 Nginx / Cloudflare / Gateway
API REST/SSE、会话 NestJS / FastAPI
执行 Agent 循环、tool Worker 进程 / 容器
模型 推理 OpenAI 兼容网关
数据 会话、向量、文件 MySQL / PG / S3
消息 异步任务 RabbitMQ / Redis Stream
观测 指标、日志、追踪 Prometheus + Loki + Tempo

同步 vs 异步

同步 SSE:适合聊天、短 tool 链(<30s)。

异步队列:适合报告生成、批量分析、多文件 RAG。

长任务异步处理流程图

用户提交 job → 返回 jobId → Worker 执行 → Webhook 或轮询结果。

成本与控制

与本博客基础设施对照

当前个人博客生产部署(简化):

Nginx (静态 + /api 反代)
  → NestJS (:3000)
  → MySQL / Redis
  → OpenAI 兼容网关(翻译、Agent)

RabbitMQ、Elasticsearch 在本地 profile 可关(.env RABBITMQ_ENABLED=false),体现 渐进式复杂度

小结

生产 Agent 架构 = API + Worker + 队列 + 观测 + 预算。先保证可关停(kill switch)、可追踪(requestId),再追求多 Agent 花活。


作者基于本博客 backend/src/infrastructure 与生产部署经验。

标签