跳到主要内容

Agent 实践

Agent 不是简单的聊天机器人,也不是传统工作流的换皮。它的基本结构可以理解为:LLM + 规划 + 记忆 + 工具 + 环境

  • LLM:理解意图和生成决策。
  • 规划:拆解任务和安排步骤。
  • 记忆:保留长期上下文和经验。
  • 工具:连接真实系统。
  • 环境:提供可执行、可验证、可回滚的工作空间。

为什么需要 Agent

硬编码、低代码和传统工作流适合输入清晰、流程稳定、规则明确的任务。一旦任务依赖非结构化信息、隐性经验、动态上下文、多轮判断和跨工具协作,固定流程就会迅速膨胀。

Agent 的价值,是把自然语言变成任务入口,让复杂流程不再完全依赖人提前写死每一个分支。

Agent 并不完美。当前主要挑战包括响应慢、幻觉、纯文本交互不够直观、长周期任务容易偏移,以及执行结果需要人类校验。因此,Agent 更适合先从“协同完成复杂任务”开始,而不是过早完全接管关键决策。

演进阶段

  1. 被动式 Agent:以 ReAct 为代表,模型根据用户问题进行推理,并在需要时调用工具。
  2. 工作流 Agent:以 LangGraph、Dify 等为代表,用工程化约束弥补模型不确定性。
  3. 自主 Agent:以 Manus、Claude Code、Codex 等为代表,具备更强的规划、长周期任务执行和自我校验能力。
  4. 自进化 Agent:通过沉淀 Skill、知识、工作方法和项目记忆,让 Agent 越用越贴合具体场景。

抽象层迁移

Agent 的技术栈正在发生变化:

  • Prompt:从深度耦合走向渐进式加载。
  • Planning:从简单思维链走向复杂长程任务拆解。
  • Memory:从 RAG 走向文件系统化的知识沉淀。
  • Tool:从 Function Call 和 MCP 走向 CLI、脚本和 Meta-Tooling。
  • Workflow:从刚性流程走向动态组合。
  • Environment:从无状态对话走向 workspace、sandbox 和权限边界。