Agent 实践
Agent 不是简单的聊天机器人,也不是传统工作流的换皮。它的基本结构可以理解为:LLM + 规划 + 记忆 + 工具 + 环境。
- LLM:理解意图和生成决策。
- 规划:拆解任务和安排步骤。
- 记忆:保留长期上下文和经验。
- 工具:连接真实系统。
- 环境:提供可执行、可验证、可回滚的工作空间。
为什么需要 Agent
硬编码、低代码和传统工作流适合输入清晰、流程稳定、规则明确的任务。一旦任务依赖非结构化信息、隐性经验、动态上下文、多轮判断和跨工具协作,固定流程就会迅速膨胀。
Agent 的价值,是把自然语言变成任务入口,让复杂流程不再完全依赖人提前写死每一个分支。
Agent 并不完美。当前主要挑战包括响应慢、幻觉、纯文本交互不够直观、长周期任务容易偏移,以及执行结果需要人类校验。因此,Agent 更适合先从“协同完成复杂任务”开始,而不是过早完全接管关键决策。
演进阶段
- 被动式 Agent:以 ReAct 为代表,模型根据用户问题进行推理,并在需要时调用工具。
- 工作流 Agent:以 LangGraph、Dify 等为代表,用工程化约束弥补模型不确定性。
- 自主 Agent:以 Manus、Claude Code、Codex 等为代表,具备更强的规划、长周期任务执行和自我校验能力。
- 自进化 Agent:通过沉淀 Skill、知识、工作方法和项目记忆,让 Agent 越用越贴合具体场景。
抽象层迁移
Agent 的技术栈正在发生变化:
- Prompt:从深度耦合走向渐进式加载。
- Planning:从简单思维链走向复杂长程任务拆解。
- Memory:从 RAG 走向文件系统化的知识沉淀。
- Tool:从 Function Call 和 MCP 走向 CLI、脚本和 Meta-Tooling。
- Workflow:从刚性流程走向动态组合。
- Environment:从无状态对话走向 workspace、sandbox 和权限边界。