Claude

Claude 是 Anthropic 开发的大语言模型系列，核心设计目标是安全、诚实和有帮助三者兼顾。与其他大模型相比，Claude 的训练方式（Constitutional AI）更强调原则驱动的行为，而不只是依赖人类偏好标注，这使得它在边界模糊的任务上更倾向于给出理由而非简单拒绝，在需要判断的场景中更少奉承、更愿意坚持正确答案。

模型系列

Claude 按能力和成本分为三个层级，每一代都会同时更新三个层级：

Haiku：响应最快、成本最低，适合高频调用、实时交互和对延迟敏感的场景。
Sonnet：能力与成本的平衡点，是大多数实际任务的首选，也是 Claude Code 的默认模型。
Opus：能力最强，适合复杂推理、长文档分析和高价值低频任务。

版本演进路径：Claude 1 → Claude 2（长上下文）→ Claude 3（多模态，三档齐发）→ Claude 3.5（Sonnet 大幅提升，推出 Computer Use）→ Claude 3.7（Extended Thinking 正式发布）→ Claude 4（Opus 4、Sonnet 4，推理和 Agent 能力显著增强）。

核心能力

超长上下文：支持 200K token 上下文窗口，可以处理完整代码库、长篇文档、会议记录和多轮历史记录。实际使用时需注意"迷失在中间"问题——关键信息放在开头或结尾比放在中间更可靠。

Extended Thinking：Claude 3.7/4 支持推理前展开内部思考过程，在数学、代码调试、复杂逻辑推断等需要多步骤推演的任务上有显著优势。Thinking 消耗额外 token，适合对质量要求高、对速度和成本不敏感的场景。

代码能力：Claude 在代码生成、调试、重构和理解上表现突出，尤其在需要跨文件理解依赖关系和上下文的任务上。SWE-Bench 数据显示 Claude 系列在真实软件工程任务中持续领先。

多模态：支持图像、PDF、文档输入，可以理解截图、图表、界面设计和技术架构图。Computer Use 功能（Claude 3.5+）允许 Claude 直接操作计算机界面，通过截图→分析→鼠标键盘操作完成任务。

产品形态

Claude.ai：网页和 App 形式的对话界面，支持 Projects（持久记忆和文档上传）、Artifacts（代码和内容预览）和多种模型切换。适合日常问答、写作、研究和原型验证。

Claude API：面向开发者的 API 接入，支持 Prompt Caching（降低重复内容成本 90%）、流式输出、工具调用（Function Calling）和 Vision。是构建 Claude 驱动产品的基础设施。

Claude Code：终端内的编程 Agent，直接在开发环境中运行，可以读写文件、执行命令、运行测试、查看报错并迭代修复。不只是代码补全，而是把 Claude 放进真实工作区参与完整开发任务。

Claude Code 的使用方式

Claude Code 和其他 AI Coding 工具的核心区别在于工作区深度：它不需要手动复制粘贴代码，而是直接在终端读写你的项目文件、运行命令、看输出，形成完整的任务闭环。

有效使用的关键：

CLAUDE.md 文件：在项目根目录写 CLAUDE.md，说明项目结构、常用命令、编码规范和禁止操作，让 Claude Code 每次进入项目都有完整上下文。
任务粒度：一次任务聚焦一个清晰的目标，完成后验证，再进入下一个。避免一次性交代十个需求。
人在关键节点：对于删除、发布、数据库操作等不可逆步骤，在任务描述里明确要求"执行前先告诉我将要做什么"。
模型选择：日常开发用 Sonnet，遇到复杂架构问题或难以排查的 bug 切换 Opus 或开启 Extended Thinking。

与其他模型的选择逻辑

Claude 相比 GPT-4o 在长文档处理、边界判断和减少奉承效应上有优势；相比 Gemini 在代码和推理任务上更稳定；相比开源模型（Llama、Hermes）在复杂指令跟随和 Agent 可靠性上更高，但灵活性和成本控制上不如本地部署的开源方案。

实际选择时：

需要隐私或低成本高频调用 → 开源模型本地部署
需要最强代码和推理能力 → Claude Sonnet/Opus
需要多模态和生态整合 → GPT-4o 或 Gemini
需要在现有 IDE 里无缝集成 → GitHub Copilot（底层也在向 Claude 迁移）

模型系列​

核心能力​

产品形态​

Claude Code 的使用方式​

与其他模型的选择逻辑​

模型系列

核心能力

产品形态

Claude Code 的使用方式

与其他模型的选择逻辑