文章目录
- claude3.7 原理简介
- 亮点:编程长板进一步提升
- 扩展思考模式(Extended Thinking Mode)
- 可控推理
- 训练数据多样性
- claude-agent :智能体式编程工具
- 参考资料
claude3.7 原理简介
亮点:编程长板进一步提升
2025 年 2 月 28 日下午 5:25,Anthropic发布了claude3.7 sonnet模型,这是首个混合推理语言大模型,即参照人类思考系统的快速反应与慢反思结合的工作模式,将LLM快速响应和思维链深度思考功能集成到统一的大模型中。其核心特点是能够在标准模式下提供近乎即时的响应,或在扩展思考模式下进行可见的逐步推理。
从官网的介绍中,可以看到claude3.7在自己的长板能力(编程和前端开发)上取得了进一步的提升;
扩展思考模式(Extended Thinking Mode)
扩展思考模式允许 Claude 在给出最终答案前,通过生成一系列 token 逐步推理问题。该功能特别适合数学问题、复杂分析、多步骤推理等任务。
可控推理
受deepseek公开推理过程的影响,claude3.7 Sonnet也公开了思维链,用户在API调用时还可控制模型思考深度,以平衡性能和计算资源;
训练数据多样性
claude3.7 sonnet的model card中介绍,claude3.7的训练数据包括互联网公开信息、第三方非公开数据、数据标准承包商提供的数据、内部生成的数据。通过去重、分类等多种数据清洗和过滤方法,确保训练数据的高质量。训练数据日期截止到2024年10月底。
安全对齐时,在强化学习中采用 Constitutional AI 技术,通过基于《联合国人权宣言》等来源的规则和原则,将模型与人类价值观对齐。从 Claude 3.5 Sonnet 开始,还新增了尊重残疾人权利的原则。
claude-agent :智能体式编程工具
与claude3.7同时发布的还有智能体式编程工具:claude-agent,其主要功能包括:
功能 | 介绍 |
---|---|
理解新代码库 | Claude Code 可以快速概述项目结构,帮助开发者找到相关代码部分。 |
修复错误 | 它能诊断错误信息并建议修复方案,提高开发效率。 |
重构代码 | 支持现代化旧代码,建议并实施符合当前最佳实践的更新。 |
处理测试 | 协助为未覆盖的代码添加测试,确保代码质量。 |
创建拉取请求 | 生成详细记录的拉取请求,方便代码变更和审查。 |
管理文档 | 生成或更新代码文档,确保代码说明清晰。 |
处理图像 | 分析图像和截图,为视觉相关代码提供上下文或建议。 |
设置项目记忆 | 通过 CLAUDE.md 文件记录项目信息,供 Claude 参考。 |
作为 Unix 风格工具使用 | 在终端中运行,像其他命令行工具一样接受输入并提供输出。 |
设置模型上下文协议 (MCP) | 允许连接外部工具(如 PostgreSQL 数据库),增强功能。 |
参考资料
https://www.anthropic.com/news/claude-3-7-sonnet
https://assets.anthropic.com/m/785e231869ea8b3b/original/claude-3-7-sonnet-system-card.pdf
https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/tutorials