2026年5月28日,Anthropic正式发布了Claude Opus 4.8模型,距离2026年4月16日发布的Claude Opus 4.7模型仅仅过去了不到1个半月。
它在 Opus 4.7 的基础上进行了多项基准测试改进,并且协作效率更高。新版本现已上市,价格不变。
Opus 4.8 版本发布,同时还带来了多项新功能。claude.ai 的用户现在可以控制 Claude 在任务中投入的精力。Claude Code 新增了“动态工作流”功能,使其能够处理超大规模问题。此外,Opus 4.8 的快速模式(模型运行速度提升 2.5 倍)的价格也比之前的版本降低了三倍。
与 Claude Opus 4.7 相比,Claude Opus 4.8旨在改善以下方面的行为:
- 长时程代理编码,包括更好的长上下文处理、更少的压缩和更好的压缩恢复。
- 推理努力程度的校准,在各个领域中,每个努力程度水平下的行为都更加可靠。
- 工具触发,减少了任务所需工具调用被跳过的情况。
适应性思维
启用自适应思维后,Claude Opus 4.8仅在判断回合需要时才会触发推理。对于简单的查找和较短的智能体步骤,它会直接响应;对于复杂的多步骤问题,它会在回答前进行推理。与相同工作量水平的 Claude Opus 4.7 相比,这减少了双模工作负载下思维令牌的浪费。与 Claude Opus 4.7 一样,除非您thinking: {type: "adaptive"}在请求中明确设置,否则思维功能默认关闭。
新功能
对话过程中系统消息
Claude Opus 4.8允许在用户回合结束后立即发送消息(需遵守放置规则)。这样,您可以在长时间的对话中稍后添加更新的指令,而无需重新输入完整的系统提示,从而保留先前回合的提示缓存命中,并降低代理循环的输入成本。无需 beta 标头。有关使用详情,请参阅“对话中途系统消息”。role: "system"messages
拒绝停止详情
自 Claude Opus 4.7 版本起,拒绝响应对象stop_details已公开文档化。当 Claude 拒绝完成请求时,除了现有的refusal停止原因之外,该对象还会描述拒绝类别,从而使您的应用程序更容易区分不同类型的拒绝请求,并将用户引导至正确的下一步。无需 beta 标头。有关类别列表和处理指南,请参阅“处理停止原因” 。
努力程度默认值
Claude Opus 4.8中的“努力度”参数默认值适用于所有界面,包括 Claude API 和 Claude Code。如果您今天显式设置了“努力度”,则您的设置将保持不变。有关各层级的指导,请参阅“努力度”部分。high
快速模式
Claude Opus 4.8 的快速模式现已作为 Claude API 的研究预览版推出。该模式可使speed: "fast"同一模型每秒输出的代币数量提升高达 2.5 倍,但需支付额外费用。有关访问权限、支持的模型和定价,请参阅快速模式页面。
降低提示缓存最小值
Claude Opus 4.8的最小可缓存提示符长度为 1024 个标记,低于 Claude Opus 4.7。在 Claude Opus 4.7 中过短而无法缓存的提示符,现在无需任何代码更改即可创建缓存条目。有关各型号的最小长度要求,请参阅“提示符缓存”部分。




