Claude Opus 4.8 正式发布

2026年5月28日，Anthropic正式发布了Claude Opus 4.8模型，距离2026年4月16日发布的Claude Opus 4.7模型仅仅过去了不到1个半月。

它在 Opus 4.7 的基础上进行了多项基准测试改进，并且协作效率更高。新版本现已上市，价格不变。

Opus 4.8 版本发布，同时还带来了多项新功能。claude.ai 的用户现在可以控制 Claude 在任务中投入的精力。Claude Code 新增了“动态工作流”功能，使其能够处理超大规模问题。此外，Opus 4.8 的快速模式（模型运行速度提升 2.5 倍）的价格也比之前的版本降低了三倍。

与 Claude Opus 4.7 相比，Claude Opus 4.8旨在改善以下方面的行为：

长时程代理编码，包括更好的长上下文处理、更少的压缩和更好的压缩恢复。
推理努力程度的校准，在各个领域中，每个努力程度水平下的行为都更加可靠。
工具触发，减少了任务所需工具调用被跳过的情况。

适应性思维

启用自适应思维后，Claude Opus 4.8仅在判断回合需要时才会触发推理。对于简单的查找和较短的智能体步骤，它会直接响应；对于复杂的多步骤问题，它会在回答前进行推理。与相同工作量水平的 Claude Opus 4.7 相比，这减少了双模工作负载下思维令牌的浪费。与 Claude Opus 4.7 一样，除非您thinking: {type: "adaptive"}在请求中明确设置，否则思维功能默认关闭。

新功能

对话过程中系统消息

Claude Opus 4.8允许在用户回合结束后立即发送消息（需遵守放置规则）。这样，您可以在长时间的对话中稍后添加更新的指令，而无需重新输入完整的系统提示，从而保留先前回合的提示缓存命中，并降低代理循环的输入成本。无需 beta 标头。有关使用详情，请参阅“对话中途系统消息”。role: "system"messages

拒绝停止详情

自 Claude Opus 4.7 版本起，拒绝响应对象stop_details已公开文档化。当 Claude 拒绝完成请求时，除了现有的refusal停止原因之外，该对象还会描述拒绝类别，从而使您的应用程序更容易区分不同类型的拒绝请求，并将用户引导至正确的下一步。无需 beta 标头。有关类别列表和处理指南，请参阅“处理停止原因” 。

努力程度默认值

Claude Opus 4.8中的“努力度”参数默认值适用于所有界面，包括 Claude API 和 Claude Code。如果您今天显式设置了“努力度”，则您的设置将保持不变。有关各层级的指导，请参阅“努力度”部分。high

快速模式

Claude Opus 4.8 的快速模式现已作为 Claude API 的研究预览版推出。该模式可使speed: "fast"同一模型每秒输出的代币数量提升高达 2.5 倍，但需支付额外费用。有关访问权限、支持的模型和定价，请参阅快速模式页面。

降低提示缓存最小值

Claude Opus 4.8的最小可缓存提示符长度为 1024 个标记，低于 Claude Opus 4.7。在 Claude Opus 4.7 中过短而无法缓存的提示符，现在无需任何代码更改即可创建缓存条目。有关各型号的最小长度要求，请参阅“提示符缓存”部分。