Anthropic 于 5 月 28 日发布 Claude Opus 4.8,升级周期加速至 41 天,AI 竞赛日趋激烈。
Anthropic 于 5 月 28 日发布 Claude Opus 4.8,升级周期加速至 41 天,AI 竞赛日趋激烈。

Anthropic 于 5 月 28 日发布 Claude Opus 4.8,升级周期加速至仅 41 天,这家 AI 实验室正全力追赶 OpenAI 和 Google,并准备将其功能强大的 Mythos 模型向公众开放。
"Opus 4.8 能够主动标记分析输入和输出中的问题,这是其他模型通常忽略、留待用户自行发现的特性,"桥水基金在 Anthropic 引用的推荐语中表示。
根据 Anthropic 的对齐评估,该模型在代码审查中遗漏缺陷的概率比 Opus 4.7 低 4 倍,且错误对齐行为的发生率也有所下降。定价保持不变,仍为每百万输入 token 5 美元、每百万输出 token 25 美元。新增的快速模式运行速度为原来的 2.5 倍,定价分别为每百万 token 10 美元和 50 美元,比之前的快速模式定价便宜 3 倍。Anthropic 还推出了 Dynamic Workflows(动态工作流)研究预览版,使 Opus 4.8 能够在数百个并行子代理中管理复杂任务,以及 Effort Control(努力控制)功能,允许用户将思考力度从低调整至最高。
加速发布的周期——Opus 4.7 仅在 41 天前发布,而 Anthropic 的 Sonnet 和 Haiku 模型的发布间隔通常为 3 到 7 个月——反映出来自 OpenAI Codex 和 Google Gemini Flash 的竞争压力。Anthropic 表示,在 Project Glasswing 的安全保障措施完成后,预计"在未来几周内"向所有客户提供 Mythos 级别的模型。Mythos 能够自主开发专业级别的网络攻击,引发了高管和全球领导人对其潜在影响的担忧。
Opus 4.8 的发布正值 Opus 4.7 遇冷之后,部分用户对上一代模型感到失望。早期测试者报告称,根据 Anthropic 的发布博文,Opus 4.8"更倾向于标记其工作中的不确定性,且更少做出无根据的断言"。该模型现在能够从启动到合并,在数十万行代码的规模上执行代码库级别的迁移,并以现有的测试套件作为基准。
Anthropic 确认正在与其他公司合作开展 Project Glasswing,旨在保护关键软件免受 AI 驱动的攻击。"优势将属于能够最大限度利用这些工具的一方,"该公司警告称,承认其最先进模型的双重用途性质。该公司在 Opus 4.8 的发布博文中表示,其在开发安全措施方面正取得"快速进展",并预计在未来几周内向所有客户提供 Mythos 级别的模型。
Opus 4.8 在可靠性方面的改进,解决了企业采用 AI 的一个关键障碍——大型语言模型倾向于生成看似合理但实际错误的输出。通过标记不确定性并减少无根据的断言,Anthropic 正致力于解决信任缺失问题,这一问题一直阻碍着许多金融服务和医疗保健公司在前台角色中部署 AI。桥水基金作为早期测试者的背书,表明机构投资者看到了这些改进的实际价值。
Anthropic 已从包括 Google 和 Amazon 在内的投资者处融资超过 100 亿美元,正与 OpenAI 的 GPT 模型和 Google 的 Gemini 家族直接竞争。AI 基础设施军备竞赛推动了该领域巨大的资本支出,Microsoft、Amazon 和 Google 承诺到 2026 年在 AI 数据中心上投入总计超过 2000 亿美元。Anthropic 在加速发布的同时维持定价的能力,可能会迫使竞争对手跟进,从而压缩整个行业的利润率。该公司的 Opus 4.8 现已可通过 claude.ai、Claude API 及主流云平台立即使用,预计具备类似功能的低成本模型也将随后推出。
本文仅供参考,不构成投资建议。