探索 AI 写代码极致：Claude Opus 4.1 模型登场，软件工程能力再攀新高峰

探索 AI 写代码极致：Claude Opus 4.1 模型登场，软件工程能力再攀新高峰

人工智能 2025-08-06 23:06:03 11小时前

IT酷哥 8 月 6 日消息，Anthropic 公司今天（8 月 6 日）发布公告，宣布推出 Claude Opus 4.1 模型，相比较今年 5 月推出的 Claude 4 系列模型，主要改进了编码、推理和执行指令的能力。

Anthropic 表示，Claude Opus 4.1 在 SWE-bench Verified 上（用于评估软件工程准确性）提升到了 74.5%，作为对比，Claude Sonnet 3.7 的准确率为 62.3%，而 Claude Opus 4 的准确率为 72.5%。具体来说，更新后的模型在“深度研究和数据分析技能，尤其是在细节追踪和代理搜索方面”表现得更加出色。

与 Opus 4 相比，Opus 4.1 在大多数功能上都有所提升，特别是在多文件代码重构方面表现尤为突出。IT酷哥附上相关数据如下：

Rakuten Group 发现，Opus 4.1 不做不必要的调整或引入新的错误，能够精确地在大型代码库中定位并修正错误。

Windsurf 报告称，Opus 4.1 在其初级开发者基准测试中，比 Opus 4 表现提高了标准差的一个单位，这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。

最新的模型今日起面向 Claude 客户开放，可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。

同时，Anthropic 在社交媒体上表示，计划在未来几周内发布“对我们模型的重大改进”，因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。

模型是在率为亚马逊准确

相关阅读

摩根大通：英伟达将在今年的人工智能产品市场中获得 60% 的份额

为了更高效“上分”，USAF 的 AI 无人机在模拟测试中选择击杀人类操作者

微软向美国政府机构开放 GPT-4 大模型，含国防部、NASA 等

联合国秘书长称支持建立全球人工智能监管机构

《自然》杂志拒绝刊登人工智能生成的图片和视频

一个月来至少三起，台积电频频投资硅谷 AI 芯片创企

OpenAI 为开发者推出 GPT 聊天机器人 API 大更新，同时降低价格

日本演员工会提出 AI 立法建议，要求建立“声音肖像权”

套娃不可取：研究人员证实用 AI 生成的结果训练 AI 将导致模型退化乃至崩溃

Stack Overflow 发布 2023 年度报告：JavaScript 位列榜首，83% 的人用过 ChatGPT

日本音乐作家团体联合会发表声明，要求政府立即组织 AI 监管讨论并邀请创作者参与

LG 发布首个生成式 AI 商业化服务 Captioning AI：10 秒内为图片提供 5 句描述和 10 个关键词

全球 AI 人才需求激增，部分岗位年薪逼近 40 万美元

阿里、腾讯、字节、美团内部算法名单公开，网信办发布深度合成服务备案信息

YouTube 测试 Aloud 人工智能配音功能，可将视频转述为不同语言

Stability AI 推出文字生成图片模型 SDXL 0.9，硬件要求下探至消费级 GPU 水平

AI 作画工具 Midjourney 迎来 5.2 版本更新，可生成相机“变焦效果”

中国联通发布鸿湖图文 AI 大模型 1.0，可实现以文生图、视频剪辑

外媒提议更新开源许可证：摆脱 80 年代束缚，应对当下人工智能时代

英科智能推出 AI 设计的罕见病特效药，已在中美同时启动人体临床试验