探索 AI 写代码极致:Claude Opus 4.1 模型登场,软件工程能力再攀新高峰

探索 AI 写代码极致:Claude Opus 4.1 模型登场,软件工程能力再攀新高峰

人工智能 2025-08-06 23:06:03 11小时前

IT酷哥 8 月 6 日消息,Anthropic 公司今天(8 月 6 日)发布公告,宣布推出 Claude Opus 4.1 模型,相比较今年 5 月推出的 Claude 4 系列模型,主要改进了编码、推理和执行指令的能力。

Anthropic 表示,Claude Opus 4.1 在 SWE-bench Verified 上(用于评估软件工程准确性)提升到了 74.5%,作为对比,Claude Sonnet 3.7 的准确率为 62.3%,而 Claude Opus 4 的准确率为 72.5%。具体来说,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现得更加出色。

与 Opus 4 相比,Opus 4.1 在大多数功能上都有所提升,特别是在多文件代码重构方面表现尤为突出。IT酷哥附上相关数据如下:

Rakuten Group 发现,Opus 4.1 不做不必要的调整或引入新的错误,能够精确地在大型代码库中定位并修正错误。

Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中,比 Opus 4 表现提高了标准差的一个单位,这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。

最新的模型今日起面向 Claude 客户开放,可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。

同时,Anthropic 在社交媒体上表示,计划在未来几周内发布“对我们模型的重大改进”,因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 摩根大通:英伟达将在今年的人工智能产品市场中获得 60% 的份额
  • 为了更高效“上分”,USAF 的 AI 无人机在模拟测试中选择击杀人类操作者
  • 微软向美国政府机构开放 GPT-4 大模型,含国防部、NASA 等
  • 联合国秘书长称支持建立全球人工智能监管机构
  • 《自然》杂志拒绝刊登人工智能生成的图片和视频
  • 一个月来至少三起,台积电频频投资硅谷 AI 芯片创企
  • OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格
  • 日本演员工会提出 AI 立法建议,要求建立“声音肖像权”
  • 套娃不可取:研究人员证实用 AI 生成的结果训练 AI 将导致模型退化乃至崩溃
  • Stack Overflow 发布 2023 年度报告:JavaScript 位列榜首,83% 的人用过 ChatGPT
  • 日本音乐作家团体联合会发表声明,要求政府立即组织 AI 监管讨论并邀请创作者参与
  • LG 发布首个生成式 AI 商业化服务 Captioning AI:10 秒内为图片提供 5 句描述和 10 个关键词
  • 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元
  • 阿里、腾讯、字节、美团内部算法名单公开,网信办发布深度合成服务备案信息
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • Stability AI 推出文字生成图片模型 SDXL 0.9,硬件要求下探至消费级 GPU 水平
  • AI 作画工具 Midjourney 迎来 5.2 版本更新,可生成相机“变焦效果”
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 最新资讯

    热门资讯