前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
未分类

Claude Haiku 4.5 发布:Anthropic 小模型性能比肩 GPT-5,速度、成本与安全性解析

NEXTECH
Last updated: 2025年10月16日 上午6:40
By NEXTECH
Share
10 Min Read
SHARE

Claude Haiku 4.5 发布:小模型性能比肩 GPT-5

Claude Haiku 4.5 性能对比图

Contents
Claude Haiku 4.5 发布:小模型性能比肩 GPT-5性能表现速度升级价格便宜安全性最后说两句

Anthropic 近日发布了 Claude Haiku 4.5,这款小模型在性能上展现出惊人实力,不仅接近五个月前发布的旗舰模型 Sonnet 4,在某些任务上甚至有所超越。其显著特点还包括成本降低三分之一,以及速度提升一倍多。

值得注意的是,直到上个月,Sonnet 4 仍是 Anthropic 的旗舰模型,而现在,一个更小巧的模型便能达到同等甚至更优的性能水平。

性能表现

Haiku 4.5 在 SWE-bench、Terminal coding、Python 工具支持、OSWorld 等测试中的表现

从完整的 benchmark 来看,Haiku 4.5 的表现引人关注:

编程能力:

You Might Also Like

大型语言模型:揭秘其随机算法的本质与深远影响
亚马逊Prime会员重磅福利:限时免费畅享Kindle Unlimited三个月!
什么是AI PaaS?一文读懂AI开发新未来:AI PaaS在AI开发中的作用
基础模型:如何赋能表格数据,应对企业级生产挑战?
  • Agentic coding(SWE-bench):73.3%
  • Terminal coding:41.0%
  • 与 Sonnet 4(72.7%、36.4%)基本持平

数学能力:

  • Python 工具支持:96.3%
  • 无工具:80.7%
  • 此表现甚至超越了很多大模型

计算机使用(Computer Use):

  • OSWorld:50.7%
  • 此成绩是亮点,直接超过 Sonnet 4 的 42.2%

Haiku 4.5 在计算机使用任务上的表现尤其令人印象深刻。

速度升级

Anthropic 特别强调了 Haiku 4.5 在速度方面的提升。官方表示其速度是原来的两倍多(more than twice the speed)。

用户体验方面,执行相同任务的等待时间直接缩短一半,例如在 Claude Code 中编写代码将获得更流畅的速度体验。

对于需要频繁调用 API 的应用而言,此次速度提升的价值甚至可能超越成本降低的意义。

价格便宜

相较于 Sonnet 4,Haiku 4.5 的 API 调用成本降低了三分之一:

  • 输入:$1 / 百万 tokens
  • 输出:$5 / 百万 tokens

具体来看,Haiku 4.5 的价格比 Sonnet 4 便宜了三分之一。

Claude Haiku 4.5 与 Sonnet 4 API 调用价格对比

部署渠道:

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Claude Code
  • Claude 网页版和 App

目前,Haiku 4.5 已基本覆盖所有支持 Claude 的平台与应用。

模型名称:claude-haiku-4-5

安全性

一个引人注目的亮点是,Haiku 4.5 被 Anthropic 认定为目前最安全的模型。

根据 Anthropic 的自动化对齐评估,Haiku 4.5 的“不一致行为”(misaligned behaviors)比例甚至低于 Sonnet 4.5 和 Opus 4.1。

此外,由于在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2。

Anthropic 模型安全性评估:Haiku 4.5 与 Sonnet 4.5、Opus 4.1 的 ASL 分级对比

相比之下,Sonnet 4.5 和 Opus 4.1 则被归类为更严格的 ASL-3。

最后说两句

Haiku 4.5 的发布,清晰地展示了人工智能能力“下沉”的速度远超预期。

仅仅在五个月前仍属旗舰模型的性能,如今已成为小模型的标准配置。

TAGGED:AI性能AnthropicClaude Haiku大模型
Share This Article
Email Copy Link Print
Previous Article 搭载M5芯片的MacBook Pro 14英寸笔记本电脑 全新M5芯片MacBook Pro与iPad Pro现已开放预订:性能飙升,AI能力再升级
Next Article 苹果设计的N1无线网络芯片为iPad Pro带来了Thread协议支持 iPad Pro M5芯片:重塑智能家居控制中心,N1芯片赋能Thread协议新纪元
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
图6:👉
提升4倍效率:AI编程助手的四大实战技巧
编程与工具
索尼PS5 Pro主机特写
索尼PS5 Pro限时直降100美元!圣诞前入手性能怪兽的最佳时机
科技
线性模式下的小时表示图
你的模型是否“时间失明”?揭秘周期性特征编码的必要性与实践
未分类
安克笔记本充电宝优惠信息图
安克大容量笔记本充电宝重回黑五史低价,仅售87.99美元
科技

相关内容

大模型‘Haha Moments’类型示例
AI 前沿技术

大模型会替代搜索引擎吗?深度探讨AI对未来信息检索的影响与融合趋势

2025年10月17日
Python战胜人类?
大模型与工程化

AI时代:人类不会取代Python,编程的本质永存

2025年10月15日
AI 前沿技术

大模型Function Calling是什么?:能力、作用与应用示例

2025年10月30日
图1:注意力机制并非过滤输入,而是放大特定信号,再通过归一化产生表观选择性。这就像带有自动增益控制的调音台,结果看似是选择性的,但其内在机制是放大。图片由作者创作。
未分类

注意力机制并非人类发明:一场跨越亿万年的“再发现”之旅

2025年11月6日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up