前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
未分类

Claude Haiku 4.5 发布:Anthropic 小模型性能比肩 GPT-5,速度、成本与安全性解析

NEXTECH
Last updated: 2025年10月16日 上午6:40
By NEXTECH
Share
10 Min Read
SHARE

Claude Haiku 4.5 发布:小模型性能比肩 GPT-5

Claude Haiku 4.5 性能对比图

Contents
Claude Haiku 4.5 发布:小模型性能比肩 GPT-5性能表现速度升级价格便宜安全性最后说两句

Anthropic 近日发布了 Claude Haiku 4.5,这款小模型在性能上展现出惊人实力,不仅接近五个月前发布的旗舰模型 Sonnet 4,在某些任务上甚至有所超越。其显著特点还包括成本降低三分之一,以及速度提升一倍多。

值得注意的是,直到上个月,Sonnet 4 仍是 Anthropic 的旗舰模型,而现在,一个更小巧的模型便能达到同等甚至更优的性能水平。

性能表现

Haiku 4.5 在 SWE-bench、Terminal coding、Python 工具支持、OSWorld 等测试中的表现

从完整的 benchmark 来看,Haiku 4.5 的表现引人关注:

编程能力:

You Might Also Like

重磅更新!Anthropic将Claude Code编程助手直接集成至Slack
神经网络的模糊与符号系统的碎片:稀疏自编码器如何实现融合
深入Triton:从向量加法看高性能GPU编程,为大模型优化提速
RAG分块策略实战:从原理到优化,提升大模型问答效果
  • Agentic coding(SWE-bench):73.3%
  • Terminal coding:41.0%
  • 与 Sonnet 4(72.7%、36.4%)基本持平

数学能力:

  • Python 工具支持:96.3%
  • 无工具:80.7%
  • 此表现甚至超越了很多大模型

计算机使用(Computer Use):

  • OSWorld:50.7%
  • 此成绩是亮点,直接超过 Sonnet 4 的 42.2%

Haiku 4.5 在计算机使用任务上的表现尤其令人印象深刻。

速度升级

Anthropic 特别强调了 Haiku 4.5 在速度方面的提升。官方表示其速度是原来的两倍多(more than twice the speed)。

用户体验方面,执行相同任务的等待时间直接缩短一半,例如在 Claude Code 中编写代码将获得更流畅的速度体验。

对于需要频繁调用 API 的应用而言,此次速度提升的价值甚至可能超越成本降低的意义。

价格便宜

相较于 Sonnet 4,Haiku 4.5 的 API 调用成本降低了三分之一:

  • 输入:$1 / 百万 tokens
  • 输出:$5 / 百万 tokens

具体来看,Haiku 4.5 的价格比 Sonnet 4 便宜了三分之一。

Claude Haiku 4.5 与 Sonnet 4 API 调用价格对比

部署渠道:

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Claude Code
  • Claude 网页版和 App

目前,Haiku 4.5 已基本覆盖所有支持 Claude 的平台与应用。

模型名称:claude-haiku-4-5

安全性

一个引人注目的亮点是,Haiku 4.5 被 Anthropic 认定为目前最安全的模型。

根据 Anthropic 的自动化对齐评估,Haiku 4.5 的“不一致行为”(misaligned behaviors)比例甚至低于 Sonnet 4.5 和 Opus 4.1。

此外,由于在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2。

Anthropic 模型安全性评估:Haiku 4.5 与 Sonnet 4.5、Opus 4.1 的 ASL 分级对比

相比之下,Sonnet 4.5 和 Opus 4.1 则被归类为更严格的 ASL-3。

最后说两句

Haiku 4.5 的发布,清晰地展示了人工智能能力“下沉”的速度远超预期。

仅仅在五个月前仍属旗舰模型的性能,如今已成为小模型的标准配置。

TAGGED:AI性能AnthropicClaude Haiku大模型
Share This Article
Email Copy Link Print
Previous Article 搭载M5芯片的MacBook Pro 14英寸笔记本电脑 全新M5芯片MacBook Pro与iPad Pro现已开放预订:性能飙升,AI能力再升级
Next Article 苹果设计的N1无线网络芯片为iPad Pro带来了Thread协议支持 iPad Pro M5芯片:重塑智能家居控制中心,N1芯片赋能Thread协议新纪元
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251226090743334.jpg
日本科学家突破EV电池瓶颈:新型富勒烯材料实现快充长续航
科技
图2:七大开源OCR模型
七大开源OCR模型深度评测:从文档解析到多模态理解,本地部署全指南
计算机视觉
20251226084048371.jpg
2026中国航天五大任务:探月采样与空间望远镜齐发
科技
图片 1
2025年AI代理架构深度解析:跨越生成式AI鸿沟,构建企业级生产力
报告

相关内容

Anthropic研究引发关注
AI 前沿技术

Anthropic重磅研究:250份文档即可投毒任意大模型,颠覆AI安全认知

2025年10月12日
1985年可口可乐经典圣诞广告:彩灯货车点亮小镇
未分类

可口可乐AI广告争议:技术革新与创意质量的博弈分析

2025年11月6日
DeepSeek-OCR技术工作原理示意图
AI 前沿技术

DeepSeek-OCR:AI文字识别黑科技,让AI高效处理文字

2025年10月27日
图片 1
未分类

2025年企业治理前瞻:加拿大市场趋势深度解析与未来挑战

2025年11月18日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up