前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
未分类

Claude Haiku 4.5 发布:Anthropic 小模型性能比肩 GPT-5,速度、成本与安全性解析

NEXTECH
Last updated: 2025年10月16日 上午6:40
By NEXTECH
Share
10 Min Read
SHARE

Claude Haiku 4.5 发布:小模型性能比肩 GPT-5

Claude Haiku 4.5 性能对比图

Contents
Claude Haiku 4.5 发布:小模型性能比肩 GPT-5性能表现速度升级价格便宜安全性最后说两句

Anthropic 近日发布了 Claude Haiku 4.5,这款小模型在性能上展现出惊人实力,不仅接近五个月前发布的旗舰模型 Sonnet 4,在某些任务上甚至有所超越。其显著特点还包括成本降低三分之一,以及速度提升一倍多。

值得注意的是,直到上个月,Sonnet 4 仍是 Anthropic 的旗舰模型,而现在,一个更小巧的模型便能达到同等甚至更优的性能水平。

性能表现

Haiku 4.5 在 SWE-bench、Terminal coding、Python 工具支持、OSWorld 等测试中的表现

从完整的 benchmark 来看,Haiku 4.5 的表现引人关注:

编程能力:

You Might Also Like

RAG深度解析:全面理解嵌入、相似度与高效检索机制
Anthropic Agent代码执行新范式:Token消耗暴降98.7%,实现AI效率革命
深度强化学习从入门到实践:零基础探索无人机智能降落
AI的边界:当人工智能遭遇极限,我们该何去何从?
  • Agentic coding(SWE-bench):73.3%
  • Terminal coding:41.0%
  • 与 Sonnet 4(72.7%、36.4%)基本持平

数学能力:

  • Python 工具支持:96.3%
  • 无工具:80.7%
  • 此表现甚至超越了很多大模型

计算机使用(Computer Use):

  • OSWorld:50.7%
  • 此成绩是亮点,直接超过 Sonnet 4 的 42.2%

Haiku 4.5 在计算机使用任务上的表现尤其令人印象深刻。

速度升级

Anthropic 特别强调了 Haiku 4.5 在速度方面的提升。官方表示其速度是原来的两倍多(more than twice the speed)。

用户体验方面,执行相同任务的等待时间直接缩短一半,例如在 Claude Code 中编写代码将获得更流畅的速度体验。

对于需要频繁调用 API 的应用而言,此次速度提升的价值甚至可能超越成本降低的意义。

价格便宜

相较于 Sonnet 4,Haiku 4.5 的 API 调用成本降低了三分之一:

  • 输入:$1 / 百万 tokens
  • 输出:$5 / 百万 tokens

具体来看,Haiku 4.5 的价格比 Sonnet 4 便宜了三分之一。

Claude Haiku 4.5 与 Sonnet 4 API 调用价格对比

部署渠道:

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Claude Code
  • Claude 网页版和 App

目前,Haiku 4.5 已基本覆盖所有支持 Claude 的平台与应用。

模型名称:claude-haiku-4-5

安全性

一个引人注目的亮点是,Haiku 4.5 被 Anthropic 认定为目前最安全的模型。

根据 Anthropic 的自动化对齐评估,Haiku 4.5 的“不一致行为”(misaligned behaviors)比例甚至低于 Sonnet 4.5 和 Opus 4.1。

此外,由于在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2。

Anthropic 模型安全性评估:Haiku 4.5 与 Sonnet 4.5、Opus 4.1 的 ASL 分级对比

相比之下,Sonnet 4.5 和 Opus 4.1 则被归类为更严格的 ASL-3。

最后说两句

Haiku 4.5 的发布,清晰地展示了人工智能能力“下沉”的速度远超预期。

仅仅在五个月前仍属旗舰模型的性能,如今已成为小模型的标准配置。

TAGGED:AI性能AnthropicClaude Haiku大模型
Share This Article
Email Copy Link Print
Previous Article 搭载M5芯片的MacBook Pro 14英寸笔记本电脑 全新M5芯片MacBook Pro与iPad Pro现已开放预订:性能飙升,AI能力再升级
Next Article 苹果设计的N1无线网络芯片为iPad Pro带来了Thread协议支持 iPad Pro M5芯片:重塑智能家居控制中心,N1芯片赋能Thread协议新纪元
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

智能问答与知识检索流程中的文档分段示意图
AI 前沿技术

文档分段深度解析:从基础规则到LLM智能分块,构建高效RAG系统的核心技术

2025年10月20日
未分类

AI医疗文档智能处理独角兽Tennr 完成1.01亿美元C轮融资 IVP 领投 估值达60.5亿美元

2025年6月29日
常见的向量数据库列表
AI 前沿技术

RAG技术深度解析:让AI更智能,掌握其工作原理、文档处理、检索策略与实战

2025年10月30日
图1:传统RAG的嵌入与检索过程
大模型与工程化

揭秘GraphRAG:超越炒作,实践者如何判断其真正价值与设计要点

2025年11月12日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up