前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
未分类

Claude Haiku 4.5 发布:Anthropic 小模型性能比肩 GPT-5,速度、成本与安全性解析

NEXTECH
Last updated: 2025年10月16日 上午6:40
By NEXTECH
Share
10 Min Read
SHARE

Claude Haiku 4.5 发布:小模型性能比肩 GPT-5

Claude Haiku 4.5 性能对比图

Contents
Claude Haiku 4.5 发布:小模型性能比肩 GPT-5性能表现速度升级价格便宜安全性最后说两句

Anthropic 近日发布了 Claude Haiku 4.5,这款小模型在性能上展现出惊人实力,不仅接近五个月前发布的旗舰模型 Sonnet 4,在某些任务上甚至有所超越。其显著特点还包括成本降低三分之一,以及速度提升一倍多。

值得注意的是,直到上个月,Sonnet 4 仍是 Anthropic 的旗舰模型,而现在,一个更小巧的模型便能达到同等甚至更优的性能水平。

性能表现

Haiku 4.5 在 SWE-bench、Terminal coding、Python 工具支持、OSWorld 等测试中的表现

从完整的 benchmark 来看,Haiku 4.5 的表现引人关注:

编程能力:

You Might Also Like

构建GPT-5智能体:赋能AI应用的未来
多智能体SQL助手(第二部分):构建RAG管理器,实现智能数据库模式检索
深度洞察:2025年技能招聘报告揭示人才市场变革与AI新机遇
女性领导力崛起:驾驭偏见,解锁机遇与引领变革
  • Agentic coding(SWE-bench):73.3%
  • Terminal coding:41.0%
  • 与 Sonnet 4(72.7%、36.4%)基本持平

数学能力:

  • Python 工具支持:96.3%
  • 无工具:80.7%
  • 此表现甚至超越了很多大模型

计算机使用(Computer Use):

  • OSWorld:50.7%
  • 此成绩是亮点,直接超过 Sonnet 4 的 42.2%

Haiku 4.5 在计算机使用任务上的表现尤其令人印象深刻。

速度升级

Anthropic 特别强调了 Haiku 4.5 在速度方面的提升。官方表示其速度是原来的两倍多(more than twice the speed)。

用户体验方面,执行相同任务的等待时间直接缩短一半,例如在 Claude Code 中编写代码将获得更流畅的速度体验。

对于需要频繁调用 API 的应用而言,此次速度提升的价值甚至可能超越成本降低的意义。

价格便宜

相较于 Sonnet 4,Haiku 4.5 的 API 调用成本降低了三分之一:

  • 输入:$1 / 百万 tokens
  • 输出:$5 / 百万 tokens

具体来看,Haiku 4.5 的价格比 Sonnet 4 便宜了三分之一。

Claude Haiku 4.5 与 Sonnet 4 API 调用价格对比

部署渠道:

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Claude Code
  • Claude 网页版和 App

目前,Haiku 4.5 已基本覆盖所有支持 Claude 的平台与应用。

模型名称:claude-haiku-4-5

安全性

一个引人注目的亮点是,Haiku 4.5 被 Anthropic 认定为目前最安全的模型。

根据 Anthropic 的自动化对齐评估,Haiku 4.5 的“不一致行为”(misaligned behaviors)比例甚至低于 Sonnet 4.5 和 Opus 4.1。

此外,由于在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2。

Anthropic 模型安全性评估:Haiku 4.5 与 Sonnet 4.5、Opus 4.1 的 ASL 分级对比

相比之下,Sonnet 4.5 和 Opus 4.1 则被归类为更严格的 ASL-3。

最后说两句

Haiku 4.5 的发布,清晰地展示了人工智能能力“下沉”的速度远超预期。

仅仅在五个月前仍属旗舰模型的性能,如今已成为小模型的标准配置。

TAGGED:AI性能AnthropicClaude Haiku大模型
Share This Article
Email Copy Link Print
Previous Article 搭载M5芯片的MacBook Pro 14英寸笔记本电脑 全新M5芯片MacBook Pro与iPad Pro现已开放预订:性能飙升,AI能力再升级
Next Article 苹果设计的N1无线网络芯片为iPad Pro带来了Thread协议支持 iPad Pro M5芯片:重塑智能家居控制中心,N1芯片赋能Thread协议新纪元
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251118101753556.jpg
欧盟DMA法案扩大监管:AWS、Azure、谷歌云恐被列为“守门人”
科技
20251118094145807.jpg
Ramp估值飙升至320亿美元:AI驱动的金融科技巨头如何崛起?
科技
20251118090846848.jpg
全球CO2地下储存新纪元:3.83亿吨封存背后的挑战与机遇
科技
20251118083904476.jpg
新研究:净零排放延迟将锁定千年热浪,气候适应跨越世纪
科技

相关内容

智能体路由式工作流示意图
Agent生态

智能体工作流:路由式设计深度解析与应用实践

2025年10月23日
人工智能在商业决策中的连接和复杂性示意图
大模型与工程化

AI赋能商业决策:智能体、预算优化与意图识别的实践洞察

2025年9月22日
New API中转站用量查询参数配置
AI 前沿技术

CC Switch:一键切换Claude、Codex AI供应商配置的桌面工具及安装指南

2025年11月15日
智能体在环境中收集经验,并利用这些经验训练策略
未分类

强化学习深度解析:从基础概念到核心算法的全面指南

2025年11月7日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up