前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
未分类

Claude Haiku 4.5 发布:Anthropic 小模型性能比肩 GPT-5,速度、成本与安全性解析

NEXTECH
Last updated: 2025年10月16日 上午6:40
By NEXTECH
Share
10 Min Read
SHARE

Claude Haiku 4.5 发布:小模型性能比肩 GPT-5

Claude Haiku 4.5 性能对比图

Contents
Claude Haiku 4.5 发布:小模型性能比肩 GPT-5性能表现速度升级价格便宜安全性最后说两句

Anthropic 近日发布了 Claude Haiku 4.5,这款小模型在性能上展现出惊人实力,不仅接近五个月前发布的旗舰模型 Sonnet 4,在某些任务上甚至有所超越。其显著特点还包括成本降低三分之一,以及速度提升一倍多。

值得注意的是,直到上个月,Sonnet 4 仍是 Anthropic 的旗舰模型,而现在,一个更小巧的模型便能达到同等甚至更优的性能水平。

性能表现

Haiku 4.5 在 SWE-bench、Terminal coding、Python 工具支持、OSWorld 等测试中的表现

从完整的 benchmark 来看,Haiku 4.5 的表现引人关注:

编程能力:

You Might Also Like

机器学习在面板数据应用中的陷阱:数据泄露与实践指南
机器学习实践洞察:从项目策略到高效工具与学习方法
AI助力两天构建部署应用:Lovable、Supabase与Netlify实战经验分享
AI心理咨询师TheraMind:大模型驱动的长期心理辅导新范式与知识增强应用
  • Agentic coding(SWE-bench):73.3%
  • Terminal coding:41.0%
  • 与 Sonnet 4(72.7%、36.4%)基本持平

数学能力:

  • Python 工具支持:96.3%
  • 无工具:80.7%
  • 此表现甚至超越了很多大模型

计算机使用(Computer Use):

  • OSWorld:50.7%
  • 此成绩是亮点,直接超过 Sonnet 4 的 42.2%

Haiku 4.5 在计算机使用任务上的表现尤其令人印象深刻。

速度升级

Anthropic 特别强调了 Haiku 4.5 在速度方面的提升。官方表示其速度是原来的两倍多(more than twice the speed)。

用户体验方面,执行相同任务的等待时间直接缩短一半,例如在 Claude Code 中编写代码将获得更流畅的速度体验。

对于需要频繁调用 API 的应用而言,此次速度提升的价值甚至可能超越成本降低的意义。

价格便宜

相较于 Sonnet 4,Haiku 4.5 的 API 调用成本降低了三分之一:

  • 输入:$1 / 百万 tokens
  • 输出:$5 / 百万 tokens

具体来看,Haiku 4.5 的价格比 Sonnet 4 便宜了三分之一。

Claude Haiku 4.5 与 Sonnet 4 API 调用价格对比

部署渠道:

  • Claude API
  • Amazon Bedrock
  • Google Cloud Vertex AI
  • Claude Code
  • Claude 网页版和 App

目前,Haiku 4.5 已基本覆盖所有支持 Claude 的平台与应用。

模型名称:claude-haiku-4-5

安全性

一个引人注目的亮点是,Haiku 4.5 被 Anthropic 认定为目前最安全的模型。

根据 Anthropic 的自动化对齐评估,Haiku 4.5 的“不一致行为”(misaligned behaviors)比例甚至低于 Sonnet 4.5 和 Opus 4.1。

此外,由于在 CBRN(化学、生物、放射性、核武器)风险评估中表现良好,Haiku 4.5 被归类为 ASL-2。

Anthropic 模型安全性评估:Haiku 4.5 与 Sonnet 4.5、Opus 4.1 的 ASL 分级对比

相比之下,Sonnet 4.5 和 Opus 4.1 则被归类为更严格的 ASL-3。

最后说两句

Haiku 4.5 的发布,清晰地展示了人工智能能力“下沉”的速度远超预期。

仅仅在五个月前仍属旗舰模型的性能,如今已成为小模型的标准配置。

TAGGED:AI性能AnthropicClaude Haiku大模型
Share This Article
Email Copy Link Print
Previous Article 搭载M5芯片的MacBook Pro 14英寸笔记本电脑 全新M5芯片MacBook Pro与iPad Pro现已开放预订:性能飙升,AI能力再升级
Next Article 苹果设计的N1无线网络芯片为iPad Pro带来了Thread协议支持 iPad Pro M5芯片:重塑智能家居控制中心,N1芯片赋能Thread协议新纪元
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251205190349369.jpg
Meta战略大转向:削减30%元宇宙预算,全力押注AI
科技
20251205183721458.jpg
南部非洲古人类基因组改写进化史:20万年隔离与独特基因
科技
20251205180959635.jpg
AMD为对华出口AI芯片支付15%税费,引发美国宪法争议
科技
20251205174331374.jpg
家的定义与核心价值:探索现代居住空间的意义
科技

相关内容

Claude Agent循环示意图
Agent生态

万物皆可Agent!Anthropic官方“三步循环法”:手把手教你构建最强智能体与Claude Agent SDK多领域应用

2025年10月13日
初级生产者营运资金表
大模型与工程化

构建多模态RAG:实现文本、图像和表格的智能响应

2025年11月4日
图1:高级LangGraph工作流示例
未分类

使用LangGraph构建高效智能体系统:深度解析与实战

2025年10月1日
表1:从clinicaltrials.gov下载的两个阿尔茨海默病研究的关键信息示例,其中部分信息已从原始数据中提取。
大模型与工程化

五步精通PICO信息提取器:构建生物医学领域NLP应用与部署

2025年9月22日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up