Anthropic 的 Claude 3.5 Haiku:速度与效率的完美平衡
Anthropic 近日悄然将 Claude 3.5 Haiku 模型全面开放给所有用户,通过网页和移动应用程序上的 Claude 聊天机器人即可使用。这一消息由 AI 领域的用户在 X 平台上率先发现。
Haiku 模型最初仅面向开发者开放,通过 Anthropic 的 API 访问。自 2024 年 10 月发布以来,这款更小、更快的模型凭借其在关键基准测试中超越大型模型的表现,以及具有竞争力的价格,吸引了广泛关注。
第三方基准测试机构 Artificial Analysis 的数据显示,Claude 3.5 Haiku “与平均水平相比,延迟更低,首个 token 的接收时间(TTFT)为 0.80 秒”,但“与平均水平相比,输出速度较慢,每秒输出 65.1 个 token”。
Haiku 的发布,虽然没有正式宣布,却紧随 Anthropic 的 AI 竞争对手 OpenAI 和 Google 的重大更新步伐。这两家公司也在今年年底发布了新的模型,并将其提供给聊天机器人的用户使用,分别是 OpenAI 的 o1 和 o1-mini 模型,以及 Google 的 Gemini 2。
对于 Anthropic 来说,关键问题在于,Claude 3.5 Haiku 的性能是否足以吸引用户订阅其 Pro 版本,或者继续使用它,而不是选择其他先进且快速的竞争对手。
作为 Anthropic 产品线中最快速、最具成本效益的模型,Claude 3.5 Haiku 在实时任务方面表现出色,例如处理大型数据集、分析财务文件以及从长上下文信息中生成输出。
Haiku 拥有 200,000 个 token 的上下文窗口,超过了 OpenAI 的 GPT-4 的 128,000 个 token 窗口,使其能够轻松处理大量输入。
在 Claude 聊天机器人中,Haiku 带来了增强其多功能性的功能。用户可以分析图像和文件附件,使其适用于多媒体任务和涉及大型文档集的工作流程。
Haiku 还与 Claude Artifacts 集成,后者是 2024 年 6 月首次推出的交互式侧边栏。Artifacts 提供了一个专门的工作区,用于实时操作和完善 AI 生成的内容,包括运行完整的应用程序。今天早上,我在使用 Haiku 测试 Artifacts 时,它能够在不到一分钟的时间内编写一个完全可玩的 Pong 版本:
尽管 Haiku 拥有诸多优势,但它也存在一些局限性。目前它不支持网页浏览或图像生成,而 OpenAI 的 GPT-4o 和 GPT-4 等竞争对手则提供了这些功能。
此外,我今天早上对其进行了简短的测试,发现它在“草莓测试”中失败了。这是一个常见的用户设计挑战,要求 AI 识别出单词“草莓”中的所有三个“R”。
Claude 3.5 Haiku 可通过 Claude 聊天机器人免费访问,但用户每天的留言数量会根据服务器需求而有所不同。
例如,今天早上我在免费版本中尝试使用它时,能够进行大约 10 次交换(总共 20 条进出消息),然后达到 Anthropic 的配额,该配额每天重置。
为了解锁更广泛的使用,用户可以订阅 Claude Pro 计划,每月价格为 20 美元。
该订阅提供免费版本的五倍使用量,在流量高峰期优先访问,提前体验新功能,以及访问 Claude 3 Opus 等其他模型。
这种定价结构与 OpenAI 的 ChatGPT Plus 订阅类似,为高级用户提供优质体验。
在 API 中,Claude 3.5 Haiku 以实惠的价格提供卓越的性能。起价为每百万输入 token 0.80 美元和每百万输出 token 4 美元,与 Claude 3 Opus 等大型模型相比,它提供了一种经济实惠的解决方案。
开发者可以使用提示缓存进一步降低成本,提示缓存可以节省高达 90% 的成本,而 Message Batches API 可以将成本降低 50%。
在基准测试中,Haiku 超越了许多更大、公开可用的模型。其性能包括在 SWE-bench Verified 上获得 40.6% 的分数,这是一个关键的编码基准测试,证明了它在需要智能和速度的任务中的实力。这使得 Haiku 成为面向用户的应用程序和时间敏感工作流程的绝佳选择。
虽然 Claude 3.5 Haiku 提供了强大的功能,但潜在用户应考虑其当前的局限性。缺乏网页浏览和图像生成功能,使其在某些用例中不如竞争对手吸引人。此外,每天的留言上限对于不想升级到 Claude Pro 订阅的用户来说可能很不方便。
然而,凭借图像和文件分析、强大的编码功能以及与 Artifacts 的集成,Haiku 仍然是需要速度和精度的任务的强大工具。
特别是 Artifacts 功能,扩展了其功能,使其超越文本生成,能够进行协作编辑和实时内容完善。
对于准备探索其潜力的用户来说,Claude 3.5 Haiku 现已上线,可通过网页和 iOS 和 Android 上的移动应用程序上的 Claude 聊天机器人使用。