Anthropic 由 Dario 和 Daniela Amodei 于 2021 年创立。 Courtesy Anthropic.
## Claude 3.5 Sonnet 横空出世,挑战 OpenAI GPT-4o
Anthropic,这家由前 OpenAI 工程师创立的人工智能初创公司,于昨日(6 月 20 日)发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。据该公司称,新模型不仅比三个月前发布的前代产品 Claude 3 Opus 快两倍,而且在推理、编码和视觉理解等多个方面超越了 OpenAI 的 GPT-4o。Anthropic 首席执行官兼联合创始人 Dario Amodei 在一份声明中表示:“随着今天的发布,我们正在迈向一个重要的转变,这将改变我们与技术互动的方式。”
Anthropic 已将自己定位为 OpenAI 的主要竞争对手之一。该公司由 Dario Amodei 和他的姐姐 Daniela 于 2021 年创立。两人此前都在 OpenAI 工作,分别负责研究以及安全和政策方面的倡议,并在 2020 年因对公司方向和缺乏安全保障的担忧而离开。
Dario Amodei 暗示在不久的将来会快速发布新模型。Claude 3.5 Sonnet 的发布将很快被 Claude 家族的新成员所取代。“我们的目标是在智能、速度和成本之间取得更好的平衡,我们计划在今年晚些时候发布 Claude 3.5 Haiku 和 Claude 3.6 Opus,同时继续进行我们的安全研究,以确保这些系统保持安全,”首席执行官表示。Anthropic 还正在探索以记忆为中心的特性,这些特性将进一步个性化模型,以记住特定用户的偏好和交互功能。
这家总部位于旧金山的初创公司目前拥有约 375 名员工,而 OpenAI 的员工人数约为 2000 人。Anthropic 的一系列发布表明,它正在努力在与 OpenAI 的快速 AI 军备竞赛中保持领先地位,OpenAI 于 5 月推出了 GPT-4o。以下是两家公司最新模型的对比:
### Claude 在阅读、编码和数学方面胜出
除了展示在幽默、细致入微和以自然、相关的方式写作方面的改进之外,Anthropic 还表示,其最新模型在推理、知识和编码能力方面超越了 GPT-4o。
据该公司称,Claude 3.5 Sonnet 在研究生级别的推理、代码、多语言数学和文本推理方面略胜于 GPT-4o。与此同时,GPT-4o 在解决数学问题方面表现出更高的技能。
尽管 Claude 的结果令人印象深刻,但由于人们对 AI 模型基准测试的狭隘关注以及无法传达普通人如何与模型互动的方式的怀疑,因此不应将其视为衡量能力的可靠指标。
### 作为视觉模型超越 GPT-4o
另一系列基准测试展示了 Claude 在视觉理解方面的改进。Anthropic 表示,其新模型在视觉理解数学、科学图表、图表和文档方面超越了 GPT-4o。据该公司称,这些功能对于零售、物流和金融服务尤为重要,这些行业往往能够“从图像、图形或插图中获得比从文本中获得更多见解”。
### Anthropic 准备将 AI 整合到工作场所
Anthropic 的新模型还将推出一个名为 Artifacts 的功能,这使其与竞争对手的模型区别开来。它将创建一个集成的工作空间,允许用户直接编辑和交互由 Claude 生成的内容,例如电子邮件、代码或文档。这项新功能体现了 Anthropic 希望通过将 Claude 从“对话式 AI”转变为“协作式工作环境”来为企业服务。
### 两种模型均免费提供
Claude 3.5 Sonnet 的网络版和应用程序版将免费提供。同时,Claude Pro 和 Team 计划的订阅者将能够以更高的速率限制访问该模型。此举遵循了 OpenAI 制定的标准,OpenAI 在今年早些时候免费推出了 GPT-4o,并为付费用户提供了更强大的功能。
### 优先考虑安全协议
据 Anthropic 称,Claude 接受了严格的安全测试,该公司将该模型提供给了英国人工智能安全研究所进行部署前的安全评估。与此同时,OpenAI 近几个月来一直受到前员工的抨击,他们声称该公司没有优先考虑安全协议。Jan Leike 曾在 OpenAI 共同领导一个安全团队,该团队现已解散,他于 5 月离开了该公司,并已加入 Anthropic。
“创建既有能力又可靠、安全且符合人类价值观的系统是一项复杂的挑战,”Dario Amodei 说。“我们还没有找到所有答案,但我们致力于认真负责地解决这些问题。”