“`html
百度发布ERNIE 4.5和ERNIE X1:AI领域的新竞速者
近日,百度强势推出两款全新AI模型:ERNIE 4.5和ERNIE X1,分别主打多模态语言理解和高级推理能力。此举无疑在全球AI竞争中投下重磅炸弹。
百度宣称,这两款模型在多项第三方基准测试中均取得了领先地位,超越了DeepSeek的V3模型和OpenAI的GPT-4.5(不得不提,这名字起的,是不是有点“巧合”?) 。在C-Eval(涵盖52个学科的中文大模型知识和推理能力评估)、CMMLU(中文大规模多任务语言理解)和GSM8K(数学应用题)等测试中,ERNIE系列表现出色。
更令人瞩目的是,百度还强调ERNIE X1的成本比DeepSeek的R1推理模型低50%,ERNIE 4.5则比OpenAI的GPT-4.5低99%。这在成本敏感的AI应用领域,无疑极具竞争力。
然而,利弊并存。ERNIE系列目前尚未开源(DeepSeek R1已开源),且上下文窗口长度远小于GPT-4.5(仅8000 tokens,对比GPT-4.5的128000 tokens,实在有些“寒酸”)。正如X用户@claudeglass所言,如此短的上下文窗口,或许只适合客服聊天机器人。
百度已承诺将于2025年6月30日开源ERNIE 4.5模型家族。
目前,用户可通过百度AI应用编程接口(API)和类ChatGPT的中文聊天机器人“ERNIE Bot”访问这两个模型。“ERNIE Bot”功能强大,能问答、文本生成、创意写作,并支持流畅的对话交互,且已免费开放。
ERNIE 4.5是百度最新的基础模型,原生多模态设计,可处理文本、图像、音频和视频,是OpenAI GPT-4.5的强劲对手。
该模型在理解、生成、推理和记忆方面均有显著提升,尤其在减少幻觉、逻辑推理和编码能力方面表现突出。
百度表示,ERNIE 4.5在多项基准测试中超越GPT-4.5,同时成本显著降低。
ERNIE 4.5的进步源于多项核心技术,包括FlashMask动态注意力掩码、异构多模态专家混合和自反馈增强后训练。
ERNIE X1则专注于深度推理能力,强调理解、规划、反思和演进。
不同于一般的多模态AI模型,ERNIE X1专为复杂推理和工具使用而设计,能够执行高级搜索、基于文档的问答、AI图像解读、代码执行和网页分析等任务。
该模型支持百度学术搜索、商业信息搜索和特许经营研究等多种工具。其开发基于渐进强化学习、端到端训练(整合思维链和行动链)以及统一的多方面奖励系统。
用户现在可以通过ERNIE Bot官网访问ERNIE 4.5和ERNIE X1。
企业用户和开发者可以通过百度AI云千帆平台的API访问ERNIE 4.5,ERNIE X1即将上线。
- ERNIE 4.5:
- 输入:每百万tokens 0.55美元
- 输出:每百万tokens 2.2美元
- ERNIE X1:
- 输入:每百万tokens 0.28美元
- 输出:每百万tokens 1.1美元
对比之下:
- DeepSeek R1
- 输入:每百万tokens 0.55美元
- 输出:每百万tokens 2.19美元
百度还计划将ERNIE 4.5和ERNIE X1整合到其更广泛的生态系统中,包括百度搜索和文心一言应用。
对于CIO、CTO、IT领导者和DevOps团队而言,ERNIE 4.5和ERNIE X1的发布既带来了机遇,也提出了挑战:
- 性能与成本:价格远低于竞争对手,企业可通过API集成ERNIE模型节省成本。但需进一步基准测试和实际应用测试,以评估其特定业务应用的性能。
- 多模态和推理能力:处理文本、图像、音频和视频的能力,对客服、内容生成、法律科技和金融等行业具有重要价值。
- 工具集成:ERNIE X1能够与高级搜索、基于文档的问答和代码解读等工具协同工作,可提升企业效率。
- 生态系统和本地化:ERNIE模型针对中文处理和区域知识进行了优化,在中国或面向中文市场的企业可能比全球替代方案更有效。
- 许可和数据隐私:虽然百度表示ERNIE 4.5将于2025年6月30日开源,但企业仍需谨慎评估本地部署或使用美国托管云服务的可行性。企业用户应在集成这些AI解决方案之前,仔细审查百度的隐私政策、合规性和模型使用条款。
2025年,AI发展日新月异,百度正凭借其多模态和推理型AI技术,稳坐领导地位。
百度计划持续投资人工智能、数据中心和云基础设施,以增强其基础模型的能力。
百度最新的AI模型以其强大的性能和更低的成本,旨在为企业和个人用户提供更易访问、更先进的AI工具。
更多详情,请访问ERNIE Bot官网。
“`