前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

DeepSeek R1-Lite 首秀惊艳,超越 OpenAI o1 表现

NEXTECH
Last updated: 2024年11月21日 下午8:57
By NEXTECH
Share
16 Min Read
SHARE

DeepSeek 推出全新推理型大语言模型 R1-Lite-Preview,性能媲美 OpenAI

DeepSeek,一家由中国量化对冲基金 High-Flyer Capital Management 孵化的 AI 公司,致力于发布高性能开源技术,近日推出了其最新的推理型大语言模型 (LLM) R1-Lite-Preview。目前,该模型仅通过 DeepSeek Chat,其基于网络的 AI 聊天机器人,提供独家访问。

DeepSeek 以其对开源 AI 生态系统的创新贡献而闻名,其新发布的模型旨在将高级推理能力带给公众,同时坚持其对可访问和透明 AI 的承诺。

尽管 R1-Lite-Preview 目前仅通过聊天应用程序提供,但其性能已引起广泛关注,在某些情况下甚至超过了 OpenAI 备受赞誉的 o1-preview 模型。

与 2024 年 9 月发布的 o1-preview 模型类似,DeepSeek-R1-Lite-Preview 展示了“思维链”推理,向用户展示其为响应查询和输入而进行的各种“思维”链或轨迹,通过解释其正在做什么以及为什么来记录过程。

虽然一些思维链/轨迹可能对人类来说看起来毫无意义甚至错误,但 DeepSeek-R1-Lite-Preview 总体上似乎非常准确,甚至可以回答让其他更老但功能强大的 AI 模型(如 GPT-4o 和 Claude 的 Anthropic 家族)感到困惑的“陷阱”问题,例如“单词 Strawberry 中有多少个字母 R?”和“哪个更大,9.11 还是 9.9?”请参见以下我使用 DeepSeek Chat 测试这些提示的截图:



DeepSeek-R1-Lite-Preview 旨在擅长需要逻辑推理、数学推理和实时解决问题的任务。

据 DeepSeek 称,该模型在 AIME(美国数学邀请赛)和 MATH 等既定基准测试中超越了 OpenAI o1-preview 水平的性能。

DeepSeek-R1-Lite-Preview 在 X 上发布的基准测试结果。

其推理能力通过其透明的思维过程得到增强,使用户能够逐步跟踪模型解决复杂挑战的过程。

DeepSeek 还发布了扩展数据,展示了当模型获得更多时间或“思维令牌”来解决问题时,其准确性稳步提高。性能图表突出了其在 AIME 等基准测试中随着思维深度的增加而获得更高分数的能力。

DeepSeek-R1-Lite-Preview 在关键基准测试中表现出色。

该公司发布的结果突出了其处理各种任务的能力,从复杂的数学到基于逻辑的场景,在 GPQA 和 Codeforces 等推理基准测试中获得了与顶级模型相媲美的性能分数。

其推理过程的透明度进一步使其脱颖而出。用户可以实时观察模型的逻辑步骤,增加了许多专有 AI 系统所缺乏的责任感和信任感。

然而,DeepSeek 尚未发布完整的代码以供独立第三方分析或基准测试,也尚未通过 API 提供 DeepSeek-R1-Lite-Preview,这将允许进行相同类型的独立测试。

此外,该公司尚未发布博客文章或技术论文来解释 DeepSeek-R1-Lite-Preview 的训练或架构方式,这留下了许多关于其底层起源的疑问。

R1-Lite-Preview 现在可以通过 DeepSeek Chat(chat.deepseek.com)访问。虽然该模型对公众免费使用,但其高级“深度思考”模式每天限制 50 条消息,为用户提供了充分的机会体验其功能。

展望未来,DeepSeek 计划根据该公司在 X 上的帖子发布其 R1 系列模型和相关 API 的开源版本。

此举符合该公司支持开源 AI 社区的历史。

其之前的版本 DeepSeek-V2.5 因将通用语言处理和高级编码能力相结合而获得了赞誉,使其成为当时最强大的开源 AI 模型之一。

DeepSeek 正在继续其在开源 AI 领域突破界限的传统。早期的模型,如 DeepSeek-V2.5 和 DeepSeek Coder,在语言和编码任务中展示了令人印象深刻的能力,基准测试将其定位为该领域的领导者。

R1-Lite-Preview 的发布增加了一个新的维度,专注于透明的推理和可扩展性。

随着企业和研究人员探索推理密集型 AI 的应用,DeepSeek 对开放性的承诺确保其模型仍然是开发和创新的重要资源。

通过将高性能、透明操作和开源可访问性相结合,DeepSeek 不仅在推动 AI 发展,而且正在重塑 AI 的共享和使用方式。

R1-Lite-Preview 现已开放公众测试。开源模型和 API 预计将陆续发布,进一步巩固 DeepSeek 作为可访问、先进 AI 技术领导者的地位。

Share This Article
Email Copy Link Print
Previous Article replicant3.jpg?resize=1200,600 AI 复制你的个性
Next Article Final-image-_AI_scraping.jpg?resize=1200 AI时代,如何保护你的艺术作品
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20250610054810485.png
抖音:2025非遗数据报告
报告
人脸识别支付公司PopID完成融资 PayPal、Visa参投
未分类
20250610054408449.png
IDC:2024年中国SASE产品服务市场规模约为11.4亿元 同比增长37.8%
报告
中汽协会:2025年4月我国汽车整车出口情况简析
报告

相关内容

GettyImages-2194950188.jpg?resize=1200,6
AI

狗狗币圈议程风向标

2025年5月9日
一位身穿安全背心的女性正在亚马逊操作包装机器
AI

机器人与包装的未来

2024年11月21日
AI

最快的AI系统,效率惊人

2024年9月24日
AI

AI加速:数据生产与消费核心原则

2025年4月18日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?