前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

深度学习新突破:架构胜过算力

NEXTECH
Last updated: 2025年4月28日 上午6:50
By NEXTECH
Share
18 Min Read
SHARE

订阅我们的每日和每周新闻通讯,获取有关行业领先的 AI 报道的最新更新和独家内容。了解更多

人工智能叙事已达到一个关键的转折点。DeepSeek 的突破——在不依赖最先进芯片的情况下实现最先进的性能——证明了 12 月 NeurIPS 上许多人已经宣布的观点:人工智能的未来不在于向问题投入更多计算资源,而在于重新构想这些系统如何与人类和我们的环境协同工作。

作为一名斯坦福大学计算机科学专业的毕业生,我见证了人工智能发展的希望与风险,我认为这一刻比 ChatGPT 的首次亮相更具变革意义。我们正在进入一些人称之为“推理复兴”的时代。OpenAI 的 o1、DeepSeek 的 R1 以及其他模型正在超越蛮力扩展,朝着更智能的方向发展,并且以空前的效率实现这一目标。

这种转变来得正是时候。在 NeurIPS 的主题演讲中,前 OpenAI 首席科学家 Ilya Sutskever 宣称“预训练将结束”,因为虽然计算能力在不断增长,但我们受到有限互联网数据的限制。DeepSeek 的突破验证了这一观点——这家中国公司的研究人员以不到 OpenAI o1 成本的一小部分实现了可比的性能,证明了创新,而不仅仅是原始计算能力,才是前进的道路。

世界模型正在崛起,以填补这一空白。World Labs 最近筹集了 2.3 亿美元用于构建像人类一样理解现实的人工智能系统,这与 DeepSeek 的方法相呼应,他们的 R1 模型表现出“Aha!”时刻——就像人类一样停下来重新评估问题。这些受人类认知过程启发的系统有望彻底改变从环境建模到人机交互的一切。

我们正在看到早期成果:Meta 最近更新了他们的 Ray-Ban 智能眼镜,使人们能够与 AI 助手进行持续的、上下文相关的对话,而无需唤醒词,并提供实时翻译。这不仅仅是功能更新——它预示着人工智能如何在不依赖大型预训练模型的情况下增强人类能力。

然而,这种演变也带来了微妙的挑战。虽然 DeepSeek 通过创新的训练技术大幅降低了成本,但这种效率突破可能矛盾地导致整体资源消耗增加——这种现象被称为杰文斯悖论,即技术效率提高往往会导致资源使用增加而不是减少。

在人工智能领域,更便宜的训练可能意味着更多组织训练更多模型,从而可能导致净能源消耗增加。但 DeepSeek 的创新不同:他们证明了在没有尖端硬件的情况下也能实现最先进的性能,他们不仅使人工智能更高效,而且从根本上改变了我们进行模型开发的方式。

这种从原始计算能力转向巧妙架构的转变可能帮助我们摆脱杰文斯悖论的陷阱,因为重点从“我们能负担多少计算能力?”转变为“我们能以多高的智能设计我们的系统?”正如加州大学洛杉矶分校教授 Guy Van Den Broeck 指出,“语言模型推理的总成本肯定不会下降。”这些系统的环境影响仍然很大,推动着行业朝着更有效的解决方案发展——这正是 DeepSeek 所代表的创新。

这种转变需要新的方法。DeepSeek 的成功证明了未来不在于构建更大的模型,而在于构建更智能、更高效的模型,这些模型与人类智能和环境限制相协调。

Meta 的首席人工智能科学家 Yann LeCun 设想未来的系统会花几天甚至几周时间思考复杂的问题,就像人类一样。DeepSeek 的 R1 模型能够暂停并重新考虑方法,代表着朝着这一愿景迈出的一步。虽然资源密集型,但这种方法可能会在气候变化解决方案、医疗保健创新等领域取得突破。但正如卡内基梅隆大学的 Ameet Talwalkar 明智地提醒我们,我们必须质疑任何声称对这些技术将把我们引向何方抱有确定性的人。

对于企业领导者来说,这种转变为前进指明了一条清晰的道路。我们需要优先考虑高效的架构。一种可以:

  • 部署专门的 AI 代理链,而不是单个大型模型。
  • 投资于优化性能和环境影响的系统。
  • 构建支持迭代的、以人为中心的开发的基础设施。

让我兴奋的是:DeepSeek 的突破证明了我们正在超越“越大越好”的时代,进入一个更加有趣的世界。随着预训练达到其极限,创新型公司正在找到用更少的资源实现更多目标的新方法,这为创造性的解决方案开辟了令人难以置信的空间。

更小、更专业的智能代理链不仅更高效,而且将帮助我们以我们从未想象过的方式解决问题。对于愿意跳出思维定势的初创企业和企业来说,这是我们再次享受人工智能的时刻,构建真正对人和地球都有意义的东西。

Kiara Nirghin 是一位屡获殊荣的斯坦福大学技术专家、畅销书作家和 Chima 的联合创始人。

DataDecisionMakers

欢迎来到 VentureBeat 社区!

DataDecisionMakers 是专家(包括从事数据工作的技术人员)分享数据相关见解和创新的平台。

如果您想了解前沿理念、最新信息、最佳实践以及数据和数据技术的未来,请加入我们 DataDecisionMakers。

您甚至可以考虑贡献自己的文章!

阅读 DataDecisionMakers 的更多内容

Share This Article
Email Copy Link Print
Previous Article 20250427174350867.jpg 调查显示日本不到3%的预购玩家想要多语言版Switch 2
Next Article 人工智能悖论:明日利器,今日威胁
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
中芯国际:2025年Q1营收163.01亿元,同比增长29.4%
报告
复旦大学:空调换热器细菌含量超马桶60倍
报告
上汽大众:2025年4月销量8.3万辆,同比增长5.9%
报告
20250510054846475.jpg
TrendForce:2025年Q1全球OLED显示器出货50.7万台 年增175%
报告

相关内容

Talker-Reasoner 框架
AI

深度思维赋予AI系统2思考能力

2024年11月14日
根据软件公司Similarweb的最新数据,OpenAI的生成式人工智慧(AI)平台ChatGPT在月访问量上已超越Google Chrome。
AI

ChatGPT用户超越Chrome AI搜索成新趋势

2024年11月25日
Map of the South Pacific showing the region from the southern part of China to Australia.
AI

最

2024年12月17日
AI

GitHub 推出全新 AI 功能,Copilot 登陆 Xcode 等平台

2024年11月14日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?