前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

下一代神经网络将“活”在硬件中

NEXTECH
Last updated: 2025年1月22日 上午6:52
By NEXTECH
Share
16 Min Read
SHARE

241219_logicgates2.jpg?resize=1200,600

想象一下,如果人工智能不再需要庞大的数据中心,不再依赖于消耗巨量能量的传统神经网络,而是直接在芯片硬件上运行,那将是怎样的景象?这并非科幻,而是现实中正在发生的突破。

最近,一项发表在顶级机器学习会议上的研究成果,为我们揭示了这种可能性。研究人员利用逻辑门构建了全新的神经网络,这些网络直接嵌入到芯片硬件中,能够以更快的速度识别图像,同时消耗的能量也大幅降低。

传统的深度学习模型,例如GPT-4和Stable Diffusion,都是基于感知器构建的,这些感知器是模拟人类大脑神经元的简化模型。虽然感知器在数量庞大时能够展现出强大的能力,但它们也需要消耗大量的能量,甚至需要像微软那样,为了支持人工智能的发展,重新启用已经关闭的核电站。

问题在于,感知器仅仅是软件抽象,在GPU上运行感知器网络需要将网络转换为硬件语言,这需要耗费时间和能量。而直接使用硬件组件构建网络,则可以省去这些成本。未来,这些网络甚至可以集成到智能手机和其他设备的芯片中,极大地减少对服务器的数据传输需求。

斯坦福大学的博士后研究员Felix Petersen,正是这一突破的推动者。他设计了一种由逻辑门组成的网络,逻辑门是计算机芯片的基本构建模块。每个逻辑门由几个晶体管组成,接收两个比特(1或0)作为输入,并根据晶体管的特定模式输出一个比特。与感知器类似,逻辑门也可以串联成网络。而运行逻辑门网络则非常便宜、快速且简单,Petersen在神经信息处理系统(NeurIPS)会议上表示,逻辑门网络的能耗比感知器网络低数十万倍。

You Might Also Like

美国小城AI探民意
阿里开源SmartResume:智能简历解析系统的工作原理与性能优势
AI 中间层仍需强劲硬件支撑
Claude Agent Skills:Anthropic赋能AI智能体专业任务执行

虽然逻辑门网络在图像标注等任务上的表现不如传统神经网络,但其速度和效率使其具有巨大的潜力。康奈尔大学电气与计算机工程教授Zhiru Zhang表示:“如果我们能够缩小差距,那么这将有可能在机器学习领域开辟许多新的可能性。”

Petersen最初并非为了构建节能的人工智能网络而研究逻辑门,而是出于对“可微分松弛”的兴趣。可微分松弛是一种将某些类型的数学问题转化为微积分可以解决的形式的策略。Petersen说:“这最初只是一个数学和方法论上的好奇心。”

反向传播算法是深度学习革命的关键,也是可微分松弛的明显应用场景。由于反向传播算法基于微积分,因此无法直接用于训练逻辑门网络。逻辑门只能处理0和1,而微积分需要对所有中间值进行计算。Petersen设计了一种方法,通过创建类似于逻辑门的功能,使逻辑门网络能够进行反向传播训练。这些功能在0和1上表现得像逻辑门,但也能对中间值给出答案。他使用这些逻辑门对模拟网络进行训练,然后将松弛的逻辑门网络转换回可以在计算机硬件中实现的形式。

这种方法的一个挑战是,训练松弛网络非常困难。网络中的每个节点都可能变成16种不同的逻辑门中的一种,并且必须跟踪和不断调整与每种逻辑门相关的16个概率。这需要大量的计算时间和能量。Petersen在NeurIPS会议上表示,训练他的网络比在GPU上训练传统神经网络要慢数百倍。在无法负担大量GPU的大学里,获得如此多的GPU时间非常困难。Petersen与斯坦福大学和康斯坦茨大学的同事合作开发了这些网络。他说:“这确实让研究变得非常困难。”

然而,一旦网络训练完成,成本就会大幅降低。Petersen将他的逻辑门网络与其他超高效网络(例如二进制神经网络)进行了比较。二进制神经网络使用简化的感知器,只能处理二进制值。逻辑门网络在CIFAR-10数据集上的图像分类任务中,与这些高效方法的表现相当。CIFAR-10数据集包含10个不同类别的低分辨率图像,从“青蛙”到“卡车”。逻辑门网络在实现这一目标时,所需的逻辑门数量不到其他方法的十分之一,所需时间不到千分之一。Petersen使用可编程计算机芯片(称为FPGA)测试了他的网络,FPGA可以用来模拟许多不同的逻辑门模式。在非可编程ASIC芯片中实现这些网络将进一步降低成本,因为可编程芯片需要使用更多组件才能实现其灵活性。

加州大学圣地亚哥分校电气与计算机工程教授Farinaz Koushanfar表示,她不确定逻辑门网络在面对更现实的问题时是否能够有效运行。她说:“这是一个有趣的想法,但我不知道它能否很好地扩展。”她指出,逻辑门网络只能通过松弛策略进行近似训练,而近似可能会失败。目前还没有出现问题,但Koushanfar表示,随着网络规模的扩大,这可能会成为更大的问题。

尽管如此,Petersen仍然雄心勃勃。他计划继续推动逻辑门网络的能力,并希望最终创造出他所说的“硬件基础模型”。一个强大的、通用的视觉逻辑门网络可以被直接大规模生产到计算机芯片上,这些芯片可以集成到个人手机和电脑等设备中。Petersen表示,这将带来巨大的节能效益。例如,如果这些网络能够有效地从低分辨率信息中重建照片和视频,那么在服务器和个人设备之间传输的数据量将大大减少。

Petersen承认,逻辑门网络在性能上永远无法与传统神经网络相媲美,但这并不是他的目标。创造出能够正常工作且尽可能高效的东西就足够了。他说:“它不会是最好的模型,但它应该是最便宜的。”

Share This Article
Email Copy Link Print
Previous Article 20250121221616371.jpg Counterpoint:2024年第三季度全球半导体代工市场份额
Next Article 20250121225419240.jpg 巨型雄心游戏开发访谈
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

ChatGPT 集成应用示意图
Agent生态

ChatGPT 变身App Store:开启“对话即应用”新时代,重塑互联网入口

2025年10月8日
AI

人工智能无法让你成为更好的作家

2024年11月17日
Ming-UniVision模型案例
AI 前沿技术

蚂蚁金服Ming-UniVision模型:告别繁琐,一体化实现图像理解、生成与编辑

2025年10月4日
AI

IBM发布开源Granite 3.0大型语言模型,助力企业AI

2024年11月14日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up