前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

开源AI:选择性透明的风险

NEXTECH
Last updated: 2025年7月24日 上午6:52
By NEXTECH
Share
17 Min Read
SHARE

“`html

开源AI:通往信任与创新的坦途

科技巨头纷纷宣称其AI成果“开放”,甚至将“开放”二字写入产品名称。然而,“开源”这一曾经的专业术语,如今已成为大众热议的焦点。在这个关键时刻,一家公司的失误都可能将公众对AI的信任倒退十年甚至更久。因此,“开放”和“透明”的概念被随意使用,甚至被滥用以博取信任。

与此同时,面对新政府对科技监管采取更为谨慎的态度,创新与监管之间的博弈日益激烈,双方都预言如果“错误”的一方胜出将会带来灾难性后果。

然而,存在着第三种途径,它已在历次技术变革浪潮中经受了考验并证明了其有效性。真正的开源协作,立足于开放和透明的原则,不仅能加速创新速度,还能促进行业开发出公正、合乎伦理且有益于社会的技术。

简而言之,开源软件的源代码可供自由查看、修改、分析、采用和共享,无论用于商业或非商业目的。历史上,它在推动创新方面发挥了巨大作用。例如,开源产品Linux、Apache、MySQL和PHP,共同构建了我们今天所熟知的互联网。

如今,通过使AI模型、数据、参数和开源AI工具民主化,社区能够再次释放更快的创新速度,避免重复造轮子。IBM最近对2400名IT决策者进行的一项研究显示,人们对使用开源AI工具来提高投资回报率的兴趣日益增长。在决定AI投资回报率时,更快的开发和创新位居榜首,研究还证实,采用开放式解决方案可能与更高的财务可行性相关。

开源AI并非只为少数公司带来短期利益,它还能促进在各个行业和领域开发更多样化、更定制化的应用,而这些领域原本可能缺乏开发专有模型的资源。

同样重要的是,开源的透明性允许对AI系统的行为和伦理进行独立审查和审计。当我们利用大众的兴趣和动力时,他们就能像发现LAION 5B数据集丑闻那样发现问题和错误。

在那次事件中,大众揪出了隐藏在数据中的1000多个包含已验证儿童性虐待材料的网址,这些数据为Stable Diffusion和Midjourney等生成式AI模型提供燃料,这些模型根据文本和图像提示生成图像,并且是许多在线视频生成工具和应用程序的基础。

这一发现引发了轩然大波,但如果该数据集像OpenAI的Sora或谷歌的Gemini那样是封闭的,后果将不堪设想。很难想象,如果AI最令人兴奋的视频创作工具开始生成令人不安的内容,将会引发怎样的强烈反弹。

幸运的是,LAION 5B数据集的开放性使社区能够促使创建者与行业监管机构合作,找到解决方案并发布RE-LAION 5B,这正是真正的开源AI的透明性不仅有益于用户,也有益于行业和努力与消费者和公众建立信任的创建者的一个典范。

虽然仅仅共享源代码相对容易,但AI系统远比软件复杂。它们依赖于系统源代码、模型参数、数据集、超参数、训练源代码、随机数生成和软件框架,所有这些组件必须协同工作才能使AI系统正常运行。

在对AI安全性的担忧日益加剧的背景下,“开放”或“开源”已成为常见的宣传用语。然而,要使这一说法准确无误,创新者必须共享拼图的所有碎片,以便其他参与者能够充分理解、分析和评估AI系统的特性,最终复制、修改和扩展其功能。

例如,Meta将Llama 3.1 405B吹捧为“第一个前沿级别的开源AI模型”,但只公开共享了系统的预训练参数或权重以及少量软件。虽然这允许用户随意下载和使用该模型,但源代码和数据集等关键组件仍然是封闭的——在Meta宣布将向网络注入AI机器人资料,同时停止审核内容准确性的消息发布后,这一点变得更加令人担忧。

公平地说,共享的内容确实对社区做出了贡献。开放权重模型提供了灵活性和可访问性,并促进了创新和一定程度的透明度。例如,DeepSeek决定开源其权重,发布其R1的技术报告,并使其免费使用,这使得AI社区能够研究和验证其方法,并将其融入到他们的工作中。

然而,当没有人能够真正查看、试验和理解创建AI系统的每一个环节时,称其为开源AI是具有误导性的。

这种误导不仅仅会威胁公众的信任。它不仅未能赋能社区中的每个人进行协作、构建和改进Llama X等模型,反而迫使使用此类AI系统的创新者盲目信任未共享的组件。

随着自动驾驶汽车驶入主要城市的街道,以及AI系统协助外科医生进行手术,我们才刚刚开始让这项技术掌控方向盘。其前景无限,但潜在的错误也同样巨大——这就是为什么我们需要重新衡量AI领域中“值得信赖”的含义。

例如,斯坦福大学的Anka Reuel及其同事最近试图为用于评估模型性能的AI基准建立一个新的框架,但行业和公众所依赖的审查实践还不足够完善。基准测试未能考虑到学习系统核心数据集不断变化的事实,以及适当的指标因用例而异。该领域仍然缺乏丰富的数学语言来描述当代AI的能力和局限性。

通过共享完整的AI系统以实现开放和透明,而不是依赖于不足的审查和对流行语的敷衍,我们可以促进更大的协作,并利用安全且合乎伦理地开发的AI来培育创新。

虽然真正的开源AI提供了一个实现这些目标的成熟框架,但行业中令人担忧的是缺乏透明度。如果没有科技公司的果断领导和合作来进行自我监管,这种信息差距可能会损害公众的信任和接受度。拥抱开放、透明和开源不仅仅是一个强大的商业模式——它也是在选择一个造福所有人的AI未来,而不是仅仅造福少数人的未来。

Jason Corso,密歇根大学教授,Voxel51联合创始人。

“`

Share This Article
Email Copy Link Print
Previous Article 20250723174428826.png Omdia:2024 年第四季度网络安全市场同比增长 5.1%
Next Article 乘联会:2025年7月1日到13日全国乘用车总共卖了57.1万辆 同比增长7%
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

AI 前沿技术

Agent、信息召回与语义索引:LLM时代的深度解析

2025年10月26日
AI

无人可知的人工智能代理难题

2025年5月31日
RAG双阶段处理流程图
AI 前沿技术

Dify知识库从Demo到生产:RAG构建企业级私有知识库的7个关键步骤

2025年11月1日
20250503225244900.png
AI

谷歌放弃 AI 武器禁令,未来人工智能走向何方?

2025年5月4日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up