Constellation Network 与 Common Crawl 携手打造首个加密安全互联网数据档案库
2024 年 12 月 19 日,旧金山——Constellation Network,一个获得美国国防部认可的 Web3 生态系统,今日宣布与 Common Crawl 基金会合作推出定制区块链,旨在创建业界首个加密安全、不可篡改的互联网数据档案库,用于 AI 训练和开发。
此次合作开创了一种全新的方法,通过基于 Constellation 的不可篡改、加密安全的区块链网络,对 17 年的互联网爬取数据进行验证和安全访问。这些数据总计近 9 PB,其中 80% 被用于训练大型语言模型 (LLM)。这种创新的特定应用网络,即 Metagraph,解决了 AI 开发中迫切需要解决的问题,同时探索了区块链技术在新兴行业中的广泛应用,例如数据溯源、隐私和道德来源。此外,该网络将利用 Constellation 的 DAG 实用资产来保护存档的互联网爬取数据。这标志着利用加密货币作为企业对数据进行公证机制的重大进步,将重点从许多其他一级网络中常见的消费者成本或 Gas 费转移到运营成本上。
关键技术创新
- 全面数据归档:互联网历史的完全不可篡改副本,为 AI 训练数据集提供前所未有的透明度和可追溯性。
- 端到端加密:确保整个 AI 开发生命周期中数据完整性的加密安全。
- 道德 AI 框架:为解决大型语言模型中围绕数据收集、存储和使用的问题提供可靠的解决方案。
Constellation Network 首席技术官 Alex Brandes 表示:“这种整合是确保 AI 开发未来的关键一步。通过确保训练数据的加密完整性和不可篡改性,我们正在解决当今该领域最紧迫的挑战之一:数据集的可信度和溯源。我们相信我们的平台将成为负责任的 AI 开发领域的基石,为数据完整性和信任树立新的标准。”
行业应用
这个基于区块链的数据档案库已经吸引了先进的 AI 研究项目的关注。TraceAI 是一个通过美国国家科学基金会 (NSF) 和 SBIR 计划开发的项目,目前正在测试阶段,开发他们自己的基于 Constellation 的特定应用网络,为其训练模型添加不可篡改性、可审计性和作者证明,并开发先进的水印技术。TraceAI 还将利用 Common Crawl 基于 Constellation 的解决方案,进一步扩展其在区块链加密 AI 方面的研究,包括跟踪数据的源头。
Forward EdgeAI 空间领域通信与商业化副总裁 Kevin Jackson 强调了这一突破的重要性:“这代表着 AI 和机器学习模型开发的自然演进,将数据管理从技术挑战转变为可信赖的商业工具,推动全球标准化和验证。”
展望未来
在接下来的几个月里,Constellation Network 和 Common Crawl 基金会将共同努力,为 AI 开发人员扩展解决方案集,并将加密验证的爬取数据访问权限的分配作为标准发布流程的一部分进行进一步整合。
Common Crawl 执行董事 Rich Skrenta 表示:“对于那些担心数据来源的用户,尤其是那些将数据用于 AI 模型的用户,Constellation 及其超图区块链提供了一个优雅的解决方案。我们期待通过与 Constellation 的合作,将能够安全地验证爬取数据作为我们标准发布流程的一部分。”
您可以在 Constellation 的交易查看器(称为“DAG 资源管理器”)中找到这种整合的证据,开发人员可以开始使用经过验证的历史爬取数据进行 AI 应用。请继续关注 Constellation、Forward Edge-AI 和 Common Crawl 开发的更多解决方案。