前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI

Diffbot AI 模型:万亿事实知识图谱赋能精准认知

NEXTECH
Last updated: 2025年3月6日 上午6:54
By NEXTECH
Share
14 Min Read
SHARE

订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多

Diffbot,一家以维护全球最大网页知识索引而闻名的硅谷小公司,今天宣布发布一款新的 AI 模型,旨在解决该领域最棘手的问题之一:事实准确性。

这款新模型是 Meta 的 LLama 3.3 的微调版本,是首个开源实现的 Graph Retrieval-Augmented Generation(GraphRAG)系统。

与仅依赖大量预加载训练数据的传统 AI 模型不同,Diffbot 的 LLM 利用来自该公司知识图谱的实时信息,知识图谱是一个不断更新的数据库,包含超过万亿个相互关联的事实。

“我们认为,最终通用推理将被提炼成大约 10 亿个参数,”Diffbot 创始人兼首席执行官迈克·唐在接受 VentureBeat 采访时表示。“你并不需要模型本身包含知识,你只需要模型擅长使用工具,以便它可以从外部查询知识。”

Diffbot 的知识图谱是一个庞大且自动化的数据库,自 2016 年以来一直在抓取公共网络。它将网页分类为实体,例如人物、公司、产品和文章,并使用计算机视觉和自然语言处理的结合来提取结构化信息。

每四到五天,知识图谱都会更新数百万个新事实,确保其保持最新。Diffbot 的 AI 模型利用此资源,通过实时查询图谱来检索信息,而不是依赖其训练数据中编码的静态知识。

例如,当被问及最近的新闻事件时,该模型可以搜索网络以获取最新更新,提取相关事实并引用原始来源。此过程旨在使系统比传统 LLM 更准确、更透明。

“想象一下,你问 AI 天气,”唐说。“我们的模型不会根据过时的训练数据生成答案,而是查询实时天气服务并提供基于实时信息的响应。”

在基准测试中,Diffbot 的方法似乎正在奏效。该公司报告称,其模型在 FreshQA 上的准确率达到 81%,FreshQA 是谷歌创建的用于测试实时事实知识的基准,超过了 ChatGPT 和 Gemini。它还在 MMLU-Pro 上获得了 70.36% 的得分,MMLU-Pro 是标准学术知识测试的更难版本。

也许最重要的是,Diffbot 将其模型完全开源,允许公司在自己的硬件上运行它并根据自己的需求进行定制。这解决了人们对大型 AI 提供商的数据隐私和供应商锁定日益增长的担忧。

“你可以在本地机器上运行它,”唐指出。“你无法在不将数据发送到谷歌并将其发送到你的场所之外的情况下运行谷歌 Gemini。”

此次发布正值 AI 发展的一个关键时刻。近几个月来,大型语言模型倾向于“幻觉”或生成虚假信息,引发了越来越多的批评,尽管公司仍在不断扩大模型规模。Diffbot 的方法表明了一条前进的替代道路——一条专注于将 AI 系统建立在可验证的事实基础上,而不是试图将所有人类知识编码到神经网络中。

“并非所有人都只是追求更大规模的模型,”唐说。“你可以拥有一个比大型模型更强大的模型,它采用了一种非直观的做法,就像我们这样。”

行业专家指出,Diffbot 基于知识图谱的方法对于需要准确性和可审计性的企业应用尤其有价值。该公司已经为思科、DuckDuckGo 和 Snapchat 等主要公司提供数据服务。

该模型现已通过 GitHub 上的开源发布提供,可以通过 diffy.chat 上的公开演示进行测试。对于希望在内部部署该模型的组织,Diffbot 表示,较小的 80 亿参数版本可以在单个 Nvidia A100 GPU 上运行,而完整的 700 亿参数版本则需要两个 H100 GPU。

展望未来,唐认为 AI 的未来不在于越来越大的模型,而在于组织和访问人类知识的更好方法:“事实会过时。许多事实将被转移到明确的地方,在那里你可以修改知识,并且可以拥有数据来源。”

随着 AI 行业努力应对事实准确性和透明度方面的挑战,Diffbot 的发布为占主导地位的“更大更好”范式提供了一种引人注目的替代方案。它是否能成功改变该领域的走向还有待观察,但它无疑证明了在 AI 领域,规模并非一切。

Share This Article
Email Copy Link Print
Previous Article Narvar如何用AI和数据提升售后体验
Next Article illustrated-silhouette-of-a-stressed-rob AI模型也容易过度思考
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20250610054810485.png
抖音:2025非遗数据报告
报告
人脸识别支付公司PopID完成融资 PayPal、Visa参投
未分类
20250610054408449.png
IDC:2024年中国SASE产品服务市场规模约为11.4亿元 同比增长37.8%
报告
中汽协会:2025年4月我国汽车整车出口情况简析
报告

相关内容

AI

Patronus AI模型Glider超越GPT-4

2025年1月18日
AI

微软携手行业巨头,将人工智能带入农场和工厂

2024年11月16日
AI

ChatGPT 视频直播分析功能升级,挑战Gemini 2

2025年1月1日
AI

GitHub 推出全新 AI 功能,Copilot 登陆 Xcode 等平台

2024年11月14日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?