订阅我们的每日和每周新闻通讯,获取有关行业领先人工智能报道的最新更新和独家内容。了解更多
Diffbot,一家以维护全球最大网页知识索引而闻名的硅谷小公司,今天宣布发布一款新的 AI 模型,旨在解决该领域最棘手的问题之一:事实准确性。
这款新模型是 Meta 的 LLama 3.3 的微调版本,是首个开源实现的 Graph Retrieval-Augmented Generation(GraphRAG)系统。
与仅依赖大量预加载训练数据的传统 AI 模型不同,Diffbot 的 LLM 利用来自该公司知识图谱的实时信息,知识图谱是一个不断更新的数据库,包含超过万亿个相互关联的事实。
“我们认为,最终通用推理将被提炼成大约 10 亿个参数,”Diffbot 创始人兼首席执行官迈克·唐在接受 VentureBeat 采访时表示。“你并不需要模型本身包含知识,你只需要模型擅长使用工具,以便它可以从外部查询知识。”
Diffbot 的知识图谱是一个庞大且自动化的数据库,自 2016 年以来一直在抓取公共网络。它将网页分类为实体,例如人物、公司、产品和文章,并使用计算机视觉和自然语言处理的结合来提取结构化信息。
每四到五天,知识图谱都会更新数百万个新事实,确保其保持最新。Diffbot 的 AI 模型利用此资源,通过实时查询图谱来检索信息,而不是依赖其训练数据中编码的静态知识。
例如,当被问及最近的新闻事件时,该模型可以搜索网络以获取最新更新,提取相关事实并引用原始来源。此过程旨在使系统比传统 LLM 更准确、更透明。
“想象一下,你问 AI 天气,”唐说。“我们的模型不会根据过时的训练数据生成答案,而是查询实时天气服务并提供基于实时信息的响应。”
在基准测试中,Diffbot 的方法似乎正在奏效。该公司报告称,其模型在 FreshQA 上的准确率达到 81%,FreshQA 是谷歌创建的用于测试实时事实知识的基准,超过了 ChatGPT 和 Gemini。它还在 MMLU-Pro 上获得了 70.36% 的得分,MMLU-Pro 是标准学术知识测试的更难版本。
也许最重要的是,Diffbot 将其模型完全开源,允许公司在自己的硬件上运行它并根据自己的需求进行定制。这解决了人们对大型 AI 提供商的数据隐私和供应商锁定日益增长的担忧。
“你可以在本地机器上运行它,”唐指出。“你无法在不将数据发送到谷歌并将其发送到你的场所之外的情况下运行谷歌 Gemini。”
此次发布正值 AI 发展的一个关键时刻。近几个月来,大型语言模型倾向于“幻觉”或生成虚假信息,引发了越来越多的批评,尽管公司仍在不断扩大模型规模。Diffbot 的方法表明了一条前进的替代道路——一条专注于将 AI 系统建立在可验证的事实基础上,而不是试图将所有人类知识编码到神经网络中。
“并非所有人都只是追求更大规模的模型,”唐说。“你可以拥有一个比大型模型更强大的模型,它采用了一种非直观的做法,就像我们这样。”
行业专家指出,Diffbot 基于知识图谱的方法对于需要准确性和可审计性的企业应用尤其有价值。该公司已经为思科、DuckDuckGo 和 Snapchat 等主要公司提供数据服务。
该模型现已通过 GitHub 上的开源发布提供,可以通过 diffy.chat 上的公开演示进行测试。对于希望在内部部署该模型的组织,Diffbot 表示,较小的 80 亿参数版本可以在单个 Nvidia A100 GPU 上运行,而完整的 700 亿参数版本则需要两个 H100 GPU。
展望未来,唐认为 AI 的未来不在于越来越大的模型,而在于组织和访问人类知识的更好方法:“事实会过时。许多事实将被转移到明确的地方,在那里你可以修改知识,并且可以拥有数据来源。”
随着 AI 行业努力应对事实准确性和透明度方面的挑战,Diffbot 的发布为占主导地位的“更大更好”范式提供了一种引人注目的替代方案。它是否能成功改变该领域的走向还有待观察,但它无疑证明了在 AI 领域,规模并非一切。