前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

Google全新File Search工具:RAG技术部署从未如此简单

NEXTECH
Last updated: 2025年11月17日 上午10:10
By NEXTECH
Share
23 Min Read
SHARE

如果曾尝试自行搭建一套RAG(Retrieval-Augmented Generation,检索增强生成)系统,便会深知其中的复杂:需要管理向量嵌入(embeddings)、向量数据库(vector databases),精确进行文本切分(chunking),并确保所有组件能与模型顺畅协作,同时控制成本。现在,Google 已经彻底解决了这些问题。

Contents
什么是 File Search 工具?成本效益显著File Search 的工作原理应用案例:Beam 的极速游戏生成Python 示例代码重要意义立即体验

Google 在 Gemini API 中推出了全新的 File Search 工具,旨在自动化RAG的所有复杂流程。用户只需上传文件并提出问题,该工具即可自动完成后续处理。

Google File Search 工具示意图

图片来源 – Google


什么是 File Search 工具?

本质上,File Search 工具使 Gemini 能够“理解”用户自有数据。用户可以上传PDF、DOCX、纯文本、JSON,甚至代码文件。当用户向 Gemini 提问时,它会精确检索上传文件中的相关部分,并基于这些信息进行回答。

这如同将用户的专属知识库直接连接到 Gemini,无需独立的向量数据库、检索管线,也无需进行复杂的运维。实现了文件输入,智能输出答案的简易流程。

You Might Also Like

Structured RAG重塑企业知识库:从模糊答案到精准洞察,解决RAG聚合与完整性挑战
OpenAI Atlas深度体验:AI浏览器革新之路才刚开始
Sealos + Claude Code + K2-thinking:快速搭建AI开发环境,高效利用Kimi K2-thinking模型
ChatPPT与魔搭社区合作,MCP 2.0重磅升级:全链路智能体服务及多模式开源

成本效益显著

该工具的成本效益令人瞩目。用户无需为查询或存储付费,仅在文件索引时产生费用。

使用gemini-embedding-001模型创建向量嵌入的费用为每100万tokens收费0.15美元。与自行搭建完整的 Pinecone 或 Weaviate 管线相比,其成本微乎其微。

此后,用户可以随意、无限次地查询这些文件。


File Search 的工作原理

File Search 工具能够自动完成文件的切分(chunking)、生成向量嵌入(embeddings)、存储与检索,并将相关上下文注入到 Gemini 的提示词中,从而将RAG流程极致简化。

所有这些操作都在现有的generateContentAPI 调用中自动完成。

当用户发起查询时,File Search 会在后台利用最新的 Gemini Embedding 模型执行一次向量搜索(vector search),确保模型能够理解语义而非仅仅是关键词匹配。

更令人惊喜的是,Gemini 的回答会附带引用(citations),明确标注来源文件及具体位置。用户可以点击核实,有效避免了模型产生幻觉的风险。


应用案例:Beam 的极速游戏生成

Phaser Studio 作为早期测试方之一,已将 File Search 工具应用于其AI驱动的游戏平台 Beam 上。

他们拥有一份包含3000多个文件(包括模板、代码片段、设计文档及其他内部数据)的资料库。File Search 工具使他们能够在不到2秒内完成整个资料库的查询,而过去手动查找相同信息则需耗费数小时。

其 CTO Richard Davey 对此总结道:

“过去要用几天才能打样的点子,如今几分钟就能玩上手。”

这极大地提升了效率。


Python 示例代码

使用该工具无需编写大量代码。以下是一个简短示例:

from google import genaifrom google.genai import typesimport timeclient = genai.Client()store = client.file_search_stores.create()upload_op = client.file_search_stores.upload_to_file_search_store(    file_search_store_name=store.name,    file='path/to/your/document.pdf')while not upload_op.done:    time.sleep(5)    upload_op = client.operations.get(upload_op)response = client.models.generate_content(    model='gemini-2.5-flash',    contents='Summarize the research on sustainable AI.',    config=types.GenerateContentConfig(        tools=[types.Tool(            file_search=types.FileSearch(                file_search_store_names=[store.name]            )        )]    ))print(response.text)grounding = response.candidates[0].grounding_metadatasources = {c.retrieved_context.title for c in grounding.grounding_chunks}print('Sources:', *sources)

通过上述代码,用户即可实现文件上传、提出问题并获取带有来源的答案,整个过程简单高效。


重要意义

许多AI开发者面临共同挑战:大模型虽强大,却难以直接访问企业内部的私有数据。

File Search 工具改变了这一现状,使 Gemini 能够在无需复杂检索设置的情况下,直接分析用户自有内容。

对于需要处理时效性强或垂直领域知识的应用,例如客服机器人、内部工具或文档问答系统,File Search 工具无疑是一项颠覆性的创新。


立即体验

用户现在即可在 Google AI Studio 中体验 File Search 工具。其中提供了一个名为 “Ask the Manual” 的演示:上传数份文件,提出问题,即可观察其卓越的答案溯源效果。

熟悉操作后,用户可以对该演示进行改造,或将其直接集成到自己的应用程序中。

TAGGED:Gemini APIGoogle File SearchRAG技术大模型应用
Share This Article
Email Copy Link Print
Previous Article 20251117100226631.jpg AI+超算:革新银河系模拟,揭示生命元素起源
Next Article 20251117104618869.jpg 高血压:在血压升高前已损伤大脑!早期预警与治疗新希望
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

AI Agent报告内容示例图三
AI 前沿技术

69页AI Agent圣经报告:智能体发展前景、未来趋势与生态全解析

2025年10月7日
AI涨乐应用界面示意图
AI 行业应用

AI重塑金融交易:华泰‘AI涨乐’开启智能交易新纪元

2025年10月16日
RAG双阶段处理流程图
AI 前沿技术

Dify知识库从Demo到生产:RAG构建企业级私有知识库的7个关键步骤

2025年11月1日
通义DeepResearch Agent在HLE、BrowseComp和xbench-DeepSearch上的SOTA性能得分
AI 前沿技术

通义DeepResearch深度解析:核心功能、模型训练与Agent前沿探讨

2025年10月16日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up