如果曾尝试自行搭建一套RAG(Retrieval-Augmented Generation,检索增强生成)系统,便会深知其中的复杂:需要管理向量嵌入(embeddings)、向量数据库(vector databases),精确进行文本切分(chunking),并确保所有组件能与模型顺畅协作,同时控制成本。现在,Google 已经彻底解决了这些问题。
Google 在 Gemini API 中推出了全新的 File Search 工具,旨在自动化RAG的所有复杂流程。用户只需上传文件并提出问题,该工具即可自动完成后续处理。

图片来源 – Google
什么是 File Search 工具?
本质上,File Search 工具使 Gemini 能够“理解”用户自有数据。用户可以上传PDF、DOCX、纯文本、JSON,甚至代码文件。当用户向 Gemini 提问时,它会精确检索上传文件中的相关部分,并基于这些信息进行回答。
这如同将用户的专属知识库直接连接到 Gemini,无需独立的向量数据库、检索管线,也无需进行复杂的运维。实现了文件输入,智能输出答案的简易流程。
成本效益显著
该工具的成本效益令人瞩目。用户无需为查询或存储付费,仅在文件索引时产生费用。
使用gemini-embedding-001模型创建向量嵌入的费用为每100万tokens收费0.15美元。与自行搭建完整的 Pinecone 或 Weaviate 管线相比,其成本微乎其微。
此后,用户可以随意、无限次地查询这些文件。
File Search 的工作原理
File Search 工具能够自动完成文件的切分(chunking)、生成向量嵌入(embeddings)、存储与检索,并将相关上下文注入到 Gemini 的提示词中,从而将RAG流程极致简化。
所有这些操作都在现有的generateContentAPI 调用中自动完成。
当用户发起查询时,File Search 会在后台利用最新的 Gemini Embedding 模型执行一次向量搜索(vector search),确保模型能够理解语义而非仅仅是关键词匹配。
更令人惊喜的是,Gemini 的回答会附带引用(citations),明确标注来源文件及具体位置。用户可以点击核实,有效避免了模型产生幻觉的风险。
应用案例:Beam 的极速游戏生成
Phaser Studio 作为早期测试方之一,已将 File Search 工具应用于其AI驱动的游戏平台 Beam 上。
他们拥有一份包含3000多个文件(包括模板、代码片段、设计文档及其他内部数据)的资料库。File Search 工具使他们能够在不到2秒内完成整个资料库的查询,而过去手动查找相同信息则需耗费数小时。
其 CTO Richard Davey 对此总结道:
“过去要用几天才能打样的点子,如今几分钟就能玩上手。”
这极大地提升了效率。
Python 示例代码
使用该工具无需编写大量代码。以下是一个简短示例:
from google import genaifrom google.genai import typesimport timeclient = genai.Client()store = client.file_search_stores.create()upload_op = client.file_search_stores.upload_to_file_search_store( file_search_store_name=store.name, file='path/to/your/document.pdf')while not upload_op.done: time.sleep(5) upload_op = client.operations.get(upload_op)response = client.models.generate_content( model='gemini-2.5-flash', contents='Summarize the research on sustainable AI.', config=types.GenerateContentConfig( tools=[types.Tool( file_search=types.FileSearch( file_search_store_names=[store.name] ) )] ))print(response.text)grounding = response.candidates[0].grounding_metadatasources = {c.retrieved_context.title for c in grounding.grounding_chunks}print('Sources:', *sources)
通过上述代码,用户即可实现文件上传、提出问题并获取带有来源的答案,整个过程简单高效。
重要意义
许多AI开发者面临共同挑战:大模型虽强大,却难以直接访问企业内部的私有数据。
File Search 工具改变了这一现状,使 Gemini 能够在无需复杂检索设置的情况下,直接分析用户自有内容。
对于需要处理时效性强或垂直领域知识的应用,例如客服机器人、内部工具或文档问答系统,File Search 工具无疑是一项颠覆性的创新。
立即体验
用户现在即可在 Google AI Studio 中体验 File Search 工具。其中提供了一个名为 “Ask the Manual” 的演示:上传数份文件,提出问题,即可观察其卓越的答案溯源效果。
熟悉操作后,用户可以对该演示进行改造,或将其直接集成到自己的应用程序中。
