前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
Agent生态

FastGPT 现已接入 minerU2,文档解析能力再上新台阶!

NEXTECH
Last updated: 2025年11月1日 上午7:50
By NEXTECH
Share
18 Min Read
SHARE

FastGPT 知识库高质量数据输入的重要性

Contents
效果展示本地化部署与接入 minerU2 详细指南

如何充分发挥 FastGPT 知识库的强大功能?关键在于高质量的数据输入!

PDF 作为相对复杂的文件格式,需转换为文本作为知识库素材。FastGPT 内置的 PDF 解析器依赖 pdfjs 库,该库基于逻辑解析,遇到图片、表格、公式等非简单文本内容时,可能出现解析效果不佳的情况。

为了解决这一痛点,用户可以在 FastGPT 社区版或商业版中,通过接入 minerU2 或 Marker 等专业的文档解析工具,实现增强解析!

minerU2 是一款强大的视觉解析引擎,它能将 PDF、JPG 和 PNG 文件,精准地转换为保留了图片、表格和公式的 Markdown 文本。这不仅极大地提升了文档解析的精度和质量,更显著优化了处理速度。现在,用户可以将内容最丰富的文档无损导入知识库,释放 FastGPT 的全部潜力!

minerU2 文档解析引擎效果展示

You Might Also Like

AI智能体编程:编码-部署-自测-改Bug闭环工作流,实现高效自我迭代
AI一体化智能体:从“问知识”到“问数据”的进化方向与实践
Dify Plugin Daemon高可用部署实践:解决插件不加载与稳定性挑战
AI浏览器深度解析:澄清与操作系统的混淆,引入“代理操作层”概念

效果展示

接入 minerU2 后,用户将看到对复杂文档内容的解析能力得到质的飞跃。

图片识别效果:

minerU2 处理前后的图片识别效果对比minerU2 原始图片识别效果

公式识别效果:

minerU2 处理前后的公式识别效果对比minerU2 原始公式识别效果

表格识别效果:

minerU2 处理前后的表格识别效果对比minerU2 原始表格识别效果

手写体识别效果:

minerU2 处理前后的手写体识别效果对比minerU2 原始手写体识别效果

在 FastGPT v4.9.0 以上版本中,社区版用户可以在 config.json 文件中添加 systemEnv.customPdfParse 配置,来接入 minerU2。商业版用户则可以直接在 Admin 管理后台根据表单指引轻松完成填写。此方法同样支持接入 Marker 解析服务。

本地化部署与接入 minerU2 详细指南

在本地环境中接入 minerU2 的过程非常简单:只需拉取官方镜像,启动容器(在 GPU 环境下),然后将 URL 地址填入 FastGPT 的配置文件或管理后台。

硬件需求:

为了确保 minerU2 稳定运行,请参考以下硬件配置建议:

  • GPU:16GB+ 显存推理卡。
  • 内存:至少 16GB+,推荐使用 32GB+ 以获得更佳性能。
  • 其他详细信息可参考官方 GitHub 项目: https://github.com/opendatalab/MinerU

拉取镜像,启动容器:

提供的 Docker 镜像已内置所有 pipeline 模型和对接 FastGPT 的 API 服务,有效避免了因网络问题导致模型拉取失败的风险。

  • 拉取 Docker 镜像:
docker pull crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/fastgpt_ck/mineru:v1
  • 启动 Docker 容器 (GPU 环境):
docker run --gpus all -itd -p 7231:8001 --name mode_pdf_minerU crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/fastgpt_ck/mineru:v1

注意:该服务会自动检测并利用所有可用的 GPU 资源。例如,若服务器有 3 个 GPU,服务将自动创建 3 个并行处理进程,可同时处理 3 个文件,大幅提升效率。

配置 URL 至 FastGPT 平台

用户可以通过以下两种方式之一,将 minerU2 服务地址配置到 FastGPT 中。

通过 Docker 部署的 Mineru 的 PDF 服务地址格式为:http://<您的IP>:7231/v2/parse/file。用户需要将其中的 <您的IP> 替换成服务器的实际 IP 地址,然后将这个完整的 URL 填入到 FastGPT 的配置中。

方式一:商业版 Admin 后台配置

登录 FastGPT 管理后台(默认为 http://localhost:3002/),在相应配置项中填入 minerU2 的 URL 地址即可。

FastGPT 商业版 Admin 后台配置 minerU2 截图

方式二:社区版 config.json 文件配置

打开 FastGPT 的 config.json 文件(可以在官方文档《Docker Compose 快速部署》中找到),找到 systemEnv.customPdfParse 部分,并将 URL 填入其中。

// 已使用 json5 进行解析,会自动去掉注释,无需手动去除
{
  "feConfigs": {
    // ... 其他配置
  },
  "systemEnv": {
    // ... 其他配置
    "customPdfParse": {
      "url": "http://127.0.0.1:7231", // <--- 在这里填入您的自定义 PDF 解析服务地址
      "key": "", // 自定义 PDF 解析服务密钥
      "doc2xKey": "", // doc2x 服务密钥
      "price": 0 // PDF 解析服务价格
    }
  }
}

保存配置(若修改 config.json,则需重启 FastGPT 服务)后,一切准备就绪。然后用户就可以在 FastGPT 的知识库中,对导入的 PDF 格式文件进行增强解析。

minerU2 和 FastGPT 的结合,意味着:

  • 更精准的文档解析:告别错乱的排版和丢失的表格,minerU2 助用户完美还原文档结构。
  • 更强大的问答体验:高质量的知识库源文件意味着 FastGPT 能提供更准确、更可靠的回答。

快来试试吧,让 FastGPT 知识库如虎添翼!

FastGPT 商业版升级提示

TAGGED:Agent生态AI知识库FastGPTminerU2文档解析
Share This Article
Email Copy Link Print
Previous Article 20251101074806305.jpg 宾夕法尼亚大学遭遇“觉醒”学生数据泄露威胁:政治动机浮出水面?
Next Article 20251101075635387.jpg 宾大邮件系统遭攻击:拒特朗普协议引政治动机猜想
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
20251202135921634.jpg
英伟达20亿美元投资新思科技,AI芯片设计革命加速
科技
20251202130505639.jpg
乌克兰国家AI模型选定谷歌Gemma,打造主权人工智能
科技
20251202121525971.jpg
中国开源AI新突破:DeepSeek V3.2模型性能比肩GPT-5
科技
20251202112744609.jpg
马斯克预言:AI三年内解决美国债务危机,可信吗?
科技

相关内容

LangChain和LangGraph构建多阶段AI流程图
Agent生态

LangChain与LangGraph:AI不再“乱跑”,打造可控多阶段智能LLM流程的实践指南

2025年10月20日
ACP 作为面向 Agent 的开放商业标准
Agent生态

Stripe 联手 OpenAI 发布 ACP:深入探讨 Agent 支付战略与 AI 经济影响

2025年11月7日
OpenAI Agent Builder 界面预览图
Agent生态

OpenAI DevDay重磅发布:Agent Builder登场,拖拽构建AI应用,连接万物

2025年10月7日
Agent生态

最接地气的AI科普:从家政阿姨看懂AI Agent与MCP智能体概念

2025年11月17日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up