KnowFlow v2.1.7重磅更新:无缝衔接Dify,分块优化与图片理解增强
KnowFlow v2.1.7 版本正式发布,此次更新带来了多项功能优化,旨在提升文档处理的智能性和效率。主要更新包括Dify平台的无缝集成、分块功能的全面升级以及图片理解能力的显著增强。
新功能亮点
1. Dify 接入与集成
为了更便捷地与 Dify 平台对接,KnowFlow 提供了专用的 Dify 插件及 DSL 模板。开发者通过简单的配置即可实现 KnowFlow 与 Dify 的无缝对接,省去了复杂的接口调试过程。

2. 分块功能全面优化
KnowFlow 针对 MinerU/Dots 文档引擎的 smart/title/parent_child 切块方法进行了统一优化,新增支持为分块内容添加父标题,有效改善了上下文理解问题。
此外,Title 切块方法现在支持自定义标题层级切割,用户可根据 H1~H6 标题层级,实现更精确的文档内容切分,特别适用于论文和规章制度等结构化文档。

3. 图片理解能力增强
在 v2.1.6 版本推出以文搜图功能的基础上,本次更新显著增强了图片理解能力。KnowFlow 现在会将图片关联的段落信息送入视觉模型,解决了图片识别脱离原文上下文的问题,从而大大提升了识别的准确率。图片附近的段落提取规则如下:
- 将图片所在标题范围内,与图片距离最近的 2 个段落作为备选。
- 在上述段落中,通过正则匹配常见关键字(如“图几”),如找到则优先返回该段落;如找不到,则返回全部备选段落。
缺陷修复与性能优化
缺陷修复
- 解决了 PPT 解析时出现的
re报错问题。 - 修复了在极端情况下,
id:x未显示引用的问题。 - 修复了 datasets API 无法直接传入 smart/regex/title/parent_child 分块方法的问题。
性能优化
- 优化了 MinerU/Dots 引擎中图片和表格的 caption 与图片/标题内容的关联,避免被分割到不同块。
- 将 chunk 的分块顺序由 top 更改为 MinerU 解析的 block 顺序,以更好地适配论文等双栏布局场景。
KnowFlow 官网文档也已同步更新,提供了分块方法的使用案例及 Dify 对接相关说明。
产品细节深入解析
Dify 接入机制
为确保 Dify 对接 KnowFlow 的灵活性和扩展性,KnowFlow 推荐直接调用其 API,而非Dify外接知识库方案,后者存在一定的局限性。
1. 插件安装:KnowFlow 提供了 Dify API 插件,预封装了 API 调用逻辑,大幅降低了 API 调试成本。

2. 插件配置:用户仅需通过简单的插件界面,输入 API_KEY、URL、知识库 ID 等必要信息,即可实现与 KnowFlow API 的无缝通信。

3. DSL 导入:为进一步简化 Dify 平台解析 API 返回结果并透传给大模型的流程,KnowFlow 提供了可一键导入的 DSL 模板,省去了手动配置的繁琐。

此插件和 DSL 模板同样适用于 RAGFlow,大大简化了 Dify 的接入过程,实现了无需代码调试、仅通过界面配置即可完成集成。
未来展望:构建AI时代数据根基
KnowFlow 本次版本更新着重提升了用户体验。KnowFlow 明确其产品定位:将结构化与非结构化数据治理成对大模型更可信的输入,构建面向未来的数据治理平台,重塑 AI 时代的数据根基。
基于此定位,KnowFlow 后续将围绕以下产品方向进行迭代:
- 智能问数(支持 Excel 及各类数据库)
- 集成 RAG 评估框架,对问答效果进行定量分析
KnowFlow 开源社区版
KnowFlow 社区版已更新至 v2.1.2 版本,支持 RBAC (Role-Based Access Control) 以及 Dots 文档引擎接入。
