AI 前沿技术

DeepSeek-OCR用户测评：文字、图表识别与提示词效果实测

Last updated: 2025年11月1日上午7:32

By NEXTECH

10 Min Read

DeepSeek-OCR用户测评：文字、图表识别与提示词效果实测

DeepSeek-OCR的用户Simon，一位资深asp.net程序员和独立的AI技术研发者，分享了他对DeepSeek-OCR的实测体验。Simon此前已研发出多项应用于具体场景的AI技术，其中一项正在申请国家发明专利。

Contents

DeepSeek-OCR用户测评：文字、图表识别与提示词效果实测亲身实践：DeepSeek-OCR功能深度探索实测总结与未来展望

OCR模型使用者关注DeepSeek-OCR已久，尤其对其在工业CAD图片识别方面的潜力抱有期待，例如在图纸上高亮显示当前加工的工序，为后续加工提供提示。DeepSeek-OCR发布后，因其宣称采用革命性技术，引起了广泛关注与好奇。

亲身实践：DeepSeek-OCR功能深度探索

为全面测评DeepSeek-OCR，测试者通过WebAPI调用硅基流动中这款模型，并编写辅助程序以呈现效果。测试过程涵盖了从简单文字图片到复杂表格、图表及照片的识别，并尝试了图上标注功能，旨在深入探究DeepSeek-OCR的实际表现。

识别图片上的文字，准确度高，速度特别快，识别体验令人称赞。

DeepSeek-OCR文字识别示例

提取图表信息，表现亦十分出色。

DeepSeek-OCR图表信息提取示例

一个令人惊喜的发现是，即使输入的原图没有具体数据，模型也能输出估算值，展示了其独特的能力。

DeepSeek-OCR无数据图表估值功能演示

针对特定场景，测试者尝试了不同的提示词，模型输出结果基本符合预期。

DeepSeek-OCR多提示词效果展示

当使用提示词“general: <image>
Analyze the crop lodging situation in the image, identify the lodged areas, and estimate the percentage of affected area.”时，模型给出的回答展现了更大的想象空间。

DeepSeek-OCR作物倒伏情况分析示例

实测总结与未来展望

上述多个场景测试充分展示了DeepSeek-OCR的强大能力。在测试过程中，DeepSeek-OCR的表现带来了惊喜与挑战并存的体验。

测试发现，中文提示词的效果有时不如英文提示词稳定，英文提示词表现更为顺畅。官方推荐的常用提示词包括：

General OCR: Free OCR.
Markdown: <|grounding|>Convert the document to markdown.
Table: <|grounding|>Extract all tables and convert to markdown format.

模型偶尔会出现幻觉，回复与图片无关的内容。尽管返回结果有时不稳定，但模型“真正看懂图片”的直观感受非常强烈，通过优化提示词可以使其具备真实的实用价值。
将图文内容转换为Markdown格式的功能非常实用，便于后续文本和电子表格的还原。
DeepSeek-OCR在处理无标值图表时能输出估算值，这一能力令人印象深刻。
该模型的识别速度惊人，被认为是目前体验过最快的OCR模型之一。
经过此次测评，DeepSeek-OCR被认为在开发一键还原图片文本或表格工具，以及图纸识别场景中具有广阔应用前景。

您是否也曾使用DeepSeek-OCR？欢迎分享您的使用心得。

TAGGED:AI前沿技术 DeepSeek-OCR 图表识别大模型文字识别

Share This Article

Previous Article

Adobe股价大跌：AI竞争加剧与未来挑战

宾夕法尼亚大学遭遇“觉醒”学生数据泄露威胁：政治动机浮出水面？

Leave a Comment

发表回复取消回复