前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
AI 前沿技术

DeepSeek-OCR用户测评:文字、图表识别与提示词效果实测

NEXTECH
Last updated: 2025年11月1日 上午7:32
By NEXTECH
Share
10 Min Read
SHARE

DeepSeek-OCR用户测评:文字、图表识别与提示词效果实测

DeepSeek-OCR的用户Simon,一位资深asp.net程序员和独立的AI技术研发者,分享了他对DeepSeek-OCR的实测体验。Simon此前已研发出多项应用于具体场景的AI技术,其中一项正在申请国家发明专利。

Contents
DeepSeek-OCR用户测评:文字、图表识别与提示词效果实测亲身实践:DeepSeek-OCR功能深度探索实测总结与未来展望

OCR模型使用者关注DeepSeek-OCR已久,尤其对其在工业CAD图片识别方面的潜力抱有期待,例如在图纸上高亮显示当前加工的工序,为后续加工提供提示。DeepSeek-OCR发布后,因其宣称采用革命性技术,引起了广泛关注与好奇。

亲身实践:DeepSeek-OCR功能深度探索

为全面测评DeepSeek-OCR,测试者通过WebAPI调用硅基流动中这款模型,并编写辅助程序以呈现效果。测试过程涵盖了从简单文字图片到复杂表格、图表及照片的识别,并尝试了图上标注功能,旨在深入探究DeepSeek-OCR的实际表现。

  1. 识别图片上的文字,准确度高,速度特别快,识别体验令人称赞。

DeepSeek-OCR文字识别示例

  1. 提取图表信息,表现亦十分出色。

DeepSeek-OCR图表信息提取示例

  1. 一个令人惊喜的发现是,即使输入的原图没有具体数据,模型也能输出估算值,展示了其独特的能力。

DeepSeek-OCR无数据图表估值功能演示

You Might Also Like

大模型Function Calling是什么?:能力、作用与应用示例
星环科技AI Infra平台:重构企业AI基础设施,技术架构与核心优势深度解析
RAG技术深度解析:让AI更智能,掌握其工作原理、文档处理、检索策略与实战
AI驱动软件开发:从“写代码”到“聊需求”的范式大转变
  1. 针对特定场景,测试者尝试了不同的提示词,模型输出结果基本符合预期。

DeepSeek-OCR多提示词效果展示

  1. 当使用提示词“general: <image>
    Analyze the crop lodging situation in the image, identify the lodged areas, and estimate the percentage of affected area.”时,模型给出的回答展现了更大的想象空间。

DeepSeek-OCR作物倒伏情况分析示例

实测总结与未来展望

上述多个场景测试充分展示了DeepSeek-OCR的强大能力。在测试过程中,DeepSeek-OCR的表现带来了惊喜与挑战并存的体验。

  1. 测试发现,中文提示词的效果有时不如英文提示词稳定,英文提示词表现更为顺畅。官方推荐的常用提示词包括:
  • General OCR: Free OCR.
  • Markdown: <|grounding|>Convert the document to markdown.
  • Table: <|grounding|>Extract all tables and convert to markdown format.
  1. 模型偶尔会出现幻觉,回复与图片无关的内容。尽管返回结果有时不稳定,但模型“真正看懂图片”的直观感受非常强烈,通过优化提示词可以使其具备真实的实用价值。

  2. 将图文内容转换为Markdown格式的功能非常实用,便于后续文本和电子表格的还原。

  3. DeepSeek-OCR在处理无标值图表时能输出估算值,这一能力令人印象深刻。

  4. 该模型的识别速度惊人,被认为是目前体验过最快的OCR模型之一。

  5. 经过此次测评,DeepSeek-OCR被认为在开发一键还原图片文本或表格工具,以及图纸识别场景中具有广阔应用前景。

您是否也曾使用DeepSeek-OCR?欢迎分享您的使用心得。


TAGGED:AI前沿技术DeepSeek-OCR图表识别大模型文字识别
Share This Article
Email Copy Link Print
Previous Article 20251101072902664.jpg Adobe股价大跌:AI竞争加剧与未来挑战
Next Article 20251101074806305.jpg 宾夕法尼亚大学遭遇“觉醒”学生数据泄露威胁:政治动机浮出水面?
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
图表1
路透社重磅报告:2025年生成式AI如何重塑新闻业与公众生活?
报告
20251212081228599.jpg
AI致命风险:ChatGPT卷入谋杀案,OpenAI与微软被诉
科技
Epic Games与谷歌法庭诉讼现场图
重磅回归!《堡垒之夜》重返Google Play商店,五年反垄断之争迎来转机
科技
苹果CEO蒂姆·库克在国会听证会上的资料图片
库克游说阴影笼罩关键儿童网络安全法案投票,国会激辩未列议程提案
科技

相关内容

LangExtract工作流程示意图
AI 前沿技术

LangExtract:大模型文本提炼工具功能与工作流程详解

2025年11月1日
RAG系统架构图
AI 前沿技术

2025年RAG最佳Reranker模型:深入解析其工作原理、优势与选择

2025年10月16日
黄仁勋向马斯克交付DGX Spark个人AI超级计算机
AI 前沿技术

黄仁勋再为马斯克送货上门:英伟达AI个人超算DGX Spark终亮相,开启桌面AI新时代

2025年10月15日
表1:从clinicaltrials.gov下载的两个阿尔茨海默病研究的关键信息示例,其中部分信息已从原始数据中提取。
大模型与工程化

五步精通PICO信息提取器:构建生物医学领域NLP应用与部署

2025年9月22日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?

Not a member? Sign Up