阿里巴巴近期在Hugging Face和ModelScope上正式开源了智能简历解析系统SmartResume。该系统能够将PDF、图片、Office文档等多种格式的简历,高效地转换为结构化数据。
这使得HR部门繁琐的手动录入简历工作得以实现秒级处理。SmartResume系统的工作原理主要分为三个核心阶段。

首先,系统运用OCR技术和PDF元数据进行文本提取,并结合基于YOLOv10的版面检测模型,以准确重建文档的阅读顺序。随后,通过大型语言模型将提取出的文本内容转化为结构化的字段信息,涵盖基本信息、工作经历、教育背景等关键要素。
其核心解析模型采用了经过微调的Qwen3-0.6B。值得一提的是,该系统支持API调用和本地模型部署两种灵活方式,以满足不同场景下的具体需求。

根据官方公布的性能对比数据显示,在SynthResume和RealResume这两个标准数据集上,SmartResume的解析管道(特别是其微调模型版本)在准确率、精确度、召回率和F1分数等核心评估指标上,均显著优于非LLM基线和朴素LLM基线方法。
SmartResume成功将传统文档解析技术与当前先进的大语言模型能力相结合,精准解决了招聘流程中处理海量简历的繁琐痛点。对于企业HR或招聘系统开发者而言,这提供了一个高效且切实可用的智能工具选择。
项目地址
- Hugging Face: https://huggingface.co/Alibaba-EI/SmartResume
