
中国人工智能初创公司深度求索(DeepSeek)于12月1日发布了两款全新的推理模型,这一举措表明,来自中国的开源系统在数学和编程基准测试中,其性能已能够匹配甚至超越美国领先的人工智能公司。
这家总部位于杭州的公司发布了DeepSeek-V3.2及其更高级的版本DeepSeek-V3.2-Speciale。两款均为开源模型,据该公司称,在多项推理任务上,其性能可与OpenAI的GPT-5和谷歌的Gemini 3 Pro相媲美。其中,V3.2-Speciale模型在四大国际顶级竞赛中取得了金牌级别的成绩,包括国际数学奥林匹克竞赛、中国数学奥林匹克竞赛、ICPC世界总决赛以及2025年国际信息学奥林匹克竞赛。
在2025年美国数学邀请赛中,DeepSeek-V3.2-Speciale获得了96.0%的分数,超越了GPT-5 High的94.6%和Gemini 3 Pro的95.0%。在衡量AI编码能力的SWE Verified基准测试中,该模型也取得了73.1%的成绩,尽管略低于Gemini 3 Pro的76.2%。
中国开源战略崭露头角
此次发布标志着中国通过开源模型与美国在AI领域的主导地位展开竞争的战略又迈出了重要一步。深度求索由梁文锋于2023年创立,并获得量化对冲基金幻方量化的投资,该公司已将自己定位为开发高性价比AI系统的领导者,其产品可与硅谷的专有模型一较高下。
据报道,DeepSeek-V3.2取代了9月份发布的实验性V3.2-Exp模型,新版本现已为该公司的应用程序、网站和API服务提供支持。这家初创公司表示,V3.2旨在成为“具备GPT-5级别性能的日常主力模型”,在推理能力和效率之间取得平衡,而V3.2-Speciale则专注于为复杂任务提供极致的推理能力。
近期数据显示,在开源AI模型的下载量方面,中国已超越美国。根据麻省理工学院和Hugging Face的一项研究,中国模型占全球下载量的17%,而美国模型为15.8%。这一转变反映了中国快速的发布周期以及对开发可在较低性能硬件上运行的、易于获取且高效模型的关注——这一战略部分是由美国对先进AI芯片的出口限制所推动的。
竞争格局日趋激烈
此次发布正值中国AI领域竞争白热化之际,阿里巴巴、百度等公司也在积极推进各自的模型。阿里巴巴的通义千问Qwen 3模型近期在2025年AIME及其他数学竞赛中取得了满分成绩。与此同时,根据斯坦福大学2025年AI指数报告,更广泛的中国AI生态系统目前贡献了全球约70%的AI相关专利。
深度求索的技术报告将V3.2系列模型描述为“为智能体构建的推理优先模型”,并引入了一种新的训练方法,该方法综合了跨越1800个环境的超过85,000个复杂任务。该公司表示,V3.2是首个将思维直接整合到工具使用中的模型,支持在使用搜索引擎和代码执行器等外部工具时,同时启用推理和非推理模式。
V3.2-Speciale变体可通过API临时获取,有效期至12月15日。该版本消耗更多的计算资源,但实现了深度求索所称的“最大化推理能力”。两款模型均采用了深度求索稀疏注意力机制,该机制旨在将处理长文本序列的计算成本降低50%至70%。
