据鲸观察3月14日报道,备受期待的DeepSeek V4和腾讯混元新模型预计都将于2026年4月发布。两款模型将实用能力置于基准性能之上,标志着中国AI竞赛进入新阶段。DeepSeek V4主打多模态与长期记忆能力,腾讯混元则聚焦上下文学习和智能体可用性。
据中国科技媒体鲸观察3月14日发布的独家报道,中国最受期待的两款AI模型——DeepSeek V4和腾讯混元新模型——预计都将于2026年4月发布。
两款模型的同步发布将标志着中国AI竞赛进入新阶段,两者都将实用能力置于原始基准性能之上。

DeepSeek V4由DeepSeek创始人梁文锋主导开发,被描述为一款能够原生处理文本、图像和视频生成的多模态大模型。除了多模态架构外,该模型据称在编程能力方面实现了飞跃,并在长期记忆(LTM)方面取得突破——这一直是大语言模型面临的持续性挑战。
该模型已受到数月关注。早前《金融时报》等媒体的报道曾暗示将在3月发布,但最新报道将时间线推至4月。一个名为“V4 Lite”的轻量化版本于3月9日短暂出现在DeepSeek网站上,暗示更广泛的V4系列即将完成。
据Whale Lab报道,两个神秘模型——“Healer Alpha”和“Hunter Alpha”——最近出现在OpenRouter平台上,引发了它们可能是DeepSeek V4早期版本的猜测。Hunter Alpha自称是一个万亿参数模型,拥有一百万token的上下文窗口,专为智能体工作流设计;而Healer Alpha被宣传为具有跨模态推理能力的多模态模型。目前尚无官方实体认领这两个模型。techflowpost
报道还指出,DeepSeek已与华为和寒武纪合作,为国产AI芯片优化V4,并与百度建立合作伙伴关系以增强其AI搜索能力。
腾讯即将推出的混元模型将由姚顺雨领导,他曾在OpenAI担任研究员,于2025年12月被腾讯任命为首席AI科学家。该模型参数量约为300亿,是姚顺雨加入公司后的首个重大产品,将专注于上下文学习和智能体可用性,而非追逐基准排名。
现年28岁的姚顺雨毕业于清华大学精英班姚班,因在AI智能体框架方面的基础性工作而闻名,包括ReAct和思维树(Tree of Thoughts)。据财新报道,他一直倡导从基准测试转向场景驱动的应用——这一理念似乎正在塑造腾讯的新模型战略。caixinglobal
这两款将于4月发布的产品,正值中国AI模型发布浪潮之际。阿里巴巴、字节跳动以及其他国内竞争对手近几个月都发布了更新版本的模型,在多模态能力、长期记忆和实际应用智能体性能等方面的竞争日益激烈。DeepSeek和腾讯能否兑现其雄心勃勃的承诺,将在未来几周内见分晓。money.usnews
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断