前途科技
  • 科技
  • AI
    • AI 前沿技术
    • Agent生态
    • AI应用场景
    • AI 行业应用
  • 初创
  • 报告
  • 学习中心
    • 编程与工具
    • 数据科学与工程
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
初创

DeepSeek Janus-Pro-7B 模型超越 DALL-E 3 和 Stable Diffusion

NEXTECH
Last updated: 2025年3月16日 上午7:02
By NEXTECH
Share
8 Min Read
SHARE

DeepSeek 再下一城:Janus-Pro-7B 多模态模型超越 DALL-E 3 和 Stable Diffusion

DeepSeek 正在迅速成为人工智能领域的领头羊。继其备受瞩目的 R1 模型之后,这家中国人工智能初创公司又发布了另一款开源人工智能模型:Janus-Pro-7B。这款多模态模型能够生成图像,在 GenEval 和 DPG-Bench 基准测试中超越了 OpenAI 的 DALL-E 3 和 Stable Diffusion,这无疑是人工智能领域的一项重大突破。

DeepSeek 将 Janus-Pro 描述为一个创新的自回归框架,它集成了多模态理解和生成能力。与之前的模型相比,Janus-Pro 通过将视觉编码分离成不同的路径来克服了它们的局限性,但仍然依赖于单个统一的 Transformer 架构进行处理。

“Janus-Pro 是一款统一的理解和生成 MLLM,它将视觉编码解耦,用于多模态理解和生成。Janus-Pro 基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建。” DeepSeek 在其发布页面上写道。

这种解耦方法不仅解决了视觉编码器在理解和生成方面的角色冲突,而且还提高了模型的灵活性。Janus-Pro 的性能超越了之前的统一模型,甚至与特定任务模型相媲美,甚至在某些方面还超越了它们。凭借其简洁性、灵活性以及有效性,Janus-Pro 成为下一代多模态模型的领先竞争者。

You Might Also Like

前OpenAI CTO创企5月估值120亿美元
最大融资纪录再被刷新,牙科AI赛道今年加速狂飙
Fhenix 测试网发布,FHE 加持,开启链上隐私新时代
做好资产配置:风浪中信步前行

Janus-Pro 基于 DeepSeek 的 LLM 架构(DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base)构建,是一个统一的多模态学习模型 (MLLM),它将视觉编码分离用于理解和生成。对于多模态理解,它利用 SigLIP-L 视觉编码器,能够处理 384 x 384 像素的图像输入。对于图像生成,Janus-Pro 使用一个专门的标记器,其降采样率为 16。

Janus-Pro 采用 MIT 许可证授权,其使用受 DeepSeek 模型许可证的约束。

就在上周,DeepSeek 推出了 DeepSeek-R1,这款推理模型被定位为 OpenAI 的 o1 模型的强劲替代品。这款开源选项因其价格实惠以及在关键基准测试中的出色表现而受到开发人员的青睐。

Share This Article
Email Copy Link Print
Previous Article 20250315225615817.jpg 2025年美国独角兽上市预测
Next Article EA体育足球游戏受挫,FIFA携手Mythical Games开启新篇章
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
图表1
《亚洲水发展展望2025》深度解读:亚太水安全喜忧参半,未来挑战何在?
未分类
谷歌助手设备概念图
谷歌支付6800万美元和解语音助手监听诉讼,你的隐私可能被“误触发”录音
科技
20260127081404359.jpg
甲骨文豪掷500亿美元押注AI基建,美国数据中心版图加速扩张
科技
OpenAI总裁豪掷2500万美元支持特朗普,科技巨头与政坛的深度捆绑引关注
AI

相关内容

20250508230245629.jpg
初创

AI初创公司Perfect获2300万美元融资,用AI解决招聘瓶颈,招聘时间缩短75%

2025年5月9日
20250214230617816.jpg
初创

CES 2025: 十大最令人印象深刻的科技产品和创新

2025年2月15日
初创科技

ETZ 将 SUI 添加到 IRA 产品中

2024年7月24日
初创

PoSciDonDAO 赋能个性化医疗研究的去中心化未来

2024年12月30日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创
  • 学习中心

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏

Copyright © 2025 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号

前途科技
Username or Email Address
Password

Lost your password?