前途科技
  • AI
  • 初创
  • 报告
我的兴趣
前途科技前途科技
Font ResizerAa
站内搜索
Have an existing account? Sign In
Follow US
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
初创

DeepSeek Janus-Pro-7B 模型超越 DALL-E 3 和 Stable Diffusion

NEXTECH
Last updated: 2025年3月16日 上午7:02
By NEXTECH
Share
8 Min Read
SHARE

DeepSeek 再下一城:Janus-Pro-7B 多模态模型超越 DALL-E 3 和 Stable Diffusion

DeepSeek 正在迅速成为人工智能领域的领头羊。继其备受瞩目的 R1 模型之后,这家中国人工智能初创公司又发布了另一款开源人工智能模型:Janus-Pro-7B。这款多模态模型能够生成图像,在 GenEval 和 DPG-Bench 基准测试中超越了 OpenAI 的 DALL-E 3 和 Stable Diffusion,这无疑是人工智能领域的一项重大突破。

DeepSeek 将 Janus-Pro 描述为一个创新的自回归框架,它集成了多模态理解和生成能力。与之前的模型相比,Janus-Pro 通过将视觉编码分离成不同的路径来克服了它们的局限性,但仍然依赖于单个统一的 Transformer 架构进行处理。

“Janus-Pro 是一款统一的理解和生成 MLLM,它将视觉编码解耦,用于多模态理解和生成。Janus-Pro 基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建。” DeepSeek 在其发布页面上写道。

这种解耦方法不仅解决了视觉编码器在理解和生成方面的角色冲突,而且还提高了模型的灵活性。Janus-Pro 的性能超越了之前的统一模型,甚至与特定任务模型相媲美,甚至在某些方面还超越了它们。凭借其简洁性、灵活性以及有效性,Janus-Pro 成为下一代多模态模型的领先竞争者。

You Might Also Like

Moises 音乐 AI 获 4000 万美元 A 轮融资,革新音频和音乐伦理 AI
加拿大StackAdapt获2.35亿美元融资扩展程序化广告平台
微博Q2净利润9.14亿 超华尔街预期
英伟达市值飙升2万亿美元,AI热潮助其领跑全球

Janus-Pro 基于 DeepSeek 的 LLM 架构(DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base)构建,是一个统一的多模态学习模型 (MLLM),它将视觉编码分离用于理解和生成。对于多模态理解,它利用 SigLIP-L 视觉编码器,能够处理 384 x 384 像素的图像输入。对于图像生成,Janus-Pro 使用一个专门的标记器,其降采样率为 16。

Janus-Pro 采用 MIT 许可证授权,其使用受 DeepSeek 模型许可证的约束。

就在上周,DeepSeek 推出了 DeepSeek-R1,这款推理模型被定位为 OpenAI 的 o1 模型的强劲替代品。这款开源选项因其价格实惠以及在关键基准测试中的出色表现而受到开发人员的青睐。

Share This Article
Email Copy Link Print
Previous Article 20250315225615817.jpg 2025年美国独角兽上市预测
Next Article EA体育足球游戏受挫,FIFA携手Mythical Games开启新篇章
Leave a Comment

发表回复 取消回复

您的邮箱地址不会被公开。 必填项已用 * 标注

最新内容
Green and grey pickup truck pictured against green background
贝佐斯投资电动皮卡热销,仅售2万美金
初创
Reddit联合创始人加入竞购TikTok美国业务
初创
AI 正在学习如何影响你
AI
比亚迪车主忠诚度高的离谱:31%换车还买比亚迪
威尔森:2025年3月国内一二线城市汽车增换购数据
报告

相关内容

Man in black blazer and white button up shirt
初创

奥特曼投资社区学院开设两年制人工智能学位

2025年4月10日
20250301230215417.jpg
初创

特朗普力推“美国优先”数字货币储备

2025年3月2日
初创科技

POPG 将扩展社区驱动的 Web3 生态系统

2024年9月4日
初创

ElevenLabs获1.8亿美元融资,估值升至33亿美元

2025年3月24日
Show More
前途科技

前途科技是一个致力于提供全球最新科技资讯的专业网站。我们以实时更新的方式,为用户呈现来自世界各地的科技新闻和深度分析,涵盖从技术创新到企业发展等多方面内容。专注于为用户提供高质量的科技创业新闻和行业动态。

分类

  • AI
  • 初创

快速链接

  • 阅读历史
  • 我的关注
  • 我的收藏
Copyright © 2024 AccessPath.com, 前途国际科技咨询(北京)有限公司,版权所有。 | 京ICP备17045010号-1 | 京公网安备 11010502033860号
前途科技
Username or Email Address
Password

Lost your password?