DeepSeek发布文生图模型“Janus-Pro”　表现优于OpenAI

（杭州28日讯）近期爆红的中国人工智能（AI）新创公司深度求索（DeepSeek），除夕当天凌晨在GitHub平台发布了Janus-Pro多模态大模型，进军文字生成图像（文生图）领域。根据其发布的测试结果，该模型在基准测试中超越美国巨头OpenAI。

综合报导，这款开源多模态模型被设计为高效且多功能的模型，擅长生成逼真图像、执行复杂视觉推理等多种视觉任务。

深度求索称，Janus-Pro在使用文本提示生成图像的基准测试中，表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

深度求索表示，该款大模型是2024年11月13日发布的JanusFlow大模型的进阶版本。相比前一代模型，Janus-Pro优化了训练策略、扩展了训练数据，模型也更大。

通过这些改进，Janus-Pro在多模态理解和文字到图像的指令跟踪功能方面都取得了重大进步，同时还增强了文字到图像生成的稳定性。

根据深度求索发布的测试结果，Janus-Pro在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。

深度求索的展示图显示，在文生图GenEval和DPG-Bench基准测试中，Janus-Pro-7B的准确率较前代Janus大幅提高，准确率测试结果分别为80%和84.2%，高于包括OpenAI DALL-E 3在内的其他对比模型，Janus的准确率分别为61%和79.7%。

随著 Janus-Pro-7B 的推出，科技业界对于其可能带来的影响高度关注。许多市场观察人士认为，DeepSeek的突破性技术可能促使竞争对手加速研发，进一步推动人工智能领域的创新发展。然而，这也引发了市场的不安情绪。

深度求索1月20日发布开源大语言模型DeepSeek-R1，凭借低训练成本，却能比拟OpenAI的o1模型的高效能引发全球科技圈关注，更促使投资者抛售全球科技股。

甯义声

热门新闻