当前位置：首页 > news >正文

阿里 Qwen3 模型更新，吉卜力风格get

news 2025/6/29 13:37:21

大家好，我是Ai学习的老章

冷知识：阿里单Qwen系列不同参数、不同格式、不同用途的开源模型已有321个

这还没有算上阿里其他团队放出的模型，比如之前我介绍过的超长上下文大模型QwenLong就是阿里通义智文开源的

刚刚，阿里新模型+1，这次是# Qwen VLo

截止发文，Qwen VLo并未开源，我理解它应该不是一个单独的模型，其对应的应该是 Qwen3-235B-A22B ，但也未更新模型

官方简介：这是一个多模态统一理解与生成模型。这一全新升级的模型不仅能够“看懂”世界，更能基于理解进行高质量的再创造，真正实现了从感知到生成的跨越。

Qwen VLo 以一种渐进式生成方式，从左到右、从上到下逐步清晰地构建整幅图片。在生成过程中，模型会对预测的内容不断调整和优化，从而确保最终结果更加和谐一致。这种生成机制不仅提升了视觉效果，还为用户带来了更灵活、更可控的创作体验。

直接访问：https://chat.qwen.ai/

模型中选择第一个就行了

官方介绍的用法：

• 1、直接生成图像，并对其进行修改，例如替换背景、添加主体、进行风格迁移，甚至可以完成基于开放指令的大幅修改，包括检测和分割等视觉感知任务，比如将卡通变为写实、将形象变成气球
• 2、一次性完成多重任务，例如生成海报、组合物体
• 3、除了能对图像的编辑和再创作，还可以完成一些对已有信息的标注，比如检测、分割、边缘检测等。
• 4、支持多张图像的输入理解和生成，不过这个还没有上线
• 5、支持文本到图像的直接生成，包括通用图像和中英文海报等。
• 6、支持动态长宽比的图像生成，对于长宽比高达 4:1 ，1:3 等细长类型图像
• 7、对生成的内容进行再分析和理解，例如识别生成图片中的狗和猫的品种。

这里就不多图杀猫了，大家可以去 https://qwenlm.github.io/zh/blog/qwen-vlo/ 查看