当前位置: 首页 > news >正文

阿里 Qwen3 模型更新,吉卜力风格get

 

大家好,我是Ai学习的老章

 

冷知识:阿里单Qwen系列不同参数、不同格式、不同用途的开源模型已有321个

 

这还没有算上阿里其他团队放出的模型,比如之前我介绍过的超长上下文大模型QwenLong就是阿里通义智文开源的

 

刚刚,阿里新模型+1,这次是# Qwen VLo

截止发文,Qwen VLo并未开源,我理解它应该不是一个单独的模型,其对应的应该是 Qwen3-235B-A22B ,但也未更新模型

官方简介:这是一个多模态统一理解与生成模型。这一全新升级的模型不仅能够“看懂”世界,更能基于理解进行高质量的再创造,真正实现了从感知到生成的跨越。

官方简介:这是一个多模态统一理解与生成模型。这一全新升级的模型不仅能够“看懂”世界,更能基于理解进行高质量的再创造,真正实现了从感知到生成的跨越。

简介

Qwen VLo 以一种渐进式生成方式,从左到右、从上到下逐步清晰地构建整幅图片。在生成过程中,模型会对预测的内容不断调整和优化,从而确保最终结果更加和谐一致。这种生成机制不仅提升了视觉效果,还为用户带来了更灵活、更可控的创作体验。

 

用法

直接访问:https://chat.qwen.ai/

模型中选择第一个就行了

 

官方介绍的用法:

  • • 1、直接生成图像,并对其进行修改,例如替换背景、添加主体、进行风格迁移,甚至可以完成基于开放指令的大幅修改,包括检测和分割等视觉感知任务,比如将卡通变为写实、将形象变成气球
  • • 2、一次性完成多重任务,例如生成海报、组合物体
  • • 3、除了能对图像的编辑和再创作,还可以完成一些对已有信息的标注,比如检测、分割、边缘检测等。
  • • 4、支持多张图像的输入理解和生成,不过这个还没有上线
  • • 5、支持文本到图像的直接生成,包括通用图像和中英文海报等。
  • • 6、 支持动态长宽比的图像生成,对于长宽比高达 4:1 ,1:3 等细长类型图像
  • • 7、对生成的内容进行再分析和理解,例如识别生成图片中的狗和猫的品种。

这里就不多图杀猫了,大家可以去 https://qwenlm.github.io/zh/blog/qwen-vlo/ 查看

 

就像GPT-4o一样,大家可能最喜爱的还是风格转化吧?

比如我把Qwen-VLo的海报转成了吉卜力风格

 

效果还可以

 

当然了,它也很懂事儿,知道什么事儿不该做😂

 

我试了几次,感觉瑕疵也有

  • • 人物类型的图片,转换风格后图像N多细节会丢失
  • • 画面元素过多时,很多物体会扭曲变形
  • • 还有老生常谈的手指细节问题

总体感受:阿里,好样的!👍

官方博客也说了:

Qwen VLo 还属于预览阶段,有很多不足的地方,在生成的过程可能存在不符合事实、不完全和原图一致、指令不遵循、在识别生图和理解的意图不够稳定的问题,还请谅解。


史上最全!371张速查表,涵盖AI、ChatGPT、Python、R、深度学习、机器学习等

 

http://www.lqws.cn/news/560341.html

相关文章:

  • 对话式数据分析与Text2SQL Agent产品可行性分析思考
  • 安卓中静态和动态添加子 View 到容器
  • Zotero 7 插件:翻译与护眼主题
  • 如何快速学习一门新编程语言
  • 使用asyncio构建高性能网络爬虫
  • Vue 项目中 Excel 导入导出功能笔记
  • 开疆智能CCLinkIE转ModbusTCP网关连接傲博机器人配置案例
  • 道路交通标志检测数据集-智能地图与导航 交通监控与执法 智慧城市交通管理-2,000 张图像
  • 鸿蒙5:ArkTS基本介绍
  • Ubuntu20.04离线安装Realtek b852无线网卡驱动
  • Note2.2 机器学习训练技巧:Batch and Momentum(Machine Learning by Hung-yi Lee)
  • vue-29(创建 Nuxt.js 项目)
  • 创客匠人视角:创始人 IP 打造为何成为知识变现的核心竞争力
  • electron中显示echarts
  • 微机系统 第八章 模拟接口
  • Windows 合并多个txt到一个txt文件中 (txt文件的合并与拆分)
  • 【Go语言-Day 10】深入指针应用:解锁函数“引用传递”与内存分配的秘密
  • 如何让ChatGPT模仿人类写作,降低AIGC率?
  • 设计模式-代理模式、装饰者模式
  • [Java 基础]LinkedList
  • 告别脚本!用浏览器为 AWS CLI 实现真正的 Cognito 单点登录
  • 基于Spring Boot的网上购物平台设计与实现
  • 【软考--软件设计师】10.2 关系型数据库
  • 网络安全体系结构和安全防护
  • Linux内核网络协议栈深度解析:面向连接的INET套接字实现
  • 【AI实践】Mac一天熟悉AI模型智能体应用(百炼版)
  • 前端React和Vue框架的区别
  • Spring AI Alibaba 入门指南:打造企业级 AI 应用
  • 全面拥抱vue3
  • 编译安装交叉工具链 riscv-gnu-toolchain