首页 > 原创作品 > 原创作品 > 阿里通义千问宣布推出多模态模型Qwen VLo,实现从感知到生成的跨越

阿里通义千问宣布推出多模态模型Qwen VLo,实现从感知到生成的跨越

发布时间:2025-06-28 10:13:06

6 月 27 日消息,阿里云通义千问刚刚发文,宣布推出最新的 Qwen VLo—— 一个多模态统一理解与生成模型,用户可以通过 Qwen Chat(chat.qwen.ai)进行体验。

这一全新升级的模型不仅能够“看懂”世界,更能基于理解进行高质量的再创造,真正实现了从感知到生成的跨越。

据介绍,Qwen VLo 能够以一种渐进式生成方式,从左到右、从上到下逐步清晰地构建整幅图片。

在生成过程中,模型会对预测的内容不断调整和优化,从而确保最终结果更加和谐一致。这种生成机制不仅提升了视觉效果,还为用户带来了更灵活、更可控的创作体验。

官方表示,Qwen VLo 采用动态分辨率训练,支持动态分辨率生成。无论是输入端还是输出端,模型都支持任意分辨率和长宽比的图像生成。

这意味着用户不再受限于固定的格式,可以根据实际需求生成适配不同场景的图像内容,无论是海报、插图、网页 Banner 还是社交媒体封面,都能轻松应对。

此外,Qwen VLo 还创新性地引入了一种全新的生成机制:从上到下、从左到右逐步清晰的生成过程。这一机制不仅提升了生成效率,还特别适用于需要精细控制的长段落文字生成任务。例如,在生成带有大量文本的广告设计或漫画分镜时,Qwen VLo 逐步生成慢慢修改。这种渐进式的生成方式让用户可以实时观察生成过程,并根据需要进行调整,从而获得最佳的创作效果。

阿里云官方提醒,Qwen VLo 还属于预览阶段,还有很多不足的地方,在生成的过程可能存在不符合事实、不完全和原图一致的问题,开发团队还在持续迭代。

Qwen VLo 在原始多模态理解与生成能力上进行了全面升级,显著增强了对图像内容的理解深度,并在此基础上实现了更加准确和一致的生成效果。

以下是 Qwen VLo 的核心亮点:

01 更精准的内容理解与再创造

以往的多模态模型在生成过程中容易出现语义不一致的问题,例如将汽车误生成其他类型的物体,或者无法保留原图的关键结构特征。而 Qwen VLo 通过更强大的细节捕捉能力,能够在生成过程中保持高度的语义一致性。例如,当用户输入一张汽车的照片并要求“更换颜色”时,Qwen VLo 不仅能准确识别车型,还能保留其原有的结构特征,同时完成色彩风格的自然转换,让生成结果既符合预期又不失真实感。

02 支持开放指令编辑修改生成

用户可以通过自然语言提出各种创意性指令,如“将这张画风改为梵高风格”、“让这张照片看起来像 19 世纪的老照片”或“给这张图片添加一个晴朗的天空”。Qwen VLo 能够灵活响应这些开放性指令,并生成符合用户预期的结果。无论是艺术风格迁移、场景重构还是细节修饰,模型都能轻松应对。甚至一些传统的视觉感知人物如预测深度图、分割图、检测图以及边缘信息等也可以通过编辑指令轻松完成。更进一步,像很多更复杂的指令,比如一条指令中同时包含修改物体、修改文字、更换背景,模型也能轻松完成。

03 多语言指令支持

Qwen VLo 支持包括中文、英文在内的多种语言指令,打破了语言壁垒,为全球用户提供了统一且便捷的交互体验。无论您使用哪种语言,只需简单描述您的需求,模型便能快速理解并输出理想结果。

原创作品更多>>

长城魏牌80进军马来西亚市场更名魏牌G9,本土化组装插混 MPV 即将上市 捷豹路虎拟利用英国闲置产能代工奇瑞车型,中英车企合作或成英国汽车业复苏关键 博通推出业界首款6G兼容DFE数字前端SoC芯片BroadPeak 详读2万3千字的新“AI 宪法”之后,我理解了Anthropic的痛苦 爬虫公司SerpApi反诉谷歌,称“谷歌才是全球最大爬虫” 阿里云Coding Plan上新:支持千问3.5、GLM-4.7、Kimi-K2.5等模型 三星Galaxy S26 Ultra宣传材料曝光:相机规格与电池容量尘埃落定 三星Galaxy S26系列手机将深度整合Perplexity AI,打造多智能体协同生态系统 宝马将在中国投产长轴距版iX3,4月北京车展首发,年内上市 中国汽车2025年出口:总量跃升与结构变迁 特斯拉取消标配自动辅助驾驶功能,新车默认不提供车道居中功能 中国电动跑车SC01正式登陆欧洲,限量1000台 大众ID.4改款后更名,ID.5将停产 晓莺说热点:2026CES观察:AI狂奔,从灵魂到躯体 宝马iX3与奔驰EQ GLC预售超预期,双方加速产能爬坡 丰田在加拿大工厂投产2026款混动版RAV4 TikTok将在欧盟加强年龄验证技术,数千个未成年人账号被移除 西贝宣布关店102家后,罗永浩最新发声 抖音加强治理摆拍演绎:煽动对立情绪最高永久封禁 华为、小米等品牌被纳入iPhone以旧换新范围 极氪007/GT车型更新计划公布:今年Q2焕新上市,将提供900V版 中国电子董事长:2026年将着力打造国产全谱系全流程EDA工具系统 推出新一代高性能芯片 突破2700万辆!2025年中国车企全球销量首超日本 工信部:动力电池、新能源汽车生产者承担动力电池回收“兜底”责任 迎接新作,《火焰之纹章》全系列17部游戏大盘点,重回旧日时光 甄嬛传、蜡笔小新、爱情公寓,百部经典影片被搬上“游戏大银幕” 官方重磅确认!工作室正全力开发《匹诺曹的谎言》续集 美国新一轮入境限制生效,全球机场乱成一团! 北京高考状元回中学母校当老师?原来10年前他就告诉了答案 2025行业之光大会——第34届全国建材与家居行业年会圆满落幕