alibaba

Qwen-Image-2.0

Qwen-Image-2.0 是阿里巴巴统一的 7B model,专为专业信息图表、写实影像和精准图像编辑设计,支持原生 2K 分辨率和 1k-token...

多模态图像生成文字排版开源权重阿里巴巴
alibaba logoalibabaQwenFebruary 10, 2026
上下文
1Ktokens
最大输出
4Ktokens
输入价格
$0.07/ 1M
输出价格
$0.07/ 1M
模态:TextImage
能力:视觉工具流式传输
基准测试
GPQA
0%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Qwen-Image-2.0 在此基准测试中得分 0%。
HLE
0%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Qwen-Image-2.0 在此基准测试中得分 0%。
MMLU
0%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Qwen-Image-2.0 在此基准测试中得分 0%。
MMLU Pro
0%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Qwen-Image-2.0 在此基准测试中得分 0%。
SimpleQA
0%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Qwen-Image-2.0 在此基准测试中得分 0%。
IFEval
0%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Qwen-Image-2.0 在此基准测试中得分 0%。
AIME 2025
0%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Qwen-Image-2.0 在此基准测试中得分 0%。
MATH
0%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Qwen-Image-2.0 在此基准测试中得分 0%。
GSM8k
0%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Qwen-Image-2.0 在此基准测试中得分 0%。
MGSM
0%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Qwen-Image-2.0 在此基准测试中得分 0%。
MathVista
72%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Qwen-Image-2.0 在此基准测试中得分 72%。
SWE-Bench
0%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Qwen-Image-2.0 在此基准测试中得分 0%。
HumanEval
0%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Qwen-Image-2.0 在此基准测试中得分 0%。
LiveCodeBench
0%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Qwen-Image-2.0 在此基准测试中得分 0%。
MMMU
77%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Qwen-Image-2.0 在此基准测试中得分 77%。
MMMU Pro
58%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Qwen-Image-2.0 在此基准测试中得分 58%。
ChartQA
86%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Qwen-Image-2.0 在此基准测试中得分 86%。
DocVQA
94%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Qwen-Image-2.0 在此基准测试中得分 94%。
Terminal-Bench
0%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Qwen-Image-2.0 在此基准测试中得分 0%。
ARC-AGI
0%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Qwen-Image-2.0 在此基准测试中得分 0%。

关于 Qwen-Image-2.0

了解 Qwen-Image-2.0 的功能、特性以及它如何帮助您获得更好的效果。

统一的视觉核心

Qwen-Image-2.0 代表了阿里巴巴云在 multimodal AI 领域的重大飞跃。与以往需要独立 model 分别进行创建和修改的版本不同,这种统一的 7B parameters 架构在单一框架内处理高保真图像生成和精确的像素级编辑。这种精简的方法确保了在广泛的视觉任务中具有风格一致性和卓越的语义遵循能力。

专业级排版与布局

该 model 专门设计用于克服 AI 艺术中最大的障碍之一:文本渲染。它支持长达 1,000 tokens 的超长指令,允许用户为专业信息图表、数据仪表盘和双语营销材料指定复杂的布局。凭借原生 2K 分辨率支持,输出结果保持了微观级别的细节,使其既适用于数字显示,也适用于高质量的印刷媒体。

State-of-the-Art 的多模态理解能力

除了生成能力,Qwen-Image-2.0 在 multimodal 理解方面也表现出色。通过将深度 reasoning 与视觉合成相结合,它在 DocVQA (94)ChartQA (86) 等 benchmark 中获得了顶级评分。这使其成为需要将复杂文本数据转换为结构化视觉表示,或使用自然语言命令对现有图像进行迭代编辑的用户的理想工具。

Qwen-Image-2.0

Qwen-Image-2.0 的使用案例

发现使用 Qwen-Image-2.0 获得出色效果的不同方式。

专业信息图表

:生成具有准确数据标签和整洁布局的复杂财务报告和技术原理图。

双语营销材料

:创建具有完美中英文字体排版的社交媒体素材,并保持光影和透视的一致性。

多格漫画

:在多格漫画布局中产出一致的角色设计,并将对话精确地放置在气泡框内。

精准图像编辑

:通过自然语言指令修改现有照片,例如添加或删除特定物体,或更改材质纹理。

高保真写实主义

:以 2K 分辨率渲染细腻的人像和建筑场景,呈现清晰的皮肤纹理和材质深度。

幻灯片生成

:将长篇文本直接转换为带有集成图标和图表的专业 PPT 风格幻灯片。

优势

局限性

专业排版: :极其擅长渲染长且复杂的双语文本和嵌套布局,不会出现拼写错误。
语言偏好: :虽然支持双语,但其文化和书法细节在中文艺术风格上打磨得最为深厚。
统一生成-编辑架构: :单个 7B model 即可同时处理创建和修改任务,确保跨任务的视觉一致性。
显存压力: :在本地生成原生 2K 图像比标准的 1024x1024 model 需要显著更多的 VRAM。
极高的文档准确度: :在文档相关的 benchmark 中占据统治地位,DocVQA 得分为 94,ChartQA 为 86。
数值瑕疵: :嵌套信息图布局中的复杂数值表格偶尔仍可能出现细微的对齐问题。
原生 2K 保真度: :产出具有专业光影和微观建筑细节的超清晰 2048x2048 图像。
区域性优化: :许多高级 agentic 功能目前在阿里云/ModelScope 生态系统内支持得最好。

API快速入门

alibaba/qwen-image-2-0

查看文档
alibaba SDK
import { QwenAI } from '@alibaba/qwen-sdk';

const qwen = new QwenAI({
  apiKey: process.env.QWEN_API_KEY
});

async function generatePoster() {
  const response = await qwen.images.generate({
    model: "qwen-image-2.0",
    prompt: "A 2K professional infographic poster about AI evolution with detailed text labels and 3D icons.",
    size: "2048x2048"
  });
  console.log('Image URL:', response.data[0].url);
}

generatePoster();

安装SDK并在几分钟内开始进行API调用。

人们对 Qwen-Image-2.0 的评价

看看社区对 Qwen-Image-2.0 的看法

"Qwen-Image-2.0 将生成和编辑统一起来,使得通过一个 prompt 生成专业信息图表真正成为可能。"
Fahd Mirza
youtube
"与之前的版本相比,人像的写实感和英文文本的渲染简直绝妙。"
Sudo AI
youtube
"它在更换复杂的时尚服饰时保持了模特脸部的特征……高定时尚的魅力与工业级的精度完美融合。"
glenegrant
x/twitter
"对于使用 1k-token prompts 直接生成 PPT 和海报等专业信息图表,这个模型非常不可思议。"
Alibaba_Qwen
x/twitter
"Qwen-Image-2.0 发布了——具有原生 2K 和真实文本渲染能力的 7B 统一生成+编辑模型……这对社区来说是个好消息。"
LocalLLaMA
reddit
"2K 分辨率结合 1,000 token context,使其成为技术文档视觉效果的最佳 open-weight 模型。"
AIExplorer
hackernews

关于 Qwen-Image-2.0 的视频

观看关于 Qwen-Image-2.0 的教程、评测和讨论

在短短 6 个月内,Qwen 团队合并了他们两个独立的模型……形成了一个名为 Qwen Image 2 的统一系统。

双语排版非常完美。复杂的汉字和英文标题渲染得非常干净。

该模型成功创建了一个具有不同区域且排列整齐的专业多板块信息图。

这不仅是为了艺术;它也适用于文档和数据可视化,这对开源社区来说是一个巨大的进步。

70 亿参数的大小使其可以在高端消费级 GPU 上运行,考虑到 2K 的输出质量,这令人印象深刻。

它确实很好地遵循了 prompt 并在图片中实现了这些内容……极其写实且具有未来感。

他们在图像质量上做了巨大改进……不再有乱码的字母了。

该模型不仅准确地模拟了骑行动作,还细致地刻画了马的肌肉组织和毛发。

统一的编辑功能允许你仅通过自然语言描述来更改图像的特定部分。

它是少数能处理长达 1000 tokens 的 prompt 以实现极其精细场景的模型之一。

专业排版渲染:支持 1k-token 指令,直接生成专业信息图表。

原生 2K 分辨率支持,可呈现极其细腻的现实场景,包括人物、自然和建筑。

我们的下一代图像生成模型在单一架构中统一了 text-to-image 和 image-to-image 编辑。

在 DocVQA 和 ChartQA 等多模态 benchmark 中实现了 state-of-the-art 的性能。

该模型在为复杂的角色驱动型叙事保持身份和风格一致性方面表现卓越。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Qwen-Image-2.0专业提示

专家提示助您充分利用Qwen-Image-2.0。

利用超长 prompt

:发挥 1,000 tokens 的容量优势,定义布局或信息图的每个特定区域,以获得最大控制力。

指定书法风格

:请求特定字体,如“小楷”或“瘦金体”,以调用其独特的双语审美能力。

一步式编辑

:上传一张基础图像,并在同一个对话 session 中执行复杂修改,无需切换 model。

与 Qwen-Max 联动

:使用像 Qwen2.5-Max 这样的大型 language model 将简单的想法扩展为该 model 擅长处理的高度详细描述。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

关于Qwen-Image-2.0的常见问题

查找关于Qwen-Image-2.0的常见问题答案