alibaba

Qwen-Image-2.0

Qwen-Image-2.0 là model 7B hợp nhất của Alibaba dành cho infographics chuyên nghiệp, photorealism và chỉnh sửa hình ảnh chính xác với độ phân giải 2K gốc và hỗ...

MultimodalTạo hình ảnhTypographyOpen WeightsAlibaba
alibaba logoalibabaQwen10 tháng 2, 2026
Ngu canh
1Ktoken
Dau ra toi da
4Ktoken
Gia dau vao
$0.07/ 1M
Gia dau ra
$0.07/ 1M
Phuong thuc:TextImage
Kha nang:Thi giacCong cuTruyen truc tiep
Diem chuan
GPQA
0%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Qwen-Image-2.0 dat 0% trong benchmark nay.
HLE
0%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Qwen-Image-2.0 dat 0% trong benchmark nay.
MMLU
0%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Qwen-Image-2.0 dat 0% trong benchmark nay.
MMLU Pro
0%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Qwen-Image-2.0 dat 0% trong benchmark nay.
SimpleQA
0%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Qwen-Image-2.0 dat 0% trong benchmark nay.
IFEval
0%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Qwen-Image-2.0 dat 0% trong benchmark nay.
AIME 2025
0%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Qwen-Image-2.0 dat 0% trong benchmark nay.
MATH
0%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Qwen-Image-2.0 dat 0% trong benchmark nay.
GSM8k
0%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Qwen-Image-2.0 dat 0% trong benchmark nay.
MGSM
0%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Qwen-Image-2.0 dat 0% trong benchmark nay.
MathVista
72%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Qwen-Image-2.0 dat 72% trong benchmark nay.
SWE-Bench
0%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Qwen-Image-2.0 dat 0% trong benchmark nay.
HumanEval
0%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Qwen-Image-2.0 dat 0% trong benchmark nay.
LiveCodeBench
0%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Qwen-Image-2.0 dat 0% trong benchmark nay.
MMMU
77%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Qwen-Image-2.0 dat 77% trong benchmark nay.
MMMU Pro
58%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Qwen-Image-2.0 dat 58% trong benchmark nay.
ChartQA
86%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Qwen-Image-2.0 dat 86% trong benchmark nay.
DocVQA
94%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Qwen-Image-2.0 dat 94% trong benchmark nay.
Terminal-Bench
0%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Qwen-Image-2.0 dat 0% trong benchmark nay.
ARC-AGI
0%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Qwen-Image-2.0 dat 0% trong benchmark nay.

Ve Qwen-Image-2.0

Tim hieu ve kha nang cua Qwen-Image-2.0, tinh nang va cach no co the giup ban dat ket qua tot hon.

Một trung tâm sức mạnh thị giác hợp nhất

Qwen-Image-2.0 đại diện cho một bước tiến đáng kể trong AI multimodal từ Alibaba Cloud. Không giống như các phiên bản trước đây yêu cầu các model riêng biệt để tạo và sửa đổi, kiến trúc 7B parameters hợp nhất này xử lý cả việc tạo hình ảnh độ trung thực cao và chỉnh sửa chính xác ở cấp độ pixel trong một framework duy nhất. Cách tiếp cận tinh gọn này đảm bảo tính nhất quán về phong cách và khả năng tuân thủ ngữ nghĩa vượt trội trên một loạt các tác vụ thị giác.

Typography và bố cục cấp độ chuyên nghiệp

Model này được thiết kế đặc biệt để vượt qua một trong những rào cản lớn nhất trong nghệ thuật AI: render văn bản. Hỗ trợ các chỉ dẫn siêu dài lên đến 1,000 tokens, nó cho phép người dùng chỉ định các bố cục phức tạp cho infographics chuyên nghiệp, bảng điều khiển dữ liệu và các tài liệu marketing song ngữ. Với hỗ trợ độ phân giải 2K gốc, đầu ra duy trì được các chi tiết vi mô, phù hợp cho cả hiển thị kỹ thuật số và các phương tiện in ấn chất lượng cao.

Khả năng hiểu Multimodal State-of-the-art

Ngoài khả năng tạo, Qwen-Image-2.0 còn xuất sắc trong việc thấu hiểu multimodal. Bằng cách tích hợp deep reasoning với tổng hợp thị giác, nó đạt được điểm số hàng đầu trên các benchmark như DocVQA (94)ChartQA (86). Điều này biến nó thành một công cụ lý tưởng cho những người dùng cần chuyển đổi dữ liệu văn bản phức tạp thành các biểu diễn trực quan có cấu trúc hoặc thực hiện các chỉnh sửa lặp lại trên hình ảnh hiện có bằng các câu lệnh ngôn ngữ tự nhiên.

Qwen-Image-2.0

Truong hop su dung cho Qwen-Image-2.0

Kham pha cac cach khac nhau ban co the su dung Qwen-Image-2.0 de dat ket qua tuyet voi.

Infographics chuyên nghiệp

Tạo các báo cáo tài chính và sơ đồ kỹ thuật phức tạp với các nhãn dữ liệu chính xác và bố cục gọn gàng.

Tài liệu Marketing song ngữ

Tạo các tài sản truyền thông xã hội với typography tiếng Anh và tiếng Trung hoàn hảo, tôn trọng ánh sáng và phối cảnh.

Truyện tranh đa khung hình

Sản xuất các thiết kế nhân vật nhất quán qua các bố cục truyện tranh nhiều ô với lời thoại được đặt chính xác trong bong bóng thoại.

Chỉnh sửa hình ảnh chính xác

Sửa đổi các ảnh có sẵn bằng cách thêm hoặc xóa các đối tượng cụ thể hoặc thay đổi kết cấu bằng các chỉ dẫn ngôn ngữ tự nhiên.

Photorealism độ trung thực cao

Render các bức chân dung chi tiết và cảnh kiến trúc ở độ phân giải 2K với kết cấu da và chiều sâu vật liệu rõ nét.

Tạo slide thuyết trình

Chuyển đổi trực tiếp văn bản dài thành các slide phong cách PPT chuyên nghiệp với các biểu tượng và biểu đồ tích hợp.

Diem manh

Han che

Typography chuyên nghiệp: Đặc biệt xuất sắc trong việc render văn bản song ngữ dài, phức tạp và các bố cục lồng nhau mà không gặp lỗi chính tả.
Thiên kiến ngôn ngữ: Mặc dù là song ngữ, các sắc thái văn hóa và thư pháp của nó được tinh chỉnh sâu sắc nhất cho các phong cách nghệ thuật Trung Hoa.
Kiến trúc Gen-Edit hợp nhất: Một model 7B duy nhất xử lý cả việc tạo và điều chỉnh, đảm bảo tính nhất quán về thị giác trong mọi tác vụ.
Cường độ VRAM: Việc tạo hình ảnh 2K gốc tại chỗ yêu cầu bộ nhớ nhiều hơn đáng kể so với các model 1024x1024 tiêu chuẩn.
Độ chính xác tài liệu cao: Thống trị các benchmark liên quan đến tài liệu với số điểm 94 trên DocVQA và 86 trên ChartQA.
Lỗi dữ liệu số: Các bảng số phức tạp trong bố cục infographics lồng nhau đôi khi vẫn có thể hiển thị các vấn đề căn chỉnh nhỏ.
Độ phân giải 2K gốc: Tạo ra hình ảnh 2048x2048 siêu sắc nét với ánh sáng chuyên nghiệp và các chi tiết kiến trúc vi mô.
Tối ưu hóa khu vực: Nhiều tính năng agentic nâng cao hiện đang được hỗ trợ tốt nhất trong hệ sinh thái Alibaba Cloud/ModelScope.

Bat dau nhanh API

alibaba/qwen-image-2-0

Xem tai lieu
alibaba SDK
import { QwenAI } from '@alibaba/qwen-sdk';

const qwen = new QwenAI({
  apiKey: process.env.QWEN_API_KEY
});

async function generatePoster() {
  const response = await qwen.images.generate({
    model: "qwen-image-2.0",
    prompt: "A 2K professional infographic poster about AI evolution with detailed text labels and 3D icons.",
    size: "2048x2048"
  });
  console.log('Image URL:', response.data[0].url);
}

generatePoster();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Qwen-Image-2.0

Xem cong dong nghi gi ve Qwen-Image-2.0

"Qwen-Image-2.0 hợp nhất việc tạo và chỉnh sửa theo cách khiến các infographics chuyên nghiệp thực sự khả thi chỉ với một prompt."
Fahd Mirza
youtube
"Photorealism ở hình dáng con người và khả năng render văn bản tiếng Anh đơn giản là tuyệt vời so với phiên bản trước."
Sudo AI
youtube
"Nó giữ nguyên khuôn mặt của model trong khi thay đổi các bộ trang phục phong cách phức tạp... sự sang trọng của thời trang cao cấp gặp gỡ độ chính xác công nghiệp."
glenegrant
x/twitter
"Model này thật đáng kinh ngạc để tạo trực tiếp các infographics chuyên nghiệp như PPT và poster với các prompt 1k-token."
Alibaba_Qwen
x/twitter
"Qwen-Image-2.0 đã ra mắt - model 7B hợp nhất tạo+sửa với 2K gốc và khả năng render văn bản thực thụ... tin tuyệt vời cho cộng đồng."
LocalLLaMA
reddit
"Độ phân giải 2K kết hợp với context 1,000 token khiến đây trở thành model open-weight tốt nhất cho hình ảnh tài liệu kỹ thuật."
AIExplorer
hackernews

Video ve Qwen-Image-2.0

Xem huong dan, danh gia va thao luan ve Qwen-Image-2.0

Chỉ trong vòng 6 tháng, đội ngũ Qwen đã hợp nhất hai model riêng biệt của họ... thành một hệ thống thống nhất duy nhất gọi là Qwen Image 2.

Typography song ngữ đạt đến độ hoàn hảo từng pixel. Các ký tự tiếng Trung phức tạp và tiêu đề tiếng Anh được render sạch sẽ.

Model đã tạo thành công một infographic chuyên nghiệp nhiều phần với các khu vực riêng biệt... tất cả đều được căn chỉnh hợp lý.

Đây không chỉ là nghệ thuật; nó dành cho tài liệu và trực quan hóa dữ liệu, đây là một bước tiến lớn cho cộng đồng open weight.

Kích thước 7 tỷ parameters giúp nó có thể tiếp cận được với các GPU người dùng cao cấp, điều này thật ấn tượng xét đến chất lượng đầu ra 2K.

Nó thực sự đã tuân thủ prompt một cách chính xác và triển khai điều này vào trong bức ảnh... cực kỳ thực tế và mang tính tương lai.

Họ đã thực hiện một cải tiến lớn về chất lượng hình ảnh... không còn những chữ cái bị lỗi nữa.

Model này mô phỏng chính xác hành động cưỡi ngựa nhưng cũng render tỉ mỉ cơ bắp và bờm ngựa.

Tính năng chỉnh sửa hợp nhất cho phép bạn thay đổi các phần cụ thể của hình ảnh chỉ bằng mô tả ngôn ngữ tự nhiên.

Đây là một trong số ít các model có thể xử lý các prompt dài như vậy, lên đến 1000 tokens, cho các khung cảnh cực kỳ chi tiết.

Render typography chuyên nghiệp: Hỗ trợ chỉ dẫn 1k-token để tạo trực tiếp các infographics chuyên nghiệp.

Hỗ trợ độ phân giải 2K gốc cho các cảnh thực tế chi tiết, bao gồm con người, thiên nhiên và kiến trúc.

Model tạo hình ảnh thế hệ tiếp theo của chúng tôi hợp nhất text-to-image và chỉnh sửa image-to-image trong một kiến trúc duy nhất.

Đạt được hiệu suất state-of-the-art trên các benchmark multimodal như DocVQA và ChartQA.

Model xuất sắc trong việc duy trì tính nhất quán về danh tính và phong cách cho các câu chuyện kể dựa trên nhân vật phức tạp.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Qwen-Image-2.0

Meo chuyen gia giup ban tan dung toi da Qwen-Image-2.0 va dat ket qua tot hon.

Tận dụng Prompt siêu dài

Sử dụng khả năng 1,000-token để xác định chi tiết từng khu vực cụ thể của bố cục hoặc infographics nhằm đạt được sự kiểm soát tối đa.

Chỉ định phong cách thư pháp

Yêu cầu các phông chữ cụ thể như 'Tiểu Khải' hoặc 'Sấu Kim' để truy cập vào các khả năng thẩm mỹ song ngữ độc đáo.

Chỉnh sửa một bước

Tải lên một hình ảnh gốc và sử dụng cùng một phiên chat để thực hiện các thay đổi phức tạp mà không cần chuyển đổi model.

Kết hợp với Qwen-Max

Sử dụng một LLM lớn như Qwen2.5-Max để mở rộng các ý tưởng đơn giản thành các mô tả chi tiết mà model này có thể phát huy tối đa sức mạnh.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

Cau hoi thuong gap ve Qwen-Image-2.0

Tim cau tra loi cho cac cau hoi thuong gap ve Qwen-Image-2.0