alibaba

Qwen-Image-2.0

Qwen-Image-2.0 คือ model ขนาด 7B แบบครบวงจรจาก Alibaba สำหรับสร้างอินโฟกราฟิกมืออาชีพ, ภาพเสมือนจริง และการแก้ไขภาพที่แม่นยำ พร้อมรองรับความละเอียด 2K แบบ...

Multimodalการสร้างรูปภาพTypographyOpen WeightsAlibaba
alibaba logoalibabaQwenFebruary 10, 2026
บริบท
1Kโทเคน
เอาต์พุตสูงสุด
4Kโทเคน
ราคาอินพุต
$0.07/ 1M
ราคาเอาต์พุต
$0.07/ 1M
โหมด:TextImage
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่ง
เกณฑ์มาตรฐาน
GPQA
0%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
HLE
0%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
MMLU
0%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
MMLU Pro
0%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
SimpleQA
0%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
IFEval
0%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
AIME 2025
0%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
MATH
0%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
GSM8k
0%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
MGSM
0%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
MathVista
72%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Qwen-Image-2.0 ได้คะแนน 72% ในเกณฑ์มาตรฐานนี้
SWE-Bench
0%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
HumanEval
0%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
0%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
MMMU
77%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Qwen-Image-2.0 ได้คะแนน 77% ในเกณฑ์มาตรฐานนี้
MMMU Pro
58%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Qwen-Image-2.0 ได้คะแนน 58% ในเกณฑ์มาตรฐานนี้
ChartQA
86%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Qwen-Image-2.0 ได้คะแนน 86% ในเกณฑ์มาตรฐานนี้
DocVQA
94%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Qwen-Image-2.0 ได้คะแนน 94% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
0%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้
ARC-AGI
0%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Qwen-Image-2.0 ได้คะแนน 0% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ Qwen-Image-2.0

เรียนรู้เกี่ยวกับความสามารถของ Qwen-Image-2.0 คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

ขุมพลังด้านทัศนศิลป์แบบครบวงจร

Qwen-Image-2.0 คือการก้าวกระโดดครั้งสำคัญในด้าน multimodal AI จาก Alibaba Cloud ซึ่งแตกต่างจากรุ่นก่อนๆ ที่ต้องใช้ model แยกกันสำหรับการสร้างและการดัดแปลง สถาปัตยกรรม model ขนาด 7B parameter แบบครบวงจรนี้สามารถจัดการทั้งการสร้างภาพความคมชัดสูงและการแก้ไขระดับพิกเซลที่แม่นยำภายในเฟรมเวิร์กเดียว วิธีการที่คล่องตัวนี้ช่วยให้มั่นใจได้ถึงความสม่ำเสมอของสไตล์และการปฏิบัติตามความหมายของคำสั่งที่เหนือกว่าในงานด้านภาพที่หลากหลาย

Typography และเลย์เอาต์ระดับมืออาชีพ

model นี้ได้รับการออกแบบมาโดยเฉพาะเพื่อเอาชนะอุปสรรคที่ใหญ่ที่สุดอย่างหนึ่งในงานศิลปะ AI นั่นคือการเรนเดอร์ข้อความ ด้วยการรองรับคำสั่งที่ยาวเป็นพิเศษถึง 1,000 tokens ช่วยให้ผู้ใช้สามารถระบุเลย์เอาต์ที่ซับซ้อนสำหรับอินโฟกราฟิกมืออาชีพ แดชบอร์ดข้อมูล และสื่อการตลาดสองภาษา ด้วยการรองรับความละเอียด 2K แบบ native ผลลัพธ์ที่ได้จึงยังคงรายละเอียดระดับไมโคร ทำให้เหมาะสำหรับทั้งการแสดงผลดิจิทัลและสื่อสิ่งพิมพ์คุณภาพสูง

ความเข้าใจ Multimodal ระดับ State-of-the-Art

นอกเหนือจากการสร้างภาพแล้ว Qwen-Image-2.0 ยังมีความเป็นเลิศในด้านความเข้าใจ multimodal ด้วยการรวมการใช้ reasoning เชิงลึกเข้ากับการสังเคราะห์ภาพ ทำให้ได้รับคะแนนสูงสุดใน benchmark เช่น DocVQA (94) และ ChartQA (86) สิ่งนี้ทำให้มันเป็นเครื่องมือที่เหมาะสำหรับผู้ใช้ที่ต้องการแปลงข้อมูลข้อความที่ซับซ้อนให้เป็นการนำเสนอด้วยภาพที่มีโครงสร้าง หรือทำการแก้ไขภาพที่มีอยู่อย่างต่อเนื่องโดยใช้คำสั่งภาษาธรรมชาติ

Qwen-Image-2.0

กรณีการใช้งานสำหรับ Qwen-Image-2.0

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Qwen-Image-2.0 เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

อินโฟกราฟิกมืออาชีพ

สร้างรายงานทางการเงินและแผนภาพเทคนิคที่ซับซ้อน พร้อมป้ายกำกับข้อมูลที่แม่นยำและเลย์เอาต์ที่สะอาดตา

สื่อการตลาดสองภาษา

สร้างชิ้นงานสำหรับโซเชียลมีเดียด้วย Typography ภาษาอังกฤษและภาษาจีนที่ไร้ที่ติ พร้อมแสงเงาและมุมมองที่สมจริง

การ์ตูนหลายช่อง

ผลิตดีไซน์ตัวละครที่สม่ำเสมอในเลย์เอาต์การ์ตูนหลายช่อง พร้อมการวางบทสนทนาในฟองคำพูดอย่างแม่นยำ

การแก้ไขภาพที่มีความแม่นยำ

แก้ไขภาพถ่ายที่มีอยู่โดยการเพิ่มหรือลบวัตถุเฉพาะ หรือเปลี่ยนพื้นผิวโดยใช้คำสั่งภาษาธรรมชาติ

ภาพเสมือนจริงความคมชัดสูง

เรนเดอร์ภาพพอร์ตเทรตและฉากสถาปัตยกรรมที่มีรายละเอียดที่ความละเอียด 2K พร้อมพื้นผิวผิวหนังและมิติของวัสดุที่มองเห็นได้ชัดเจน

การสร้างสไลด์นำเสนอ

แปลงข้อความยาวๆ เป็นสไลด์สไตล์ PPT ระดับมืออาชีพพร้อมไอคอนและแผนภูมิในตัวโดยตรง

จุดแข็ง

ข้อจำกัด

Typography ระดับมืออาชีพ: ยอดเยี่ยมในการเรนเดอร์ข้อความสองภาษาที่ยาวและซับซ้อน รวมถึงเลย์เอาต์แบบซ้อนกันโดยไม่มีข้อผิดพลาดในการสะกด
อคติทางภาษา: แม้จะเป็นสองภาษา แต่ความละเอียดอ่อนทางวัฒนธรรมและการเขียนพู่กันนั้นได้รับการปรับแต่งให้ลึกซึ้งที่สุดสำหรับสไตล์ศิลปะจีน
สถาปัตยกรรม Gen-Edit แบบครบวงจร: model ขนาด 7B ตัวเดียวจัดการทั้งการสร้างและการดัดแปลง เพื่อให้แน่ใจว่าความสม่ำเสมอของภาพในทุกงาน
การใช้ VRAM สูง: การสร้างภาพ 2K แบบ native ในเครื่อง (local) ต้องใช้หน่วยความจำมากกว่า model มาตรฐาน 1024x1024 อย่างมาก
ความแม่นยำของเอกสารสูง: ครองตำแหน่งสูงสุดใน benchmark ด้านเอกสารด้วยคะแนน 94 ใน DocVQA และ 86 ใน ChartQA
ข้อผิดพลาดทางตัวเลข: ตารางตัวเลขที่ซับซ้อนภายในเลย์เอาต์อินโฟกราฟิกแบบซ้อนกันยังคงอาจแสดงปัญหาการจัดตำแหน่งเล็กน้อยในบางครั้ง
ความละเอียด 2K แบบ Native: ผลิตภาพขนาด 2048x2048 ที่คมชัดเป็นพิเศษ พร้อมการจัดแสงระดับมืออาชีพและรายละเอียดทางสถาปัตยกรรมระดับไมโคร
การปรับแต่งระดับภูมิภาค: ฟีเจอร์ agentic ขั้นสูงหลายอย่างในปัจจุบันได้รับการสนับสนุนดีที่สุดภายในระบบนิเวศของ Alibaba Cloud/ModelScope

เริ่มต้นด่วน API

alibaba/qwen-image-2-0

ดูเอกสาร
alibaba SDK
import { QwenAI } from '@alibaba/qwen-sdk';

const qwen = new QwenAI({
  apiKey: process.env.QWEN_API_KEY
});

async function generatePoster() {
  const response = await qwen.images.generate({
    model: "qwen-image-2.0",
    prompt: "A 2K professional infographic poster about AI evolution with detailed text labels and 3D icons.",
    size: "2048x2048"
  });
  console.log('Image URL:', response.data[0].url);
}

generatePoster();

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Qwen-Image-2.0

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Qwen-Image-2.0

"Qwen-Image-2.0 รวมการสร้างและการแก้ไขเข้าด้วยกันในแบบที่ทำให้การสร้างอินโฟกราฟิกแบบมืออาชีพเป็นไปได้จริงด้วย prompt เดียว"
Fahd Mirza
youtube
"ภาพเสมือนจริงในรูปร่างมนุษย์และการเรนเดอร์ข้อความภาษาอังกฤษนั้นยอดเยี่ยมมากเมื่อเทียบกับเวอร์ชันก่อนหน้า"
Sudo AI
youtube
"มันรักษาใบหน้าของนางแบบให้เหมือนจริงในขณะที่เปลี่ยนชุดที่มีสไตล์ซับซ้อน... ความหรูหราของแฟชั่นระดับสูงพบกับความแม่นยำระดับอุตสาหกรรม"
glenegrant
x/twitter
"model นี้ยอดเยี่ยมมากสำหรับการสร้างอินโฟกราฟิกมืออาชีพอย่าง PPT และโปสเตอร์โดยตรงด้วย prompt 1k-token"
Alibaba_Qwen
x/twitter
"Qwen-Image-2.0 มาแล้ว - model 7B แบบรวมการสร้าง+แก้ไข พร้อม 2K native และการเรนเดอร์ข้อความที่ใช้งานได้จริง... ข่าวดีสำหรับชุมชน"
LocalLLaMA
reddit
"ความละเอียด 2K รวมกับ context 1,000 token ทำให้เป็น model แบบ open-weight ที่ดีที่สุดสำหรับภาพประกอบเอกสารทางเทคนิค"
AIExplorer
hackernews

วิดีโอเกี่ยวกับ Qwen-Image-2.0

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Qwen-Image-2.0

ภายในเวลาเพียง 6 เดือน ทีม Qwen ได้รวมสอง model ที่แยกจากกัน... เข้าสู่ระบบเดียวที่เรียกว่า Qwen Image 2

Typography สองภาษานั้นสมบูรณ์แบบระดับพิกเซล ตัวอักษรจีนที่ซับซ้อนและหัวข้อภาษาอังกฤษถูกเรนเดอร์ออกมาอย่างสะอาดตา

model ประสบความสำเร็จในการสร้างอินโฟกราฟิกมืออาชีพแบบหลายส่วนพร้อมโซนที่แยกชัดเจน... ทั้งหมดถูกจัดวางอย่างเหมาะสม

นี่ไม่ใช่แค่สำหรับงานศิลปะ แต่มันสำหรับเอกสารและการแสดงข้อมูลซึ่งเป็นก้าวสำคัญสำหรับชุมชน open weight

ขนาด 7 พันล้าน parameter ทำให้เข้าถึงได้สำหรับ GPU ระดับผู้บริโภคทั่วไป ซึ่งน่าทึ่งมากเมื่อพิจารณาจากคุณภาพผลลัพธ์ระดับ 2K

มันทำตาม prompt ได้อย่างถูกต้องและนำไปใช้ในรูปภาพได้อย่างเหมาะสม... สมจริงเป็นพิเศษและล้ำยุค

พวกเขาได้ปรับปรุงคุณภาพของภาพอย่างมาก... ไม่มีตัวอักษรที่ผิดเพี้ยนอีกต่อไป

model นี้ไม่เพียงแต่จำลองท่าทางการขี่ได้อย่างแม่นยำ แต่ยังเรนเดอร์กล้ามเนื้อและขนของม้าได้อย่างละเอียดละออ

ฟีเจอร์การแก้ไขแบบครบวงจรช่วยให้คุณเปลี่ยนส่วนเฉพาะของรูปภาพได้โดยใช้เพียงคำอธิบายภาษาธรรมชาติ

มันเป็นหนึ่งในไม่กี่ model ที่สามารถจัดการ prompt ที่ยาวได้ถึง 1,000 tokens สำหรับฉากที่มีรายละเอียดเหลือเชื่อ

การเรนเดอร์ Typography ระดับมืออาชีพ: รองรับคำสั่ง 1k-token สำหรับการสร้างอินโฟกราฟิกมืออาชีพโดยตรง

รองรับความละเอียด 2K แบบ native สำหรับฉากเสมือนจริงที่มีรายละเอียดประณีต ทั้งผู้คน ธรรมชาติ และสถาปัตยกรรม

model การสร้างรูปภาพยุคใหม่ของเรารวม text-to-image และ image-to-image editing ไว้ในสถาปัตยกรรมเดียว

บรรลุประสิทธิภาพระดับ state-of-the-art ใน multimodal benchmark ต่างๆ เช่น DocVQA และ ChartQA

model มีความเป็นเลิศในการรักษาเอกลักษณ์และความสม่ำเสมอของสไตล์สำหรับการเล่าเรื่องผ่านตัวละครที่ซับซ้อน

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ Qwen-Image-2.0

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Qwen-Image-2.0 และได้ผลลัพธ์ที่ดีขึ้น

ใช้ Ultra-Long Prompts

ใช้ประโยชน์จากความจุ 1,000 tokens เพื่อกำหนดทุกโซนของเลย์เอาต์หรืออินโฟกราฟิกเพื่อให้ได้การควบคุมสูงสุด

ระบุสไตล์การเขียนพู่กัน

ระบุฟอนต์เฉพาะ เช่น 'Small Regular Script' หรือ 'Slender Gold' เพื่อเข้าถึงความสามารถด้านสุนทรียศาสตร์แบบสองภาษาที่ไม่เหมือนใคร

การแก้ไขในขั้นตอนเดียว

อัปโหลดรูปภาพต้นฉบับและใช้ chat session เดียวกันเพื่อทำการแก้ไขที่ซับซ้อนโดยไม่ต้องสลับ model

เชื่อมต่อกับ Qwen-Max

ใช้ LLM ขนาดใหญ่อย่าง Qwen2.5-Max เพื่อขยายไอเดียง่ายๆ ให้กลายเป็นคำอธิบายที่มีรายละเอียดสูงซึ่ง model นี้ถนัด

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

คำถามที่พบบ่อยเกี่ยวกับ Qwen-Image-2.0

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Qwen-Image-2.0