alibaba

Qwen-Image-2.0

Qwen-Image-2.0, Alibaba'nın profesyonel infografikler, fotorealizm ve yerel 2K çözünürlük ile 1k-token prompt desteğine sahip hassas görsel düzenleme için...

MultimodalGörsel OluşturmaTipografiOpen WeightsAlibaba
alibaba logoalibabaQwenFebruary 10, 2026
Bağlam
1Ktoken
Maks. çıktı
4Ktoken
Giriş fiyatı
$0.07/ 1M
Çıkış fiyatı
$0.07/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkış
Benchmarks
GPQA
0%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
HLE
0%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
MMLU
0%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
MMLU Pro
0%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
SimpleQA
0%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
IFEval
0%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
AIME 2025
0%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
MATH
0%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
GSM8k
0%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
MGSM
0%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
MathVista
72%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Qwen-Image-2.0 bu benchmark'ta 72% puan aldı.
SWE-Bench
0%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
HumanEval
0%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
LiveCodeBench
0%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
MMMU
77%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Qwen-Image-2.0 bu benchmark'ta 77% puan aldı.
MMMU Pro
58%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Qwen-Image-2.0 bu benchmark'ta 58% puan aldı.
ChartQA
86%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Qwen-Image-2.0 bu benchmark'ta 86% puan aldı.
DocVQA
94%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Qwen-Image-2.0 bu benchmark'ta 94% puan aldı.
Terminal-Bench
0%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.
ARC-AGI
0%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Qwen-Image-2.0 bu benchmark'ta 0% puan aldı.

Qwen-Image-2.0 Hakkında

Qwen-Image-2.0'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Birleşik Bir Görsel Güç Merkezi

Qwen-Image-2.0, Alibaba Cloud'un multimodal AI alanındaki en önemli adımlarından birini temsil ediyor. Oluşturma ve düzenleme için ayrı modeller gerektiren önceki sürümlerin aksine, bu birleşik 7B parameters mimarisi, hem yüksek kaliteli görsel oluşturmayı hem de hassas piksel düzeyinde düzenlemeyi tek bir çerçeve içinde yönetir. Bu aerodinamik yaklaşım, geniş bir görsel görev yelpazesinde stil tutarlılığı ve üstün semantik bağlılık sağlar.

Profesyonel Düzeyde Tipografi ve Düzenler

model, AI sanatındaki en büyük engellerden biri olan metin oluşturma sorununu aşmak için özel olarak tasarlanmıştır. 1.000 token'a kadar ultra uzun talimatları destekleyerek kullanıcıların profesyonel infografikler, veri panelleri ve çift dilli pazarlama materyalleri için karmaşık düzenler belirlemesine olanak tanır. Yerel 2K çözünürlük desteği ile çıktılar mikroskobik detayları korur, bu da onu hem dijital ekranlar hem de yüksek kaliteli basılı materyaller için uygun hale getirir.

State-of-the-Art Multimodal Anlama

Görsel oluşturmanın ötesinde, Qwen-Image-2.0 multimodal kavrama yeteneğinde de öne çıkar. Derin reasoning yeteneğini görsel sentezle birleştirerek, DocVQA (94) ve ChartQA (86) gibi benchmark testlerinde en üst düzey puanları elde eder. Bu özellikler, karmaşık metinsel verileri yapılandırılmış görsel temsillere dönüştürmesi gereken veya doğal dil komutlarını kullanarak mevcut görseller üzerinde yinelemeli düzenlemeler yapmak isteyen kullanıcılar için ideal bir araç haline getirir.

Qwen-Image-2.0

Qwen-Image-2.0 için Kullanım Alanları

Harika sonuçlar elde etmek için Qwen-Image-2.0'i kullanmanın farklı yollarını keşfedin.

Profesyonel İnfografikler

Doğru veri etiketleri ve temiz düzenlerle karmaşık finansal raporlar ve teknik şemalar oluşturun.

Çift Dilli Pazarlama Materyalleri

Işığa ve perspektife sadık, kusursuz İngilizce ve Çince tipografiye sahip sosyal medya içerikleri üretin.

Çok Panelli Çizgi Romanlar

Konuşma balonlarına hassas bir şekilde yerleştirilmiş diyaloglarla, çok panelli çizgi roman düzenlerinde tutarlı karakter tasarımları yapın.

Hassas Görsel Düzenleme

Doğal dil talimatlarını kullanarak belirli nesneleri ekleyip çıkararak veya dokuları değiştirerek mevcut fotoğrafları düzenleyin.

Yüksek Kaliteli Fotorealizm

Görünür cilt dokuları ve materyal derinliği ile 2K çözünürlükte ayrıntılı portreler ve mimari sahneler oluşturun.

Slayt Sunumu Oluşturma

Uzun metinleri, entegre simgeler ve grafiklerle profesyonel PPT tarzı slaytlara doğrudan dönüştürün.

Güçlü Yönler

Sınırlamalar

Profesyonel Tipografi: Uzun ve karmaşık çift dilli metinleri ve iç içe geçmiş düzenleri yazım hatası olmadan oluşturmada olağanüstüdür.
Dil Yanlılığı: Çift dilli olsa da, kültürel ve kaligrafik nüansları en çok Çin sanatsal stilleri için rafine edilmiştir.
Birleşik Gen-Edit Mimarisi: Tek bir 7B model hem oluşturma hem de düzenleme işlemlerini yürüterek görevler arasında görsel tutarlılık sağlar.
VRAM Yoğunluğu: Yerel olarak 2K görseller oluşturmak, standart 1024x1024 modellerinden önemli ölçüde daha fazla bellek gerektirir.
Yüksek Belge Doğruluğu: DocVQA'da 94 ve ChartQA'da 86 puanla belgeyle ilgili benchmark testlerinde lider konumdadır.
Sayısal Hatalar: İç içe geçmiş infografik düzenlerindeki karmaşık sayısal tablolar hala zaman zaman küçük hizalama sorunları gösterebilir.
Yerel 2K Kalitesi: Profesyonel ışıklandırma ve mikroskobik mimari detaylarla ultra keskin 2048x2048 görseller üretir.
Bölgesel Optimizasyon: Gelişmiş agentic özelliklerin çoğu şu anda en iyi Alibaba Cloud/ModelScope ekosisteminde desteklenmektedir.

API Hızlı Başlangıç

alibaba/qwen-image-2-0

Belgeleri Görüntüle
alibaba SDK
import { QwenAI } from '@alibaba/qwen-sdk';

const qwen = new QwenAI({
  apiKey: process.env.QWEN_API_KEY
});

async function generatePoster() {
  const response = await qwen.images.generate({
    model: "qwen-image-2.0",
    prompt: "A 2K professional infographic poster about AI evolution with detailed text labels and 3D icons.",
    size: "2048x2048"
  });
  console.log('Image URL:', response.data[0].url);
}

generatePoster();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Qwen-Image-2.0 Hakkında Ne Diyor

Topluluğun Qwen-Image-2.0 hakkında ne düşündüğünü görün

"Qwen-Image-2.0, oluşturma ve düzenlemeyi öyle bir şekilde birleştiriyor ki tek bir prompt ile profesyonel infografikler hazırlamak gerçekten mümkün hale geliyor."
Fahd Mirza
youtube
"İnsan formlarındaki fotorealizm ve İngilizce metin oluşturma, önceki sürüme kıyasla kesinlikle muazzam."
Sudo AI
youtube
"model, yüz hatlarını gerçeğe uygun tutarken karmaşık tarzdaki kıyafetleri değiştirmeyi başardı... yüksek moda görkemi endüstriyel hassasiyetle buluşuyor."
glenegrant
x/twitter
"Bu model, 1k-token prompt'lar ile PPT'ler ve posterler gibi profesyonel infografiklerin doğrudan oluşturulması için inanılmaz."
Alibaba_Qwen
x/twitter
"Qwen-Image-2.0 çıktı - yerel 2K ve gerçek metin oluşturma yeteneğine sahip 7B birleşik gen+edit modeli... topluluk için harika bir haber."
LocalLLaMA
reddit
"2K çözünürlük ve 1.000 token context window birleşimi, bunu teknik dokümantasyon görselleri için en iyi open-weight model yapıyor."
AIExplorer
hackernews

Qwen-Image-2.0 Hakkında Videolar

Qwen-Image-2.0 hakkında eğitimler, incelemeler ve tartışmalar izleyin

Sadece 6 ay içinde Qwen ekibi iki ayrı modelini... Qwen Image 2 adı verilen tek bir birleşik sistemde birleştirdi.

Çift dilli tipografi piksel düzeyinde mükemmel. Karmaşık Çince karakterler ve İngilizce başlıklar tertemiz görünüyor.

model, tümü düzgün şekilde hizalanmış, belirgin bölgelere sahip profesyonel, çok bölümlü bir infografik oluşturmayı başardı.

Bu sadece sanat için değil; belgeler ve veri görselleştirme için de kullanılabiliyor, bu da open weights topluluğu için büyük bir adım.

7 milyar parametre boyutu, 2K çıktı kalitesi göz önüne alındığında etkileyici bir şekilde üst düzey tüketici GPU'ları için erişilebilir kılıyor.

prompt'u gerçekten düzgün bir şekilde takip etmiş ve bunu resmin içine başarıyla uygulamış... hiper gerçekçi ve fütüristik.

Görsel kalitesinde büyük bir gelişme kaydetmişler... artık hatalı harfler yok.

Bu model sürüş aksiyonunu doğru bir şekilde modellerken aynı zamanda atın kas yapısını ve tüylerini titizlikle işliyor.

Birleşik düzenleme özelliği, sadece doğal dilde bir açıklama kullanarak görselin belirli kısımlarını değiştirmenize olanak tanıyor.

İnanılmaz derecede ayrıntılı sahneler için 1000 token'a kadar bu kadar uzun prompt'ları işleyebilen nadir modellerden biri.

Profesyonel tipografi oluşturma: Profesyonel infografiklerin doğrudan üretimi için 1k-token talimatlarını destekler.

İnsanlar, doğa ve mimari dahil olmak üzere ince ayrıntılara sahip gerçekçi sahneler için yerel 2K çözünürlük desteği.

Yeni nesil görsel oluşturma modelimiz, metinden görsele ve görselden görsele düzenlemeyi tek bir mimaride birleştiriyor.

DocVQA ve ChartQA gibi multimodal benchmark testlerinde state-of-the-art performans sergiliyor.

model, karmaşık karakter odaklı hikaye anlatımı için kimlik ve stil tutarlılığını korumada mükemmeldir.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Qwen-Image-2.0 için Pro İpuçları

Qwen-Image-2.0'den en iyi şekilde yararlanmak için uzman ipuçları.

Ultra Uzun Prompt Kullanın

Bir düzenin veya infografiğin her bir bölgesini tanımlayarak maksimum kontrol sağlamak için 1.000 token kapasitesinden yararlanın.

Kaligrafi Stillerini Belirtin

Benzersiz çift dilli estetik yeteneklere erişmek için 'Küçük Standart Yazı' veya 'İnce Altın' gibi belirli yazı tiplerini talep edin.

Tek Adımda Düzenleme

model değiştirmeye gerek kalmadan karmaşık düzenlemeler yapmak için bir temel görsel yükleyin ve aynı sohbet oturumunu kullanın.

Qwen-Max ile Zincirleme Yapın

Basit fikirleri, bu modelin en iyi performans gösterdiği yüksek detaylı açıklamalara dönüştürmek için Qwen2.5-Max gibi bir LLM kullanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

Qwen-Image-2.0 Hakkında Sık Sorulan Sorular

Qwen-Image-2.0 hakkında sık sorulan soruların cevaplarını bulun