alibaba

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview, 1M context, yerel thinking mode ve agentic kodlama ile reasoning alanında SOTA skorlara sahip Alibaba'nın flagship MoE modelidir.

MoEAgentic Coding1M ContextFrontier ModelAlibaba Qwen
alibaba logoalibabaQwen 3.620 Nisan 2026
Bağlam
1.0Mtoken
Maks. çıktı
8Ktoken
Giriş fiyatı
$1.25/ 1M
Çıkış fiyatı
$10.00/ 1M
Modalite:TextImageVideo
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
86%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). Qwen3.6-Max-Preview bu benchmark'ta 86% puan aldı.
HLE
51%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. Qwen3.6-Max-Preview bu benchmark'ta 51% puan aldı.
MMLU
83%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. Qwen3.6-Max-Preview bu benchmark'ta 83% puan aldı.
MMLU Pro
79%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. Qwen3.6-Max-Preview bu benchmark'ta 79% puan aldı.
SimpleQA
52%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. Qwen3.6-Max-Preview bu benchmark'ta 52% puan aldı.
IFEval
75%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. Qwen3.6-Max-Preview bu benchmark'ta 75% puan aldı.
AIME 2025
93%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. Qwen3.6-Max-Preview bu benchmark'ta 93% puan aldı.
MATH
95%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. Qwen3.6-Max-Preview bu benchmark'ta 95% puan aldı.
GSM8k
98%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. Qwen3.6-Max-Preview bu benchmark'ta 98% puan aldı.
MGSM
92%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. Qwen3.6-Max-Preview bu benchmark'ta 92% puan aldı.
MathVista
86%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. Qwen3.6-Max-Preview bu benchmark'ta 86% puan aldı.
SWE-Bench
73%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. Qwen3.6-Max-Preview bu benchmark'ta 73% puan aldı.
HumanEval
91%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. Qwen3.6-Max-Preview bu benchmark'ta 91% puan aldı.
LiveCodeBench
79%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. Qwen3.6-Max-Preview bu benchmark'ta 79% puan aldı.
MMMU
82%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. Qwen3.6-Max-Preview bu benchmark'ta 82% puan aldı.
MMMU Pro
75%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. Qwen3.6-Max-Preview bu benchmark'ta 75% puan aldı.
ChartQA
85%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. Qwen3.6-Max-Preview bu benchmark'ta 85% puan aldı.
DocVQA
89%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. Qwen3.6-Max-Preview bu benchmark'ta 89% puan aldı.
Terminal-Bench
65%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. Qwen3.6-Max-Preview bu benchmark'ta 65% puan aldı.
ARC-AGI
14%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. Qwen3.6-Max-Preview bu benchmark'ta 14% puan aldı.

Qwen3.6-Max-Preview Hakkında

Qwen3.6-Max-Preview'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Qwen3.6-Max-Preview, Alibaba'nın yüksek performanslı yapay zeka serisindeki bir sonraki adımı temsil eden flagship proprietary LLM'dir. Seyrek (sparse) Mixture-of-Experts (MoE) mimarisinden yararlanan model, önemli operasyonel verimliliği korurken trilyon parametreli sistemlerin reasoning derinliğine ulaşır. Özellikle agentic kodlama, dünya bilgisi ve karmaşık talimat takibi için optimize edilmiştir.

Modelin en dikkat çekici özelliği, sistemin nihai yanıtını vermeden önce görünür bir iç chain-of-thought oluşturmasına olanak tanıyan yerel Thinking Mode özelliğidir. Bu şeffaflık, mantıksal planlama ve hata düzeltme adımlarına net bir bakış sağladığı için otonom agent'lar geliştiren yazılımcılar için oldukça değerlidir. 1 milyon token'lık devasa context window ile birleştiğinde model, tüm proje depolarını veya kapsamlı dokümantasyon kütüphanelerini tek seferde işleyebilir.

Alibaba Cloud Model Studio üzerinde barındırılan Qwen3.6-Max-Preview, endüstri standardı protokolleri destekler ve OpenAI tarzı API spesifikasyonları ile uyumludur. Multimodal veri analizi ve sağlam agentic iş akışları için frontier düzeyinde yapay zeka yeteneklerine ihtiyaç duyan işletmeler için birincil tercih olmak üzere tasarlanmış olup, Batılı kapalı kaynaklı modellere yüksek performanslı bir alternatif sunar.

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview için Kullanım Alanları

Harika sonuçlar elde etmek için Qwen3.6-Max-Preview'i kullanmanın farklı yollarını keşfedin.

Otonom Yazılım Mühendisliği

Modeli, tüm kod tabanlarında gezinebilen, mimari değişiklikleri planlayabilen ve birden fazla dosyadaki hataları giderebilen bir coding agent olarak konuşlandırın.

Geniş Ölçekli Teknik Analiz

RAG kısıtlamaları olmaksızın derinlemesine analiz için 1M token context window kapasitesini kullanarak eksiksiz dokümantasyon setlerini veya yasal çerçeveleri sisteme yükleyin.

Karmaşık Reasoning ve Planlama

Doğruluk için çok adımlı bir iç planın gerekli olduğu üst düzey matematiksel problemleri çözmek adına yerel Thinking Mode özelliğinden yararlanın.

Multimodal İçerik Anlama

Veri çıkarmak ve dinamik görsel olayları özetlemek için hem statik görselleri hem de karmaşık video dizilerini analiz edin.

Etkileşimli Terminal İşlemleri

Optimize edilmiş Terminal-Bench performansından yararlanarak, yapay zekanın doğrudan shell ve CLI ortamlarıyla etkileşime girmesini sağlayan araçlar geliştirin.

Kurumsal Agentic İş Akışları

Otomasyon için yüksek talimat güvenilirliği ve sofistike tool-calling yeteneklerinin gerektiği karmaşık iş süreçlerine modeli entegre edin.

Güçlü Yönler

Sınırlamalar

Dünya Lideri Kodlama Yeteneği: SWE-bench Pro'da %57,3 puan alarak otonom yazılım görevlerinde Claude 4.5 Opus gibi büyük frontier model'leri geride bırakır.
Closed Source Kısıtlaması: Qwen 3.6 Medium sürümlerinin aksine Max-Preview özeldir ve yerel donanım üzerinde kendi kendine barındırılamaz (self-hosted).
Muazzam 1M Token Context: Devasa veri setlerini ve tam teknik kütüphaneleri, eski mimarilerdeki context bozulmaları olmadan tek bir prompt içinde işler.
Yüksek Çıkış Token'ı Maliyeti: 1M çıkış token'ı başına 10,00 $ fiyatlandırma, giriş fiyatına göre 8 kat daha pahalıdır; bu da uzun reasoning zincirlerini daha maliyetli hale getirir.
Şeffaf Yerel Reasoning: Yerleşik Thinking Mode, iç mantığı görünür kılarak karmaşık problem çözmede daha yüksek güvenilirlik ve daha kolay hata ayıklama sağlar.
Bilgi Kesintisi Kısıtlamaları: Statik bir önizleme modeli olarak, 2026 başındaki eğitim kesintisinin ötesindeki olaylar veya kütüphane güncellemeleri hakkında gerçek zamanlı farkındalığı yoktur.
Agresif Fiyatlandırma: 1 milyon giriş token'ı başına 1,25 $ maliyetle, Batılı muadillerinin maliyetinin çok altında bir frontier düzeyinde performans sunar.
Bölgesel API Latency: Konuşlandırma bölgesine bağlı olarak, uluslararası kullanıcılar optimize edilmiş yerel varyantlara göre daha yüksek latency ile karşılaşabilir.

API Hızlı Başlangıç

alibaba/qwen3.6-max-preview

Belgeleri Görüntüle
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  base_url: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.6-max-preview',
    messages: [{ role: 'user', content: 'Design a system architecture for a real-time AI agent.' }],
    extra_body: { enable_thinking: true },
    stream: true
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar Qwen3.6-Max-Preview Hakkında Ne Diyor

Topluluğun Qwen3.6-Max-Preview hakkında ne düşündüğünü görün

Devasa bir sunucu çiftliğinde çalışan bir modelden bekleyeceğiniz türden bir performans artık masaüstünüzde.
softtechhubus
reddit
Qwen3.6-Max-Preview, SWE-Bench Pro'da Claude Opus 4.5'i yendi. Çin hızla arayı kapatıyor.
BridgeMind
twitter
Milyon token başına 1,25 $ ile Qwen, büyük ölçekli veri girişi için Claude'dan önemli ölçüde daha ucuz.
TechReviewer2026
reddit
Thinking Mode'un varsayılan durum olarak sisteme dahil edilmiş olması, agentic güvenilirlik için anlamlı bir tasarım tercihi.
DevGuru
twitter
Qwen, yeni bir üst düzey proprietary flagship model olarak Qwen 3.6 Max Preview'u piyasaya sürdü.
AICodeKing
youtube
Plus modeline kıyasla daha gelişmiş agentic kodlama ve daha iyi gerçek dünya agent güvenilirliği gösteriyor.
Codedigipt
youtube

Qwen3.6-Max-Preview Hakkında Videolar

Qwen3.6-Max-Preview hakkında eğitimler, incelemeler ve tartışmalar izleyin

Qwen, yeni bir üst düzey proprietary flagship model olarak Qwen 3.6 Max Preview'u piyasaya sürdü.

Model, SkillsBench ve Terminal-Bench 2.0 gibi coding-agent benchmark'larında güçlü bir sıçrama gösteriyor.

Qwen, Claude 4.5 Opus gibi modellere karşı üst düzeyde ciddi bir rekabet içinde.

Bu model, dünya bilgisi ve talimat takibi konusunda anlamlı bir gelişmeyi temsil ediyor.

SWE-bench'teki performans artışı, onu Plus varyantından ayıran asıl nokta.

Benchmark hikayesi, aslında barındırılan Max Preview'u open-weight ailesinden farklı konumlandırmakla ilgili.

Ekosistemin derinliğini sadece model ağırlıklarının ötesinde değerlendirmek için Qwen Code sayfalarını ve repo yüzeylerini kullanıyoruz.

Thinking mode, geçen yılki o1 tarzı modellere kıyasla şaşırtıcı derecede hızlı.

Bu, agentic görevler için güvenilir bir API'ye ihtiyaç duyan kurumsal geliştiriciler için tasarlandığı çok belli.

Multimodal vision performansı, bazı belge analizi testlerinde Gemini 2'yi yakalıyor.

Bu video, Qwen'in bir sonraki flagship modeline erken bir bakış olan Qwen3.6-Max-Preview'u tanıtıyor.

Plus modeline kıyasla daha gelişmiş agentic kodlama ve daha iyi gerçek dünya agent güvenilirliği gösteriyor.

1M context window, Qwen 2'nin ilk sürümlerinde gördüğümüzden çok daha kararlı.

Eğer çok fazla kodlama yapıyorsanız, Qwen 3.6 Max şu anki benchmark lideridir.

Fiyatlandırma, flagship closed-source modeli için bile oldukça rekabetçi kalmaya devam ediyor.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

Qwen3.6-Max-Preview için Pro İpuçları

Qwen3.6-Max-Preview'den en iyi şekilde yararlanmak için uzman ipuçları.

Dahili Reasoning'i Etkinleştirin

Karmaşık reasoning gerektiren süreçlerde hata ayıklama yapmak için, API isteğinizde 'enable_thinking' parametresini true olarak ayarlayın.

Uzun Vadeli Mantıksal Tutarlılığı Koruyun

Modelin oturum boyunca mantıksal tutarlılığı korumasını sağlamak için çok turlu konuşmalarda 'preserve_thinking' özelliğini kullanın.

Tüm Kütüphaneleri Besleyin

Dosyalar arası daha iyi bir anlayış için verileri parçalamak yerine 1M context window avantajından yararlanarak kaynak materyallerin tamamını sağlayın.

Uyumlu Endpoint'leri Kullanın

Küresel uygulamalar için uluslararası kullanıcılarda latency değerini minimize etmek adına Alibaba Cloud Singapur veya ABD Virginia endpoint'lerini kullanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Qwen3.6-Max-Preview Hakkında Sık Sorulan Sorular

Qwen3.6-Max-Preview hakkında sık sorulan soruların cevaplarını bulun