alibaba

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview är Alibabas flagship MoE-modell med 1M context window, inbyggd Thinking Mode och SOTA-resultat inom agentic kodning och resonemang.

MoEAgentic Coding1M ContextFrontier ModelAlibaba Qwen
alibaba logoalibabaQwen 3.620 april 2026
Kontext
1.0Mtokens
Max utdata
8Ktokens
Inmatningspris
$1.25/ 1M
Utdatapris
$10.00/ 1M
Modalitet:TextImageVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
86%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Qwen3.6-Max-Preview fick 86% pa detta benchmark.
HLE
51%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Qwen3.6-Max-Preview fick 51% pa detta benchmark.
MMLU
83%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Qwen3.6-Max-Preview fick 83% pa detta benchmark.
MMLU Pro
79%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Qwen3.6-Max-Preview fick 79% pa detta benchmark.
SimpleQA
52%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Qwen3.6-Max-Preview fick 52% pa detta benchmark.
IFEval
75%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Qwen3.6-Max-Preview fick 75% pa detta benchmark.
AIME 2025
93%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Qwen3.6-Max-Preview fick 93% pa detta benchmark.
MATH
95%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Qwen3.6-Max-Preview fick 95% pa detta benchmark.
GSM8k
98%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Qwen3.6-Max-Preview fick 98% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Qwen3.6-Max-Preview fick 92% pa detta benchmark.
MathVista
86%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Qwen3.6-Max-Preview fick 86% pa detta benchmark.
SWE-Bench
73%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Qwen3.6-Max-Preview fick 73% pa detta benchmark.
HumanEval
91%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Qwen3.6-Max-Preview fick 91% pa detta benchmark.
LiveCodeBench
79%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Qwen3.6-Max-Preview fick 79% pa detta benchmark.
MMMU
82%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Qwen3.6-Max-Preview fick 82% pa detta benchmark.
MMMU Pro
75%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Qwen3.6-Max-Preview fick 75% pa detta benchmark.
ChartQA
85%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Qwen3.6-Max-Preview fick 85% pa detta benchmark.
DocVQA
89%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Qwen3.6-Max-Preview fick 89% pa detta benchmark.
Terminal-Bench
65%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Qwen3.6-Max-Preview fick 65% pa detta benchmark.
ARC-AGI
14%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Qwen3.6-Max-Preview fick 14% pa detta benchmark.

Om Qwen3.6-Max-Preview

Lar dig om Qwen3.6-Max-Previews kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Qwen3.6-Max-Preview är den proprietära flagship-modellen för stora språkmodeller från Alibaba, och representerar nästa steg i deras högpresterande AI-serie. Genom att använda en gles Mixture-of-Experts (MoE)-arkitektur uppnår modellen resonemangsdjupet hos ett system med biljoner parametrar, samtidigt som den bibehåller hög operativ effektivitet. Den är specifikt optimerad för agentic kodning, världskunskap och att följa komplexa instruktioner.

Modellens utmärkande funktion är dess inbyggda Thinking Mode, som gör att systemet kan generera en synlig intern chain-of-thought innan det levererar ett slutgiltigt svar. Denna transparens är särskilt värdefull för utvecklare som bygger autonoma agenter, eftersom den ger en tydlig inblick i logisk planering och steg för felkorrigering. Kombinerat med ett massivt context window på 1 miljon tokens kan modellen läsa in hela projektarkiv eller omfattande dokumentationsbibliotek i en enda körning.

Qwen3.6-Max-Preview hostas på Alibaba Cloud Model Studio, stödjer branschstandarder och är kompatibel med API-specifikationer i OpenAI-stil. Den är designad för att vara det främsta valet för företag som kräver AI-kapacitet i frontier-klass för multimodal dataanalys och robusta agentic arbetsflöden, och erbjuder ett högpresterande alternativ till västerländska closed-source-modeller.

Qwen3.6-Max-Preview

Anvandningsfall for Qwen3.6-Max-Preview

Upptack de olika satten du kan anvanda Qwen3.6-Max-Preview for att uppna fantastiska resultat.

Autonom mjukvaruutveckling

Distribuera modellen som en kodningsagent kapabel att navigera i hela kodbaser, planera arkitektoniska förändringar och fixa buggar i flera filer.

Storskalig teknisk analys

Utnyttja context window på 1M tokens för att läsa in fullständiga dokumentationsset eller juridiska ramverk för djupgående analys utan RAG-begränsningar.

Komplexa resonemang och planering

Använd den inbyggda Thinking Mode för att lösa avancerade matematiska problem där en intern plan i flera steg krävs för hög precision.

Multimodal innehållsförståelse

Analysera både statiska bilder och komplexa videosekvenser för att extrahera data och sammanfatta dynamiska visuella händelser.

Interaktiva terminaloperationer

Bygg verktyg som låter AI:n interagera direkt med skal och CLI-miljöer, med fördel av dess optimerade Terminal-Bench-prestanda.

Agentic arbetsflöden för företag

Integrera modellen i komplexa affärsprocesser där hög instruktionspålitlighet och sofistikerad verktygsanvändning krävs för automatisering.

Styrkor

Begransningar

Världsledande kodningsförmåga: Uppnår 57,3 % på SWE-bench Pro, vilket överträffar ledande frontier models som Claude 4.5 Opus för autonoma mjukvaruuppgifter.
Closed-source begränsning: Till skillnad från Medium-versionerna av Qwen 3.6 är Max-Preview proprietär och kan inte köras lokalt på egen hårdvara.
Enormt context window på 1M tokens: Hanterar massiva dataset och fullständiga tekniska bibliotek i en och samma prompt utan den typiska försämringen av kontext som äldre arkitekturer lider av.
Hög kostnad för output tokens: Priset på $10,00 per 1 miljon output tokens är 8 gånger högre än priset för input, vilket gör långa resonemangskedjor dyrare än själva datainläsningen.
Transparent inbyggt resonemang: Den inbyggda Thinking Mode exponerar den interna logiken, vilket möjliggör högre tillförlitlighet vid komplex problemlösning och enklare felsökning.
Begränsad kunskapspåfyllnad: Som en statisk preview-modell saknar den realtidsinsikt om händelser eller biblioteksuppdateringar som skett efter dess träningsstopp i början av 2026.
Aggressiv prisstrategi: Med $1,25 per miljon input tokens erbjuder den prestanda i toppklass till en bråkdel av kostnaden för västerländska proprietära alternativ.
Regional API-latency: Beroende på vilken region tjänsten körs i kan internationella användare uppleva högre latency jämfört med högt optimerade lokala varianter.

API snabbstart

alibaba/qwen3.6-max-preview

Visa dokumentation
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  base_url: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.6-max-preview',
    messages: [{ role: 'user', content: 'Design a system architecture for a real-time AI agent.' }],
    extra_body: { enable_thinking: true },
    stream: true
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Qwen3.6-Max-Preview

Se vad communityt tycker om Qwen3.6-Max-Preview

Den prestanda man förväntar sig från en modell som körs på en massiv serverfarm finns nu tillgänglig direkt på skrivbordet.
softtechhubus
reddit
Qwen3.6-Max-Preview slog precis Claude Opus 4.5 på SWE-Bench Pro. Kina kommer ikapp snabbt.
BridgeMind
twitter
Med $1,25 per miljon tokens är Qwen betydligt billigare än Claude för storskalig datainmatning.
TechReviewer2026
reddit
Att Thinking Mode är inbyggt som standardläge är ett meningsfullt designval för tillförlitligheten hos agenter.
DevGuru
twitter
Qwen har lanserat Qwen 3.6 Max Preview som en ny proprietär flagship-modell i toppskiktet.
AICodeKing
youtube
Den visar förbättrad agentic kodning och bättre tillförlitlighet i verkliga agent-scenarier jämfört med Plus-modellen.
Codedigipt
youtube

Videor om Qwen3.6-Max-Preview

Se handledningar, recensioner och diskussioner om Qwen3.6-Max-Preview

Qwen har lanserat Qwen 3.6 Max Preview som en ny proprietär flagship-modell i toppskiktet.

Modellen visar ett kraftigt hopp i benchmark-tester för kodningsagenter som SkillsBench och Terminal-Bench 2.0.

Qwen försöker tydligt konkurrera på allvar i toppskiktet mot modeller som Claude 4.5 Opus.

Denna modell representerar en meningsfull förbättring inom världskunskap och förmågan att följa instruktioner.

Prestandaökningen på SWE-bench är det som verkligen skiljer denna från Plus-varianten.

Benchmark-historien handlar egentligen om att positionera den hostade Max-Preview som unik jämfört med familjen av open-weight-modeller.

Vi använder Qwen Code-sidor och repo-ytor för att bedöma ekosystemets djup utöver bara modellvikterna.

Thinking Mode är förvånansvärt snabbt jämfört med o1-liknande modeller från förra året.

Denna är tydligt designad för företagsutvecklare som behöver ett pålitligt API för agentic uppgifter.

Den multimodala vision-prestandan börjar komma ikapp Gemini 2 i vissa dokumentanalystester.

Den här videon introducerar Qwen3.6-Max-Preview, en tidig titt på nästa flagship-modell från Qwen.

Den visar förbättrad agentic kodning och bättre tillförlitlighet i verkliga agent-scenarier jämfört med Plus-modellen.

Context window på 1M tokens är mycket stabilare än vad vi såg i de tidiga Qwen 2-versionerna.

Om du kodar mycket är Qwen 3.6 Max för närvarande benchmark-ledaren.

Prissättningen förblir mycket konkurrenskraftig även för deras proprietära flagship-modell.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Qwen3.6-Max-Preview

Experttips for att hjalpa dig fa ut det mesta av Qwen3.6-Max-Preview och uppna battre resultat.

Aktivera internt resonemang

Sätt parametern 'enable_thinking' till true i din API-förfrågan för att se modellens interna logik vid felsökning av komplexa resonemang.

Bevara logik över långa sekvenser

Använd funktionen 'preserve_thinking' för konversationer i flera steg för att säkerställa att modellen bibehåller logisk konsistens genom hela sessionen.

Mata in hela bibliotek

Dra nytta av context window på 1M tokens genom att tillhandahålla fullständigt källmaterial istället för uppdelad data för bättre förståelse mellan filer.

Använd kompatibla slutpunkter

För globala applikationer, använd slutpunkterna i Singapore eller US Virginia i Alibaba Cloud för att minimera regional latency för internationella användare.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Vanliga fragor om Qwen3.6-Max-Preview

Hitta svar pa vanliga fragor om Qwen3.6-Max-Preview