alibaba

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview je Alibabin flagship MoE model s 1M context window-om, izvornim thinking mode-om i SOTA rezultatima u agentic kodiranju i reasoning-u.

MoEAgentic Coding1M ContextFrontier ModelAlibaba Qwen
alibaba logoalibabaQwen 3.620. travnja 2026.
Kontekst
1.0Mtokena
Maks. izlaz
8Ktokena
Ulazna cijena
$1.25/ 1M
Izlazna cijena
$10.00/ 1M
Modalitet:TextImageVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
86%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Qwen3.6-Max-Preview je postigao 86% na ovom benchmarku.
HLE
51%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Qwen3.6-Max-Preview je postigao 51% na ovom benchmarku.
MMLU
83%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Qwen3.6-Max-Preview je postigao 83% na ovom benchmarku.
MMLU Pro
79%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Qwen3.6-Max-Preview je postigao 79% na ovom benchmarku.
SimpleQA
52%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Qwen3.6-Max-Preview je postigao 52% na ovom benchmarku.
IFEval
75%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Qwen3.6-Max-Preview je postigao 75% na ovom benchmarku.
AIME 2025
93%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Qwen3.6-Max-Preview je postigao 93% na ovom benchmarku.
MATH
95%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Qwen3.6-Max-Preview je postigao 95% na ovom benchmarku.
GSM8k
98%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Qwen3.6-Max-Preview je postigao 98% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Qwen3.6-Max-Preview je postigao 92% na ovom benchmarku.
MathVista
86%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Qwen3.6-Max-Preview je postigao 86% na ovom benchmarku.
SWE-Bench
73%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Qwen3.6-Max-Preview je postigao 73% na ovom benchmarku.
HumanEval
91%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Qwen3.6-Max-Preview je postigao 91% na ovom benchmarku.
LiveCodeBench
79%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Qwen3.6-Max-Preview je postigao 79% na ovom benchmarku.
MMMU
82%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Qwen3.6-Max-Preview je postigao 82% na ovom benchmarku.
MMMU Pro
75%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Qwen3.6-Max-Preview je postigao 75% na ovom benchmarku.
ChartQA
85%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Qwen3.6-Max-Preview je postigao 85% na ovom benchmarku.
DocVQA
89%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Qwen3.6-Max-Preview je postigao 89% na ovom benchmarku.
Terminal-Bench
65%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Qwen3.6-Max-Preview je postigao 65% na ovom benchmarku.
ARC-AGI
14%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Qwen3.6-Max-Preview je postigao 14% na ovom benchmarku.

O modelu Qwen3.6-Max-Preview

Saznajte o mogućnostima, značajkama i načinima korištenja modela Qwen3.6-Max-Preview.

Qwen3.6-Max-Preview je flagship vlasnički LLM tvrtke Alibaba, koji predstavlja sljedeći korak u njihovoj seriji AI modela visokih performansi. Koristeći rijetku Mixture-of-Experts (MoE) arhitekturu, model postiže dubinu reasoning-a sustava s bilijunima parametara uz održavanje značajne operativne učinkovitosti. Posebno je optimiziran za agentic kodiranje, svjetsko znanje i složeno praćenje uputa.

Istaknuta značajka modela je njegov izvorni Thinking Mode, koji omogućuje sustavu generiranje vidljivog internog chain-of-thought-a prije davanja konačnog odgovora. Ova transparentnost posebno je vrijedna za developere koji grade autonomne agente, jer pruža jasan uvid u logičko planiranje i korake za ispravljanje pogrešaka. U kombinaciji s masivnim 1-milijun-token context window-om, model može u jednom prolazu obraditi cijele projektne repozitorije ili opsežne knjižnice dokumentacije.

Hostan na Alibaba Cloud Model Studio, Qwen3.6-Max-Preview podržava industrijske standardne protokole i kompatibilan je s OpenAI-style API specifikacijama. Dizajniran je kao primarni izbor za poduzeća koja trebaju AI mogućnosti na frontier razini za multimodalnu analizu podataka i robusne agentic radne procese, nudeći alternativu visokih performansi zapadnim closed-source modelima.

Qwen3.6-Max-Preview

Slučajevi korištenja za Qwen3.6-Max-Preview

Otkrijte različite načine korištenja modela Qwen3.6-Max-Preview za postizanje izvrsnih rezultata.

Autonomni softverski inženjering

Implementirajte model kao agenta za kodiranje koji može navigirati kroz cijele baze koda, planirati arhitektonske promjene i ispravljati bugove u više datoteka.

Tehnička analiza velikih razmjera

Koristite 1M token context window za unos kompletnih setova dokumentacije ili pravnih okvira za detaljnu analizu bez ograničenja koja donosi RAG.

Složeni reasoning i planiranje

Iskoristite izvorni Thinking Mode za rješavanje matematičkih problema visoke razine gdje je potreban višestupanjski interni plan za točnost.

Multimodalno razumijevanje sadržaja

Analizirajte statične slike i složene video sekvence kako biste izdvojili podatke i saželi dinamičke vizualne događaje.

Interaktivne operacije u terminalu

Izgradite alate koji omogućuju AI-u izravnu interakciju sa shell-ovima i CLI okruženjima, koristeći prednosti optimizacije za Terminal-Bench.

Poslovni agentic radni procesi

Integrirajte model u složene poslovne cjevovode gdje su za automatizaciju potrebni visoka pouzdanost uputa i sofisticirani pozivi alata.

Prednosti

Ograničenja

Vodeća sposobnost kodiranja u svijetu: Postiže rezultat od 57,3% na SWE-bench Pro, nadmašujući vodeće frontier modele poput Claude 4.5 Opus za autonomne softverske zadatke.
Ograničenje zatvorenog koda: Za razliku od Medium verzija modela Qwen 3.6, Max-Preview je vlasnički model i ne može se samostalno hostati na lokalnom hardveru.
Golemi context window od 1M tokena: Obrađuje masivne skupove podataka i potpune tehničke knjižnice unutar jednog prompta bez tipične degradacije konteksta starijih arhitektura.
Visoka premija na output tokens: Cijena od 10,00 USD za 1M output tokens je 8x veća od cijene inputa, što čini dugačke lance reasoning-a skupljima od unosa podataka.
Transparentan izvorni reasoning: Ugrađeni Thinking Mode izlaže internu logiku, omogućujući veću pouzdanost u složenom rješavanju problema i jednostavnije debugiranje.
Ograničenja znanja: Kao statični preview model, nema uvid u događaje ili ažuriranja knjižnica u stvarnom vremenu nakon datuma prekida treniranja početkom 2026.
Agresivno cjenovno pozicioniranje: Uz cijenu od 1,25 USD po milijun input tokens, nudi performanse na razini frontier modela uz djelić cijene zapadnih vlasničkih modela.
Regionalna API latency: Ovisno o regiji implementacije, međunarodni korisnici mogu se suočiti s većom latency u odnosu na visoko optimizirane lokalne varijante.

API brzi početak

alibaba/qwen3.6-max-preview

Pogledaj dokumentaciju
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  base_url: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.6-max-preview',
    messages: [{ role: 'user', content: 'Design a system architecture for a real-time AI agent.' }],
    extra_body: { enable_thinking: true },
    stream: true
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Qwen3.6-Max-Preview

Pogledajte što zajednica misli o modelu Qwen3.6-Max-Preview

Performanse koje biste očekivali od modela koji radi na masivnoj serverskoj farmi sada su na vašem desktopu.
softtechhubus
reddit
Qwen3.6-Max-Preview je upravo pobijedio Claude Opus 4.5 na SWE-Bench Pro. Kina brzo sustiže.
BridgeMind
twitter
Uz cijenu od 1,25 USD po milijun tokena, Qwen je znatno jeftiniji od Claudea za unos podataka velikih razmjera.
TechReviewer2026
reddit
Činjenica da je Thinking Mode ugrađen kao zadano stanje predstavlja značajan dizajnerski izbor za pouzdanost agenata.
DevGuru
twitter
Qwen je lansirao Qwen 3.6 Max Preview kao novi vrhunski vlasnički flagship model.
AICodeKing
youtube
Pokazuje poboljšano agentic kodiranje i bolju pouzdanost agenta u stvarnom svijetu u odnosu na Plus model.
Codedigipt
youtube

Videozapisi o modelu Qwen3.6-Max-Preview

Gledajte tutorijale, recenzije i diskusije o modelu Qwen3.6-Max-Preview

Qwen je lansirao Qwen 3.6 Max Preview kao novi vrhunski vlasnički flagship model.

Model pokazuje snažan skok u benchmarkovima za agentic kodiranje kao što su SkillsBench i Terminal-Bench 2.0.

Qwen se jasno pokušava ozbiljno natjecati na visokoj razini protiv modela poput Claude 4.5 Opus.

Ovaj model predstavlja značajno poboljšanje u svjetskom znanju i praćenju uputa.

Skok u performansama na SWE-benchu je ono što ga stvarno izdvaja od Plus varijante.

Benchmark priča se zapravo vrti oko pozicioniranja hosted Max Preview verzije kao zasebne u odnosu na open-weight obitelj.

Koristimo Qwen Code stranice i repo površine kako bismo ocijenili dubinu ekosustava izvan samih težina modela.

Thinking mode je iznenađujuće brz u usporedbi s o1-style modelima od prošle godine.

Ovo je jasno dizajnirano za enterprise developere kojima treba pouzdan API za agentic zadatke.

Multimodalne vizualne performanse sustižu Gemini 2 u nekim testovima analize dokumenata.

Ovaj video predstavlja Qwen3.6-Max-Preview, rani pogled na sljedeći flagship model iz Qwena.

Pokazuje poboljšano agentic kodiranje i bolju pouzdanost agenta u stvarnom svijetu u odnosu na Plus model.

1M context window je puno stabilniji nego što smo vidjeli u ranim Qwen 2 verzijama.

Ako puno radite na kodiranju, Qwen 3.6 Max je trenutno benchmark lider.

Cijene ostaju vrlo konkurentne čak i za njihov flagship closed-source model.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Qwen3.6-Max-Preview

Stručni savjeti za maksimalno iskorištavanje Qwen3.6-Max-Preview.

Omogućite interni reasoning

Postavite parametar 'enable_thinking' na true u vašem API zahtjevu kako biste vidjeli internu logiku modela za debugiranje složenih zadataka reasoning-a.

Očuvajte logiku dugog horizonta

Koristite značajku 'preserve_thinking' za konverzacije s više koraka kako biste osigurali da model održava logičku dosljednost tijekom cijele sesije.

Učitajte cijele knjižnice

Iskoristite 1M context window pružanjem kompletnih izvornih materijala umjesto fragmentiranih podataka za bolje razumijevanje povezanosti između datoteka.

Koristite kompatibilne krajnje točke

Za globalne aplikacije, koristite krajnje točke u Singapuru ili US Virginia unutar Alibaba Cloud-a kako biste smanjili regionalnu latency za međunarodne korisnike.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Često Postavljana Pitanja o Qwen3.6-Max-Preview

Pronađite odgovore na česta pitanja o Qwen3.6-Max-Preview