alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next je vrhunski Apache 2.0 model za programiranje iz Alibaba Clouda, s 80B MoE arhitekturom i 256k context window-om za napredni lokalni razvoj.

Coding AIOpen WeightsMixture of ExpertsAgentic WorkflowsLocal LLM
alibaba logoalibabaQwen33. veljače 2026.
Kontekst
256Ktokena
Maks. izlaz
8Ktokena
Ulazna cijena
$0.14/ 1M
Izlazna cijena
$0.42/ 1M
Modalitet:Text
Mogućnosti:AlatiStreaming
Benchmarks
GPQA
53.4%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Qwen3-Coder-Next je postigao 53.4% na ovom benchmarku.
HLE
28.5%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Qwen3-Coder-Next je postigao 28.5% na ovom benchmarku.
MMLU
86.2%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Qwen3-Coder-Next je postigao 86.2% na ovom benchmarku.
MMLU Pro
78.4%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Qwen3-Coder-Next je postigao 78.4% na ovom benchmarku.
SimpleQA
48.2%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Qwen3-Coder-Next je postigao 48.2% na ovom benchmarku.
IFEval
89.1%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Qwen3-Coder-Next je postigao 89.1% na ovom benchmarku.
AIME 2025
89.2%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Qwen3-Coder-Next je postigao 89.2% na ovom benchmarku.
MATH
83.5%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Qwen3-Coder-Next je postigao 83.5% na ovom benchmarku.
GSM8k
95.8%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Qwen3-Coder-Next je postigao 95.8% na ovom benchmarku.
MGSM
92.5%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Qwen3-Coder-Next je postigao 92.5% na ovom benchmarku.
MathVista
71.2%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Qwen3-Coder-Next je postigao 71.2% na ovom benchmarku.
SWE-Bench
74.2%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Qwen3-Coder-Next je postigao 74.2% na ovom benchmarku.
HumanEval
94.1%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Qwen3-Coder-Next je postigao 94.1% na ovom benchmarku.
LiveCodeBench
74.5%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Qwen3-Coder-Next je postigao 74.5% na ovom benchmarku.
MMMU
72.4%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Qwen3-Coder-Next je postigao 72.4% na ovom benchmarku.
MMMU Pro
58.6%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Qwen3-Coder-Next je postigao 58.6% na ovom benchmarku.
ChartQA
86.4%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Qwen3-Coder-Next je postigao 86.4% na ovom benchmarku.
DocVQA
93.5%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Qwen3-Coder-Next je postigao 93.5% na ovom benchmarku.
Terminal-Bench
58.2%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Qwen3-Coder-Next je postigao 58.2% na ovom benchmarku.
ARC-AGI
12.5%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Qwen3-Coder-Next je postigao 12.5% na ovom benchmarku.

O modelu Qwen3-Coder-Next

Saznajte o mogućnostima, značajkama i načinima korištenja modela Qwen3-Coder-Next.

Arhitektura modela

Qwen3-Coder-Next je specijalizirani model otvorenih težina koji je dizajnirao Alibaba Cloud za inženjerske agente. Koristi Mixture-of-Experts (MoE) arhitekturu s ukupno 80 milijardi parametara, ali aktivira samo 3 milijarde parametara po token. Ovaj dizajn kombinira inteligenciju masivnog modela s brzinom inference malog modela. Arhitektura uključuje hibridni attention mehanizam, integrirajući Gated DeltaNet sa standardnim Gated Attention za obradu konteksta do 262 144 tokens.

Agentic specijalizacija

Model je obučen na više od 800 000 provjerljivih programerskih zadataka i izvršnih okruženja. Ova obuka naglašava reasoning na duge staze i sposobnost oporavka od neuspjeha izvršavanja. Ostvaruje 70,8% na SWE-Bench Verified, pokazujući svoju sposobnost rješavanja višestupanjskih razvojnih zadataka od početnog planiranja do konačnog izvršenja koda. Ističe se u autonomnim agentic okvirima kao što su OpenClaw i Qwen Code.

Implementacija i privatnost

Licenciran pod Apache 2.0, ovaj model pruža sigurnu alternativu za developere koji zahtijevaju lokalna, privatna razvojna okruženja. Može se pokrenuti na potrošačkom hardveru s dovoljno RAM-a putem kvantizacije. Visok context window omogućuje analizu na razini repozitorija bez degradacije performansi koja se obično vidi kod modela s manjim kontekstom.

Qwen3-Coder-Next

Slučajevi korištenja za Qwen3-Coder-Next

Otkrijte različite načine korištenja modela Qwen3-Coder-Next za postizanje izvrsnih rezultata.

Autonomni agenti za programiranje

Pokreće okvire za rješavanje višestupanjskih razvojnih zadataka od planiranja do konačnog izvršenja.

Lokalni privatni razvoj

Pokreće vrhunsku pomoć pri kodiranju na potrošačkim GPU-ovima sa 16 GB VRAM-a koristeći kvantizirane MoE slojeve.

Analiza repozitorija velikih razmjera

Obrađuje cijele baze koda unutar svog 256k window-a za prepoznavanje tehničkog duga.

Popravak i refaktoriranje koda

Ažurira stari kod prema modernim standardima pružanjem povratnih informacija iz izvršnog okruženja.

Višejezično skriptiranje

Generira kod visoke vjernosti na više od 40 programskih jezika, uključujući Rust i Go.

Interaktivna 3D simulacija

Izrađuje složene web-vizualizatore i simulacije koristeći brzu one-shot generaciju.

Prednosti

Ograničenja

MoE učinkovitost: Radi s 3B aktivnih parametara na potrošačkom hardveru, zadržavajući inteligenciju klase 80B.
Zahtjevi za sistemski RAM: Ukupna količina od 80B parametara zahtijeva otprilike 45 GB ukupnog RAM-a za učinkovitu 4-bitnu kvantizaciju.
Agentic specijalizacija: Ostvaruje 70,8% na SWE-Bench Verified, pokazujući vrhunsko rješavanje problema u više koraka.
Ograničenja rekurzivnog stanja: Hibridna attention arhitektura čini self-speculative decoding nepodržanim u uobičajenim inference engineima.
Masivni nativni context: Window od 262 144 tokens podržava analizu na razini cijelog repozitorija bez degradacije performansi.
Ograničenja samo na tekst: Nedostaju mu multimodalne vizualne sposobnosti, što ga sprječava u ispravljanju layouta na temelju screenshotova.
Dozvoljeno licenciranje: Objavljen pod Apache 2.0 licencom, što omogućuje neograničenu komercijalnu upotrebu i privatno lokalno hosting okruženje.
Fizika visoke složenosti: Može imati poteškoća s one-shot generacijom ekstremne 3D fizikalne logike u usporedbi s gustim flagship modelima.

API brzi početak

alibaba/qwen-3-coder-next

Pogledaj dokumentaciju
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Qwen3-Coder-Next

Pogledajte što zajednica misli o modelu Qwen3-Coder-Next

Gotovo se izjednačava s Claudeom u ukupnim sposobnostima programiranja. Pobjeđuje Claude 3.5 Sonnet na HumanEval-u s 92,7%.
Philipp Schmid
twitter
Učinkovitost MoE verzije je suluda za lokalni hardver. Postižem 26 TPS na sustavu srednje klase.
LocalAI_Dev
reddit
Self-speculative decoding je matematički nemoguć za Qwen Coder Next zbog rekurzivnih stanja.
GodComplecs
reddit
Qwen3-Coder-Next se temelji na MoE i mnogo je jači i pametniji nego prije!
JustinLin610
twitter
Demonstrira sposobnost prebacivanja davatelja usluga usred projekta s novim varijantama modela od 480B.
saveralter
reddit
Agentic recept za treniranje na 800 tisuća zadataka vidi se u načinu na koji se oporavlja od pogrešaka pri izgradnji.
TechGurus
hackernews

Videozapisi o modelu Qwen3-Coder-Next

Gledajte tutorijale, recenzije i diskusije o modelu Qwen3-Coder-Next

Čini ga dostupnim ljudima koji se žele igrati s lokalnim AI agentima za programiranje

Ovo mi vrišti da testiram ovaj model otvorenog koda, što ću i učiniti

Memorijska učinkovitost ove stvari je ogromna pobjeda

Složenu logiku obrađuje bolje od prethodnog gustog modela od 72B

Ovo je prvi otvoreni model koji ispravno slijedi moje terminalske naredbe

Qwen 3 coder Next također ima samo 3 milijarde aktivnih parametara za pokretanje na potrošačkoj grafičkoj kartici

Radi prekrasno. Stvarno sam zapanjen što mogu dobiti ovaj rezultat iz prve od lokalnog AI-ja

80 milijardi parametara obično zahtijeva klaster, ali MoE pristup mijenja sve

Obrađuje 40+ programskih jezika bez ikakvog primjetnog pada performansi

Korištenje uz OpenClaw čini da se osjećam kao da imam junior programera u timu

Model od tri milijarde parametara ide rame uz rame s modelima 10 do 20 puta većim od sebe

Qwen 3 dolazi s puno prednosti, ali uz nižu cijenu

Context od 256k je stvaran, nije halucinirao sredinu mog projekta

Latencija je iznenađujuće niska s obzirom na ukupnu težinu od 80B parametara

Popravio je bug u mom naslijeđenom (legacy) Go repozitoriju koji je GPT-4o propustio tri puta

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Qwen3-Coder-Next

Stručni savjeti za maksimalno iskorištavanje Qwen3-Coder-Next.

Koristite dugačke sistemske promptove

Pružite modelu detaljne primjere i dokumentaciju kako biste uskladili njegovo agentic ponašanje.

Iterativna povratna informacija o pogreškama

Ubacite zapisnike pogrešaka iz konzole preglednika natrag u model za samoispravljanje s visokom stopom uspjeha.

Optimizirajte prebacivanje slojeva

Prebacite specifične MoE slojeve eksperata u sistemski RAM kako biste uravnotežili brzinu inference i reasoning.

Uskladite sampling parametre

Koristite temperature od 1.0 s top_p 0.95 i top_k 40 za najpreciznije rezultate programiranja.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Često Postavljana Pitanja o Qwen3-Coder-Next

Pronađite odgovore na česta pitanja o Qwen3-Coder-Next