alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next er Alibaba Clouds elite Apache 2.0 kodningsmodel, der indeholder en 80B MoE-arkitektur og 256k context window til avanceret lokal udvikling.

Kodning AIOpen WeightsMixture of ExpertsAgentic WorkflowsLokal LLM
alibaba logoalibabaQwen33. februar 2026
Kontekst
256Ktokens
Maks output
8Ktokens
Input-pris
$0.14/ 1M
Output-pris
$0.42/ 1M
Modalitet:Text
Funktioner:VærktøjerStreaming
Benchmarks
GPQA
53.4%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). Qwen3-Coder-Next scorede 53.4% på denne benchmark.
HLE
28.5%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. Qwen3-Coder-Next scorede 28.5% på denne benchmark.
MMLU
86.2%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. Qwen3-Coder-Next scorede 86.2% på denne benchmark.
MMLU Pro
78.4%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. Qwen3-Coder-Next scorede 78.4% på denne benchmark.
SimpleQA
48.2%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. Qwen3-Coder-Next scorede 48.2% på denne benchmark.
IFEval
89.1%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. Qwen3-Coder-Next scorede 89.1% på denne benchmark.
AIME 2025
89.2%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. Qwen3-Coder-Next scorede 89.2% på denne benchmark.
MATH
83.5%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. Qwen3-Coder-Next scorede 83.5% på denne benchmark.
GSM8k
95.8%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. Qwen3-Coder-Next scorede 95.8% på denne benchmark.
MGSM
92.5%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. Qwen3-Coder-Next scorede 92.5% på denne benchmark.
MathVista
71.2%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. Qwen3-Coder-Next scorede 71.2% på denne benchmark.
SWE-Bench
74.2%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. Qwen3-Coder-Next scorede 74.2% på denne benchmark.
HumanEval
94.1%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. Qwen3-Coder-Next scorede 94.1% på denne benchmark.
LiveCodeBench
74.5%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. Qwen3-Coder-Next scorede 74.5% på denne benchmark.
MMMU
72.4%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. Qwen3-Coder-Next scorede 72.4% på denne benchmark.
MMMU Pro
58.6%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. Qwen3-Coder-Next scorede 58.6% på denne benchmark.
ChartQA
86.4%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. Qwen3-Coder-Next scorede 86.4% på denne benchmark.
DocVQA
93.5%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. Qwen3-Coder-Next scorede 93.5% på denne benchmark.
Terminal-Bench
58.2%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. Qwen3-Coder-Next scorede 58.2% på denne benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. Qwen3-Coder-Next scorede 12.5% på denne benchmark.

Om Qwen3-Coder-Next

Lær om Qwen3-Coder-Nexts muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Modelarkitektur

Qwen3-Coder-Next er en specialiseret open-weight model designet af Alibaba Cloud til software engineering-agenter. Den anvender en Mixture-of-Experts (MoE)-arkitektur med i alt 80 milliarder parameters, men aktiverer kun 3 milliarder parameters pr. token. Dette design kombinerer intelligensen fra en massiv model med inference-hastigheden fra en lille model. Arkitekturen inkluderer en hybrid attention-mekanisme, der integrerer Gated DeltaNet med standard Gated Attention for at behandle kontekster på op til 262.144 tokens.

Agentic specialisering

Modellen er trænet på over 800.000 verificerbare kodningsopgaver og eksekverbare miljøer. Denne træning lægger vægt på reasoning over længere forløb og evnen til at komme sig efter eksekveringsfejl. Den scorer 70,8% på SWE-Bench Verified, hvilket demonstrerer dens kapacitet til at håndtere udviklingsopgaver i flere trin, fra indledende planlægning til endelig kode-eksekvering. Den excellerer i autonome agentic frameworks som OpenClaw og Qwen Code.

Deployment og privatliv

Modellen er licenseret under Apache 2.0 og tilbyder et sikkert alternativ for udviklere, der har brug for lokale, private udviklingsmiljøer. Den kan køre på forbrugerhardware med tilstrækkelig RAM via kvantisering. Det store context window muliggør analyse i repo-skala uden det fald i ydeevne, man typisk ser i modeller med mindre context.

Qwen3-Coder-Next

Anvendelser for Qwen3-Coder-Next

Opdag de forskellige måder, du kan bruge Qwen3-Coder-Next til at opnå gode resultater.

Autonome kodningsagenter

Driver frameworks til at håndtere udviklingsopgaver i flere trin, fra planlægning til endelig eksekvering.

Lokal privat udvikling

Kører elite kodningsassistance på forbruger-GPU'er med 16GB VRAM ved hjælp af kvantiserede MoE-lag.

Analyse af store repositories

Behandler hele kodebaser inden for sit 256k-vindue for at identificere teknisk gæld.

Kodereparation og refaktorering

Opdaterer legacy-kode til moderne standarder ved at levere feedback fra eksekverbare miljøer.

Flersproget scripting

Genererer kode af høj kvalitet på tværs af over 40 programmeringssprog, herunder Rust og Go.

Interaktiv 3D-simulering

Bygger komplekse webbaserede visualiseringer og simuleringer ved hjælp af hurtig one-shot generation.

Styrker

Begrænsninger

MoE-effektivitet: Opererer med 3B aktive parameters til forbrugerhardware, mens den bibeholder intelligens på 80B-niveau.
Krav til system-RAM: Det totale antal på 80B parameters kræver omtrent 45GB total RAM for effektiv 4-bit kvantisering.
Agentic specialisering: Scorer 70,8% på SWE-Bench Verified, hvilket demonstrerer overlegen problemløsning i flere omgange.
Begrænsninger i recurrent state: Hybrid attention-arkitektur betyder, at self-speculative decoding ikke understøttes i almindelige inference-engines.
Massivt native context: Vinduet på 262.144 tokens understøtter analyse i repo-skala uden tab af ydeevne.
Begrænsninger for tekst-kun: Mangler multimodale vision-egenskaber, hvilket forhindrer fejlretning af layouts baseret på screenshots.
Tilladende licensering: Udgivet under Apache 2.0, hvilket muliggør ubegrænset kommerciel brug og privat lokal hosting.
Høj-kompleks fysik: Kan have svært ved one-shot generation af ekstrem 3D-fysik-logik sammenlignet med tætte flagship-modeller.

API hurtig start

alibaba/qwen-3-coder-next

Se dokumentation
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Qwen3-Coder-Next

Se hvad fællesskabet mener om Qwen3-Coder-Next

Matcher næsten Claude i samlede kodningsevner. Slår Claude 3.5 Sonnet på HumanEval med 92,7%.
Philipp Schmid
twitter
Effektiviteten af MoE-versionen er vanvittig for lokal hardware. Jeg får 26 TPS på et system i mellemklassen.
LocalAI_Dev
reddit
Self-speculative decoding er matematisk umuligt for Qwen Coder Next pga. recurrent states.
GodComplecs
reddit
Qwen3-Coder-Next er baseret på MoE, og er meget stærkere og klogere end før!
JustinLin610
twitter
Demonstrerer evnen til at skifte udbyder midt i et projekt med de nye 480B-modelvarianter.
saveralter
reddit
Den agentic træningsopskrift på 800k opgaver kan ses i måden, den genopretter sig efter build-fejl.
TechGurus
hackernews

Videoer om Qwen3-Coder-Next

Se vejledninger, anmeldelser og diskussioner om Qwen3-Coder-Next

Gør den tilgængelig for folk, der vil lege med lokale AI-kodningsagenter

Dette skriger for mig på at teste denne open code-model, hvilket jeg vil gøre

Hukommelseseffektiviteten på denne er en kæmpe sejr

Den håndterer kompleks logik bedre end den tidligere 72B dense-model

Dette er den første open model, der rent faktisk følger mine terminalkommandoer korrekt

Qwen 3 coder Next har også kun 3 milliarder aktive parameters, så den kan køre på et forbruger-grafikkort

Det virker smukt. Jeg er virkelig forbløffet over, at jeg kan få dette resultat i ét hug fra lokal AI

80 milliarder parameters kræver normalt en cluster, men MoE-tilgangen ændrer alt

Den håndterer 40+ programmeringssprog uden mærkbart fald i ydeevne

At bruge den med OpenClaw føles som at have en juniorudvikler på teamet

En model med tre milliarder parameters, der går direkte i clinch med modeller, der er 10 til 20 gange større

Qwen 3 kommer med mange fordele, men til en lavere pris

De 256k context er ægte, den hallucinerede ikke i midten af mit projekt

Latensen er overraskende lav givet den samlede vægt på 80B parameters

Den rettede en bug i min legacy Go-repo, som GPT-4o overså tre gange

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til Qwen3-Coder-Next

Eksperttips til at hjælpe dig med at få mest muligt ud af Qwen3-Coder-Next og opnå bedre resultater.

Brug lange system-prompts

Giv modellen detaljerede eksempler og dokumentation for at finjustere dens agentic adfærd.

Iterativ fejlfeedback

Fodr modellen med fejl-logs fra browserkonsollen for at opnå en høj succesrate ved selvkorrektion.

Optimer lag-offloading

Offload specifikke MoE-ekspertlag til system-RAM for at balancere inference-hastighed og reasoning.

Juster sampling-parametre

Brug en temperatur på 1.0 med top_p 0.95 og top_k 40 for at opnå de mest præcise kodningsresultater.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Ofte stillede spørgsmål om Qwen3-Coder-Next

Find svar på almindelige spørgsmål om Qwen3-Coder-Next