alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next è il model di programmazione d'élite Apache 2.0 di Alibaba Cloud, dotato di un'architettura MoE da 80B e un context window da 256k per uno...

AI di programmazioneOpen WeightsMixture of ExpertsFlussi di lavoro agenticLLM locale
alibaba logoalibabaQwen33 febbraio 2026
Contesto
256Ktoken
Output max
8Ktoken
Prezzo input
$0.14/ 1M
Prezzo output
$0.42/ 1M
Modalita:Text
Capacita:StrumentiStreaming
Benchmark
GPQA
53.4%
GPQA: Domande scientifiche livello laurea. Un benchmark rigoroso con 448 domande su biologia, fisica e chimica. Gli esperti PhD raggiungono solo il 65-74% di accuratezza. Qwen3-Coder-Next ha ottenuto 53.4% in questo benchmark.
HLE
28.5%
HLE: Ragionamento esperto di alto livello. Testa la capacita di un modello di dimostrare ragionamento a livello esperto in domini specializzati. Qwen3-Coder-Next ha ottenuto 28.5% in questo benchmark.
MMLU
86.2%
MMLU: Comprensione linguistica multitask massiva. Un benchmark completo con 16.000 domande su 57 materie accademiche. Qwen3-Coder-Next ha ottenuto 86.2% in questo benchmark.
MMLU Pro
78.4%
MMLU Pro: MMLU Edizione Professionale. Una versione migliorata di MMLU con 12.032 domande e un formato piu difficile a 10 opzioni. Qwen3-Coder-Next ha ottenuto 78.4% in questo benchmark.
SimpleQA
48.2%
SimpleQA: Benchmark di accuratezza fattuale. Testa la capacita di un modello di fornire risposte accurate e fattuali. Qwen3-Coder-Next ha ottenuto 48.2% in questo benchmark.
IFEval
89.1%
IFEval: Valutazione del seguire istruzioni. Misura quanto bene un modello segue istruzioni e vincoli specifici. Qwen3-Coder-Next ha ottenuto 89.1% in questo benchmark.
AIME 2025
89.2%
AIME 2025: Esame di matematica invitazionale americano. Problemi matematici a livello competitivo dal prestigioso esame AIME. Qwen3-Coder-Next ha ottenuto 89.2% in questo benchmark.
MATH
83.5%
MATH: Risoluzione di problemi matematici. Un benchmark matematico completo che testa la risoluzione di problemi in algebra, geometria, calcolo. Qwen3-Coder-Next ha ottenuto 83.5% in questo benchmark.
GSM8k
95.8%
GSM8k: Matematica scuola elementare 8K. 8.500 problemi matematici a parole di livello scuola elementare. Qwen3-Coder-Next ha ottenuto 95.8% in questo benchmark.
MGSM
92.5%
MGSM: Matematica multilingue scuola elementare. Il benchmark GSM8k tradotto in 10 lingue. Qwen3-Coder-Next ha ottenuto 92.5% in questo benchmark.
MathVista
71.2%
MathVista: Ragionamento visivo matematico. Testa la capacita di risolvere problemi matematici con elementi visivi. Qwen3-Coder-Next ha ottenuto 71.2% in questo benchmark.
SWE-Bench
74.2%
SWE-Bench: Benchmark ingegneria software. I modelli AI tentano di risolvere veri problemi GitHub in progetti Python. Qwen3-Coder-Next ha ottenuto 74.2% in questo benchmark.
HumanEval
94.1%
HumanEval: Problemi di programmazione Python. 164 problemi di programmazione dove i modelli devono generare implementazioni corrette di funzioni Python. Qwen3-Coder-Next ha ottenuto 94.1% in questo benchmark.
LiveCodeBench
74.5%
LiveCodeBench: Benchmark di codifica live. Testa le capacita di codifica su sfide di programmazione reali continuamente aggiornate. Qwen3-Coder-Next ha ottenuto 74.5% in questo benchmark.
MMMU
72.4%
MMMU: Comprensione multimodale. Benchmark di comprensione multimodale su 30 materie universitarie. Qwen3-Coder-Next ha ottenuto 72.4% in questo benchmark.
MMMU Pro
58.6%
MMMU Pro: MMMU Edizione Professionale. Versione migliorata di MMMU con domande piu impegnative. Qwen3-Coder-Next ha ottenuto 58.6% in questo benchmark.
ChartQA
86.4%
ChartQA: Domande e risposte su grafici. Testa la capacita di comprendere e analizzare informazioni da grafici e diagrammi. Qwen3-Coder-Next ha ottenuto 86.4% in questo benchmark.
DocVQA
93.5%
DocVQA: Domande visive su documenti. Testa la capacita di estrarre informazioni da immagini di documenti. Qwen3-Coder-Next ha ottenuto 93.5% in questo benchmark.
Terminal-Bench
58.2%
Terminal-Bench: Attivita terminale/CLI. Testa la capacita di eseguire operazioni da linea di comando. Qwen3-Coder-Next ha ottenuto 58.2% in questo benchmark.
ARC-AGI
12.5%
ARC-AGI: Astrazione e ragionamento. Testa l'intelligenza fluida attraverso nuovi puzzle di riconoscimento di pattern. Qwen3-Coder-Next ha ottenuto 12.5% in questo benchmark.

Informazioni su Qwen3-Coder-Next

Scopri le capacita di Qwen3-Coder-Next, le funzionalita e come puo aiutarti a ottenere risultati migliori.

Architettura del model

Qwen3-Coder-Next è un model open-weight specializzato progettato da Alibaba Cloud per agenti di ingegneria del software. Utilizza un'architettura Mixture-of-Experts (MoE) con 80 miliardi di parametri totali, ma attiva solo 3 miliardi di parametri per token. Questo design combina l'intelligenza di un model massiccio con la velocità di inference di uno piccolo. L'architettura include un meccanismo di attenzione ibrido, che integra Gated DeltaNet con la Gated Attention standard per elaborare contesti fino a 262.144 tokens.

Specializzazione agentic

Il model è addestrato su oltre 800.000 attività di programmazione verificabili e ambienti eseguibili. Questo addestramento enfatizza il reasoning a lungo raggio e la capacità di ripristino in caso di fallimenti dell'esecuzione. Ottiene un punteggio del 70,8% su SWE-Bench Verified, dimostrando la sua capacità di gestire attività di sviluppo in più fasi, dalla pianificazione iniziale all'esecuzione del codice finale. Eccelle in framework agentic autonomi come OpenClaw e Qwen Code.

Deployment e privacy

Concesso in licenza con Apache 2.0, questo model offre un'alternativa sicura per gli sviluppatori che necessitano di ambienti di sviluppo locali e privati. Può essere eseguito su hardware di classe consumer con RAM sufficiente tramite quantizzazione. L'elevato context window consente l'analisi a livello di repository senza il degrado delle prestazioni tipicamente riscontrato nei model con contesto più ridotto.

Qwen3-Coder-Next

Casi d'uso per Qwen3-Coder-Next

Scopri i diversi modi in cui puoi usare Qwen3-Coder-Next per ottenere ottimi risultati.

Agenti di programmazione autonomi

Alimenta framework in grado di gestire attività di sviluppo in più fasi, dalla pianificazione all'esecuzione finale.

Sviluppo locale privato

Esegue assistenza alla programmazione d'élite su GPU consumer con 16GB di VRAM utilizzando layer MoE quantizzati.

Analisi di repository su larga scala

Elabora intere codebase all'interno della sua finestra da 256k per identificare il debito tecnico.

Riparazione e refactoring del codice

Aggiorna codice legacy agli standard moderni fornendo feedback in ambienti eseguibili.

Scripting multilingue

Genera codice ad alta fedeltà in oltre 40 linguaggi di programmazione, inclusi Rust e Go.

Simulazione 3D interattiva

Crea complessi visualizzatori e simulazioni basati sul web utilizzando una rapida generazione one-shot.

Punti di forza

Limitazioni

Efficienza MoE: Opera con 3B di parametri attivi su hardware consumer, pur mantenendo un'intelligenza di classe 80B.
Requisiti di RAM di sistema: Il numero totale di 80B di parametri richiede circa 45GB di RAM totale per un'efficace quantizzazione a 4-bit.
Specializzazione agentic: Ottiene un punteggio del 70,8% su SWE-Bench Verified, dimostrando una risoluzione di problemi multi-turno superiore.
Limitazioni dello stato ricorrente: L'architettura di attenzione ibrida rende il self-speculative decoding non supportato nei comuni motori di inference.
Massiccio contesto nativo: La finestra da 262.144 tokens supporta l'analisi a livello di repository senza degrado delle prestazioni.
Vincoli solo testo: Manca di capacità di visione multimodal, il che impedisce il debug dei layout tramite screenshot.
Licenza permissiva: Rilasciato con licenza Apache 2.0, che consente un uso commerciale illimitato e l'hosting locale privato.
Fisica ad alta complessità: Potrebbe avere difficoltà con la generazione one-shot di logica fisica 3D estrema rispetto ai model flagship densi.

Avvio rapido API

alibaba/qwen-3-coder-next

Visualizza documentazione
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

Installa l'SDK e inizia a fare chiamate API in pochi minuti.

Cosa dice la gente su Qwen3-Coder-Next

Guarda cosa pensa la community di Qwen3-Coder-Next

Eguaglia quasi Claude nelle capacità di programmazione generali. Batte Claude 3.5 Sonnet su HumanEval al 92,7%.
Philipp Schmid
twitter
L'efficienza della versione MoE è incredibile per l'hardware locale. Sto ottenendo 26 TPS su un sistema di fascia media.
LocalAI_Dev
reddit
Il self-speculative decoding è matematicamente impossibile per Qwen Coder Next a causa degli stati ricorrenti.
GodComplecs
reddit
Qwen3-Coder-Next si basa su MoE ed è molto più forte e intelligente di prima!
JustinLin610
twitter
Dimostra la capacità di cambiare provider a metà progetto con le nuove varianti di model da 480B.
saveralter
reddit
La ricetta di addestramento agentic su 800k attività si nota nel modo in cui si riprende dagli errori di build.
TechGurus
hackernews

Video su Qwen3-Coder-Next

Guarda tutorial, recensioni e discussioni su Qwen3-Coder-Next

Lo rende accessibile a chi vuole sperimentare con agenti di programmazione AI locali

Questo mi spinge a testare immediatamente questo model open code

L'efficienza della memoria in questo caso è un enorme vantaggio

Gestisce la logica complessa meglio del precedente model denso da 72B

È il primo model open che segue correttamente i miei comandi da terminale

Qwen 3 Coder Next ha solo 3 miliardi di parametri attivi per girare su schede video consumer

Funziona magnificamente. Sono davvero stupito di poter ottenere questo risultato in un colpo solo da una AI locale

80 miliardi di parametri di solito richiedono un cluster, ma l'approccio MoE cambia tutto

Gestisce oltre 40 linguaggi di programmazione senza alcun calo di prestazioni evidente

Usarlo con OpenClaw fa sembrare di avere un programmatore junior nel team

Un model da tre miliardi di parametri che sfida modelli da 10 a 20 volte la sua dimensione

Qwen 3 offre molti vantaggi ma con un costo inferiore

Il contesto da 256k è reale, non ha avuto allucinazioni nel mezzo del mio progetto

La latency è sorprendentemente bassa dato il peso totale di 80B di parametri

Ha corretto un bug nel mio repository Go legacy che GPT-4o aveva mancato tre volte

Piu di semplici prompt

Potenzia il tuo workflow con l'automazione AI

Automatio combina la potenza degli agenti AI, dell'automazione web e delle integrazioni intelligenti per aiutarti a fare di piu in meno tempo.

Agenti AI
Automazione web
Workflow intelligenti

Consigli Pro per Qwen3-Coder-Next

Consigli esperti per aiutarti a ottenere il massimo da Qwen3-Coder-Next e raggiungere risultati migliori.

Utilizzare prompt di sistema lunghi

Fornisci al model esempi dettagliati e documentazione per allineare il suo comportamento agentic.

Feedback iterativo sugli errori

Invia i log di errore della console del browser al model per un'auto-correzione ad alto tasso di successo.

Ottimizzare lo scaricamento dei layer

Scarica specifici layer expert della MoE nella RAM di sistema per bilanciare la velocità di inference e il reasoning.

Allineare i parametri di campionamento

Utilizza una temperature di 1.0 con top_p 0.95 e top_k 40 per ottenere i risultati di programmazione più accurati.

Testimonianze

Cosa dicono i nostri utenti

Unisciti a migliaia di utenti soddisfatti che hanno trasformato il loro workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Correlati AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Domande frequenti su Qwen3-Coder-Next

Trova risposte alle domande comuni su Qwen3-Coder-Next