alibaba

Qwen3-Coder-Next

O Qwen3-Coder-Next é o modelo de programação de elite Apache 2.0 da Alibaba Cloud, apresentando arquitetura MoE de 80B e context window de 256k para...

IA de ProgramaçãoPesos AbertosMixture of ExpertsFluxos de Trabalho AgenticLLM Local
alibaba logoalibabaQwen33 de fevereiro de 2026
Contexto
256Ktokens
Saida Max
8Ktokens
Preco Entrada
$0.14/ 1M
Preco Saida
$0.42/ 1M
Modalidade:Text
Capacidades:FerramentasStreaming
Benchmarks
GPQA
53.4%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Qwen3-Coder-Next pontuou 53.4% neste benchmark.
HLE
28.5%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Qwen3-Coder-Next pontuou 28.5% neste benchmark.
MMLU
86.2%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Qwen3-Coder-Next pontuou 86.2% neste benchmark.
MMLU Pro
78.4%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Qwen3-Coder-Next pontuou 78.4% neste benchmark.
SimpleQA
48.2%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Qwen3-Coder-Next pontuou 48.2% neste benchmark.
IFEval
89.1%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Qwen3-Coder-Next pontuou 89.1% neste benchmark.
AIME 2025
89.2%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Qwen3-Coder-Next pontuou 89.2% neste benchmark.
MATH
83.5%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Qwen3-Coder-Next pontuou 83.5% neste benchmark.
GSM8k
95.8%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Qwen3-Coder-Next pontuou 95.8% neste benchmark.
MGSM
92.5%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Qwen3-Coder-Next pontuou 92.5% neste benchmark.
MathVista
71.2%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Qwen3-Coder-Next pontuou 71.2% neste benchmark.
SWE-Bench
74.2%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Qwen3-Coder-Next pontuou 74.2% neste benchmark.
HumanEval
94.1%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Qwen3-Coder-Next pontuou 94.1% neste benchmark.
LiveCodeBench
74.5%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Qwen3-Coder-Next pontuou 74.5% neste benchmark.
MMMU
72.4%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Qwen3-Coder-Next pontuou 72.4% neste benchmark.
MMMU Pro
58.6%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Qwen3-Coder-Next pontuou 58.6% neste benchmark.
ChartQA
86.4%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Qwen3-Coder-Next pontuou 86.4% neste benchmark.
DocVQA
93.5%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Qwen3-Coder-Next pontuou 93.5% neste benchmark.
Terminal-Bench
58.2%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Qwen3-Coder-Next pontuou 58.2% neste benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Qwen3-Coder-Next pontuou 12.5% neste benchmark.

Sobre Qwen3-Coder-Next

Aprenda sobre as capacidades do Qwen3-Coder-Next, recursos e como ele pode ajuda-lo a obter melhores resultados.

Arquitetura do Modelo

O Qwen3-Coder-Next é um modelo especializado de pesos abertos projetado pela Alibaba Cloud para agentes de engenharia de software. Ele utiliza uma arquitetura de Mixture-of-Experts (MoE) com 80 bilhões de parâmetros totais, mas ativa apenas 3 bilhões de parâmetros por token. Este design combina a inteligência de um modelo massivo com a velocidade de inference de um pequeno. A arquitetura inclui um mecanismo de atenção híbrida, integrando Gated DeltaNet com Gated Attention padrão para processar contextos de até 262.144 tokens.

Especialização Agentic

O modelo é treinado em mais de 800.000 tarefas de programação verificáveis e ambientes executáveis. Este treinamento enfatiza o reasoning de longo prazo e a capacidade de se recuperar de falhas de execução. Ele pontua 70,8% no SWE-Bench Verified, demonstrando sua capacidade de lidar com tarefas de desenvolvimento de várias etapas, desde o planejamento inicial até a execução final do código. Ele se destaca em frameworks agentic autônomos como o OpenClaw e o Qwen Code.

Implantação e Privacidade

Licenciado sob Apache 2.0, este modelo oferece uma alternativa segura para desenvolvedores que exigem ambientes de desenvolvimento locais e privados. Ele pode ser executado em hardware de consumidor com RAM suficiente por meio de quantização. O alto context window permite a análise em escala de repositório sem a degradação de desempenho tipicamente vista em modelos de contexto menor.

Qwen3-Coder-Next

Casos de Uso para Qwen3-Coder-Next

Descubra as diferentes maneiras de usar Qwen3-Coder-Next para obter otimos resultados.

Agentes de Programação Autônomos

Impulsiona frameworks para lidar com tarefas de desenvolvimento de várias etapas, desde o planejamento até a execução final.

Desenvolvimento Local Privado

Executa assistência de programação de elite em GPUs de consumidor com 16GB de VRAM usando camadas MoE quantizadas.

Análise de Repositórios em Grande Escala

Processa bases de código inteiras dentro do seu window de 256k para identificar dívidas técnicas.

Reparo e Refatoração de Código

Atualiza código legado para padrões modernos fornecendo feedback de ambiente executável.

Scripting Multilíngue

Gera código de alta fidelidade em mais de 40 linguagens de programação, incluindo Rust e Go.

Simulação 3D Interativa

Cria visualizadores e simulações complexas baseadas na web usando geração rápida one-shot.

Pontos Fortes

Limitacoes

Eficiência MoE: Opera com 3B de parâmetros ativos para hardware de consumidor, mantendo a inteligência de uma classe de 80B.
Requisitos de RAM do Sistema: A contagem total de 80B de parâmetros requer aproximadamente 45GB de RAM total para uma quantização de 4-bit eficaz.
Especialização Agentic: Pontua 70,8% no SWE-Bench Verified, demonstrando uma resolução de problemas multi-turn superior.
Limitações de Estado Recorrente: A arquitetura de atenção híbrida torna o self-speculative decoding não suportado em engines de inference comuns.
Contexto Nativo Massivo: O window de 262.144 tokens suporta análise em escala de repositório sem degradação de desempenho.
Restrições Apenas de Texto: Carece de capacidades de visão multimodal, impedindo-o de depurar layouts a partir de screenshots.
Licenciamento Permissivo: Lançado sob Apache 2.0, permitindo uso comercial irrestrito e hospedagem local privada.
Física de Alta Complexidade: Pode ter dificuldades com a geração one-shot de lógica física 3D extrema em comparação com modelos flagship densos.

Inicio Rapido da API

alibaba/qwen-3-coder-next

Ver Documentacao
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Qwen3-Coder-Next

Veja o que a comunidade pensa sobre Qwen3-Coder-Next

Praticamente iguala o Claude nas capacidades gerais de programação. Supera o Claude 3.5 Sonnet no HumanEval em 92,7%.
Philipp Schmid
twitter
A eficiência da versão MoE é insana para hardware local. Estou obtendo 26 TPS em um sistema intermediário.
LocalAI_Dev
reddit
O self-speculative decoding é matematicamente impossível para o Qwen Coder Next devido aos estados recorrentes.
GodComplecs
reddit
O Qwen3-Coder-Next é baseado em MoE e muito mais forte e inteligente do que antes!
JustinLin610
twitter
Demonstrando a capacidade de alternar provedores no meio do projeto com as novas variantes de modelo de 480B.
saveralter
reddit
A receita de treinamento agentic em 800 mil tarefas mostra como ele se recupera de erros de build.
TechGurus
hackernews

Videos Sobre Qwen3-Coder-Next

Assista tutoriais, analises e discussoes sobre Qwen3-Coder-Next

Permite que seja acessível para pessoas que desejam brincar com agentes de programação de IA local

Isso para mim está gritando 'teste esse modelo de código aberto', o que farei

A eficiência de memória nisso é uma grande vitória

Ele lida com lógica complexa melhor do que o modelo denso de 72B anterior

Este é o primeiro modelo aberto que realmente segue meus comandos de terminal corretamente

O Qwen 3 coder Next também tem apenas 3 bilhões de parâmetros ativos para rodar em placa de vídeo de consumidor

Funciona maravilhosamente bem. Estou realmente impressionado por conseguir este resultado em um disparo com IA local

80 bilhões de parâmetros geralmente requerem um cluster, mas a abordagem MoE muda tudo

Ele lida com mais de 40 linguagens de programação sem qualquer queda perceptível de desempenho

Usá-lo com o OpenClaw faz parecer ter um desenvolvedor júnior na equipe

Modelo de três bilhões de parâmetros enfrentando modelos de 10 a 20 vezes o seu tamanho

O Qwen 3 vem com muitas vantagens, mas com um custo menor

O contexto de 256k é real, não alucinou no meio do meu projeto

A latency é surpreendentemente baixa, dado o peso total de 80B de parâmetros

Corrigiu um bug no meu repositório Go legado que o GPT-4o perdeu três vezes

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Qwen3-Coder-Next

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Qwen3-Coder-Next e obter melhores resultados.

Use System Prompts Longos

Forneça ao modelo exemplos detalhados e documentação para alinhar seu comportamento agentic.

Feedback Iterativo de Erros

Insira logs de erro do console do navegador de volta no modelo para uma autocorreção de alta taxa de sucesso.

Otimize o Descarregamento de Camadas (Layer Offloading)

Descarregue expert layers específicas de MoE para a RAM do sistema para equilibrar a velocidade de inference e o reasoning.

Alinhe os Parâmetros de Amostragem

Use uma temperature de 1.0 com top_p 0.95 e top_k 40 para obter os resultados de programação mais precisos.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Perguntas Frequentes Sobre Qwen3-Coder-Next

Encontre respostas para perguntas comuns sobre Qwen3-Coder-Next