alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next es el model de programación de élite Apache 2.0 de Alibaba Cloud, con una arquitectura MoE de 80B y una context window de 256k para un...

IA de programaciónPesos abiertosMixture of ExpertsFlujos de trabajo agenticLLM local
alibaba logoalibabaQwen3-CoderFebruary 2, 2026
Contexto
256Ktokens
Salida máx.
8Ktokens
Precio entrada
$0.14/ 1M
Precio salida
$0.42/ 1M
Modalidad:Text
Capacidades:HerramientasStreaming
Benchmarks
GPQA
53.4%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Qwen3-Coder-Next obtuvo 53.4% en este benchmark.
HLE
28.5%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Qwen3-Coder-Next obtuvo 28.5% en este benchmark.
MMLU
86.2%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Qwen3-Coder-Next obtuvo 86.2% en este benchmark.
MMLU Pro
78.4%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Qwen3-Coder-Next obtuvo 78.4% en este benchmark.
SimpleQA
48.2%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Qwen3-Coder-Next obtuvo 48.2% en este benchmark.
IFEval
89.1%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Qwen3-Coder-Next obtuvo 89.1% en este benchmark.
AIME 2025
89.2%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Qwen3-Coder-Next obtuvo 89.2% en este benchmark.
MATH
83.5%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Qwen3-Coder-Next obtuvo 83.5% en este benchmark.
GSM8k
95.8%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Qwen3-Coder-Next obtuvo 95.8% en este benchmark.
MGSM
92.5%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Qwen3-Coder-Next obtuvo 92.5% en este benchmark.
MathVista
71.2%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Qwen3-Coder-Next obtuvo 71.2% en este benchmark.
SWE-Bench
74.2%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Qwen3-Coder-Next obtuvo 74.2% en este benchmark.
HumanEval
94.1%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Qwen3-Coder-Next obtuvo 94.1% en este benchmark.
LiveCodeBench
74.5%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Qwen3-Coder-Next obtuvo 74.5% en este benchmark.
MMMU
72.4%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Qwen3-Coder-Next obtuvo 72.4% en este benchmark.
MMMU Pro
58.6%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Qwen3-Coder-Next obtuvo 58.6% en este benchmark.
ChartQA
86.4%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Qwen3-Coder-Next obtuvo 86.4% en este benchmark.
DocVQA
93.5%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Qwen3-Coder-Next obtuvo 93.5% en este benchmark.
Terminal-Bench
58.2%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Qwen3-Coder-Next obtuvo 58.2% en este benchmark.
ARC-AGI
12.5%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Qwen3-Coder-Next obtuvo 12.5% en este benchmark.

Acerca de Qwen3-Coder-Next

Conoce las capacidades, características y formas de uso de Qwen3-Coder-Next.

Descripción general del model

Qwen3-Coder-Next es un model de lenguaje de pesos abiertos state-of-the-art diseñado por el equipo Qwen de Alibaba Cloud, optimizado específicamente para agentes de programación y entornos de desarrollo locales. Construido sobre la arquitectura Qwen3-Next-80B-A3B-Base, utiliza un diseño sofisticado de Mixture-of-Experts (MoE) con atención híbrida (Gated DeltaNet y Gated Attention). Esto permite que el model mantenga una base de conocimientos masiva de 80-billion-parameter mientras activa solo 3 billion parameters por token, lo que resulta en un reasoning de nivel flagship con la velocidad de inference y la huella de memoria de un model mucho más pequeño.

Especialización agentic

El model representa un cambio hacia el escalado de señales de entrenamiento agentic en lugar de solo el recuento bruto de parameters. Ha sido entrenado en más de 800,000 tareas de programación verificables vinculadas a entornos ejecutables, lo que le permite aprender directamente de la retroalimentación del entorno. Esta receta de entrenamiento especializada enfatiza el reasoning de largo horizonte, el uso de herramientas y la capacidad de recuperarse de fallos de ejecución, capacidades que son críticas para los flujos de trabajo modernos de "vibe coding" y marcos de trabajo agentic autónomos como OpenClaw.

Rendimiento local

Con una context window nativa de 256K que puede extrapolarse aún más, Qwen3-Coder-Next está posicionado de manera única como el asistente de programación local-first más potente disponible. Publicado bajo la licencia Apache 2.0, otorga a los desarrolladores el poder de construir, depurar y lanzar bases de código completas dentro de un entorno seguro y privado sin depender de API propietarias en la nube.

Qwen3-Coder-Next

Casos de uso de Qwen3-Coder-Next

Descubre las diferentes formas de usar Qwen3-Coder-Next para lograr excelentes resultados.

Desarrollo agentic local

Impulsa agentes de programación autónomos que pueden planificar, ejecutar y depurar software localmente sin que los datos sensibles salgan de la máquina.

Prototipado web complejo

Generación de aplicaciones full-stack funcionales, incluyendo visualizaciones 3D y juegos interactivos, a partir de un solo prompt en lenguaje natural.

Análisis de grandes repositorios

Utilización de la context window de 256K para ingerir y aplicar reasoning sobre estructuras completas de proyectos de varios archivos para refactorización y optimización.

Auditoría de seguridad automatizada

Escaneo de bases de código en busca de vulnerabilidades complejas como inyección SQL y exposición de credenciales en texto plano con sugerencias de corrección fundamentadas.

Resumen de investigación técnica

Extracción y análisis de documentación técnica o académica densa para producir informes HTML organizados y accionables.

Migración de sistemas entre lenguajes

Traducción de lógica de negocio compleja y restricciones específicas de hardware entre diferentes lenguajes de programación con alta fidelidad.

Fortalezas

Limitaciones

Eficiencia excepcional: Utiliza una arquitectura MoE de 3B active parameters para ofrecer un reasoning de programación de nivel flagship con costes de inference 10 veces menores.
Complejidad en Zero-Shot: Las simulaciones 3D o tareas arquitectónicas muy complejas a menudo requieren de 2 a 3 prompts iterativos para alcanzar la perfección funcional.
Entrenamiento agentic de élite: Entrenado en más de 800,000 tareas verificables, lo que lo hace superior en la planificación de múltiples pasos y en la recuperación de errores de ejecución.
Umbrales de memoria: El requisito de más de 45 GB de RAM para cuantizaciones de alta calidad sigue siendo una barrera para muchos portátiles de desarrollador estándar.
Contexto local masivo: La context window de 256K es una de las más grandes disponibles para modelos locales, lo que permite un reasoning sobre repositorios completos.
Sesgo hacia estética minimalista: Por defecto, crea diseños de interfaz de usuario extremadamente simples y sin estilo a menos que se le pida específicamente un toque visual.
Licencia permisiva: Publicado bajo Apache 2.0, lo que permite a los desarrolladores realizar fine-tuning y desplegar sin licencias propietarias restrictivas.
Restricción de modalidad: A diferencia de la serie VL, el model Coder-Next se basa puramente en texto y no puede procesar activos visuales directamente.

Inicio rápido de API

alibaba/qwen-3-coder-next

Ver documentación
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3-coder-next',
    messages: [{ role: 'user', content: 'Write a React hook for debouncing a value.' }],
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Qwen3-Coder-Next

Mira lo que la comunidad piensa sobre Qwen3-Coder-Next

"Este model es increíble para la programación y se sitúa muy bien frente a la competencia"
Becky Jane
youtube
"La arquitectura permite una longitud de contexto masiva sin disparar la VRAM"
bjan
youtube
"Alibaba está dominando el juego de los pesos abiertos con esta arquitectura MoE"
DevGuru88
reddit
"Finalmente un model local que maneja una context window de 256k sin parecer un caracol"
AI_Explorer
x
"Estoy viendo un decodificado estable de ~7.8 tok/s en CPU, lo cual es suficiente para un revisor de código local"
Express-Jicama-9827
reddit
"Qwen3 Coder es básicamente el destino final para configuraciones de desarrollo local."
TechTrend_AI
x

Videos sobre Qwen3-Coder-Next

Mira tutoriales, reseñas y discusiones sobre Qwen3-Coder-Next

También tenemos una longitud de context window de 256k, que es muy robusta, especialmente para algo que se puede ejecutar localmente.

Tenemos nuestro resultado a una velocidad de 26.17 tokens por segundo... un resultado bastante extenso.

Este es un model muy emocionante... muestra un potencial extremo para la programación agentic.

La precisión en tareas de Python es simplemente asombrosa para un model de pesos abiertos.

Creo que este model elimina oficialmente la necesidad de asistentes de programación de pago para la mayoría de los desarrolladores.

Está construido sobre un model de 3 billion parameters activos en un total de 80 billion parameters.

No es solo un model de IA para programación con una context window de 200k... es absolutamente intuitivo.

Para los usuarios cotidianos, simplemente puedes pedirle que extraiga información de una página web, analice el contenido y genere un informe limpio.

La forma en que maneja proyectos de múltiples archivos localmente cambia las reglas del juego para la privacidad.

El function calling se siente mucho más ágil en comparación con la versión anterior.

Escribiendo historias a 62 tokens por segundo. Boom. Eso fue rápido.

Estamos arrasando ahora mismo... 150 tokens por segundo con procesamiento por lotes... esto es increíble.

Este juego de carreras de coches fue en realidad mejor que la versión en Claude... hay que reconocerlo.

La arquitectura MoE realmente brilla cuando miras la eficiencia de tokens por vatio.

La cuantización no parece afectar la lógica tanto como esperaba.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Qwen3-Coder-Next

Consejos de expertos para ayudarte a sacar el máximo provecho de Qwen3-Coder-Next.

Optimización del ancho de banda del hardware

Para la escala de 80B, asegúrese de que su sistema utilice memoria de canales altos para evitar cuellos de botella de inference en configuraciones que solo usan CPU.

Depuración iterativa

Introduzca los propios errores de tiempo de ejecución del model de nuevo en el prompt; está entrenado específicamente para reconocer fallos de ejecución y refinar su lógica.

Prompting rico en contexto

Maximice la context window de 256K proporcionando archivos de dependencias relevantes y diagramas de arquitectura para reducir alucinaciones.

Refinamiento estético

Al generar interfaces de usuario, solicite explícitamente colores y transiciones CSS para anular la tendencia predeterminada del model hacia diseños minimalistas.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
other

PixVerse-R1

Other

PixVerse-R1 is a next-gen real-time world model by AIsphere, offering interactive 1080p video generation with instant response and physics-aware continuity.

Preguntas Frecuentes Sobre Qwen3-Coder-Next

Encuentra respuestas a preguntas comunes sobre Qwen3-Coder-Next