alibaba

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview es el model MoE insignia de Alibaba, con 1M de contexto, modo de razonamiento nativo y puntuaciones SOTA en agentic coding y razonamiento.

MoEAgentic Coding1M ContextFrontier ModelAlibaba Qwen
alibaba logoalibabaQwen 3.620 de abril de 2026
Contexto
1.0Mtokens
Salida máx.
8Ktokens
Precio entrada
$1.25/ 1M
Precio salida
$10.00/ 1M
Modalidad:TextImageVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
86%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Qwen3.6-Max-Preview obtuvo 86% en este benchmark.
HLE
51%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Qwen3.6-Max-Preview obtuvo 51% en este benchmark.
MMLU
83%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Qwen3.6-Max-Preview obtuvo 83% en este benchmark.
MMLU Pro
79%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Qwen3.6-Max-Preview obtuvo 79% en este benchmark.
SimpleQA
52%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Qwen3.6-Max-Preview obtuvo 52% en este benchmark.
IFEval
75%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Qwen3.6-Max-Preview obtuvo 75% en este benchmark.
AIME 2025
93%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Qwen3.6-Max-Preview obtuvo 93% en este benchmark.
MATH
95%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Qwen3.6-Max-Preview obtuvo 95% en este benchmark.
GSM8k
98%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Qwen3.6-Max-Preview obtuvo 98% en este benchmark.
MGSM
92%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Qwen3.6-Max-Preview obtuvo 92% en este benchmark.
MathVista
86%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Qwen3.6-Max-Preview obtuvo 86% en este benchmark.
SWE-Bench
73%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Qwen3.6-Max-Preview obtuvo 73% en este benchmark.
HumanEval
91%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Qwen3.6-Max-Preview obtuvo 91% en este benchmark.
LiveCodeBench
79%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Qwen3.6-Max-Preview obtuvo 79% en este benchmark.
MMMU
82%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Qwen3.6-Max-Preview obtuvo 82% en este benchmark.
MMMU Pro
75%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Qwen3.6-Max-Preview obtuvo 75% en este benchmark.
ChartQA
85%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Qwen3.6-Max-Preview obtuvo 85% en este benchmark.
DocVQA
89%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Qwen3.6-Max-Preview obtuvo 89% en este benchmark.
Terminal-Bench
65%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Qwen3.6-Max-Preview obtuvo 65% en este benchmark.
ARC-AGI
14%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Qwen3.6-Max-Preview obtuvo 14% en este benchmark.

Acerca de Qwen3.6-Max-Preview

Conoce las capacidades, características y formas de uso de Qwen3.6-Max-Preview.

Qwen3.6-Max-Preview es el gran lenguaje model (LLM) propietario insignia de Alibaba, que representa el siguiente paso en su serie de IA de alto rendimiento. Utilizando una arquitectura de Mixture-of-Experts (MoE) dispersa, el model logra la profundidad de razonamiento de un sistema de un billón de parameters mientras mantiene una eficiencia operativa significativa. Está específicamente optimizado para agentic coding, conocimiento general y seguimiento de instrucciones complejas.

La característica destacada del model es su Thinking Mode nativo, que permite al sistema generar una chain-of-thought interna visible antes de entregar una respuesta final. Esta transparencia es particularmente valiosa para los desarrolladores que construyen agentes autónomos, ya que proporciona una ventana clara a los pasos de planificación lógica y corrección de errores. Combinado con una masiva context window de 1 millón de tokens, el model puede ingerir repositorios de proyectos completos o extensas bibliotecas de documentación en una sola pasada.

Alojado en Alibaba Cloud Model Studio, Qwen3.6-Max-Preview admite protocolos estándar de la industria y es compatible con las especificaciones de API al estilo OpenAI. Está diseñado para ser la opción principal para empresas que requieren capacidades de IA de nivel frontier para análisis de datos multimodales y flujos de trabajo agentic robustos, ofreciendo una alternativa de alto rendimiento a los models closed-source occidentales.

Qwen3.6-Max-Preview

Casos de uso de Qwen3.6-Max-Preview

Descubre las diferentes formas de usar Qwen3.6-Max-Preview para lograr excelentes resultados.

Ingeniería de software autónoma

Implementa el model como un agente de programación capaz de navegar por bases de código completas, planificar cambios arquitectónicos y corregir errores en múltiples archivos.

Análisis técnico a gran escala

Utiliza la context window de 1M tokens para ingerir conjuntos completos de documentación o marcos legales para un análisis profundo sin las limitaciones del RAG.

Razonamiento y planificación complejos

Aprovecha el Thinking Mode nativo para resolver problemas matemáticos de alto nivel donde se requiere un plan interno de múltiples pasos para garantizar la precisión.

Comprensión de contenido multimodal

Analiza tanto imágenes estáticas como secuencias de vídeo complejas para extraer datos y resumir eventos visuales dinámicos.

Operaciones de terminal interactivas

Crea herramientas que permitan a la IA interactuar directamente con shells y entornos CLI, beneficiándose de su rendimiento optimizado en Terminal-Bench.

Flujos de trabajo agentic empresariales

Integra el model en pipelines de negocio complejos donde se requiere una alta fiabilidad instruccional y un tool-calling sofisticado para la automatización.

Fortalezas

Limitaciones

Capacidad de programación líder mundial: Logra una puntuación del 57,3 % en SWE-bench Pro, superando a importantes frontier models como Claude 4.5 Opus en tareas de software autónomas.
Restricción de código cerrado: A diferencia de las versiones Medium de Qwen 3.6, el Max-Preview es propietario y no puede autoalojarse en hardware local.
Enorme context window de 1M tokens: Maneja conjuntos de datos masivos y bibliotecas técnicas completas dentro de un mismo prompt sin la degradación de contexto típica de arquitecturas más antiguas.
Prima alta por token de salida: El precio de 10,00 $/1M de tokens de salida supone un incremento de 8 veces respecto al precio de entrada, lo que hace que las cadenas de razonamiento largas sean más costosas que la ingestión.
Razonamiento nativo transparente: El Thinking Mode integrado expone la lógica interna, lo que permite una mayor fiabilidad en la resolución de problemas complejos y facilita la depuración.
Limitaciones en el corte de conocimientos: Como model de vista previa estática, carece de conocimiento en tiempo real de eventos o actualizaciones de bibliotecas posteriores a su fecha de corte de entrenamiento a principios de 2026.
Posicionamiento de precios agresivo: Con 1,25 $ por millón de tokens de entrada, ofrece un rendimiento de nivel frontier a una fracción del coste de sus equivalentes propietarios occidentales.
Latency de API regional: Dependiendo de la región de despliegue, los usuarios internacionales pueden experimentar una mayor latency en comparación con variantes locales altamente optimizadas.

Inicio rápido de API

alibaba/qwen3.6-max-preview

Ver documentación
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  base_url: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.6-max-preview',
    messages: [{ role: 'user', content: 'Design a system architecture for a real-time AI agent.' }],
    extra_body: { enable_thinking: true },
    stream: true
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Qwen3.6-Max-Preview

Mira lo que la comunidad piensa sobre Qwen3.6-Max-Preview

El tipo de rendimiento que esperarías de un model ejecutándose en una granja de servidores masiva está ahora en tu escritorio.
softtechhubus
reddit
Qwen3.6-Max-Preview acaba de superar a Claude Opus 4.5 en SWE-Bench Pro. China se está poniendo al día rápidamente.
BridgeMind
twitter
A 1,25 $ por millón de tokens, Qwen es significativamente más barato que Claude para la ingestión de datos a gran escala.
TechReviewer2026
reddit
El hecho de que el Thinking Mode esté integrado como estado predeterminado es una decisión de diseño significativa para la fiabilidad de los agentes.
DevGuru
twitter
Qwen ha lanzado Qwen 3.6 Max Preview como un nuevo model flagship propietario de alta gama.
AICodeKing
youtube
Muestra un agentic coding mejorado y una mayor fiabilidad de agentes en el mundo real en comparación con el model Plus.
Codedigipt
youtube

Videos sobre Qwen3.6-Max-Preview

Mira tutoriales, reseñas y discusiones sobre Qwen3.6-Max-Preview

Qwen ha lanzado Qwen 3.6 Max Preview como un nuevo model flagship propietario de alta gama.

El model muestra un fuerte salto en benchmarks de coding-agent como SkillsBench y Terminal-Bench 2.0.

Qwen claramente está tratando de competir seriamente en la gama alta contra models como Claude 4.5 Opus.

Este model representa una mejora significativa en el conocimiento general y en el seguimiento de instrucciones.

El salto de rendimiento en SWE-bench es lo que realmente lo distingue de la variante Plus.

La historia de los benchmarks trata realmente de posicionar el Max Preview alojado como algo distinto a la familia open-weight.

Usamos páginas de Qwen Code y superficies de repositorios para juzgar la profundidad del ecosistema más allá de los pesos del model.

El thinking mode es sorprendentemente rápido en comparación con los models al estilo o1 del año pasado.

Claramente está diseñado para desarrolladores empresariales que necesitan una API fiable para tareas de agentes.

El rendimiento multimodal de visión está alcanzando a Gemini 2 en algunas pruebas de análisis de documentos.

Este vídeo presenta Qwen3.6-Max-Preview, un primer vistazo al próximo model flagship de Qwen.

Muestra un agentic coding mejorado y una mayor fiabilidad de agentes en el mundo real en comparación con el model Plus.

La context window de 1M es mucho más estable de lo que vimos en las primeras versiones de Qwen 2.

Si programas mucho, Qwen 3.6 Max es actualmente el líder en benchmarks.

El precio sigue siendo muy competitivo incluso para su model closed-source insignia.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Qwen3.6-Max-Preview

Consejos de expertos para ayudarte a sacar el máximo provecho de Qwen3.6-Max-Preview.

Habilitar el razonamiento interno

Establece el parámetro 'enable_thinking' en true en tu solicitud de API para ver la lógica interna del model y depurar razonamientos complejos.

Preservar la lógica de largo alcance

Utiliza la función 'preserve_thinking' para conversaciones de múltiples turnos para asegurar que el model mantenga la coherencia lógica a lo largo de toda la sesión.

Alimentar con bibliotecas completas

Aprovecha la context window de 1M proporcionando materiales fuente completos en lugar de datos fragmentados para una mejor comprensión entre archivos.

Usar endpoints compatibles

Para aplicaciones globales, utiliza los endpoints de Singapur o Virginia (EE. UU.) en Alibaba Cloud para minimizar la latency regional para usuarios internacionales.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Preguntas Frecuentes Sobre Qwen3.6-Max-Preview

Encuentra respuestas a preguntas comunes sobre Qwen3.6-Max-Preview