alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B es el model MoE flagship de pesos abiertos de Alibaba. Cuenta con reasoning multimodal nativo, una context window de 1M y un aumento de 19x...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen2026-02-16
Contexto
1.0Mtokens
Salida máx.
8Ktokens
Precio entrada
$0.60/ 1M
Precio salida
$3.60/ 1M
Modalidad:TextImageVideo
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
88.4%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). Qwen3.5-397B-A17B obtuvo 88.4% en este benchmark.
HLE
28.7%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. Qwen3.5-397B-A17B obtuvo 28.7% en este benchmark.
MMLU
88.6%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. Qwen3.5-397B-A17B obtuvo 88.6% en este benchmark.
MMLU Pro
87.8%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. Qwen3.5-397B-A17B obtuvo 87.8% en este benchmark.
SimpleQA
48%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. Qwen3.5-397B-A17B obtuvo 48% en este benchmark.
IFEval
92.6%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. Qwen3.5-397B-A17B obtuvo 92.6% en este benchmark.
AIME 2025
91.3%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. Qwen3.5-397B-A17B obtuvo 91.3% en este benchmark.
MATH
74.1%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. Qwen3.5-397B-A17B obtuvo 74.1% en este benchmark.
GSM8k
93.7%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. Qwen3.5-397B-A17B obtuvo 93.7% en este benchmark.
MGSM
92.1%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. Qwen3.5-397B-A17B obtuvo 92.1% en este benchmark.
MathVista
90.3%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. Qwen3.5-397B-A17B obtuvo 90.3% en este benchmark.
SWE-Bench
76.4%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). Qwen3.5-397B-A17B obtuvo 76.4% en este benchmark.
HumanEval
79.3%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. Qwen3.5-397B-A17B obtuvo 79.3% en este benchmark.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. Qwen3.5-397B-A17B obtuvo 83.6% en este benchmark.
MMMU
85%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. Qwen3.5-397B-A17B obtuvo 85% en este benchmark.
MMMU Pro
79%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. Qwen3.5-397B-A17B obtuvo 79% en este benchmark.
ChartQA
86.5%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. Qwen3.5-397B-A17B obtuvo 86.5% en este benchmark.
DocVQA
93.2%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. Qwen3.5-397B-A17B obtuvo 93.2% en este benchmark.
Terminal-Bench
52.5%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. Qwen3.5-397B-A17B obtuvo 52.5% en este benchmark.
ARC-AGI
12%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. Qwen3.5-397B-A17B obtuvo 12% en este benchmark.

Acerca de Qwen3.5-397B-A17B

Conoce las capacidades, características y formas de uso de Qwen3.5-397B-A17B.

Un salto monumental en la IA abierta

Qwen3.5-397B-A17B representa un salto monumental en la estrategia de IA de Alibaba Cloud, pasando de ser un fuerte competidor open-source a un sistema dominante de nivel frontier model diseñado para la era de la IA agentic. Lanzado el 16 de febrero de 2026, es el buque insignia de la serie Qwen3.5, utilizando una arquitectura masiva de Mixture-of-Experts (MoE) de 397 mil millones de parameters. Al activar solo 17 mil millones de parameters por token, logra un aumento sin precedentes de 19x en el throughput de decodificación en comparación con su predecesor, Qwen3-Max, mientras reduce la brecha de rendimiento con los models propietarios más avanzados del mundo.

Potencia multimodal unificada

El model es una potencia multimodal nativa y unificada. A diferencia de las versiones anteriores que requerían adaptadores de visión-lenguaje independientes, Qwen3.5 presenta una multimodalidad de fusión temprana entrenada con billones de tokens multimodales. Esto le permite ver y razonar sobre más de dos horas de contenido de vídeo, operar como un agente de GUI en interfaces de escritorio y móviles, y manejar tareas complejas de coding en su modo especializado Thinking. Con un vocabulario ampliado de 250.000 tokens que admite 201 idiomas, se posiciona como la principal opción global para la automatización multilingüe y multimodal.

Diseñado para la era Agentic

Más allá del simple chat, Qwen3.5-397B está optimizado para el uso de herramientas y flujos de trabajo autónomos. Sus altas puntuaciones en benchmarks de function-calling y seguimiento de instrucciones lo convierten en la base ideal para la ingeniería de software visual y la investigación de nivel de doctorado. Al ofrecer un rendimiento state-of-the-art bajo una licencia Apache 2.0, Alibaba ha proporcionado a la comunidad una alternativa creíble y de alta eficiencia a los models closed-source más restringidos.

Qwen3.5-397B-A17B

Casos de uso de Qwen3.5-397B-A17B

Descubre las diferentes formas de usar Qwen3.5-397B-A17B para lograr excelentes resultados.

Agentes de GUI autónomos

Navega por interfaces complejas de PC y smartphones para completar flujos de trabajo de automatización de oficina de múltiples pasos.

Inteligencia de vídeo de larga duración

Extrae resúmenes y razonamientos causales profundos de archivos de vídeo continuos de hasta 120 minutos de duración.

Vibe coding y prototipado

Traduce bocetos de UI directamente en código React y lógica frontend lista para producción en un solo intento.

Investigación de nivel de doctorado

Resuelve problemas de STEM de nivel de postgrado utilizando el modo especializado de razonamiento interno chain-of-thought.

Soporte global multilingüe

Interactúa con usuarios en 201 idiomas con una eficiencia de tokenización superior para escrituras no inglesas.

Ingeniería de software visual

Transforma wireframes y capturas de pantalla en código HTML, CSS y JavaScript limpio y consciente del diseño.

Fortalezas

Limitaciones

Eficiencia de inference: Logra mejoras de 19x en el throughput de decodificación activando solo 17B de parameters a través de su arquitectura MoE híbrida.
Demanda masiva de hardware: Con 397B de parameters totales, ejecutar versiones sin cuantificar localmente requiere una infraestructura de nivel servidor de gama alta.
Reasoning de vídeo nativo: Procesa hasta 120 minutos de vídeo continuo de forma nativa sin necesidad de adaptadores de extracción de fotogramas.
Brecha en la modalidad de audio: Carece de las capacidades nativas de entrada y salida de audio que se encuentran en los models 'omni' como GPT-4o o Gemini.
Capacidad STEM de primer nivel: Compite con models de reasoning propietarios con una puntuación del 88,4% en GPQA y del 91,3% en los exámenes de matemáticas AIME 2025.
Brecha de rendimiento en HLE: Se sitúa por detrás de los líderes propietarios en Humanity's Last Exam (28,7%), lo que indica lagunas en conocimientos expertos de nicho.
Accesibilidad de pesos abiertos: Proporciona inteligencia multimodal de nivel frontier model bajo la licencia Apache 2.0 para despliegues en empresas privadas.
Huella de memoria: Su escala masiva requiere una VRAM sustancial incluso con dispersión, lo que limita su despliegue generalizado a nivel de consumidor.

Inicio rápido de API

alibaba/qwen-3.5-plus

Ver documentación
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre Qwen3.5-397B-A17B

Mira lo que la comunidad piensa sobre Qwen3.5-397B-A17B

Qwen3.5-397B es básicamente la respuesta de la comunidad open-source a GPT-4o. La capacidad SVG por sí sola es increíble para el diseño web.
u/LLM_Reviewer
reddit
El aumento de 19x en el throughput hace que Qwen3.5 se sienta significativamente más ágil que cualquier otro model de este tamaño que haya probado.
tech_enthusiast_99
reddit
Apache 2.0 para un model de este tamaño es un cambio total de paradigma para el desarrollo local de IA y empresas enfocadas en la privacidad.
TechInnovator88
twitter
El enrutamiento MoE en el model 3.5-397B es notablemente más inteligente que el de la generación 2.5 anterior; realmente sigue la lógica.
DistanceSolar1449
reddit
El contexto de 1M en un model de pesos abiertos de este calibre no tiene precedentes en el ecosistema actual.
dev_logic
hackernews
El reasoning de vídeo no es solo fotograma a fotograma; es una comprensión temporal real que se siente a años luz de los vision LLMs actuales.
Matthew Berman (Context)
youtube

Videos sobre Qwen3.5-397B-A17B

Mira tutoriales, reseñas y discusiones sobre Qwen3.5-397B-A17B

Supera a Claude Opus 4.5 en navegación web, así como a Gemini 3 Pro en varias tareas multimodal.

Según se informa, es 19 veces más rápido que Qwen 3 Max, que admite 201 idiomas y dialectos.

Hizo un trabajo fantástico con la mariposa fotorrealista... mejor que la mayoría de los models open-source.

El model 397B es esencialmente el primer model de pesos abiertos que realmente compite en la frontera de la AGI.

Escalar con MoE claramente está funcionando para Alibaba y sus últimos resultados de benchmark lo demuestran.

Este model está igualando lo que su Qwen Max era capaz de hacer... pero con un aumento de velocidad de hasta 19x.

El tokenizador ha pasado a un vocab de 250K... igualando a Gemini y al tokenizador de Google.

Hay que ver al equipo de Qwen como un Frontier Lab... se están lanzando a tareas en las que se centran los laboratorios propietarios.

La tokenización es mucho más eficiente para escrituras no latinas en comparación con las iteraciones anteriores de Llama.

El modo Thinking añade una latency significativa, pero la ganancia de precisión merece la pena para coding y reasoning.

Este es un vision language model unificado... donde los models anteriores tenían una variante VL específica, este lo contiene todo en un solo model.

La comprensión de vídeo le permite captar detalles temporales que los métodos de extracción de fotogramas pasan por alto.

En términos de coding, se siente tan receptivo como el model GPT-4o pero con un mejor seguimiento de instrucciones.

La capacidad de agente de GUI de escritorio es la característica más destacada aquí para la automatización en el mundo real.

Maneja 120 minutos de vídeo sin perder el contexto, lo cual es sencillamente masivo para el análisis.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para Qwen3.5-397B-A17B

Consejos de expertos para ayudarte a sacar el máximo provecho de Qwen3.5-397B-A17B.

Activar el modo Thinking

Utiliza el parámetro enable_thinking para tareas con gran carga lógica para activar rutas de reasoning internas profundas.

Aprovecha la búsqueda nativa

Activa el parámetro search en el cuerpo de la solicitud para verificar hechos con datos de la web en tiempo real y ejecutar código python.

Optimiza los prompts de vídeo

Proporciona anclas de marcas de tiempo específicas para centrar la context window de 1M de tokens en los segmentos más relevantes.

Selección de endpoint regional

Utiliza el endpoint dashscope-intl para usuarios fuera de China continental para reducir la latency de red.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Preguntas Frecuentes Sobre Qwen3.5-397B-A17B

Encuentra respuestas a preguntas comunes sobre Qwen3.5-397B-A17B