alibaba

Qwen3.5-397B-A17B

O Qwen3.5-397B-A17B é o modelo MoE open-weight flagship da Alibaba. Ele apresenta reasoning multimodal nativo, uma janela de contexto de 1M e um throughput de...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516 de fevereiro de 2026
Contexto
1.0Mtokens
Saida Max
8Ktokens
Preco Entrada
$0.60/ 1M
Preco Saida
$3.60/ 1M
Modalidade:TextImageVideo
Capacidades:VisaoFerramentasStreamingRaciocinio
Benchmarks
GPQA
88.4%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Qwen3.5-397B-A17B pontuou 88.4% neste benchmark.
HLE
28.7%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Qwen3.5-397B-A17B pontuou 28.7% neste benchmark.
MMLU
88.6%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Qwen3.5-397B-A17B pontuou 88.6% neste benchmark.
MMLU Pro
87.8%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Qwen3.5-397B-A17B pontuou 87.8% neste benchmark.
SimpleQA
48%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Qwen3.5-397B-A17B pontuou 48% neste benchmark.
IFEval
92.6%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Qwen3.5-397B-A17B pontuou 92.6% neste benchmark.
AIME 2025
91.3%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Qwen3.5-397B-A17B pontuou 91.3% neste benchmark.
MATH
74.1%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Qwen3.5-397B-A17B pontuou 74.1% neste benchmark.
GSM8k
93.7%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Qwen3.5-397B-A17B pontuou 93.7% neste benchmark.
MGSM
92.1%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Qwen3.5-397B-A17B pontuou 92.1% neste benchmark.
MathVista
90.3%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Qwen3.5-397B-A17B pontuou 90.3% neste benchmark.
SWE-Bench
76.4%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Qwen3.5-397B-A17B pontuou 76.4% neste benchmark.
HumanEval
79.3%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Qwen3.5-397B-A17B pontuou 79.3% neste benchmark.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Qwen3.5-397B-A17B pontuou 83.6% neste benchmark.
MMMU
85%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Qwen3.5-397B-A17B pontuou 85% neste benchmark.
MMMU Pro
79%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Qwen3.5-397B-A17B pontuou 79% neste benchmark.
ChartQA
86.5%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Qwen3.5-397B-A17B pontuou 86.5% neste benchmark.
DocVQA
93.2%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Qwen3.5-397B-A17B pontuou 93.2% neste benchmark.
Terminal-Bench
52.5%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Qwen3.5-397B-A17B pontuou 52.5% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Qwen3.5-397B-A17B pontuou 12% neste benchmark.

Sobre Qwen3.5-397B-A17B

Aprenda sobre as capacidades do Qwen3.5-397B-A17B, recursos e como ele pode ajuda-lo a obter melhores resultados.

Mixture of Experts de Alta Eficiência

Qwen3.5-397B-A17B é um modelo multimodal nativo flagship que utiliza uma arquitetura híbrida inovadora, fundindo atenção linear através de Gated Delta Networks com uma Mixture-of-Experts (MoE) esparsa. Embora contenha 397 bilhões de parâmetros totais, seu design esparso ativa apenas 17 bilhões de parâmetros por passagem direta, alcançando eficiência e velocidade de inference excepcionais sem comprometer suas vastas capacidades de reasoning. Ele é otimizado tanto para tarefas de linguagem quanto visuais, suportando um vocabulário massivo de 250k tokens e oferecendo suporte para mais de 201 idiomas e dialetos.

Fluxos de Trabalho Agentic Multimodais Nativos

O modelo se destaca como um agente multimodal nativo, capaz de processar até um milhão de tokens de contexto, o que equivale a aproximadamente duas horas de vídeo. Ele introduz um Thinking Mode especializado para reasoning lógico complexo e é equipado nativamente para fluxos de trabalho agentic, incluindo desenvolvimento web, navegação de GUI e inteligência espacial do mundo real. Sua arquitetura suporta treinamento FP8 de ponta a ponta e um framework de treinamento-inference desagregado, tornando-o um dos modelos mais escaláveis e eficientes para aplicações de IA de nível empresarial.

Open Weights para Acessibilidade Global

Lançado sob a licença Apache 2.0, este modelo fornece à comunidade open-source capacidades de nível de fronteira anteriormente restritas a sistemas proprietários. Ele preenche a lacuna entre contagens massivas de parâmetros e implantação prática, permitindo que organizações executem tarefas de reasoning de última geração em infraestrutura privada com um overhead de computação significativamente menor do que as alternativas densas de 400B.

Qwen3.5-397B-A17B

Casos de Uso para Qwen3.5-397B-A17B

Descubra as diferentes maneiras de usar Qwen3.5-397B-A17B para obter otimos resultados.

Análise de Vídeo de Longa Duração

Analise até duas horas de conteúdo de vídeo para extrair lógica, realizar engenharia reversa de código a partir de filmagens ou gerar resumos estruturados.

Pesquisa STEM de Nível de PhD

Resolva questões científicas de nível de doutorado e problemas matemáticos de nível de olimpíada usando seu modo de deep-thinking adaptativo.

Agentes de GUI Autônomos

Automatize interações com smartphones e computadores para lidar com fluxos de trabalho de escritório e navegação móvel entre aplicativos.

Engenharia de Software Visual

Execute 'vibe coding' transformando instruções em linguagem natural e esboços de UI em código frontend funcional.

Inteligência Documental

Processe documentos complexos, gráficos e esboços manuscritos para extrair dados estruturados e realizar engenharia reversa de layouts.

Aplicações de IA Espacial

Entenda relações em nível de pixel para tarefas de IA incorporada (embodied AI), como análise de cenas de direção autônoma e navegação robótica.

Pontos Fortes

Limitacoes

Suporte Superior a Vídeo: Suporta 1 milhão de tokens, permitindo o processamento nativo de até 120 minutos de vídeo para tarefas agentic e de codificação.
Barreira de Hardware Massiva: A implantação completa requer racks de GPU de nível de servidor com mais de 800GB de VRAM para precisão de 16 bits não compactada.
Eficiência de Inference MoE: A arquitetura de 397B totais/17B ativos proporciona um aumento de 19x no throughput de decodificação em comparação com modelos densos anteriores.
Lacuna de Conhecimento HLE: Apesar de suas pontuações altas em ciência e matemática, ele pontua apenas 28,7% no Humanity's Last Exam (HLE), indicando uma lacuna na facticidade especializada absoluta.
Reasoning de Ponta (State-of-the-Art): Alcança 91,3% no AIME e 88,4% no GPQA, rivalizando com os principais modelos fechados (closed-source) em ciência e matemática de nível PhD.
Excesso de Confiança em Ferramentas: Em cenários de agentes autônomos, o modelo ocasionalmente alucina saídas de ferramentas ou ignora resultados em favor de previsões internas.
Open Weights (Apache 2.0): Oferece inteligência de nível de fronteira com a liberdade de open weights, permitindo implantação privada e on-premise.
Desempenho em Tarefas de Terminal: Pontua 52,5% no Terminal-Bench 2.0, ficando atrás de concorrentes em tarefas complexas de interação via linha de comando.

Inicio Rapido da API

alibaba/qwen3.5-plus

Ver Documentacao
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analise a lógica desta arquitetura MoE.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Qwen3.5-397B-A17B

Veja o que a comunidade pensa sobre Qwen3.5-397B-A17B

O Qwen3.5-397B é essencialmente um modelo de classe GPT-5, mas open-weight. A arquitetura DeltaNet está resolvendo os problemas de latency do MoE perfeitamente.
u/DeepLearningLover
reddit
O reasoning multimodal nativo no Qwen3.5 parece incrível. 1M de contexto + análise de vídeo vai mudar os fluxos de trabalho de agentes.
@AiDevDaily
twitter
A decisão de usar treinamento FP8 de ponta a ponta enquanto mantém BF16 em camadas sensíveis é uma aula de otimizações de estabilidade.
cold_fusion
hackernews
Esta é a primeira vez que vejo um modelo aberto realmente superar o Gemini 1.5 Pro em tarefas complexas de agentes multimodais.
AI Revolution
youtube
O aumento de 19x no throughput de decodificação em relação ao Qwen3-Max torna este uma alternativa viável para agentes de nível de produção.
u/ModelTester2026
reddit
Fiquei surpreso com o quão bem ele lida com quantização de 4 bits. Ele mantém quase toda a capacidade de reasoning em uma configuração dual A100.
@GlobalTechReview
twitter

Videos Sobre Qwen3.5-397B-A17B

Assista tutoriais, analises e discussoes sobre Qwen3.5-397B-A17B

Um modelo de 397 bilhões de parâmetros, mas com 17 bilhões de parâmetros ativos.

Ao decodificar em 256K, este modelo é 19 vezes mais rápido que o Qwen 3 Max.

O reasoning nativo de visão-linguagem é o que diferencia este modelo para fluxos de trabalho agentic.

Isso supera a maioria dos modelos fechados nos benchmarks padrão de matemática.

Rodar isso localmente é difícil, mas as versões quantizadas são viáveis em Macs de alto desempenho.

Modelo de 397 bilhões de parâmetros com 17 bilhões de parâmetros ativos. É nativamente multimodal.

Provavelmente é o melhor modelo multimodal open-source no momento.

A capacidade de processar duas horas de vídeo nativamente é uma vantagem massiva.

Veja essas pontuações de lógica, ele está atingindo níveis do GPT-4o consistentemente.

A licença Apache torna isso muito atraente para a privacidade de dados corporativos.

Extração estruturada via OCR. Você tem um PDF bagunçado... e precisa transformar isso em um JSON limpo. Este modelo se destaca nisso.

Você obtém a inteligência de um gigante de 400 bilhões de parâmetros... mas paga o custo computacional de um modelo de 17 bilhões.

Ele lida com a recuperação de contexto longo melhor do que a versão anterior.

A integração de tool use é integrada no treinamento base, não um adicional.

O modo de pensamento permite que ele corrija sua própria lógica antes de gerar a saída.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Qwen3.5-397B-A17B

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Qwen3.5-397B-A17B e obter melhores resultados.

Ative o Modo de Pensamento (Thinking Mode)

Passe o parâmetro 'enable_thinking: true' na sua chamada de API para ativar o deep reasoning para matemática, codificação e quebra-cabeças lógicos complexos.

Utilize o Modo Rápido (Fast Mode)

Use o modo 'Fast' para consultas simples para obter respostas instantâneas sem consumir tokens em fases internas de pensamento desnecessárias.

Otimize Prompts para Vídeo

Ao analisar vídeo, peça ao modelo para focar no resultado dinâmico final em vez de uma análise quadro a quadro para obter melhor coerência temporal.

Aproveite a Quantização

Use quantização de 4 bits ou 8 bits (GGUF/EXL2) para rodar o modelo em hardware de consumidor, caso você tenha VRAM suficiente (200GB+).

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Perguntas Frequentes Sobre Qwen3.5-397B-A17B

Encontre respostas para perguntas comuns sobre Qwen3.5-397B-A17B