O Qwen3.5-397B-A17B é open-source?

Sim, ele foi lançado como um modelo open-weights sob a licença Apache 2.0, o que permite uso comercial e hospedagem privada.

O que significa '17B de parâmetros ativos'?

Ele utiliza uma arquitetura Mixture-of-Experts onde apenas 17 bilhões dos seus 397 bilhões de parâmetros são usados para processar cada token, reduzindo drasticamente os requisitos de computação.

Quanto custa a API do Qwen3.5-Plus?

Ele custa US$ 0,40 por 1 milhão de tokens de entrada e US$ 2,40 por 1 milhão de tokens de saída, tornando-o um dos frontier models mais rentáveis disponíveis.

Ele consegue processar arquivos de vídeo?

Sim, o modelo pode processar nativamente até 1 milhão de tokens de contexto, o que equivale a aproximadamente 120 minutos de vídeo.

Ele suporta function calling?

Sim, o modelo possui suporte robusto para tool use, incluindo busca na web, interpretação de código e chamadas de funções personalizadas.

Quais são os requisitos de hardware?

Devido aos 397B de parâmetros totais, rodar o modelo em precisão de 16 bits requer mais de 800GB de VRAM, o que normalmente exige um rack de servidor multi-GPU.

Como ele lida com tarefas de reasoning?

O Qwen3.5 usa um framework de RL assíncrono para suportar reasoning do tipo chain-of-thought, que pode ser ativado via parâmetros da API como 'enable_thinking'.

Qwen3.5-397B-A17B

O Qwen3.5-397B-A17B é o modelo MoE open-weight flagship da Alibaba. Ele apresenta reasoning multimodal nativo, uma janela de contexto de 1M e um throughput de...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen3.516 de fevereiro de 2026

Contexto

1.0Mtokens

Saida Max

8Ktokens

Preco Entrada

$0.60/ 1M

Preco Saida

$3.60/ 1M

Modalidade:TextImageVideo

Capacidades:VisaoFerramentasStreamingRaciocinio

Benchmarks

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

Ver Documentacao da API

Sobre Qwen3.5-397B-A17B

Aprenda sobre as capacidades do Qwen3.5-397B-A17B, recursos e como ele pode ajuda-lo a obter melhores resultados.

Mixture of Experts de Alta Eficiência

Qwen3.5-397B-A17B é um modelo multimodal nativo flagship que utiliza uma arquitetura híbrida inovadora, fundindo atenção linear através de Gated Delta Networks com uma Mixture-of-Experts (MoE) esparsa. Embora contenha 397 bilhões de parâmetros totais, seu design esparso ativa apenas 17 bilhões de parâmetros por passagem direta, alcançando eficiência e velocidade de inference excepcionais sem comprometer suas vastas capacidades de reasoning. Ele é otimizado tanto para tarefas de linguagem quanto visuais, suportando um vocabulário massivo de 250k tokens e oferecendo suporte para mais de 201 idiomas e dialetos.

Fluxos de Trabalho Agentic Multimodais Nativos

O modelo se destaca como um agente multimodal nativo, capaz de processar até um milhão de tokens de contexto, o que equivale a aproximadamente duas horas de vídeo. Ele introduz um Thinking Mode especializado para reasoning lógico complexo e é equipado nativamente para fluxos de trabalho agentic, incluindo desenvolvimento web, navegação de GUI e inteligência espacial do mundo real. Sua arquitetura suporta treinamento FP8 de ponta a ponta e um framework de treinamento-inference desagregado, tornando-o um dos modelos mais escaláveis e eficientes para aplicações de IA de nível empresarial.

Open Weights para Acessibilidade Global

Lançado sob a licença Apache 2.0, este modelo fornece à comunidade open-source capacidades de nível de fronteira anteriormente restritas a sistemas proprietários. Ele preenche a lacuna entre contagens massivas de parâmetros e implantação prática, permitindo que organizações executem tarefas de reasoning de última geração em infraestrutura privada com um overhead de computação significativamente menor do que as alternativas densas de 400B.

Casos de Uso para Qwen3.5-397B-A17B

Descubra as diferentes maneiras de usar Qwen3.5-397B-A17B para obter otimos resultados.

Análise de Vídeo de Longa Duração

Analise até duas horas de conteúdo de vídeo para extrair lógica, realizar engenharia reversa de código a partir de filmagens ou gerar resumos estruturados.

Pesquisa STEM de Nível de PhD

Resolva questões científicas de nível de doutorado e problemas matemáticos de nível de olimpíada usando seu modo de deep-thinking adaptativo.

Agentes de GUI Autônomos

Automatize interações com smartphones e computadores para lidar com fluxos de trabalho de escritório e navegação móvel entre aplicativos.

Engenharia de Software Visual

Execute 'vibe coding' transformando instruções em linguagem natural e esboços de UI em código frontend funcional.

Inteligência Documental

Processe documentos complexos, gráficos e esboços manuscritos para extrair dados estruturados e realizar engenharia reversa de layouts.

Aplicações de IA Espacial

Entenda relações em nível de pixel para tarefas de IA incorporada (embodied AI), como análise de cenas de direção autônoma e navegação robótica.

Pontos Fortes

Limitacoes

Suporte Superior a Vídeo: Suporta 1 milhão de tokens, permitindo o processamento nativo de até 120 minutos de vídeo para tarefas agentic e de codificação.

Barreira de Hardware Massiva: A implantação completa requer racks de GPU de nível de servidor com mais de 800GB de VRAM para precisão de 16 bits não compactada.

Eficiência de Inference MoE: A arquitetura de 397B totais/17B ativos proporciona um aumento de 19x no throughput de decodificação em comparação com modelos densos anteriores.

Lacuna de Conhecimento HLE: Apesar de suas pontuações altas em ciência e matemática, ele pontua apenas 28,7% no Humanity's Last Exam (HLE), indicando uma lacuna na facticidade especializada absoluta.

Reasoning de Ponta (State-of-the-Art): Alcança 91,3% no AIME e 88,4% no GPQA, rivalizando com os principais modelos fechados (closed-source) em ciência e matemática de nível PhD.

Excesso de Confiança em Ferramentas: Em cenários de agentes autônomos, o modelo ocasionalmente alucina saídas de ferramentas ou ignora resultados em favor de previsões internas.

Open Weights (Apache 2.0): Oferece inteligência de nível de fronteira com a liberdade de open weights, permitindo implantação privada e on-premise.

Desempenho em Tarefas de Terminal: Pontua 52,5% no Terminal-Bench 2.0, ficando atrás de concorrentes em tarefas complexas de interação via linha de comando.

Inicio Rapido da API

alibaba/qwen3.5-plus

Ver Documentacao

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analise a lógica desta arquitetura MoE.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Qwen3.5-397B-A17B

Veja o que a comunidade pensa sobre Qwen3.5-397B-A17B

“O Qwen3.5-397B é essencialmente um modelo de classe GPT-5, mas open-weight. A arquitetura DeltaNet está resolvendo os problemas de latency do MoE perfeitamente.”

— u/DeepLearningLover

“O reasoning multimodal nativo no Qwen3.5 parece incrível. 1M de contexto + análise de vídeo vai mudar os fluxos de trabalho de agentes.”

— @AiDevDaily

twitter

“A decisão de usar treinamento FP8 de ponta a ponta enquanto mantém BF16 em camadas sensíveis é uma aula de otimizações de estabilidade.”

— cold_fusion

hackernews

“Esta é a primeira vez que vejo um modelo aberto realmente superar o Gemini 1.5 Pro em tarefas complexas de agentes multimodais.”

— AI Revolution

youtube

“O aumento de 19x no throughput de decodificação em relação ao Qwen3-Max torna este uma alternativa viável para agentes de nível de produção.”

— u/ModelTester2026

“Fiquei surpreso com o quão bem ele lida com quantização de 4 bits. Ele mantém quase toda a capacidade de reasoning em uma configuração dual A100.”

— @GlobalTechReview

twitter

Videos Sobre Qwen3.5-397B-A17B

Assista tutoriais, analises e discussoes sobre Qwen3.5-397B-A17B

“Um modelo de 397 bilhões de parâmetros, mas com 17 bilhões de parâmetros ativos.”

“Ao decodificar em 256K, este modelo é 19 vezes mais rápido que o Qwen 3 Max.”

“O reasoning nativo de visão-linguagem é o que diferencia este modelo para fluxos de trabalho agentic.”

“Isso supera a maioria dos modelos fechados nos benchmarks padrão de matemática.”

“Rodar isso localmente é difícil, mas as versões quantizadas são viáveis em Macs de alto desempenho.”

“Modelo de 397 bilhões de parâmetros com 17 bilhões de parâmetros ativos. É nativamente multimodal.”

“Provavelmente é o melhor modelo multimodal open-source no momento.”

“A capacidade de processar duas horas de vídeo nativamente é uma vantagem massiva.”

“Veja essas pontuações de lógica, ele está atingindo níveis do GPT-4o consistentemente.”

“A licença Apache torna isso muito atraente para a privacidade de dados corporativos.”

“Extração estruturada via OCR. Você tem um PDF bagunçado... e precisa transformar isso em um JSON limpo. Este modelo se destaca nisso.”

“Você obtém a inteligência de um gigante de 400 bilhões de parâmetros... mas paga o custo computacional de um modelo de 17 bilhões.”

“Ele lida com a recuperação de contexto longo melhor do que a versão anterior.”

“A integração de tool use é integrada no treinamento base, não um adicional.”

“O modo de pensamento permite que ele corrija sua própria lógica antes de gerar a saída.”

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA

Automacao Web

Fluxos Inteligentes

Comece Gratis

Dicas Profissionais para Qwen3.5-397B-A17B

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Qwen3.5-397B-A17B e obter melhores resultados.

Ative o Modo de Pensamento (Thinking Mode)

Passe o parâmetro 'enable_thinking: true' na sua chamada de API para ativar o deep reasoning para matemática, codificação e quebra-cabeças lógicos complexos.

Utilize o Modo Rápido (Fast Mode)

Use o modo 'Fast' para consultas simples para obter respostas instantâneas sem consumir tokens em fases internas de pensamento desnecessárias.

Otimize Prompts para Vídeo

Ao analisar vídeo, peça ao modelo para focar no resultado dinâmico final em vez de uma análise quadro a quadro para obter melhor coerência temporal.

Aproveite a Quantização

Use quantização de 4 bits ou 8 bits (GGUF/EXL2) para rodar o modelo em hardware de consumidor, caso você tenha VRAM suficiente (200GB+).

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Perguntas Frequentes Sobre Qwen3.5-397B-A17B

Encontre respostas para perguntas comuns sobre Qwen3.5-397B-A17B