alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B este modelul flagship open-weight MoE de la Alibaba. Acesta dispune de reasoning multimodal nativ, o fereastră de context de 1M și un...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516 februarie 2026
Context
1.0Mtokeni
Output maxim
8Ktokeni
Pret input
$0.60/ 1M
Pret output
$3.60/ 1M
Modalitate:TextImageVideo
Capabilitati:ViziuneUnelteStreamingRationament
Benchmark-uri
GPQA
88.4%
GPQA: Intrebari stiintifice nivel postuniversitar. Benchmark riguros cu 448 intrebari din biologie, fizica si chimie. Expertii PhD obtin doar 65-74% acuratete. Qwen3.5-397B-A17B a obtinut 88.4% la acest benchmark.
HLE
28.7%
HLE: Rationament nivel expert. Testeaza capacitatea modelului de a demonstra rationament la nivel de expert in domenii specializate. Qwen3.5-397B-A17B a obtinut 28.7% la acest benchmark.
MMLU
88.6%
MMLU: Intelegere lingvistica multitasking masiva. Benchmark cuprinzator cu 16.000 intrebari din 57 materii academice. Qwen3.5-397B-A17B a obtinut 88.6% la acest benchmark.
MMLU Pro
87.8%
MMLU Pro: MMLU Editie Profesionala. Versiune imbunatatita MMLU cu 12.032 intrebari si format mai dificil cu 10 optiuni. Qwen3.5-397B-A17B a obtinut 87.8% la acest benchmark.
SimpleQA
48%
SimpleQA: Benchmark acuratete factuala. Testeaza capacitatea modelului de a oferi raspunsuri precise si factuale. Qwen3.5-397B-A17B a obtinut 48% la acest benchmark.
IFEval
92.6%
IFEval: Evaluare urmarire instructiuni. Masoara cat de bine urmeaza un model instructiuni si constrangeri specifice. Qwen3.5-397B-A17B a obtinut 92.6% la acest benchmark.
AIME 2025
91.3%
AIME 2025: Examen invitational matematica american. Probleme matematice nivel competitie din prestigiosul examen AIME. Qwen3.5-397B-A17B a obtinut 91.3% la acest benchmark.
MATH
74.1%
MATH: Rezolvare probleme matematice. Benchmark matematic cuprinzator care testeaza rezolvarea problemelor in algebra, geometrie, calcul. Qwen3.5-397B-A17B a obtinut 74.1% la acest benchmark.
GSM8k
93.7%
GSM8k: Matematica scoala primara 8K. 8.500 probleme matematice cu enunt nivel scoala primara. Qwen3.5-397B-A17B a obtinut 93.7% la acest benchmark.
MGSM
92.1%
MGSM: Matematica scoala primara multilingva. Benchmark GSM8k tradus in 10 limbi. Qwen3.5-397B-A17B a obtinut 92.1% la acest benchmark.
MathVista
90.3%
MathVista: Rationament vizual matematic. Testeaza capacitatea de a rezolva probleme matematice cu elemente vizuale. Qwen3.5-397B-A17B a obtinut 90.3% la acest benchmark.
SWE-Bench
76.4%
SWE-Bench: Benchmark inginerie software. Modelele AI incearca sa rezolve probleme reale GitHub in proiecte Python. Qwen3.5-397B-A17B a obtinut 76.4% la acest benchmark.
HumanEval
79.3%
HumanEval: Probleme programare Python. 164 probleme de programare unde modelele trebuie sa genereze implementari corecte de functii Python. Qwen3.5-397B-A17B a obtinut 79.3% la acest benchmark.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark codare live. Testeaza abilitatile de codare pe provocari de programare reale actualizate continuu. Qwen3.5-397B-A17B a obtinut 83.6% la acest benchmark.
MMMU
85%
MMMU: Intelegere multimodala. Benchmark intelegere multimodala din 30 materii universitare. Qwen3.5-397B-A17B a obtinut 85% la acest benchmark.
MMMU Pro
79%
MMMU Pro: MMMU Editie Profesionala. Versiune imbunatatita MMMU cu intrebari mai provocatoare. Qwen3.5-397B-A17B a obtinut 79% la acest benchmark.
ChartQA
86.5%
ChartQA: Intrebari si raspunsuri grafice. Testeaza capacitatea de a intelege si analiza informatii din grafice si diagrame. Qwen3.5-397B-A17B a obtinut 86.5% la acest benchmark.
DocVQA
93.2%
DocVQA: Intrebari vizuale documente. Testeaza capacitatea de a extrage informatii din imagini de documente. Qwen3.5-397B-A17B a obtinut 93.2% la acest benchmark.
Terminal-Bench
52.5%
Terminal-Bench: Sarcini terminal/CLI. Testeaza capacitatea de a efectua operatii linie de comanda. Qwen3.5-397B-A17B a obtinut 52.5% la acest benchmark.
ARC-AGI
12%
ARC-AGI: Abstractizare si rationament. Testeaza inteligenta fluida prin puzzle-uri noi de recunoastere a tiparelor. Qwen3.5-397B-A17B a obtinut 12% la acest benchmark.

Despre Qwen3.5-397B-A17B

Afla despre capabilitatile lui Qwen3.5-397B-A17B, caracteristici si cum te poate ajuta sa obtii rezultate mai bune.

Mixture of Experts de înaltă eficiență

Qwen3.5-397B-A17B este un model multimodal nativ flagship care utilizează o arhitectură hibridă inovatoare, fuzionând atenția liniară prin Gated Delta Networks cu un Mixture-of-Experts (MoE) rar. Deși conține 397 de miliarde de parametri în total, designul său rar activează doar 17 miliarde de parametri per forward pass, atingând o eficiență și o viteză de inferență excepționale fără a compromite capacitățile sale vaste de reasoning. Este optimizat atât pentru sarcini lingvistice, cât și vizuale, suportând un vocabular masiv de 250k tokens și oferind suport pentru peste 201 limbi și dialecte.

Fluxuri de lucru agentice multimodale native

Modelul excelează ca agent multimodal nativ, capabil să proceseze până la un milion de tokens de context, ceea ce este echivalent cu aproximativ două ore de video. Acesta introduce un Thinking Mode specializat pentru raționamente logice complexe și este echipat nativ pentru fluxuri de lucru agentice, incluzând dezvoltarea web, navigarea GUI și inteligența spațială în lumea reală. Arhitectura sa suportă training FP8 end-to-end și un cadru disociat de training-inferență, făcându-l unul dintre cele mai scalabile și eficiente modele pentru aplicații AI la nivel enterprise.

Open Weights pentru accesibilitate globală

Lansat sub licența Apache 2.0, acest model oferă comunității open-source capacități la nivel de frontier model, restricționate anterior la sisteme proprietare. Acesta acoperă diferența dintre numărul masiv de parametri și implementarea practică, permițând organizațiilor să ruleze sarcini de reasoning de ultimă generație pe infrastructură privată, cu un overhead de calcul semnificativ mai mic decât alternativele dense de 400B.

Qwen3.5-397B-A17B

Cazuri de utilizare pentru Qwen3.5-397B-A17B

Descopera diferitele moduri in care poti folosi Qwen3.5-397B-A17B pentru a obtine rezultate excelente.

Analiza video pe termen lung

Analizează până la două ore de conținut video pentru a extrage logică, a face reverse-engineering pentru cod din înregistrări sau pentru a genera rezumate structurate.

Cercetare STEM la nivel de doctorat

Rezolvă probleme științifice de nivel academic și probleme de matematică de nivel olimpiadă folosind modul său adaptiv de deep-thinking.

Agenți GUI autonomi

Automatizează interacțiunile cu smartphone-uri și computere pentru a gestiona fluxurile de lucru de birou și navigarea cross-app pe mobil.

Inginerie software vizuală

Execută 'vibe coding' prin transformarea instrucțiunilor în limbaj natural și a schițelor UI în cod frontend funcțional.

Inteligență documentară

Procesează documente complexe, grafice și schițe scrise de mână pentru a extrage date structurate și a face reverse-engineering pentru layout-uri.

Aplicații de AI spațial

Înțelege relațiile la nivel de pixel pentru sarcini de AI întrupat (embodied AI), precum analiza scenelor pentru condus autonom și navigație robotică.

Puncte forte

Limitari

Suport video superior: Suportă 1 milion de tokens, permițând procesarea nativă a până la 120 de minute de video pentru sarcini agentice și de programare.
Barieră hardware masivă: Implementarea completă necesită rack-uri de GPU-uri la nivel de server cu peste 800GB de VRAM pentru precizia necomprimată de 16 biți.
Eficiența inferenței MoE: Arhitectura cu 397B total/17B activi oferă o creștere de 19x a throughput-ului de decodare comparativ cu modelele dense flagship anterioare.
Lacune în cunoștințele HLE: În ciuda scorurilor mari la știință și matematică, obține doar 28,7% la Humanity's Last Exam (HLE), indicând o lacună în factualitatea absolută a expertului.
Reasoning de ultimă generație: Obține 91,3% pe AIME și 88,4% pe GPQA, concurând cu cele mai bune modele closed-source în științe și matematică la nivel de doctorat.
Încredere excesivă în instrumente: În scenariile cu agenți autonomi, modelul a halucinat ocazional output-uri ale instrumentelor sau a ignorat rezultatele în favoarea predicțiilor interne.
Open Weights sub Apache 2.0: Oferă inteligență la nivel de frontier model cu libertatea oferită de open weights, permițând implementarea privată, on-premise.
Performanța sarcinilor de terminal: Obține 52,5% pe Terminal-Bench 2.0, rămânând în urma competitorilor în sarcini complexe de interacțiune prin linie de comandă.

Start rapid API

alibaba/qwen3.5-plus

Vezi documentatia
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analizează logica acestei arhitecturi MoE.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instaleaza SDK-ul si incepe sa faci apeluri API in cateva minute.

Ce spun oamenii despre Qwen3.5-397B-A17B

Vezi ce crede comunitatea despre Qwen3.5-397B-A17B

Qwen3.5-397B este în esență un model de clasă GPT-5, dar open-weight. Arhitectura DeltaNet rezolvă perfect problemele de latency ale MoE.
u/DeepLearningLover
reddit
Reasoning-ul multimodal nativ pe Qwen3.5 arată incredibil. Contextul de 1M + analiza video vor schimba fluxurile de lucru ale agenților.
@AiDevDaily
twitter
Decizia de a folosi training FP8 end-to-end menținând BF16 în straturile sensibile este o lecție de optimizare a stabilității.
cold_fusion
hackernews
Este prima dată când văd un model open care bate Gemini 1.5 Pro în sarcini complexe ale agenților multimodali.
AI Revolution
youtube
Îmbunătățirea de 19x a throughput-ului de decodare față de Qwen3-Max face ca acesta să fie o alternativă viabilă pentru agenții la nivel de producție.
u/ModelTester2026
reddit
Am fost surprins de cât de bine gestionează cuantizarea pe 4-biți. Păstrează aproape toată capacitatea de reasoning pe un setup dual A100.
@GlobalTechReview
twitter

Videoclipuri despre Qwen3.5-397B-A17B

Urmareste tutoriale, recenzii si discutii despre Qwen3.5-397B-A17B

Un model de 397 miliarde de parametri, dar cu 17 miliarde activi.

Când decodifică la 256K, acest model este de 19 ori mai rapid decât Qwen 3 Max.

Reasoning-ul nativ vizual-lingvistic este ceea ce îl diferențiază pentru fluxurile de lucru agentice.

Acesta depășește majoritatea modelelor closed pe benchmark-urile standard de matematică.

Rularea locală este dificilă, dar versiunile cuantizate sunt viabile pe Mac-uri high-end.

Model de 397 miliarde de parametri cu 17 miliarde activi. Este nativ multimodal.

Este probabil în prezent cel mai bun model multimodal open-source.

Capacitatea de a procesa două ore de video nativ este un avantaj masiv.

Uită-te la aceste scoruri de logică, atinge constant nivelurile GPT-4o.

Licența Apache îl face foarte atractiv pentru confidențialitatea datelor corporative.

Extracție structurată OCR. Ai un PDF dezordonat... și trebuie să-l transformi în JSON curat. Acest model excelează aici.

Obții inteligența unui gigant de 400 miliarde de parametri... dar plătești costul de calcul al unui model de 17 miliarde.

Gestionează recuperarea contextului lung mai bine decât versiunea anterioară.

Integrarea utilizării instrumentelor este integrată în training-ul de bază, nu este o idee ulterioară.

Modul Thinking îi permite să își corecteze propria logică înainte de a afișa rezultatul.

Mai mult decat prompturi

Supraalimenteaza-ti fluxul de lucru cu automatizare AI

Automatio combina puterea agentilor AI, automatizarea web si integrarile inteligente pentru a te ajuta sa realizezi mai mult in mai putin timp.

Agenti AI
Automatizare web
Fluxuri inteligente

Sfaturi Pro pentru Qwen3.5-397B-A17B

Sfaturi de expert care te ajuta sa obtii maximul din Qwen3.5-397B-A17B si sa obtii rezultate mai bune.

Activarea modului Thinking

Transmite parametrul 'enable_thinking: true' în apelul tău API pentru a activa deep reasoning pentru matematică, programare și puzzle-uri logice complexe.

Utilizarea modului Rapid (Fast Mode)

Folosește modul 'Fast' pentru interogări simple pentru a obține răspunsuri instantanee fără a consuma tokens în faze de gândire internă inutile.

Optimizarea prompt-urilor pentru video

Când analizezi conținut video, cere modelului să se concentreze pe rezultatul dinamic final în loc de o analiză cadru cu cadru, pentru o coerență temporală mai bună.

Utilizarea cuantizării (Quantization)

Folosește cuantizarea pe 4-biți sau 8-biți (GGUF/EXL2) pentru a rula modelul pe hardware de consum dacă ai suficient VRAM (200GB+).

Testimoniale

Ce spun utilizatorii nostri

Alatura-te miilor de utilizatori multumiti care si-au transformat fluxul de lucru

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Similar AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Intrebari frecvente despre Qwen3.5-397B-A17B

Gaseste raspunsuri la intrebarile comune despre Qwen3.5-397B-A17B