alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B je Alibabin flagship open-weight MoE model. Donosi nativni multimodal reasoning, 1M context window i 19x veći decoding throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen2026-02-16
Kontekst
1.0Mtokena
Maks. izlaz
8Ktokena
Ulazna cijena
$0.60/ 1M
Izlazna cijena
$3.60/ 1M
Modalitet:TextImageVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
88.4%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Qwen3.5-397B-A17B je postigao 88.4% na ovom benchmarku.
HLE
28.7%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Qwen3.5-397B-A17B je postigao 28.7% na ovom benchmarku.
MMLU
88.6%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Qwen3.5-397B-A17B je postigao 88.6% na ovom benchmarku.
MMLU Pro
87.8%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Qwen3.5-397B-A17B je postigao 87.8% na ovom benchmarku.
SimpleQA
48%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Qwen3.5-397B-A17B je postigao 48% na ovom benchmarku.
IFEval
92.6%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Qwen3.5-397B-A17B je postigao 92.6% na ovom benchmarku.
AIME 2025
91.3%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Qwen3.5-397B-A17B je postigao 91.3% na ovom benchmarku.
MATH
74.1%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Qwen3.5-397B-A17B je postigao 74.1% na ovom benchmarku.
GSM8k
93.7%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Qwen3.5-397B-A17B je postigao 93.7% na ovom benchmarku.
MGSM
92.1%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Qwen3.5-397B-A17B je postigao 92.1% na ovom benchmarku.
MathVista
90.3%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Qwen3.5-397B-A17B je postigao 90.3% na ovom benchmarku.
SWE-Bench
76.4%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Qwen3.5-397B-A17B je postigao 76.4% na ovom benchmarku.
HumanEval
79.3%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Qwen3.5-397B-A17B je postigao 79.3% na ovom benchmarku.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Qwen3.5-397B-A17B je postigao 83.6% na ovom benchmarku.
MMMU
85%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Qwen3.5-397B-A17B je postigao 85% na ovom benchmarku.
MMMU Pro
79%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Qwen3.5-397B-A17B je postigao 79% na ovom benchmarku.
ChartQA
86.5%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Qwen3.5-397B-A17B je postigao 86.5% na ovom benchmarku.
DocVQA
93.2%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Qwen3.5-397B-A17B je postigao 93.2% na ovom benchmarku.
Terminal-Bench
52.5%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Qwen3.5-397B-A17B je postigao 52.5% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Qwen3.5-397B-A17B je postigao 12% na ovom benchmarku.

O modelu Qwen3.5-397B-A17B

Saznajte o mogućnostima, značajkama i načinima korištenja modela Qwen3.5-397B-A17B.

Monumentalan skok u Open AI svijetu

Qwen3.5-397B-A17B predstavlja monumentalan skok u AI strategiji tvrtke Alibaba Cloud, prelazeći iz snažnog open-source konkurenta u dominantni frontier-level sustav dizajniran za agentic AI eru. Objavljen 16. veljače 2026., on je flagship serije Qwen3.5, koristeći masivnu 397-milijardi-parametara Mixture-of-Experts (MoE) arhitekturu. Aktiviranjem samo 17 milijardi parameters po tokenu, postiže neviđen 19x veći decoding throughput u usporedbi sa svojim prethodnikom, Qwen3-Max, istovremeno smanjujući jaz u performansama u odnosu na najnaprednije closed-source modele na svijetu.

Objedinjena multimodalna snaga

Ovaj model je objedinjeni, nativni multimodal sustav. Za razliku od prethodnih verzija koje su zahtijevale zasebne vizualno-jezične adaptere, Qwen3.5 donosi early-fusion multimodalnost treniranu na trilijunima multimodalnih tokena. To mu omogućuje gledanje i reasoning nad više od dva sata video sadržaja, rad u ulozi GUI agenta na desktop i mobilnim sučeljima te rješavanje složenih zadataka kodiranja u svom specijaliziranom Thinking mode načinu rada. S proširenim vokabularom od 250.000 tokena koji podržava 201 jezik, on stoji kao vodeći globalni izbor za višejezičnu i multimodalnu automatizaciju.

Arhitektura za agentic eru

Osim jednostavnog chata, Qwen3.5-397B je optimiziran za korištenje alata i autonomne workflowe. Njegovi visoki rezultati u benchmark testovima za function calling i praćenje uputa čine ga idealnom okosnicom za vizualni softverski inženjering i istraživanja na razini doktorata. Nudeći state-of-the-art performanse pod Apache 2.0 licencom, Alibaba je zajednici pružila vjerodostojnu i visoko učinkovitu alternativu najograničenijim closed-source modelima.

Qwen3.5-397B-A17B

Slučajevi korištenja za Qwen3.5-397B-A17B

Otkrijte različite načine korištenja modela Qwen3.5-397B-A17B za postizanje izvrsnih rezultata.

Autonomni GUI agenti

Navigira kroz kompleksna sučelja računala i pametnih telefona radi izvršavanja uredskih procesa u više koraka.

Dugotrajna video inteligencija

Ekstrahira duboki kauzalni reasoning i sažetke iz kontinuiranih video datoteka trajanja do 120 minuta.

Vibe coding i prototipiranje

Pretvara skice korisničkog sučelja izravno u React kod i frontend logiku spremnu za produkciju u jednom pokušaju.

Istraživanja na razini doktorata

Rješava STEM probleme na diplomskoj razini koristeći specijalizirani interni chain-of-thought Thinking mode.

Višejezična globalna podrška

Komunicira s korisnicima na 201 jeziku uz vrhunsku efikasnost tokenizacije za pisma koja nisu engleska.

Vizualni softverski inženjering

Transformira wireframe nacrte i snimke zaslona u čist HTML, CSS i JavaScript kod svjestan layouta.

Prednosti

Ograničenja

Efikasnost inference procesa: Postiže 19x veći decoding throughput aktivacijom samo 17B parameters putem svoje hibridne MoE arhitekture.
Ogromni hardverski zahtjevi: S ukupno 397B parameters, lokalno pokretanje nekvantiziranih verzija zahtijeva vrhunsku serversku infrastrukturu.
Nativni video reasoning: Obrađuje do 120 minuta kontinuiranog videa nativno, bez potrebe za adapterima za ekstrakciju okvira.
Nedostatak audio modalnosti: Nedostaju nativne mogućnosti unosa i izlaza zvuka koje se nalaze u 'omni' modelima poput GPT-4o ili Gemini.
Vrhunske STEM sposobnosti: Parira closed-source modelima s rezultatom od 88,4% na GPQA i 91,3% na AIME 2025 matematičkim ispitima.
HLE jaz u performansama: Zaostaje za vodećim modelima na Humanity's Last Exam (28,7%), što ukazuje na praznine u specifičnim ekspertnim znanjima.
Pristupačnost uz Open-Weight: Pruža multimodal inteligenciju frontier-level razine pod Apache 2.0 licencom za privatne enterprise implementacije.
Memorijski otisak: Sama ljestvica zahtijeva znatan VRAM čak i uz sparsity, što ograničava široku primjenu na potrošačkoj razini.

API brzi početak

alibaba/qwen-3.5-plus

Pogledaj dokumentaciju
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Qwen3.5-397B-A17B

Pogledajte što zajednica misli o modelu Qwen3.5-397B-A17B

Qwen3.5-397B je u osnovi odgovor open-source zajednice na GPT-4o. Sama SVG sposobnost je nevjerojatna za web dizajn.
u/LLM_Reviewer
reddit
Skok od 19x u throughputu čini da Qwen3.5 djeluje značajno responzivnije od bilo kojeg drugog modela ove veličine koji sam testirao.
tech_enthusiast_99
reddit
Apache 2.0 za model ove veličine je potpuna prekretnica za lokalni AI razvoj i tvrtke fokusirane na privatnost.
TechInnovator88
twitter
MoE usmjeravanje u modelu 3.5-397B je osjetno inteligentnije nego u prethodnoj 2.5 generaciji; on zapravo prati logiku.
DistanceSolar1449
reddit
Kontekst od 1M na open-weight modelu ovog kalibra je bez presedana u trenutnom ekosustavu.
dev_logic
hackernews
Video reasoning nije samo analiza okvir-po-okvir; to je stvarno temporalno razumijevanje koje se čini miljama ispred trenutnih vizualnih LLM-ova.
Matthew Berman (Context)
youtube

Videozapisi o modelu Qwen3.5-397B-A17B

Gledajte tutorijale, recenzije i diskusije o modelu Qwen3.5-397B-A17B

Pobjeđuje Claude Opus 4.5 u browser zadacima kao i Gemini 3 Pro u nekoliko multimodal zadataka.

Navodno je 19 puta brži od modela Qwen 3 Max koji podržava 201 jezik i dijalekt.

Odradio je sjajan posao s fotorealističnim leptirom... bolje od većine open-source modela.

Model 397B je u osnovi prvi open-weights model koji se uistinu natječe na samoj granici AGI-ja.

Skaliranje s MoE očito funkcionira za Alibabu, a njihovi najnoviji benchmark rezultati to dokazuju.

Ovaj model se podudara s onim što je Qwen Max mogao učiniti... ali to postiže uz do 19x veći skok u brzini.

Tokenizer je dosegao vokabular od 250 tisuća... što odgovara onome što nude Gemini i Googleov tokenizer.

Qwen tim treba promatrati kao Frontier Lab... skaču u zadatke na koje se fokusiraju zatvoreni laboratoriji.

Tokenizacija je mnogo učinkovitija za pisma koja nisu latinica u usporedbi s ranijim Llama iteracijama.

Thinking mode dodaje značajan latency, ali dobitak u preciznosti se isplati za kodiranje i reasoning.

Ovo je objedinjeni vizualno-jezični model... dok su prethodni modeli imali specifičnu VL varijantu, ovaj ima sve sadržano u jednom modelu.

Razumijevanje videa omogućuje mu da uhvati temporalne detalje koje metode ekstrakcije okvira propuštaju.

Što se tiče kodiranja, osjeća se responzivnim kao GPT-4o model, ali s boljim praćenjem uputa.

Mogućnost GUI agenta za desktop je istaknuta značajka ovdje za automatizaciju u stvarnom svijetu.

Obrađuje 120 minuta videa bez gubitka konteksta, što je ogromno za analizu.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Qwen3.5-397B-A17B

Stručni savjeti za maksimalno iskorištavanje Qwen3.5-397B-A17B.

Uključite Thinking mode

Koristite enable_thinking parametar za zadatke koji zahtijevaju intenzivnu logiku kako biste aktivirali duboke interne putanje za reasoning.

Iskoristite nativno pretraživanje

Omogućite search parametar u tijelu zahtjeva kako biste provjerili činjenice s podacima s weba u stvarnom vremenu i izvršili Python kod.

Optimizirajte video prompte

Navedite specifične vremenske oznake (timestamps) kako biste fokusirali context window od 1M tokena na najrelevantnije segmente.

Odabir regionalnog endpointa

Koristite dashscope-intl endpoint za korisnike izvan kontinentalne Kine kako biste smanjili mrežni latency.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Često Postavljana Pitanja o Qwen3.5-397B-A17B

Pronađite odgovore na česta pitanja o Qwen3.5-397B-A17B