alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B je vlajkový open-weight MoE model od Alibaby. Disponuje nativním multimodálním reasoningem, 1M kontextovým oknem a 19x vyšší propustností...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516. února 2026
Kontext
1.0Mtokenu
Max vystup
8Ktokenu
Cena vstupu
$0.60/ 1M
Cena vystupu
$3.60/ 1M
Modalita:TextImageVideo
Schopnosti:VideniNastrojeStreamingUvazovani
Benchmarky
GPQA
88.4%
GPQA: Vedecke otazky postgradualni urovne. Prisnybenchmark s 448 otazkami z biologie, fyziky a chemie. PhD experti dosahuji pouze 65-74% presnosti. Qwen3.5-397B-A17B ziskal 88.4% v tomto benchmarku.
HLE
28.7%
HLE: Uvazovani na expertni urovni. Testuje schopnost modelu demonstrovat uvazovani na expertni urovni ve specializovanych oblastech. Qwen3.5-397B-A17B ziskal 28.7% v tomto benchmarku.
MMLU
88.6%
MMLU: Masivni viceulohove porozumeni jazyku. Komplexni benchmark s 16 000 otazkami z 57 akademickych predmetu. Qwen3.5-397B-A17B ziskal 88.6% v tomto benchmarku.
MMLU Pro
87.8%
MMLU Pro: MMLU Profesionalni edice. Vylepsena verze MMLU s 12 032 otazkami a tezsim 10-moznostnim formatem. Qwen3.5-397B-A17B ziskal 87.8% v tomto benchmarku.
SimpleQA
48%
SimpleQA: Benchmark fakticke presnosti. Testuje schopnost modelu poskytnout presne, fakticke odpovedi. Qwen3.5-397B-A17B ziskal 48% v tomto benchmarku.
IFEval
92.6%
IFEval: Hodnoceni dodrzovani instrukci. Meri, jak dobre model dodrzuje specificke instrukce a omezeni. Qwen3.5-397B-A17B ziskal 92.6% v tomto benchmarku.
AIME 2025
91.3%
AIME 2025: Americka pozvanecka matematicka zkouska. Matematicke ulohy na soutezni urovni z prestizni zkousky AIME. Qwen3.5-397B-A17B ziskal 91.3% v tomto benchmarku.
MATH
74.1%
MATH: Reseni matematickych problemu. Komplexni matematicky benchmark testujici reseni problemu v algebre, geometrii, kalkulu. Qwen3.5-397B-A17B ziskal 74.1% v tomto benchmarku.
GSM8k
93.7%
GSM8k: Matematika zakladni skoly 8K. 8 500 matematickych slovnich uloh urovne zakladni skoly. Qwen3.5-397B-A17B ziskal 93.7% v tomto benchmarku.
MGSM
92.1%
MGSM: Vicejazycna matematika zakladni skoly. Benchmark GSM8k prelozeny do 10 jazyku. Qwen3.5-397B-A17B ziskal 92.1% v tomto benchmarku.
MathVista
90.3%
MathVista: Matematicke vizualni uvazovani. Testuje schopnost resit matematicke problemy s vizualnimi prvky. Qwen3.5-397B-A17B ziskal 90.3% v tomto benchmarku.
SWE-Bench
76.4%
SWE-Bench: Benchmark softwaroveho inzenyrstvi. AI modely se pokousi resit skutecne problemy GitHub v Python projektech. Qwen3.5-397B-A17B ziskal 76.4% v tomto benchmarku.
HumanEval
79.3%
HumanEval: Programovaci ulohy v Pythonu. 164 programovacich uloh, kde modely musi generovat spravne implementace Python funkci. Qwen3.5-397B-A17B ziskal 79.3% v tomto benchmarku.
LiveCodeBench
83.6%
LiveCodeBench: Zive programovaci benchmark. Testuje programovaci schopnosti na neustale aktualizovanych, skutecnych programovacich vyzvan. Qwen3.5-397B-A17B ziskal 83.6% v tomto benchmarku.
MMMU
85%
MMMU: Multimodalni porozumeni. Multimodalni benchmark porozumeni z 30 univerzitnich predmetu. Qwen3.5-397B-A17B ziskal 85% v tomto benchmarku.
MMMU Pro
79%
MMMU Pro: MMMU Profesionalni edice. Vylepsena verze MMMU s narocnejsimi otazkami. Qwen3.5-397B-A17B ziskal 79% v tomto benchmarku.
ChartQA
86.5%
ChartQA: Otazky a odpovedi o grafech. Testuje schopnost porozumet a analyzovat informace z grafu a diagramu. Qwen3.5-397B-A17B ziskal 86.5% v tomto benchmarku.
DocVQA
93.2%
DocVQA: Vizualni otazky o dokumentech. Testuje schopnost extrahovat informace z obrazku dokumentu. Qwen3.5-397B-A17B ziskal 93.2% v tomto benchmarku.
Terminal-Bench
52.5%
Terminal-Bench: Ulohy terminal/CLI. Testuje schopnost provadet operace prikazoveho radku. Qwen3.5-397B-A17B ziskal 52.5% v tomto benchmarku.
ARC-AGI
12%
ARC-AGI: Abstrakce a uvazovani. Testuje fluidni inteligenci prostrednictvim novych hadanek rozpoznavani vzoru. Qwen3.5-397B-A17B ziskal 12% v tomto benchmarku.

O Qwen3.5-397B-A17B

Zjistete o schopnostech Qwen3.5-397B-A17B, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Vysoce efektivní Mixture-of-Experts

Qwen3.5-397B-A17B je vlajkový nativní multimodální model, který využívá inovativní hybridní architekturu spojující lineární pozornost prostřednictvím Gated Delta Networks s řídkou Mixture-of-Experts (MoE). Přestože obsahuje celkem 397 miliard parameters, jeho řídký návrh aktivuje pouze 17 miliard parameters na jeden průchod (forward pass), čímž dosahuje výjimečné efektivity inference a rychlosti, aniž by byla kompromitována jeho rozsáhlá schopnost reasoningu. Je optimalizován jak pro jazykové, tak vizuální úkoly, podporuje masivní slovník 250k tokens a nabízí podporu pro více než 201 jazyků a dialektů.

Nativní multimodální agentní pracovní postupy

Model exceluje jako nativní multimodální agent, schopný zpracovat až jeden milion tokens kontextu, což odpovídá přibližně dvěma hodinám videa. Zavádí specializovaný Thinking Mode pro komplexní logické uvažování a je nativně vybaven pro agentní pracovní postupy, včetně webového vývoje, navigace v GUI a prostorové inteligence v reálném světě. Jeho architektura podporuje FP8 end-to-end trénink a disagregovaný tréninkový a inferenční framework, což z něj činí jeden z nejškálovatelnějších a nejefektivnějších modelů pro AI aplikace na podnikové úrovni.

Open weights pro globální dostupnost

Tento model, vydaný pod licencí Apache 2.0, poskytuje open-source komunitě schopnosti na úrovni frontier modelů, které byly dříve omezeny pouze na proprietární systémy. Překlenuje propast mezi obrovským počtem parametrů a praktickým nasazením, což organizacím umožňuje provozovat špičkové úlohy reasoningu na soukromé infrastruktuře s výrazně nižšími výpočetními nároky než u dense 400B alternativ.

Qwen3.5-397B-A17B

Pripady pouziti pro Qwen3.5-397B-A17B

Objevte ruzne zpusoby, jak muzete pouzit Qwen3.5-397B-A17B pro dosazeni skvelych vysledku.

Dlouhodobá analýza videa

Analyzujte až dvě hodiny video obsahu pro extrakci logiky, reverzní inženýrství kódu ze záběrů nebo generování strukturovaných shrnutí.

Vědecký výzkum na úrovni PhD

Řešte náročné vědecké úlohy a matematické olympiádní problémy s využitím adaptivního režimu hloubkového přemýšlení.

Autonomní GUI agenti

Automatizujte interakce se smartphony a počítači pro vyřizování kancelářských pracovních postupů a mobilní navigaci napříč aplikacemi.

Vizuální softwarové inženýrství

Provádějte tzv. „vibe coding“ převodem instrukcí v přirozeném jazyce a náčrtů UI na funkční frontend kód.

Inteligentní zpracování dokumentů

Zpracovávejte složité dokumenty, grafy a ručně psané náčrty pro extrakci strukturovaných dat a reverzní inženýrství rozvržení.

Prostorové AI aplikace

Pochopení vztahů na úrovni pixelů pro úkoly embodied AI, jako je analýza scén autonomního řízení a navigace robotů.

Silne stranky

Omezeni

Špičková podpora videa: Podporuje 1 milion tokens, což umožňuje nativní zpracování až 120 minut videa pro agentic a programovací úkoly.
Obrovské hardwarové nároky: Plné nasazení vyžaduje serverové GPU racky s více než 800 GB VRAM pro nekomprimovanou 16bitovou přesnost.
Efektivita inference MoE: Architektura 397B celkem/17B aktivních parametrů poskytuje 19x vyšší propustnost dekódování oproti předchozím dense flagship modelům.
Mezery ve znalostech HLE: Navzdory vysokému skóre ve vědě a matematice dosahuje pouze 28,7 % v Humanity's Last Exam (HLE), což značí nedostatky v absolutní expertní faktualitě.
State-of-the-art reasoning: Dosahuje 91,3 % v benchmarku AIME a 88,4 % v GPQA, čímž konkuruje špičkovým closed-source modelům v oborech přírodních věd a matematiky.
Přílišná důvěra v nástroje: Ve scénářích s autonomními agenty model občas halucinuje výstupy nástrojů nebo ignoruje jejich výsledky ve prospěch interních predikcí.
Open weights pod licencí Apache 2.0: Nabízí inteligenci na úrovni frontier modelů se svobodou open weights, což umožňuje privátní nasazení on-premise.
Výkon v terminálových úlohách: Dosahuje 52,5 % v Terminal-Bench 2.0, čímž zaostává za konkurencí v komplexních interaktivních úlohách příkazového řádku.

Rychly start API

alibaba/qwen3.5-plus

Zobrazit dokumentaci
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o Qwen3.5-397B-A17B

Podivejte se, co si komunita mysli o Qwen3.5-397B-A17B

Qwen3.5-397B je v podstatě model třídy GPT-5, ale s open weights. Architektura DeltaNet perfektně řeší problémy s latencí MoE.
u/DeepLearningLover
reddit
Nativní multimodální reasoning u Qwen3.5 vypadá neuvěřitelně. 1M kontext + video analýza změní pracovní postupy agentů.
@AiDevDaily
twitter
Rozhodnutí použít FP8 trénink end-to-end při zachování BF16 v citlivých vrstvách je mistrovský tah v optimalizaci stability.
cold_fusion
hackernews
Je to poprvé, co vidím, jak open model skutečně poráží Gemini 1.5 Pro v komplexních multimodálních agent úkolech.
AI Revolution
youtube
19násobné zvýšení propustnosti dekódování oproti Qwen3-Max z něj dělá životaschopnou alternativu pro produkční agenty.
u/ModelTester2026
reddit
Byl jsem překvapen, jak dobře zvládá 4bitovou kvantizaci. Zachovává si téměř veškeré schopnosti reasoningu na setupu s dvěma A100.
@GlobalTechReview
twitter

Videa o Qwen3.5-397B-A17B

Sledujte navody, recenze a diskuse o Qwen3.5-397B-A17B

Model s 397 miliardami parametrů, ale pouze se 17 miliardami aktivních parametrů.

Při dekódování na 256K je tento model 19x rychlejší než Qwen 3 Max.

Nativní vizi-jazykový reasoning je to, co jej odlišuje pro agentic pracovní postupy.

Překonává většinu uzavřených modelů ve standardních matematických benchmarcích.

Lokální běh je náročný, ale kvantizované verze fungují na high-end Macích.

397 miliard parametrů, 17 miliard aktivních. Je nativně multimodální.

Pravděpodobně aktuálně nejlepší open-source multimodální model.

Schopnost nativně zpracovat dvě hodiny videa je obrovská výhoda.

Podívejte se na tato skóre logiky, konzistentně dosahuje úrovně GPT-4o.

Licence Apache je velmi atraktivní pro ochranu firemních dat.

Strukturovaná extrakce OCR. Máte nepřehledné PDF... a potřebujete z něj čistý JSON. V tom model exceluje.

Získáváte inteligenci 400miliardového giganta... ale platíte výpočetní náklady 17miliardového modelu.

Zvládá retrieval dlouhého kontextu lépe než předchozí verze.

Integrace nástrojů je součástí základního tréninku, ne dodatečným prvkem.

Thinking mode mu umožňuje opravit vlastní logiku před odesláním výstupu.

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti
Webova automatizace
Chytre workflow

Profesionalni tipy pro Qwen3.5-397B-A17B

Expertni tipy, ktere vam pomohou ziskat maximum z Qwen3.5-397B-A17B a dosahnout lepsich vysledku.

Aktivace režimu přemýšlení (Thinking Mode)

V API volání přidejte parametr 'enable_thinking: true' pro aktivaci hloubkového reasoningu při řešení úloh z oblasti matematiky, programování a komplexní logiky.

Využití rychlého režimu (Fast Mode)

Pro jednoduché dotazy použijte 'Fast' režim, abyste získali okamžité odpovědi bez zbytečného čerpání tokens na interní fáze přemýšlení.

Optimalizace video promptů

Při analýze videa vyzvěte model, aby se zaměřil na konečný dynamický výsledek namísto analýzy snímek po snímku; dosáhnete tak lepší temporální koherence.

Využití kvantizace

Použijte 4bitovou nebo 8bitovou kvantizaci (GGUF/EXL2) pro běh modelu na běžném hardwaru, pokud máte dostatek VRAM (200 GB+).

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Casto kladene dotazy o Qwen3.5-397B-A17B

Najdete odpovedi na bezne otazky o Qwen3.5-397B-A17B