Je Qwen3.5-397B-A17B open-source?

Ano, je vydán jako open-weight model pod licencí Apache 2.0, která umožňuje komerční využití a privátní hosting.

Co znamená „17B aktivních parameters“?

Využívá architekturu Mixture-of-Experts, kde je pro zpracování každého jednotlivého tokenu potřeba pouze 17 miliard z jeho 397 miliard parameters, což dramaticky snižuje nároky na výpočetní výkon.

Kolik stojí API pro Qwen3.5-Plus?

Stojí 0,40 USD za 1 milion input tokens a 2,40 USD za 1 milion output tokens, což z něj činí jeden z nejekonomičtějších frontier modelů na trhu.

Dokáže zpracovávat video soubory?

Ano, model dokáže nativně zpracovat kontext až 1 milion tokens, což odpovídá zhruba 120 minutám videa.

Podporuje function calling?

Ano, model má robustní podporu pro tool use, včetně vyhledávání na webu, interpretace kódu a volání vlastních funkcí (function calling).

Jaké jsou hardwarové nároky?

Vzhledem k celkovému počtu 397B parameters vyžaduje běh modelu v 16bitové přesnosti přes 800 GB VRAM, což obvykle vyžaduje serverový rack s několika GPU.

Jak zvládá úlohy vyžadující reasoning?

Qwen3.5 využívá asynchronní RL framework pro podporu chain-of-thought reasoning, který lze aktivovat pomocí API parameters, jako je 'enable_thinking'.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B je vlajkový open-weight MoE model od Alibaby. Disponuje nativním multimodálním reasoningem, 1M kontextovým oknem a 19x vyšší propustností...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen3.516. února 2026

Kontext

1.0Mtokenu

Max vystup

8Ktokenu

Cena vstupu

$0.60/ 1M

Cena vystupu

$3.60/ 1M

Modalita:TextImageVideo

Schopnosti:VideniNastrojeStreamingUvazovani

Benchmarky

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

Zobrazit API dokumentaci

O Qwen3.5-397B-A17B

Zjistete o schopnostech Qwen3.5-397B-A17B, funkcich a jak vam muze pomoci dosahnout lepsich vysledku.

Vysoce efektivní Mixture-of-Experts

Qwen3.5-397B-A17B je vlajkový nativní multimodální model, který využívá inovativní hybridní architekturu spojující lineární pozornost prostřednictvím Gated Delta Networks s řídkou Mixture-of-Experts (MoE). Přestože obsahuje celkem 397 miliard parameters, jeho řídký návrh aktivuje pouze 17 miliard parameters na jeden průchod (forward pass), čímž dosahuje výjimečné efektivity inference a rychlosti, aniž by byla kompromitována jeho rozsáhlá schopnost reasoningu. Je optimalizován jak pro jazykové, tak vizuální úkoly, podporuje masivní slovník 250k tokens a nabízí podporu pro více než 201 jazyků a dialektů.

Nativní multimodální agentní pracovní postupy

Model exceluje jako nativní multimodální agent, schopný zpracovat až jeden milion tokens kontextu, což odpovídá přibližně dvěma hodinám videa. Zavádí specializovaný Thinking Mode pro komplexní logické uvažování a je nativně vybaven pro agentní pracovní postupy, včetně webového vývoje, navigace v GUI a prostorové inteligence v reálném světě. Jeho architektura podporuje FP8 end-to-end trénink a disagregovaný tréninkový a inferenční framework, což z něj činí jeden z nejškálovatelnějších a nejefektivnějších modelů pro AI aplikace na podnikové úrovni.

Open weights pro globální dostupnost

Tento model, vydaný pod licencí Apache 2.0, poskytuje open-source komunitě schopnosti na úrovni frontier modelů, které byly dříve omezeny pouze na proprietární systémy. Překlenuje propast mezi obrovským počtem parametrů a praktickým nasazením, což organizacím umožňuje provozovat špičkové úlohy reasoningu na soukromé infrastruktuře s výrazně nižšími výpočetními nároky než u dense 400B alternativ.

Pripady pouziti pro Qwen3.5-397B-A17B

Objevte ruzne zpusoby, jak muzete pouzit Qwen3.5-397B-A17B pro dosazeni skvelych vysledku.

Dlouhodobá analýza videa

Analyzujte až dvě hodiny video obsahu pro extrakci logiky, reverzní inženýrství kódu ze záběrů nebo generování strukturovaných shrnutí.

Vědecký výzkum na úrovni PhD

Řešte náročné vědecké úlohy a matematické olympiádní problémy s využitím adaptivního režimu hloubkového přemýšlení.

Autonomní GUI agenti

Automatizujte interakce se smartphony a počítači pro vyřizování kancelářských pracovních postupů a mobilní navigaci napříč aplikacemi.

Vizuální softwarové inženýrství

Provádějte tzv. „vibe coding“ převodem instrukcí v přirozeném jazyce a náčrtů UI na funkční frontend kód.

Inteligentní zpracování dokumentů

Zpracovávejte složité dokumenty, grafy a ručně psané náčrty pro extrakci strukturovaných dat a reverzní inženýrství rozvržení.

Prostorové AI aplikace

Pochopení vztahů na úrovni pixelů pro úkoly embodied AI, jako je analýza scén autonomního řízení a navigace robotů.

Silne stranky

Omezeni

Špičková podpora videa: Podporuje 1 milion tokens, což umožňuje nativní zpracování až 120 minut videa pro agentic a programovací úkoly.

Obrovské hardwarové nároky: Plné nasazení vyžaduje serverové GPU racky s více než 800 GB VRAM pro nekomprimovanou 16bitovou přesnost.

Efektivita inference MoE: Architektura 397B celkem/17B aktivních parametrů poskytuje 19x vyšší propustnost dekódování oproti předchozím dense flagship modelům.

Mezery ve znalostech HLE: Navzdory vysokému skóre ve vědě a matematice dosahuje pouze 28,7 % v Humanity's Last Exam (HLE), což značí nedostatky v absolutní expertní faktualitě.

State-of-the-art reasoning: Dosahuje 91,3 % v benchmarku AIME a 88,4 % v GPQA, čímž konkuruje špičkovým closed-source modelům v oborech přírodních věd a matematiky.

Přílišná důvěra v nástroje: Ve scénářích s autonomními agenty model občas halucinuje výstupy nástrojů nebo ignoruje jejich výsledky ve prospěch interních predikcí.

Open weights pod licencí Apache 2.0: Nabízí inteligenci na úrovni frontier modelů se svobodou open weights, což umožňuje privátní nasazení on-premise.

Výkon v terminálových úlohách: Dosahuje 52,5 % v Terminal-Bench 2.0, čímž zaostává za konkurencí v komplexních interaktivních úlohách příkazového řádku.

Rychly start API

alibaba/qwen3.5-plus

Zobrazit dokumentaci

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Nainstalujte SDK a zacnete provadet API volani behem nekolika minut.

Co lide rikaji o Qwen3.5-397B-A17B

Podivejte se, co si komunita mysli o Qwen3.5-397B-A17B

“Qwen3.5-397B je v podstatě model třídy GPT-5, ale s open weights. Architektura DeltaNet perfektně řeší problémy s latencí MoE.”

— u/DeepLearningLover

“Nativní multimodální reasoning u Qwen3.5 vypadá neuvěřitelně. 1M kontext + video analýza změní pracovní postupy agentů.”

— @AiDevDaily

twitter

“Rozhodnutí použít FP8 trénink end-to-end při zachování BF16 v citlivých vrstvách je mistrovský tah v optimalizaci stability.”

— cold_fusion

hackernews

“Je to poprvé, co vidím, jak open model skutečně poráží Gemini 1.5 Pro v komplexních multimodálních agent úkolech.”

— AI Revolution

youtube

“19násobné zvýšení propustnosti dekódování oproti Qwen3-Max z něj dělá životaschopnou alternativu pro produkční agenty.”

— u/ModelTester2026

“Byl jsem překvapen, jak dobře zvládá 4bitovou kvantizaci. Zachovává si téměř veškeré schopnosti reasoningu na setupu s dvěma A100.”

— @GlobalTechReview

twitter

Videa o Qwen3.5-397B-A17B

Sledujte navody, recenze a diskuse o Qwen3.5-397B-A17B

“Model s 397 miliardami parametrů, ale pouze se 17 miliardami aktivních parametrů.”

“Při dekódování na 256K je tento model 19x rychlejší než Qwen 3 Max.”

“Nativní vizi-jazykový reasoning je to, co jej odlišuje pro agentic pracovní postupy.”

“Překonává většinu uzavřených modelů ve standardních matematických benchmarcích.”

“Lokální běh je náročný, ale kvantizované verze fungují na high-end Macích.”

“397 miliard parametrů, 17 miliard aktivních. Je nativně multimodální.”

“Pravděpodobně aktuálně nejlepší open-source multimodální model.”

“Schopnost nativně zpracovat dvě hodiny videa je obrovská výhoda.”

“Podívejte se na tato skóre logiky, konzistentně dosahuje úrovně GPT-4o.”

“Licence Apache je velmi atraktivní pro ochranu firemních dat.”

“Strukturovaná extrakce OCR. Máte nepřehledné PDF... a potřebujete z něj čistý JSON. V tom model exceluje.”

“Získáváte inteligenci 400miliardového giganta... ale platíte výpočetní náklady 17miliardového modelu.”

“Zvládá retrieval dlouhého kontextu lépe než předchozí verze.”

“Integrace nástrojů je součástí základního tréninku, ne dodatečným prvkem.”

“Thinking mode mu umožňuje opravit vlastní logiku před odesláním výstupu.”

Vice nez jen prompty

Zrychlete svuj workflow s AI automatizaci

Automatio kombinuje silu AI agentu, webove automatizace a chytrych integraci, aby vam pomohl dosahnout vice za kratsi cas.

AI agenti

Webova automatizace

Chytre workflow

Zacit zdarma

Profesionalni tipy pro Qwen3.5-397B-A17B

Expertni tipy, ktere vam pomohou ziskat maximum z Qwen3.5-397B-A17B a dosahnout lepsich vysledku.

Aktivace režimu přemýšlení (Thinking Mode)

V API volání přidejte parametr 'enable_thinking: true' pro aktivaci hloubkového reasoningu při řešení úloh z oblasti matematiky, programování a komplexní logiky.

Využití rychlého režimu (Fast Mode)

Pro jednoduché dotazy použijte 'Fast' režim, abyste získali okamžité odpovědi bez zbytečného čerpání tokens na interní fáze přemýšlení.

Optimalizace video promptů

Při analýze videa vyzvěte model, aby se zaměřil na konečný dynamický výsledek namísto analýzy snímek po snímku; dosáhnete tak lepší temporální koherence.

Využití kvantizace

Použijte 4bitovou nebo 8bitovou kvantizaci (GGUF/EXL2) pro běh modelu na běžném hardwaru, pokud máte dostatek VRAM (200 GB+).

Reference

Co rikaji nasi uzivatele

Pridejte se k tisicum spokojenych uzivatelu, kteri transformovali svuj workflow

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Souvisejici AI Models

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Casto kladene dotazy o Qwen3.5-397B-A17B

Najdete odpovedi na bezne otazky o Qwen3.5-397B-A17B