Vad är context window för Qwen3.5-397B?

Modellen stöder ett enormt context window på 1 000 000 tokens, perfekt för stora källkodsprojekt och långa videor.

Är Qwen3.5-397B open-source?

Ja, den är släppt med öppna vikter under Apache 2.0-licensen, vilket möjliggör lokal hosting och anpassning.

Vad kostar Qwen3.5 via API?

Priset är $0,60 per 1 miljon input tokens och $3,60 per 1 miljon output tokens på Alibaba Cloud.

Stöder den bild- och video-input?

Ja, det är en nativ multimodal model som kan bearbeta statiska bilder och upp till 2 timmar video.

Hur står den sig i jämförelse med GPT-4o?

Qwen3.5 matchar eller överträffar GPT-4o i STEM benchmarks, poäng i mattetävlingar och vision-language-uppgifter.

Vilken hårdvara krävs för lokal hosting?

Det krävs hårdvara i enterprise-klass, som dubbla H100s eller en Mac Studio med 256GB RAM, på grund av dess storlek på 397B parameters.

Stöder den function-calling?

Ja, den är högt optimerad för användning av verktyg och rankas konsekvent i toppen av benchmarks för function-calling.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B är Alibabas flagship open-weight MoE-model. Den har nativ multimodal reasoning, ett 1M context window och 19x decoding throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen2026-02-16

Kontext

1.0Mtokens

Max utdata

8Ktokens

Inmatningspris

$0.60/ 1M

Utdatapris

$3.60/ 1M

Modalitet:TextImageVideo

Kapaciteter:VisionVerktygStreamingResonemang

Benchmarks

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

Visa API-dokumentation

Om Qwen3.5-397B-A17B

Lar dig om Qwen3.5-397B-A17Bs kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Ett monumentalt språng för öppen AI

Qwen3.5-397B-A17B representerar ett monumentalt språng i Alibaba Clouds AI-strategi, och går från att vara en stark open-source-utmanare till ett dominant system på frontier model-nivå designat för eran av agentic AI. Den släpptes den 16 februari 2026 och är flagship-modellen i Qwen3.5-serien, byggd på en massiv 397-miljarders parameters Mixture-of-Experts (MoE)-arkitektur. Genom att endast aktivera 17 miljarder parameters per token uppnår den en oöverträffad 19x ökning i decoding throughput jämfört med sin föregångare, Qwen3-Max, samtidigt som den minskar prestandagapet till världens mest avancerade proprietära modeller.

Enhetligt multimodalt kraftpaket

Modellen är ett enhetligt, nativt multimodalt kraftpaket. Till skillnad från tidigare versioner som krävde separata vision-language-adapters, har Qwen3.5 early-fusion-multimodalitet tränad på biljoner multimodala tokens. Detta gör att den kan se och utföra reasoning över två timmar videoinnehåll, fungera som en GUI-agent i desktop- och mobilgränssnitt, samt hantera komplexa kodningsuppgifter i sitt specialiserade Thinking mode. Med ett utökat ordförråd på 250 000 tokens som stöder 201 språk, står den som det främsta globala valet för flerspråkig och multimodal automation.

Arkitekterad för eran av agents

Bortom enkel chatt är Qwen3.5-397B optimerad för användning av verktyg och autonoma arbetsflöden. Dess höga poäng i benchmarks för function-calling och instruktionsföljsamhet gör den till en idealisk ryggrad för visuell mjukvaruutveckling och forskning på PhD-nivå. Genom att erbjuda state-of-the-art prestanda under en Apache 2.0-licens, har Alibaba gett communityn ett trovärdigt och högeffektivt alternativ till de mest begränsade closed-source-modellerna.

Anvandningsfall for Qwen3.5-397B-A17B

Upptack de olika satten du kan anvanda Qwen3.5-397B-A17B for att uppna fantastiska resultat.

Autonoma GUI-agents

Navigerar i komplexa gränssnitt på PC och smartphones för att slutföra arbetsflöden för kontorsautomation i flera steg.

Intelligens för långformsvideo

Extraherar djup kausal reasoning och sammanfattningar från kontinuerliga videofiler på upp till 120 minuter.

Vibe coding och prototypering

Översätter UI-skisser direkt till produktionsklar React och frontend-logik i ett enda steg.

Forskning på PhD-nivå

Löser STEM-problem på avancerad akademisk nivå med hjälp av det specialiserade interna chain-of-thought i Thinking mode.

Globalt flerspråkigt stöd

Interagerar med användare på 201 språk med överlägsen effektivitet i tokenization för icke-engelska skrifter.

Visuell mjukvaruutveckling

Transformerar wireframes och screenshots till ren, layout-medveten HTML, CSS och JavaScript-kod.

Styrkor

Begransningar

Inference-effektivitet: Uppnår 19x högre decoding throughput genom att endast aktivera 17B parameters via sin hybrid-MoE-arkitektur.

Enorma hårdvarukrav: Med totalt 397B parameters krävs avancerad infrastruktur i serverklass för att köra okvantiserade versioner lokalt.

Nativ video-reasoning: Bearbetar upp till 120 minuter kontinuerlig video nativt utan behov av adapters för frame-extraction.

Gap i ljudmodalitet: Saknar de nativa funktioner för ljud-input och output som finns i 'omni'-modeller som GPT-4o eller Gemini.

STEM-kapacitet i toppklass: Utmanar proprietära reasoning-modeller med 88,4 % på GPQA och 91,3 % på AIME 2025-matteprov.

Prestandagap i HLE: Ligger efter proprietära ledare i Humanity's Last Exam (28,7 %), vilket tyder på luckor i nischad expertkunskap.

Tillgänglig via open-weights: Erbjuder multimodal intelligens på frontier model-nivå under Apache 2.0-licens för privata företagsmiljöer.

Minnesavtryck: Den enorma skalan kräver betydande VRAM även med sparsity, vilket begränsar användning på konsumentnivå.

API snabbstart

alibaba/qwen-3.5-plus

Visa dokumentation

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Qwen3.5-397B-A17B

Se vad communityt tycker om Qwen3.5-397B-A17B

“Qwen3.5-397B är i princip open-source-communityns svar på GPT-4o. SVG-kapaciteten i sig är helt galen för webbdesign.”

— u/LLM_Reviewer

“Ökningen på 19x i throughput gör att Qwen3.5 känns betydligt mer responsiv än någon annan model i den här storleken jag har testat.”

— tech_enthusiast_99

“Apache 2.0 för en så här stor model är en total game changer för lokal AI-utveckling och integritetsfokuserade företag.”

— TechInnovator88

twitter

“MoE-routingen i 3.5-397B-modellen är märkbart intelligentare än i den tidigare 2.5-generationen; den följer faktiskt logik.”

— DistanceSolar1449

“Ett 1M context på en open-weight-model av den här kalibern saknar motstycke i det nuvarande ekosystemet.”

— dev_logic

hackernews

“Video-reasoning handlar inte bara om frame-för-frame; det är en faktisk temporal förståelse som känns mil före nuvarande vision-LLMs.”

— Matthew Berman (Context)

youtube

Videor om Qwen3.5-397B-A17B

Se handledningar, recensioner och diskussioner om Qwen3.5-397B-A17B

“Den slår Claude Opus 4.5 på browser-tester samt Gemini 3 Pro i flera multimodala uppgifter.”

“Rapporteras vara 19 gånger snabbare än Qwen 3 Max som stöder 201 språk och dialekter.”

“Den gjorde ett fantastiskt jobb med den fotorealistiska fjärilen... bättre än de flesta open-source-modeller.”

“397B-modellen är i princip den första open-weights-modellen som verkligen tävlar vid fronten för AGI.”

“Att skala med MoE fungerar tydligt för Alibaba och deras senaste benchmark-resultat bevisar det.”

“Den här modellen matchar vad deras Qwen Max kunde göra... men den kan göra det med upp till 19x hastighetsökning.”

“Tokenizern har nu ett vocab på 250K... vilket matchar Gemini och Googles tokenizer.”

“Man måste se Qwen-teamet som ett Frontier Lab... de ger sig på uppgifter som proprietära labb fokuserar på.”

“Tokenization är mycket mer effektiv för icke-latinska skrifter jämfört med tidigare Llama-iterationer.”

“Thinking mode tillför betydande latency men vinsten i noggrannhet är värd det för kodning och reasoning.”

“Detta är en enhetlig vision language model... där tidigare modeller hade en specifik VL-variant, har denna allt samlat i en enda model.”

“Videoförståelsen gör att den kan uppfatta temporala detaljer som metoder för frame-extraction missar.”

“När det gäller kodning känns den lika responsiv som GPT-4o-modellen men med bättre förmåga att följa instruktioner.”

“Förmågan som GUI-agent för desktop är den utstickande funktionen här för verklig automation.”

“Den hanterar 120 minuter video utan att tappa context, vilket är enormt för analys.”

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter

Webbautomatisering

Smarta arbetsfloden

Kom igang gratis

Proffs-tips for Qwen3.5-397B-A17B

Experttips for att hjalpa dig fa ut det mesta av Qwen3.5-397B-A17B och uppna battre resultat.

Växla Thinking mode

Använd parametern enable_thinking för logiktunga uppgifter för att aktivera djupa interna reasoning-vägar.

Utnyttja nativ sökning

Aktivera parametern search för att verifiera fakta mot webbdata i realtid och exekvera python-kod.

Optimera video-prompts

Ange specifika tidsstämplar för att fokusera ditt 1M token context window på de mest relevanta segmenten.

Val av regional endpoint

Använd dashscope-intl-endpointen för användare utanför Kina för att minska nätverkets latency.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context

$0.60/$2.50/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context

$0.50/$3.00/1M

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context

$5.00/$25.00/1M

Vanliga fragor om Qwen3.5-397B-A17B

Hitta svar pa vanliga fragor om Qwen3.5-397B-A17B