alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B är Alibabas flagship open-weight MoE-model. Den har nativ multimodal reasoning, ett 1M context window och 19x decoding throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen2026-02-16
Kontext
1.0Mtokens
Max utdata
8Ktokens
Inmatningspris
$0.60/ 1M
Utdatapris
$3.60/ 1M
Modalitet:TextImageVideo
Kapaciteter:VisionVerktygStreamingResonemang
Benchmarks
GPQA
88.4%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Qwen3.5-397B-A17B fick 88.4% pa detta benchmark.
HLE
28.7%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Qwen3.5-397B-A17B fick 28.7% pa detta benchmark.
MMLU
88.6%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Qwen3.5-397B-A17B fick 88.6% pa detta benchmark.
MMLU Pro
87.8%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Qwen3.5-397B-A17B fick 87.8% pa detta benchmark.
SimpleQA
48%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Qwen3.5-397B-A17B fick 48% pa detta benchmark.
IFEval
92.6%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Qwen3.5-397B-A17B fick 92.6% pa detta benchmark.
AIME 2025
91.3%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Qwen3.5-397B-A17B fick 91.3% pa detta benchmark.
MATH
74.1%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Qwen3.5-397B-A17B fick 74.1% pa detta benchmark.
GSM8k
93.7%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Qwen3.5-397B-A17B fick 93.7% pa detta benchmark.
MGSM
92.1%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Qwen3.5-397B-A17B fick 92.1% pa detta benchmark.
MathVista
90.3%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Qwen3.5-397B-A17B fick 90.3% pa detta benchmark.
SWE-Bench
76.4%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Qwen3.5-397B-A17B fick 76.4% pa detta benchmark.
HumanEval
79.3%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Qwen3.5-397B-A17B fick 79.3% pa detta benchmark.
LiveCodeBench
83.6%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Qwen3.5-397B-A17B fick 83.6% pa detta benchmark.
MMMU
85%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Qwen3.5-397B-A17B fick 85% pa detta benchmark.
MMMU Pro
79%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Qwen3.5-397B-A17B fick 79% pa detta benchmark.
ChartQA
86.5%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Qwen3.5-397B-A17B fick 86.5% pa detta benchmark.
DocVQA
93.2%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Qwen3.5-397B-A17B fick 93.2% pa detta benchmark.
Terminal-Bench
52.5%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Qwen3.5-397B-A17B fick 52.5% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Qwen3.5-397B-A17B fick 12% pa detta benchmark.

Om Qwen3.5-397B-A17B

Lar dig om Qwen3.5-397B-A17Bs kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Ett monumentalt språng för öppen AI

Qwen3.5-397B-A17B representerar ett monumentalt språng i Alibaba Clouds AI-strategi, och går från att vara en stark open-source-utmanare till ett dominant system på frontier model-nivå designat för eran av agentic AI. Den släpptes den 16 februari 2026 och är flagship-modellen i Qwen3.5-serien, byggd på en massiv 397-miljarders parameters Mixture-of-Experts (MoE)-arkitektur. Genom att endast aktivera 17 miljarder parameters per token uppnår den en oöverträffad 19x ökning i decoding throughput jämfört med sin föregångare, Qwen3-Max, samtidigt som den minskar prestandagapet till världens mest avancerade proprietära modeller.

Enhetligt multimodalt kraftpaket

Modellen är ett enhetligt, nativt multimodalt kraftpaket. Till skillnad från tidigare versioner som krävde separata vision-language-adapters, har Qwen3.5 early-fusion-multimodalitet tränad på biljoner multimodala tokens. Detta gör att den kan se och utföra reasoning över två timmar videoinnehåll, fungera som en GUI-agent i desktop- och mobilgränssnitt, samt hantera komplexa kodningsuppgifter i sitt specialiserade Thinking mode. Med ett utökat ordförråd på 250 000 tokens som stöder 201 språk, står den som det främsta globala valet för flerspråkig och multimodal automation.

Arkitekterad för eran av agents

Bortom enkel chatt är Qwen3.5-397B optimerad för användning av verktyg och autonoma arbetsflöden. Dess höga poäng i benchmarks för function-calling och instruktionsföljsamhet gör den till en idealisk ryggrad för visuell mjukvaruutveckling och forskning på PhD-nivå. Genom att erbjuda state-of-the-art prestanda under en Apache 2.0-licens, har Alibaba gett communityn ett trovärdigt och högeffektivt alternativ till de mest begränsade closed-source-modellerna.

Qwen3.5-397B-A17B

Anvandningsfall for Qwen3.5-397B-A17B

Upptack de olika satten du kan anvanda Qwen3.5-397B-A17B for att uppna fantastiska resultat.

Autonoma GUI-agents

Navigerar i komplexa gränssnitt på PC och smartphones för att slutföra arbetsflöden för kontorsautomation i flera steg.

Intelligens för långformsvideo

Extraherar djup kausal reasoning och sammanfattningar från kontinuerliga videofiler på upp till 120 minuter.

Vibe coding och prototypering

Översätter UI-skisser direkt till produktionsklar React och frontend-logik i ett enda steg.

Forskning på PhD-nivå

Löser STEM-problem på avancerad akademisk nivå med hjälp av det specialiserade interna chain-of-thought i Thinking mode.

Globalt flerspråkigt stöd

Interagerar med användare på 201 språk med överlägsen effektivitet i tokenization för icke-engelska skrifter.

Visuell mjukvaruutveckling

Transformerar wireframes och screenshots till ren, layout-medveten HTML, CSS och JavaScript-kod.

Styrkor

Begransningar

Inference-effektivitet: Uppnår 19x högre decoding throughput genom att endast aktivera 17B parameters via sin hybrid-MoE-arkitektur.
Enorma hårdvarukrav: Med totalt 397B parameters krävs avancerad infrastruktur i serverklass för att köra okvantiserade versioner lokalt.
Nativ video-reasoning: Bearbetar upp till 120 minuter kontinuerlig video nativt utan behov av adapters för frame-extraction.
Gap i ljudmodalitet: Saknar de nativa funktioner för ljud-input och output som finns i 'omni'-modeller som GPT-4o eller Gemini.
STEM-kapacitet i toppklass: Utmanar proprietära reasoning-modeller med 88,4 % på GPQA och 91,3 % på AIME 2025-matteprov.
Prestandagap i HLE: Ligger efter proprietära ledare i Humanity's Last Exam (28,7 %), vilket tyder på luckor i nischad expertkunskap.
Tillgänglig via open-weights: Erbjuder multimodal intelligens på frontier model-nivå under Apache 2.0-licens för privata företagsmiljöer.
Minnesavtryck: Den enorma skalan kräver betydande VRAM även med sparsity, vilket begränsar användning på konsumentnivå.

API snabbstart

alibaba/qwen-3.5-plus

Visa dokumentation
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Analyze this 2-hour video context.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Qwen3.5-397B-A17B

Se vad communityt tycker om Qwen3.5-397B-A17B

Qwen3.5-397B är i princip open-source-communityns svar på GPT-4o. SVG-kapaciteten i sig är helt galen för webbdesign.
u/LLM_Reviewer
reddit
Ökningen på 19x i throughput gör att Qwen3.5 känns betydligt mer responsiv än någon annan model i den här storleken jag har testat.
tech_enthusiast_99
reddit
Apache 2.0 för en så här stor model är en total game changer för lokal AI-utveckling och integritetsfokuserade företag.
TechInnovator88
twitter
MoE-routingen i 3.5-397B-modellen är märkbart intelligentare än i den tidigare 2.5-generationen; den följer faktiskt logik.
DistanceSolar1449
reddit
Ett 1M context på en open-weight-model av den här kalibern saknar motstycke i det nuvarande ekosystemet.
dev_logic
hackernews
Video-reasoning handlar inte bara om frame-för-frame; det är en faktisk temporal förståelse som känns mil före nuvarande vision-LLMs.
Matthew Berman (Context)
youtube

Videor om Qwen3.5-397B-A17B

Se handledningar, recensioner och diskussioner om Qwen3.5-397B-A17B

Den slår Claude Opus 4.5 på browser-tester samt Gemini 3 Pro i flera multimodala uppgifter.

Rapporteras vara 19 gånger snabbare än Qwen 3 Max som stöder 201 språk och dialekter.

Den gjorde ett fantastiskt jobb med den fotorealistiska fjärilen... bättre än de flesta open-source-modeller.

397B-modellen är i princip den första open-weights-modellen som verkligen tävlar vid fronten för AGI.

Att skala med MoE fungerar tydligt för Alibaba och deras senaste benchmark-resultat bevisar det.

Den här modellen matchar vad deras Qwen Max kunde göra... men den kan göra det med upp till 19x hastighetsökning.

Tokenizern har nu ett vocab på 250K... vilket matchar Gemini och Googles tokenizer.

Man måste se Qwen-teamet som ett Frontier Lab... de ger sig på uppgifter som proprietära labb fokuserar på.

Tokenization är mycket mer effektiv för icke-latinska skrifter jämfört med tidigare Llama-iterationer.

Thinking mode tillför betydande latency men vinsten i noggrannhet är värd det för kodning och reasoning.

Detta är en enhetlig vision language model... där tidigare modeller hade en specifik VL-variant, har denna allt samlat i en enda model.

Videoförståelsen gör att den kan uppfatta temporala detaljer som metoder för frame-extraction missar.

När det gäller kodning känns den lika responsiv som GPT-4o-modellen men med bättre förmåga att följa instruktioner.

Förmågan som GUI-agent för desktop är den utstickande funktionen här för verklig automation.

Den hanterar 120 minuter video utan att tappa context, vilket är enormt för analys.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Qwen3.5-397B-A17B

Experttips for att hjalpa dig fa ut det mesta av Qwen3.5-397B-A17B och uppna battre resultat.

Växla Thinking mode

Använd parametern enable_thinking för logiktunga uppgifter för att aktivera djupa interna reasoning-vägar.

Utnyttja nativ sökning

Aktivera parametern search för att verifiera fakta mot webbdata i realtid och exekvera python-kod.

Optimera video-prompts

Ange specifika tidsstämplar för att fokusera ditt 1M token context window på de mest relevanta segmenten.

Val av regional endpoint

Använd dashscope-intl-endpointen för användare utanför Kina för att minska nätverkets latency.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Vanliga fragor om Qwen3.5-397B-A17B

Hitta svar pa vanliga fragor om Qwen3.5-397B-A17B