alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B është flagship model MoE open-weight nga Alibaba. Ai përmban arsyetim native multimodal, 1M context window dhe 19x decoding throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516 Shkurt, 2026
Konteksti
1.0Mtokena
Output maksimal
8Ktokena
Cmimi i inputit
$0.60/ 1M
Cmimi i outputit
$3.60/ 1M
Modaliteti:TextImageVideo
Aftesite:VizioniMjetetStreamingArsyetimi
Benchmarket
GPQA
88.4%
GPQA: Pyetje shkence niveli pasuniversitar. Benchmark rigoroz me 448 pyetje nga biologjia, fizika dhe kimia. Ekspertet PhD arrijne vetem 65-74% saktesi. Qwen3.5-397B-A17B mori 88.4% ne kete benchmark.
HLE
28.7%
HLE: Arsyetim niveli ekspert. Teston aftesine e modelit per te demonstruar arsyetim niveli ekspert ne fusha te specializuara. Qwen3.5-397B-A17B mori 28.7% ne kete benchmark.
MMLU
88.6%
MMLU: Kuptim masiv gjuhor multitask. Benchmark gjitheperfshires me 16,000 pyetje ne 57 lende akademike. Qwen3.5-397B-A17B mori 88.6% ne kete benchmark.
MMLU Pro
87.8%
MMLU Pro: MMLU Edicioni Profesional. Version i permiresuar i MMLU me 12,032 pyetje dhe format me te veshtire me 10 opsione. Qwen3.5-397B-A17B mori 87.8% ne kete benchmark.
SimpleQA
48%
SimpleQA: Benchmark saktesie faktike. Teston aftesine e modelit per te dhene pergjigje te sakta, faktike. Qwen3.5-397B-A17B mori 48% ne kete benchmark.
IFEval
92.6%
IFEval: Vleresim i ndjekjes se udhezimeve. Mat sa mire modeli ndjek udhezime dhe kufizime specifike. Qwen3.5-397B-A17B mori 92.6% ne kete benchmark.
AIME 2025
91.3%
AIME 2025: Provimi Amerikan i Matematikes me Ftese. Probleme matematike niveli konkursi nga provimi prestigjioz AIME. Qwen3.5-397B-A17B mori 91.3% ne kete benchmark.
MATH
74.1%
MATH: Zgjidhje problemesh matematike. Benchmark gjitheperfshires matematike qe teston zgjidhjen e problemeve ne algebre, gjeometri, kalkulus. Qwen3.5-397B-A17B mori 74.1% ne kete benchmark.
GSM8k
93.7%
GSM8k: Matematike shkolle fillore 8K. 8,500 probleme matematike me fjale niveli shkolle fillore. Qwen3.5-397B-A17B mori 93.7% ne kete benchmark.
MGSM
92.1%
MGSM: Matematike shkolle fillore shumegjuheshe. Benchmarku GSM8k i perkthyer ne 10 gjuhe. Qwen3.5-397B-A17B mori 92.1% ne kete benchmark.
MathVista
90.3%
MathVista: Arsyetim vizual matematik. Teston aftesine per te zgjidhur probleme matematike me elemente vizuale. Qwen3.5-397B-A17B mori 90.3% ne kete benchmark.
SWE-Bench
76.4%
SWE-Bench: Benchmark inxhinieri software. Modelet AI perpiqen te zgjidhin probleme reale GitHub ne projekte Python. Qwen3.5-397B-A17B mori 76.4% ne kete benchmark.
HumanEval
79.3%
HumanEval: Probleme programimi Python. 164 probleme programimi ku modelet duhet te gjenerojne implementime te sakta funksionesh Python. Qwen3.5-397B-A17B mori 79.3% ne kete benchmark.
LiveCodeBench
83.6%
LiveCodeBench: Benchmark kodimi live. Teston aftesite e kodimit ne sfida programimi te botes reale qe perditsohen vazhdimisht. Qwen3.5-397B-A17B mori 83.6% ne kete benchmark.
MMMU
85%
MMMU: Kuptim multimodal. Benchmark kuptimi multimodal nga 30 lende universitare. Qwen3.5-397B-A17B mori 85% ne kete benchmark.
MMMU Pro
79%
MMMU Pro: MMMU Edicioni Profesional. Version i permiresuar i MMMU me pyetje me sfiduese. Qwen3.5-397B-A17B mori 79% ne kete benchmark.
ChartQA
86.5%
ChartQA: Pyetje dhe pergjigje grafiku. Teston aftesine per te kuptuar dhe analizuar informacion nga grafiqet dhe diagramet. Qwen3.5-397B-A17B mori 86.5% ne kete benchmark.
DocVQA
93.2%
DocVQA: Pyetje vizuale dokumentesh. Teston aftesine per te nxjerre informacion nga imazhet e dokumenteve. Qwen3.5-397B-A17B mori 93.2% ne kete benchmark.
Terminal-Bench
52.5%
Terminal-Bench: Detyra terminal/CLI. Teston aftesine per te kryer operacione te linjes se komandes. Qwen3.5-397B-A17B mori 52.5% ne kete benchmark.
ARC-AGI
12%
ARC-AGI: Abstraksion dhe arsyetim. Teston inteligjencen e lengeshem permes puzzleve te reja te njohjes se modeleve. Qwen3.5-397B-A17B mori 12% ne kete benchmark.

Rreth Qwen3.5-397B-A17B

Meso per aftesite e Qwen3.5-397B-A17B, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Mixture of Experts me Efikasitet të Lartë

Qwen3.5-397B-A17B është një flagship model native multimodal që përdor një arkitekturë hibride inovative, duke bashkuar linear attention përmes Gated Delta Networks me një Mixture-of-Experts (MoE) të rrallë. Edhe pse përmban 397 miliardë parameters gjithsej, dizajni i tij i rrallë aktivizon vetëm 17 miliardë parameters për forward pass, duke arritur efikasitet dhe shpejtësi të jashtëzakonshme të inferencës pa komprometuar aftësitë e tij të gjera të reasoning. Ai është optimizuar si për detyra gjuhësore ashtu edhe për ato vizuale, duke mbështetur një fjalor masiv prej 250k tokens dhe duke ofruar mbështetje për mbi 201 gjuhë dhe dialekte.

Rrjedhat e Punës Agentic Multimodal Native

Modeli shkëlqen si një agjent multimodal native, i aftë për të përpunuar deri në një milion tokens context, që është e barabartë me afërsisht dy orë video. Ai prezanton një Thinking Mode të specializuar për arsyetim kompleks logjik dhe është i pajisur nativisht për rrjedha pune agentic, duke përfshirë zhvillimin web, navigimin GUI dhe inteligjencën hapësinore të botës reale. Arkitektura e tij mbështet trajnimin FP8 end-to-end dhe një kornizë të çagreguar trajnimi-inferencë, duke e bërë atë një nga modelet më të shkallëzueshme dhe efikase për aplikacionet AI të nivelit ndërmarrje.

Open Weights për Aksesueshmëri Globale

I publikuar nën licencën Apache 2.0, ky model i ofron komunitetit open-source aftësi të nivelit frontier që më parë ishin të kufizuara në sisteme pronësore. Ai kapërcen hendekun midis numrave masivë të parameters dhe deployment-it praktik, duke lejuar organizatat të ekzekutojnë detyra të avancuara të reasoning në infrastrukturë private me kosto komputacionale dukshëm më të ulët se alternativat dense 400B.

Qwen3.5-397B-A17B

Rastet e perdorimit per Qwen3.5-397B-A17B

Zbulo menyrat e ndryshme per te perdorur Qwen3.5-397B-A17B per te arritur rezultate te shkelvqyera.

Analizë Video me Kohëzgjatje të Gjatë

Analizoni deri në dy orë përmbajtje video për të nxjerrë logjikë, për të bërë reverse-engineering të kodit nga pamjet ose për të gjeneruar përmbledhje të strukturuara.

Kërkime STEM në Niveli PhD

Zgjidhni pyetje shkencore të nivelit PhD dhe probleme matematikore të nivelit olimpiadë duke përdorur modalitetin e tij adaptiv të deep-thinking.

Agjentë Autonomë GUI

Automatizoni ndërveprimet me smartfonë dhe kompjuterë për të menaxhuar rrjedhat e punës në zyrë dhe navigimin midis aplikacioneve celulare.

Inxhinieri Softuerike Vizuale

Ekzekutoni 'vibe coding' duke shndërruar udhëzimet në gjuhë natyrore dhe skicat e UI-së në kod frontend funksional.

Inteligjenca e Dokumenteve

Përpunoni dokumente komplekse, diagrame dhe skica të shkruara me dorë për të nxjerrë të dhëna të strukturuara dhe për të bërë reverse-engineering të faqosjes.

Aplikacione të Spatial AI

Kuptoni marrëdhëniet në nivel pikseli për detyra të AI të mishëruar (embodied AI) si analiza e skenave të drejtimit autonom dhe navigimi robotik.

Pikat e forta

Kufizimet

Mbështetje superiore për Video: Mbështet 1 milion tokens, duke lejuar përpunimin native të deri në 120 minuta video për detyra agentic dhe kodimi.
Barrierë e madhe harduerike: Deployment-i i plotë kërkon rack-e me GPU të nivelit server me mbi 800GB VRAM për precizion të pakompresuar 16-bit.
Efikasiteti i Inferencës MoE: Arkitektura 397B total/17B aktive ofron një rritje prej 19x në throughput-in e dekodimit krahasuar me modelet e mëparshme dense flagship.
Hendek në njohuritë HLE: Pavarësisht rezultateve të larta në shkencë dhe matematikë, ai shënon vetëm 28.7% në Humanity's Last Exam (HLE), duke treguar një hendek në faktualitetin absolut të ekspertëve.
Reasoning State-of-the-art: Arrin 91.3% në AIME dhe 88.4% në GPQA, duke rivalizuar modelet më të mira closed-source në shkencë dhe matematikë të nivelit PhD.
Mbivlerësim i mjeteve: Në skenarët e agjentëve autonomë, modeli ndonjëherë halucinon outputet e mjeteve ose injoron rezultatet në favor të parashikimeve të brendshme.
Apache 2.0 Open Weights: Ofron inteligjencë të nivelit frontier me lirinë e open weights, duke lejuar deployment privat, on-premise.
Performanca në detyra terminale: Shënon 52.5% në Terminal-Bench 2.0, duke mbetur pas konkurrentëve në detyra komplekse të ndërveprimit me command-line.

Fillim i shpejte API

alibaba/qwen3.5-plus

Shiko dokumentacionin
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analizo logjikën e kësaj arkitekture MoE.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per Qwen3.5-397B-A17B

Shiko se cfare mendon komuniteti per Qwen3.5-397B-A17B

Qwen3.5-397B është thelbësisht një model i klasës GPT-5 por open-weight. Arkitektura DeltaNet po zgjidh problemet e latency-t të MoE në mënyrë perfekte.
u/DeepLearningLover
reddit
Arsyetimi multimodal native në Qwen3.5 duket i pabesueshëm. 1M context + analiza video do të ndryshojë rrjedhat e punës së agjentëve.
@AiDevDaily
twitter
Vendimi për të përdorur trajnim FP8 end-to-end duke ruajtur BF16 në shtresat e ndjeshme është një kryevepër në optimizimet e stabilitetit.
cold_fusion
hackernews
Kjo është hera e parë që shoh një model open që vërtet mposht Gemini 1.5 Pro në detyra komplekse multimodale agentic.
AI Revolution
youtube
Përmirësimi 19x në throughput-in e dekodimit krahasuar me Qwen3-Max e bën këtë një alternativë të zbatueshme për agjentët e nivelit production.
u/ModelTester2026
reddit
U befasova nga sa mirë e trajton kuantizimin 4-bit. Ai ruan pothuajse të gjithë aftësinë e reasoning në një konfigurim me dy A100.
@GlobalTechReview
twitter

Video rreth Qwen3.5-397B-A17B

Shiko tutoriale, rishikime dhe diskutime rreth Qwen3.5-397B-A17B

Një model me 397 miliardë parameters, por me 17 miliardë parameters aktive.

Kur dekodohet në 256K, ky model është 19 herë më i shpejtë se Qwen 3 Max.

Arsyetimi native vision-language është ajo që e dallon këtë për rrjedhat e punës agentic.

Kjo mposht shumicën e modeleve closed në benchmark-et standarde të matematikës.

Ekzekutimi i këtij lokalisht është i vështirë, por versionet e kuantizuara funksionojnë në Mac-ët e nivelit të lartë.

Model me 397 miliardë parameters me 17 miliardë parameters aktive. Është multimodal native.

Ndoshta është aktualisht modeli më i mirë multimodal open-source.

Aftësia për të përpunuar dy orë video native është një avantazh masiv.

Shikoni këto rezultate logjike, po arrin nivelet e GPT-4o vazhdimisht.

Licenca Apache e bën këtë shumë tërheqës për privatësinë e të dhënave të korporatave.

Ekstraksion i strukturuar OCR. Keni një PDF të çrregullt... dhe duhet ta ktheni atë në JSON të pastër. Ky model shkëlqen aty.

Merrni inteligjencën e një gjiganti me 400 miliardë parameters... por paguani koston komputacionale të një modeli me 17 miliardë parameters.

Ai trajton retrieval me context të gjatë më mirë se versioni i mëparshëm.

Integrimi i tool use është ndërtuar në trajnimin bazë, jo një mendim i dytë.

Modaliteti Thinking e lejon të korrigjojë logjikën e tij përpara se të nxjerrë outputin.

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI
Automatizimi i web-it
Workflow-e inteligjente

Keshilla Pro per Qwen3.5-397B-A17B

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga Qwen3.5-397B-A17B dhe te arrish rezultate me te mira.

Aktivizoni Thinking Mode

Kaloni parametrin 'enable_thinking: true' në thirrjen tuaj API për të aktivizuar deep reasoning për matematikë, kodim dhe enigma komplekse logjike.

Përdorni Fast Mode

Përdorni modalitetin 'Fast' për pyetje të thjeshta për të marrë përgjigje të menjëhershme pa konsumuar tokens për faza të panevojshme të brendshme të mendimit.

Optimizoni Video Prompts

Kur analizoni video, udhëzoni modelin të fokusohet te rezultati përfundimtar dinamik në vend të analizës frame-për-frame për një koherencë më të mirë kohore.

Shfrytëzoni Quantization

Përdorni quantization 4-bit ose 8-bit (GGUF/EXL2) për të ekzekutuar modelin në harduer të konsumatorit nëse keni mjaftueshëm VRAM (200GB+).

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Pyetjet e bera shpesh rreth Qwen3.5-397B-A17B

Gjej pergjigje per pyetjet e zakonshme rreth Qwen3.5-397B-A17B