A është Qwen3.5-397B-A17B open-source?

Po, ai është publikuar si një model open-weight nën licencën Apache 2.0, e cila lejon përdorimin tregtar dhe hosting-un privat.

Çfarë do të thotë '17B active parameters'?

Ai përdor një arkitekturë Mixture-of-Experts ku vetëm 17 miliardë nga 397 miliardë parameters të tij përdoren për të përpunuar çdo token, duke ulur ndjeshëm kërkesat për komputacion.

Sa kushton API i Qwen3.5-Plus?

Kushton $0.40 për 1 milion input tokens dhe $2.40 për 1 milion output tokens, duke e bërë një nga frontier models më efikase për sa i përket kostos.

A mund të përpunojë skedarë video?

Po, modeli mund të përpunojë në mënyrë native deri në 1 milion tokens context, që është e barabartë me afërsisht 120 minuta video.

A mbështet function calling?

Po, modeli ka mbështetje të fuqishme për tool use, duke përfshirë kërkimin në web, interpretimin e kodit dhe thirrjen e funksioneve të personalizuara (function calling).

Cilat janë kërkesat harduerike?

Për shkak të 397B parameters gjithsej, ekzekutimi i modelit në precizion 16-bit kërkon mbi 800GB VRAM, gjë që zakonisht kërkon një server rack me shumë GPU.

Si i menaxhon detyrat e reasoning?

Qwen3.5 përdor një kornizë asinkrone RL për të mbështetur chain-of-thought reasoning, e cila mund të aktivizohet përmes API parameters si 'enable_thinking'.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B është flagship model MoE open-weight nga Alibaba. Ai përmban arsyetim native multimodal, 1M context window dhe 19x decoding throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen3.516 Shkurt, 2026

Konteksti

1.0Mtokena

Output maksimal

8Ktokena

Cmimi i inputit

$0.60/ 1M

Cmimi i outputit

$3.60/ 1M

Modaliteti:TextImageVideo

Aftesite:VizioniMjetetStreamingArsyetimi

Benchmarket

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

Shiko dokumentacionin API

Rreth Qwen3.5-397B-A17B

Meso per aftesite e Qwen3.5-397B-A17B, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Mixture of Experts me Efikasitet të Lartë

Qwen3.5-397B-A17B është një flagship model native multimodal që përdor një arkitekturë hibride inovative, duke bashkuar linear attention përmes Gated Delta Networks me një Mixture-of-Experts (MoE) të rrallë. Edhe pse përmban 397 miliardë parameters gjithsej, dizajni i tij i rrallë aktivizon vetëm 17 miliardë parameters për forward pass, duke arritur efikasitet dhe shpejtësi të jashtëzakonshme të inferencës pa komprometuar aftësitë e tij të gjera të reasoning. Ai është optimizuar si për detyra gjuhësore ashtu edhe për ato vizuale, duke mbështetur një fjalor masiv prej 250k tokens dhe duke ofruar mbështetje për mbi 201 gjuhë dhe dialekte.

Rrjedhat e Punës Agentic Multimodal Native

Modeli shkëlqen si një agjent multimodal native, i aftë për të përpunuar deri në një milion tokens context, që është e barabartë me afërsisht dy orë video. Ai prezanton një Thinking Mode të specializuar për arsyetim kompleks logjik dhe është i pajisur nativisht për rrjedha pune agentic, duke përfshirë zhvillimin web, navigimin GUI dhe inteligjencën hapësinore të botës reale. Arkitektura e tij mbështet trajnimin FP8 end-to-end dhe një kornizë të çagreguar trajnimi-inferencë, duke e bërë atë një nga modelet më të shkallëzueshme dhe efikase për aplikacionet AI të nivelit ndërmarrje.

Open Weights për Aksesueshmëri Globale

I publikuar nën licencën Apache 2.0, ky model i ofron komunitetit open-source aftësi të nivelit frontier që më parë ishin të kufizuara në sisteme pronësore. Ai kapërcen hendekun midis numrave masivë të parameters dhe deployment-it praktik, duke lejuar organizatat të ekzekutojnë detyra të avancuara të reasoning në infrastrukturë private me kosto komputacionale dukshëm më të ulët se alternativat dense 400B.

Rastet e perdorimit per Qwen3.5-397B-A17B

Zbulo menyrat e ndryshme per te perdorur Qwen3.5-397B-A17B per te arritur rezultate te shkelvqyera.

Analizë Video me Kohëzgjatje të Gjatë

Analizoni deri në dy orë përmbajtje video për të nxjerrë logjikë, për të bërë reverse-engineering të kodit nga pamjet ose për të gjeneruar përmbledhje të strukturuara.

Kërkime STEM në Niveli PhD

Zgjidhni pyetje shkencore të nivelit PhD dhe probleme matematikore të nivelit olimpiadë duke përdorur modalitetin e tij adaptiv të deep-thinking.

Agjentë Autonomë GUI

Automatizoni ndërveprimet me smartfonë dhe kompjuterë për të menaxhuar rrjedhat e punës në zyrë dhe navigimin midis aplikacioneve celulare.

Inxhinieri Softuerike Vizuale

Ekzekutoni 'vibe coding' duke shndërruar udhëzimet në gjuhë natyrore dhe skicat e UI-së në kod frontend funksional.

Inteligjenca e Dokumenteve

Përpunoni dokumente komplekse, diagrame dhe skica të shkruara me dorë për të nxjerrë të dhëna të strukturuara dhe për të bërë reverse-engineering të faqosjes.

Aplikacione të Spatial AI

Kuptoni marrëdhëniet në nivel pikseli për detyra të AI të mishëruar (embodied AI) si analiza e skenave të drejtimit autonom dhe navigimi robotik.

Pikat e forta

Kufizimet

Mbështetje superiore për Video: Mbështet 1 milion tokens, duke lejuar përpunimin native të deri në 120 minuta video për detyra agentic dhe kodimi.

Barrierë e madhe harduerike: Deployment-i i plotë kërkon rack-e me GPU të nivelit server me mbi 800GB VRAM për precizion të pakompresuar 16-bit.

Efikasiteti i Inferencës MoE: Arkitektura 397B total/17B aktive ofron një rritje prej 19x në throughput-in e dekodimit krahasuar me modelet e mëparshme dense flagship.

Hendek në njohuritë HLE: Pavarësisht rezultateve të larta në shkencë dhe matematikë, ai shënon vetëm 28.7% në Humanity's Last Exam (HLE), duke treguar një hendek në faktualitetin absolut të ekspertëve.

Reasoning State-of-the-art: Arrin 91.3% në AIME dhe 88.4% në GPQA, duke rivalizuar modelet më të mira closed-source në shkencë dhe matematikë të nivelit PhD.

Mbivlerësim i mjeteve: Në skenarët e agjentëve autonomë, modeli ndonjëherë halucinon outputet e mjeteve ose injoron rezultatet në favor të parashikimeve të brendshme.

Apache 2.0 Open Weights: Ofron inteligjencë të nivelit frontier me lirinë e open weights, duke lejuar deployment privat, on-premise.

Performanca në detyra terminale: Shënon 52.5% në Terminal-Bench 2.0, duke mbetur pas konkurrentëve në detyra komplekse të ndërveprimit me command-line.

Fillim i shpejte API

alibaba/qwen3.5-plus

Shiko dokumentacionin

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analizo logjikën e kësaj arkitekture MoE.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per Qwen3.5-397B-A17B

Shiko se cfare mendon komuniteti per Qwen3.5-397B-A17B

“Qwen3.5-397B është thelbësisht një model i klasës GPT-5 por open-weight. Arkitektura DeltaNet po zgjidh problemet e latency-t të MoE në mënyrë perfekte.”

— u/DeepLearningLover

“Arsyetimi multimodal native në Qwen3.5 duket i pabesueshëm. 1M context + analiza video do të ndryshojë rrjedhat e punës së agjentëve.”

— @AiDevDaily

twitter

“Vendimi për të përdorur trajnim FP8 end-to-end duke ruajtur BF16 në shtresat e ndjeshme është një kryevepër në optimizimet e stabilitetit.”

— cold_fusion

hackernews

“Kjo është hera e parë që shoh një model open që vërtet mposht Gemini 1.5 Pro në detyra komplekse multimodale agentic.”

— AI Revolution

youtube

“Përmirësimi 19x në throughput-in e dekodimit krahasuar me Qwen3-Max e bën këtë një alternativë të zbatueshme për agjentët e nivelit production.”

— u/ModelTester2026

“U befasova nga sa mirë e trajton kuantizimin 4-bit. Ai ruan pothuajse të gjithë aftësinë e reasoning në një konfigurim me dy A100.”

— @GlobalTechReview

twitter

Video rreth Qwen3.5-397B-A17B

Shiko tutoriale, rishikime dhe diskutime rreth Qwen3.5-397B-A17B

“Një model me 397 miliardë parameters, por me 17 miliardë parameters aktive.”

“Kur dekodohet në 256K, ky model është 19 herë më i shpejtë se Qwen 3 Max.”

“Arsyetimi native vision-language është ajo që e dallon këtë për rrjedhat e punës agentic.”

“Kjo mposht shumicën e modeleve closed në benchmark-et standarde të matematikës.”

“Ekzekutimi i këtij lokalisht është i vështirë, por versionet e kuantizuara funksionojnë në Mac-ët e nivelit të lartë.”

“Model me 397 miliardë parameters me 17 miliardë parameters aktive. Është multimodal native.”

“Ndoshta është aktualisht modeli më i mirë multimodal open-source.”

“Aftësia për të përpunuar dy orë video native është një avantazh masiv.”

“Shikoni këto rezultate logjike, po arrin nivelet e GPT-4o vazhdimisht.”

“Licenca Apache e bën këtë shumë tërheqës për privatësinë e të dhënave të korporatave.”

“Ekstraksion i strukturuar OCR. Keni një PDF të çrregullt... dhe duhet ta ktheni atë në JSON të pastër. Ky model shkëlqen aty.”

“Merrni inteligjencën e një gjiganti me 400 miliardë parameters... por paguani koston komputacionale të një modeli me 17 miliardë parameters.”

“Ai trajton retrieval me context të gjatë më mirë se versioni i mëparshëm.”

“Integrimi i tool use është ndërtuar në trajnimin bazë, jo një mendim i dytë.”

“Modaliteti Thinking e lejon të korrigjojë logjikën e tij përpara se të nxjerrë outputin.”

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI

Automatizimi i web-it

Workflow-e inteligjente

Fillo falas

Keshilla Pro per Qwen3.5-397B-A17B

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga Qwen3.5-397B-A17B dhe te arrish rezultate me te mira.

Aktivizoni Thinking Mode

Kaloni parametrin 'enable_thinking: true' në thirrjen tuaj API për të aktivizuar deep reasoning për matematikë, kodim dhe enigma komplekse logjike.

Përdorni Fast Mode

Përdorni modalitetin 'Fast' për pyetje të thjeshta për të marrë përgjigje të menjëhershme pa konsumuar tokens për faza të panevojshme të brendshme të mendimit.

Optimizoni Video Prompts

Kur analizoni video, udhëzoni modelin të fokusohet te rezultati përfundimtar dinamik në vend të analizës frame-për-frame për një koherencë më të mirë kohore.

Shfrytëzoni Quantization

Përdorni quantization 4-bit ose 8-bit (GGUF/EXL2) për të ekzekutuar modelin në harduer të konsumatorit nëse keni mjaftueshëm VRAM (200GB+).

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Pyetjet e bera shpesh rreth Qwen3.5-397B-A17B

Gjej pergjigje per pyetjet e zakonshme rreth Qwen3.5-397B-A17B