Чи є Qwen3.5-397B-A17B open-source?

Так, модель випущена як open-source модель (з відкритими вагами) за ліцензією Apache 2.0, що дозволяє комерційне використання та приватний хостинг.

Що означає «17B активних параметрів»?

Вона використовує архітектуру Mixture-of-Experts, де лише 17 мільярдів із 397 мільярдів параметрів залучаються для обробки кожного окремого token, що значно знижує вимоги до обчислень.

Скільки коштує API Qwen3.5-Plus?

Вартість становить $0.40 за 1 мільйон вхідних tokens та $2.40 за 1 мільйон вихідних tokens, що робить її однією з найбільш економічно вигідних frontier model на ринку.

Чи може вона обробляти відеофайли?

Так, модель може нативно обробляти до 1 мільйона tokens контексту, що еквівалентно приблизно 120 хвилинам відео.

Чи підтримує вона function calling?

Так, модель має надійну підтримку використання інструментів (tool use), включаючи веб-пошук, інтерпретацію коду та виклик користувацьких функцій.

Які апаратні вимоги?

Через загальну кількість 397B параметрів, запуск моделі у 16-бітної точності потребує понад 800 ГБ VRAM, що зазвичай вимагає використання серверної стійки з декількома GPU.

Як вона справляється із завданнями на reasoning?

Qwen3.5 використовує асинхронний RL-фреймворк для підтримки chain-of-thought reasoning, який можна ввімкнути через параметри API, наприклад 'enable_thinking'.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B — це флагманська open-weight MoE модель від Alibaba. Вона відрізняється нативним мультимодальним reasoning, вікном контексту 1M та 19-кратним...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen3.516 лютого 2026 р.

Контекст

1.0Mтокенів

Макс. вивід

8Kтокенів

Ціна вводу

$0.60/ 1M

Ціна виводу

$3.60/ 1M

Модальність:TextImageVideo

Можливості:ЗірІнструментиПотокова передачаМіркування

Бенчмарки

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

Переглянути документацію API

Про Qwen3.5-397B-A17B

Дізнайтеся про можливості Qwen3.5-397B-A17B, функції та як це може допомогти вам досягти кращих результатів.

Високоефективна Mixture-of-Experts

Qwen3.5-397B-A17B, це флагманська нативна мультимодальна модель, що використовує інноваційну гібридну архітектуру, поєднуючи лінійну увагу через Gated Delta Networks із розрідженою Mixture-of-Experts (MoE). Хоча вона містить загалом 397 мільярдів параметрів, її розріджена конструкція активує лише 17 мільярдів параметрів за один прямий прохід (forward pass), досягаючи виняткової ефективності та швидкості inference без шкоди для її великих можливостей reasoning. Вона оптимізована як для мовних, так і для візуальних завдань, підтримуючи словник у 250 тис. tokens та забезпечуючи підтримку понад 201 мови й діалекту.

Нативні мультимодальні agentic-процеси

Модель чудово проявляє себе як нативний мультимодальний агент, здатний опрацьовувати до одного мільйона tokens контексту, що еквівалентно приблизно двом годинам відео. Вона представляє спеціалізований Thinking Mode для складних логічних міркувань і нативно обладнана для agentic-процесів, включаючи веб-розробку, навігацію в GUI та просторовий інтелект у реальному світі. Її архітектура підтримує тренування FP8 end-to-end, що робить її однією з найбільш масштабованих та ефективних моделей для корпоративних AI-застосунків.

Відкриті ваги для глобальної доступності

Випущена за ліцензією Apache 2.0, ця модель надає open-source спільноті можливості рівня frontier model, які раніше були обмежені пропрієтарними системами. Вона долає розрив між величезною кількістю параметрів та практичним розгортанням, дозволяючи організаціям виконувати State-of-the-art завдання на власному обладнанні зі значно меншими обчислювальними витратами, ніж у щільних (dense) 400B альтернатив.

Випадки використання для Qwen3.5-397B-A17B

Відкрийте різні способи використання Qwen3.5-397B-A17B для досягнення чудових результатів.

Аналіз тривалого відео

Аналізуйте до двох годин відеоконтенту для вилучення логіки, реверс-інжинірингу коду з відео або створення структурованих резюме.

STEM-дослідження рівня PhD

Вирішуйте наукові завдання рівня PhD та математичні олімпіадні задачі, використовуючи адаптивний режим глибокого мислення.

Автономні GUI-агенти

Автоматизуйте взаємодію зі смартфонами та комп'ютерами для керування робочими процесами та навігації між застосунками.

Візуальна розробка ПЗ

Займайтеся «vibe coding», перетворюючи інструкції природною мовою та ескізи інтерфейсу на функціональний фронтенд-код.

Інтелектуальна обробка документів

Опрацьовуйте складні документи, графіки та рукописні нотатки для вилучення структурованих даних та аналізу макетів.

Застосунки просторового AI

Розуміння попіксельних зв'язків для завдань embodied AI, таких як аналіз сцен безпілотного водіння та робототехнічна навігація.

Сильні сторони

Обмеження

Чудова підтримка відео: Підтримує 1 мільйон tokens, дозволяючи нативно обробляти до 120 хвилин відео для agentic-завдань та програмування.

Високий апаратний бар'єр: Повне розгортання вимагає серверних стійок з GPU з понад 800 ГБ VRAM для нестиснутої 16-бітної точності.

Ефективність inference MoE: Архітектура з 397B загальних/17B активних параметрів забезпечує 19-кратний приріст пропускної здатності декодування порівняно з попередніми dense flagship models.

Прогалини у знаннях HLE: Попри високі бали в науці та математиці, модель має лише 28.7% на Humanity's Last Exam (HLE), що вказує на прогалину в абсолютній експертній фактичності.

State-of-the-art reasoning: Досягає 91.3% на AIME та 88.4% на GPQA, конкуруючи з топовими closed-source моделями у науці та математиці рівня PhD.

Надмірна впевненість у tool use: У сценаріях з автономними агентами модель іноді галюцинує результати роботи інструментів або ігнорує їх на користь внутрішніх передбачень.

Відкриті ваги Apache 2.0: Пропонує інтелект рівня frontier model зі свободою відкритих ваг, що дозволяє розгортання в локальній інфраструктурі.

Продуктивність термінальних завдань: Має 52.5% на Terminal-Bench 2.0, відстаючи від конкурентів у складних завданнях взаємодії з командним рядком.

Швидкий старт API

alibaba/qwen3.5-plus

Переглянути документацію

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Qwen3.5-397B-A17B

Подивіться, що думає спільнота про Qwen3.5-397B-A17B

“Qwen3.5-397B, це, по суті, модель класу GPT-5, але з відкритими вагами. Архітектура DeltaNet ідеально вирішує проблеми latency в MoE.”

— u/DeepLearningLover

“Нативний мультимодальний reasoning у Qwen3.5 виглядає неймовірно. 1M контексту + аналіз відео змінять робочі процеси агентів.”

— @AiDevDaily

twitter

“Рішення використовувати FP8 для тренування end-to-end, зберігаючи BF16 у чутливих шарах, це майстер-клас з оптимізації стабільності.”

— cold_fusion

hackernews

“Це перший раз, коли я бачу open-source модель, яка справді перевершує Gemini 1.5 Pro у складних мультимодальних agentic-завданнях.”

— AI Revolution

youtube

“19-кратне покращення пропускної здатності декодування порівняно з Qwen3-Max робить її життєздатною альтернативою для агентів продакшн-рівня.”

— u/ModelTester2026

“Я був здивований, наскільки добре вона справляється з 4-бітовим квантуванням. Вона зберігає майже всі можливості reasoning на установці з двома A100.”

— @GlobalTechReview

twitter

Відео про Qwen3.5-397B-A17B

Дивіться навчальні матеріали, огляди та обговорення про Qwen3.5-397B-A17B

“Модель на 397 мільярдів параметрів, але з 17 мільярдами активних параметрів.”

“При декодуванні на 256K ця модель у 19 разів швидша за Qwen 3 Max.”

“Нативний візуально-мовний reasoning, це те, що вирізняє її для agentic-процесів.”

“Це перевершує більшість closed-source моделей на стандартних математичних бенчмарках.”

“Запускати це локально важко, але квантовані версії цілком працюють на потужних Mac.”

“Модель на 397 мільярдів параметрів із 17 мільярдами активних. Вона нативно мультимодальна.”

“Ймовірно, на сьогодні це найкраща open-source мультимодальна модель.”

“Можливість нативно обробляти дві години відео, це величезна перевага.”

“Подивіться на ці бали логіки, вона стабільно досягає рівня GPT-4o.”

“Ліцензія Apache робить її дуже привабливою для корпоративної безпеки даних.”

“OCR структуроване вилучення. У вас є брудний PDF... і вам потрібно перетворити це на чистий JSON. Ця модель тут блищить.”

“Ви отримуєте інтелект гіганта на 400 мільярдів параметрів... але платите обчислювальну ціну моделі на 17 мільярдів.”

“Вона працює з довгим контекстом краще, ніж попередня версія.”

“Інтеграція використання інструментів вбудована в базове навчання, а не додана пізніше.”

“Thinking mode дозволяє їй виправляти власну логіку перед виведенням відповіді.”

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти

Веб-автоматизація

Розумні робочі процеси

Почати безкоштовно

Професійні поради для Qwen3.5-397B-A17B

Експертні поради, які допоможуть вам отримати максимум від Qwen3.5-397B-A17B та досягти кращих результатів.

Увімкнення Thinking Mode

Використовуйте параметр 'enable_thinking: true' у вашому виклику API, щоб активувати глибокий reasoning для математики, програмування та складних логічних задач.

Використання Fast Mode

Застосовуйте режим 'Fast' для простих запитів, щоб отримувати миттєві відповіді, не витрачаючи tokens на зайві внутрішні етапи міркування.

Оптимізація підказок для відео

Під час аналізу відео просіть модель зосередитися на фінальному динамічному результаті, а не на аналізі кадрів, для кращої часової узгодженості.

Використання квантування

Використовуйте 4-бітове або 8-бітове квантування (GGUF/EXL2) для запуску моделі на споживчому залізі, якщо у вас є достатньо VRAM (200 ГБ+).

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

Claude Fable 5

Anthropic

Anthropic's Claude Fable 5 is a Mythos-class model featuring a 1M context window and 128K output tokens. It excels at agentic coding and 3D physics.

1M context

$10.00/$50.00/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context

$3.00/$15.00/1M

DeepSeek v4

DeepSeek

DeepSeek v4 is a 1.6T parameter MoE model featuring a 1M token context window and native multimodal support for text, vision, and video at disruptive prices.

1M context

$1.74/$3.48/1M

Часті запитання про Qwen3.5-397B-A17B

Знайдіть відповіді на поширені запитання про Qwen3.5-397B-A17B