alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B — це флагманська open-weight MoE модель від Alibaba. Вона відрізняється нативним мультимодальним reasoning, вікном контексту 1M та 19-кратним...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516 лютого 2026 р.
Контекст
1.0Mтокенів
Макс. вивід
8Kтокенів
Ціна вводу
$0.60/ 1M
Ціна виводу
$3.60/ 1M
Модальність:TextImageVideo
Можливості:ЗірІнструментиПотокова передачаМіркування
Бенчмарки
GPQA
88.4%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Qwen3.5-397B-A17B набрав 88.4% у цьому бенчмарку.
HLE
28.7%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Qwen3.5-397B-A17B набрав 28.7% у цьому бенчмарку.
MMLU
88.6%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Qwen3.5-397B-A17B набрав 88.6% у цьому бенчмарку.
MMLU Pro
87.8%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Qwen3.5-397B-A17B набрав 87.8% у цьому бенчмарку.
SimpleQA
48%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Qwen3.5-397B-A17B набрав 48% у цьому бенчмарку.
IFEval
92.6%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Qwen3.5-397B-A17B набрав 92.6% у цьому бенчмарку.
AIME 2025
91.3%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Qwen3.5-397B-A17B набрав 91.3% у цьому бенчмарку.
MATH
74.1%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Qwen3.5-397B-A17B набрав 74.1% у цьому бенчмарку.
GSM8k
93.7%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Qwen3.5-397B-A17B набрав 93.7% у цьому бенчмарку.
MGSM
92.1%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Qwen3.5-397B-A17B набрав 92.1% у цьому бенчмарку.
MathVista
90.3%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Qwen3.5-397B-A17B набрав 90.3% у цьому бенчмарку.
SWE-Bench
76.4%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Qwen3.5-397B-A17B набрав 76.4% у цьому бенчмарку.
HumanEval
79.3%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Qwen3.5-397B-A17B набрав 79.3% у цьому бенчмарку.
LiveCodeBench
83.6%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Qwen3.5-397B-A17B набрав 83.6% у цьому бенчмарку.
MMMU
85%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Qwen3.5-397B-A17B набрав 85% у цьому бенчмарку.
MMMU Pro
79%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Qwen3.5-397B-A17B набрав 79% у цьому бенчмарку.
ChartQA
86.5%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Qwen3.5-397B-A17B набрав 86.5% у цьому бенчмарку.
DocVQA
93.2%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Qwen3.5-397B-A17B набрав 93.2% у цьому бенчмарку.
Terminal-Bench
52.5%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Qwen3.5-397B-A17B набрав 52.5% у цьому бенчмарку.
ARC-AGI
12%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Qwen3.5-397B-A17B набрав 12% у цьому бенчмарку.

Про Qwen3.5-397B-A17B

Дізнайтеся про можливості Qwen3.5-397B-A17B, функції та як це може допомогти вам досягти кращих результатів.

Високоефективна Mixture-of-Experts

Qwen3.5-397B-A17B, це флагманська нативна мультимодальна модель, що використовує інноваційну гібридну архітектуру, поєднуючи лінійну увагу через Gated Delta Networks із розрідженою Mixture-of-Experts (MoE). Хоча вона містить загалом 397 мільярдів параметрів, її розріджена конструкція активує лише 17 мільярдів параметрів за один прямий прохід (forward pass), досягаючи виняткової ефективності та швидкості inference без шкоди для її великих можливостей reasoning. Вона оптимізована як для мовних, так і для візуальних завдань, підтримуючи словник у 250 тис. tokens та забезпечуючи підтримку понад 201 мови й діалекту.

Нативні мультимодальні agentic-процеси

Модель чудово проявляє себе як нативний мультимодальний агент, здатний опрацьовувати до одного мільйона tokens контексту, що еквівалентно приблизно двом годинам відео. Вона представляє спеціалізований Thinking Mode для складних логічних міркувань і нативно обладнана для agentic-процесів, включаючи веб-розробку, навігацію в GUI та просторовий інтелект у реальному світі. Її архітектура підтримує тренування FP8 end-to-end, що робить її однією з найбільш масштабованих та ефективних моделей для корпоративних AI-застосунків.

Відкриті ваги для глобальної доступності

Випущена за ліцензією Apache 2.0, ця модель надає open-source спільноті можливості рівня frontier model, які раніше були обмежені пропрієтарними системами. Вона долає розрив між величезною кількістю параметрів та практичним розгортанням, дозволяючи організаціям виконувати State-of-the-art завдання на власному обладнанні зі значно меншими обчислювальними витратами, ніж у щільних (dense) 400B альтернатив.

Qwen3.5-397B-A17B

Випадки використання для Qwen3.5-397B-A17B

Відкрийте різні способи використання Qwen3.5-397B-A17B для досягнення чудових результатів.

Аналіз тривалого відео

Аналізуйте до двох годин відеоконтенту для вилучення логіки, реверс-інжинірингу коду з відео або створення структурованих резюме.

STEM-дослідження рівня PhD

Вирішуйте наукові завдання рівня PhD та математичні олімпіадні задачі, використовуючи адаптивний режим глибокого мислення.

Автономні GUI-агенти

Автоматизуйте взаємодію зі смартфонами та комп'ютерами для керування робочими процесами та навігації між застосунками.

Візуальна розробка ПЗ

Займайтеся «vibe coding», перетворюючи інструкції природною мовою та ескізи інтерфейсу на функціональний фронтенд-код.

Інтелектуальна обробка документів

Опрацьовуйте складні документи, графіки та рукописні нотатки для вилучення структурованих даних та аналізу макетів.

Застосунки просторового AI

Розуміння попіксельних зв'язків для завдань embodied AI, таких як аналіз сцен безпілотного водіння та робототехнічна навігація.

Сильні сторони

Обмеження

Чудова підтримка відео: Підтримує 1 мільйон tokens, дозволяючи нативно обробляти до 120 хвилин відео для agentic-завдань та програмування.
Високий апаратний бар'єр: Повне розгортання вимагає серверних стійок з GPU з понад 800 ГБ VRAM для нестиснутої 16-бітної точності.
Ефективність inference MoE: Архітектура з 397B загальних/17B активних параметрів забезпечує 19-кратний приріст пропускної здатності декодування порівняно з попередніми dense flagship models.
Прогалини у знаннях HLE: Попри високі бали в науці та математиці, модель має лише 28.7% на Humanity's Last Exam (HLE), що вказує на прогалину в абсолютній експертній фактичності.
State-of-the-art reasoning: Досягає 91.3% на AIME та 88.4% на GPQA, конкуруючи з топовими closed-source моделями у науці та математиці рівня PhD.
Надмірна впевненість у tool use: У сценаріях з автономними агентами модель іноді галюцинує результати роботи інструментів або ігнорує їх на користь внутрішніх передбачень.
Відкриті ваги Apache 2.0: Пропонує інтелект рівня frontier model зі свободою відкритих ваг, що дозволяє розгортання в локальній інфраструктурі.
Продуктивність термінальних завдань: Має 52.5% на Terminal-Bench 2.0, відстаючи від конкурентів у складних завданнях взаємодії з командним рядком.

Швидкий старт API

alibaba/qwen3.5-plus

Переглянути документацію
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Qwen3.5-397B-A17B

Подивіться, що думає спільнота про Qwen3.5-397B-A17B

Qwen3.5-397B, це, по суті, модель класу GPT-5, але з відкритими вагами. Архітектура DeltaNet ідеально вирішує проблеми latency в MoE.
u/DeepLearningLover
reddit
Нативний мультимодальний reasoning у Qwen3.5 виглядає неймовірно. 1M контексту + аналіз відео змінять робочі процеси агентів.
@AiDevDaily
twitter
Рішення використовувати FP8 для тренування end-to-end, зберігаючи BF16 у чутливих шарах, це майстер-клас з оптимізації стабільності.
cold_fusion
hackernews
Це перший раз, коли я бачу open-source модель, яка справді перевершує Gemini 1.5 Pro у складних мультимодальних agentic-завданнях.
AI Revolution
youtube
19-кратне покращення пропускної здатності декодування порівняно з Qwen3-Max робить її життєздатною альтернативою для агентів продакшн-рівня.
u/ModelTester2026
reddit
Я був здивований, наскільки добре вона справляється з 4-бітовим квантуванням. Вона зберігає майже всі можливості reasoning на установці з двома A100.
@GlobalTechReview
twitter

Відео про Qwen3.5-397B-A17B

Дивіться навчальні матеріали, огляди та обговорення про Qwen3.5-397B-A17B

Модель на 397 мільярдів параметрів, але з 17 мільярдами активних параметрів.

При декодуванні на 256K ця модель у 19 разів швидша за Qwen 3 Max.

Нативний візуально-мовний reasoning, це те, що вирізняє її для agentic-процесів.

Це перевершує більшість closed-source моделей на стандартних математичних бенчмарках.

Запускати це локально важко, але квантовані версії цілком працюють на потужних Mac.

Модель на 397 мільярдів параметрів із 17 мільярдами активних. Вона нативно мультимодальна.

Ймовірно, на сьогодні це найкраща open-source мультимодальна модель.

Можливість нативно обробляти дві години відео, це величезна перевага.

Подивіться на ці бали логіки, вона стабільно досягає рівня GPT-4o.

Ліцензія Apache робить її дуже привабливою для корпоративної безпеки даних.

OCR структуроване вилучення. У вас є брудний PDF... і вам потрібно перетворити це на чистий JSON. Ця модель тут блищить.

Ви отримуєте інтелект гіганта на 400 мільярдів параметрів... але платите обчислювальну ціну моделі на 17 мільярдів.

Вона працює з довгим контекстом краще, ніж попередня версія.

Інтеграція використання інструментів вбудована в базове навчання, а не додана пізніше.

Thinking mode дозволяє їй виправляти власну логіку перед виведенням відповіді.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Qwen3.5-397B-A17B

Експертні поради, які допоможуть вам отримати максимум від Qwen3.5-397B-A17B та досягти кращих результатів.

Увімкнення Thinking Mode

Використовуйте параметр 'enable_thinking: true' у вашому виклику API, щоб активувати глибокий reasoning для математики, програмування та складних логічних задач.

Використання Fast Mode

Застосовуйте режим 'Fast' для простих запитів, щоб отримувати миттєві відповіді, не витрачаючи tokens на зайві внутрішні етапи міркування.

Оптимізація підказок для відео

Під час аналізу відео просіть модель зосередитися на фінальному динамічному результаті, а не на аналізі кадрів, для кращої часової узгодженості.

Використання квантування

Використовуйте 4-бітове або 8-бітове квантування (GGUF/EXL2) для запуску моделі на споживчому залізі, якщо у вас є достатньо VRAM (200 ГБ+).

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Часті запитання про Qwen3.5-397B-A17B

Знайдіть відповіді на поширені запитання про Qwen3.5-397B-A17B