Является ли Qwen3.5-397B-A17B open-source?

Да, модель выпущена как open-weight модель под лицензией Apache 2.0, что разрешает её коммерческое использование и приватный хостинг.

Что означает «17B активных параметров»?

В ней используется архитектура Mixture-of-Experts, где для обработки одного токена задействуется только 17 миллиардов параметров из 397 миллиардов, что существенно снижает требования к вычислительным ресурсам.

Сколько стоит API Qwen3.5-Plus?

Стоимость составляет $0.40 за 1 миллион входных tokens и $2.40 за 1 миллион выходных tokens, что делает эту модель одним из самых экономически эффективных frontier models на рынке.

Может ли она обрабатывать видеофайлы?

Да, модель поддерживает контекст до 1 миллиона tokens, что эквивалентно примерно 120 минутам видео.

Поддерживает ли она function calling?

Да, модель обладает расширенной поддержкой tool use, включая поиск в интернете, интерпретацию кода и вызов пользовательских функций.

Каковы аппаратные требования?

Из-за общего объема в 397B параметров, запуск модели с точностью 16-бит требует более 800 ГБ VRAM, что обычно подразумевает использование серверной стойки с несколькими GPU.

Как она справляется с задачами, требующими reasoning?

Qwen3.5 использует асинхронный RL-фреймворк для поддержки chain-of-thought, который можно включить через параметры API, такие как 'enable_thinking'.

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B — это флагманская open-weight MoE-модель от Alibaba. Она поддерживает нативный мультимодальный reasoning, контекст 1M и 19-кратный throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning

alibabaQwen3.516 февраля 2026 г.

Контекст

1.0Mтокенов

Макс. вывод

8Kтокенов

Цена ввода

$0.60/ 1M

Цена вывода

$3.60/ 1M

Модальность:TextImageVideo

Возможности:ЗрениеИнструментыПотоковая передачаРассуждение

Бенчмарки

GPQA

88.4%

HLE

28.7%

MMLU

88.6%

MMLU Pro

87.8%

SimpleQA

48%

IFEval

92.6%

AIME 2025

91.3%

MATH

74.1%

GSM8k

93.7%

MGSM

92.1%

MathVista

90.3%

SWE-Bench

76.4%

HumanEval

79.3%

LiveCodeBench

83.6%

MMMU

85%

MMMU Pro

79%

ChartQA

86.5%

DocVQA

93.2%

Terminal-Bench

52.5%

ARC-AGI

12%

Документация API

О модели Qwen3.5-397B-A17B

Узнайте о возможностях, функциях и способах использования Qwen3.5-397B-A17B.

Высокоэффективная смесь экспертов (Mixture of Experts)

Qwen3.5-397B-A17B, это флагманская нативно мультимодальная модель, использующая инновационную гибридную архитектуру, объединяющую линейное внимание через Gated Delta Networks с разреженной Mixture-of-Experts (MoE). Несмотря на общий объем в 397 миллиардов параметров, ее разреженная конструкция активирует лишь 17 миллиардов параметров на один проход, обеспечивая исключительную эффективность и скорость инференса без ущерба для глубоких способностей к reasoning. Модель оптимизирована как для языковых, так и для визуальных задач, поддерживая словарь в 250 тысяч tokens и более 201 языка и диалекта.

Нативные мультимодальные агентные процессы

Модель превосходно работает как нативный мультимодальный агент, способный обрабатывать до одного миллиона tokens контекста, что эквивалентно примерно двум часам видео. В ней представлен специализированный режим размышления (Thinking Mode) для сложного логического вывода. Модель нативно подготовлена для агентных рабочих процессов: веб-разработки, навигации по GUI и пространственного интеллекта в реальном мире. Ее архитектура поддерживает обучение FP8 «от начала до конца» (end-to-end) и дезагрегированный фреймворк для обучения и инференса, что делает ее одной из самых масштабируемых и эффективных моделей для корпоративных AI-решений.

Открытые веса для глобальной доступности

Выпущенная под лицензией Apache 2.0, эта модель предоставляет open-source сообществу возможности уровня frontier model, ранее доступные только в проприетарных системах. Она преодолевает разрыв между огромным количеством параметров и практическим применением, позволяя организациям запускать сложные задачи, требующие глубокого reasoning, на собственной инфраструктуре с значительно меньшими вычислительными затратами, чем у плотных 400B-аналогов.

Варианты использования Qwen3.5-397B-A17B

Откройте для себя различные способы использования Qwen3.5-397B-A17B для достижения отличных результатов.

Анализ длинных видео

Анализируйте до двух часов видеоконтента для извлечения логики, обратной разработки кода из видеоряда или генерации структурированных резюме.

Научные исследования уровня PhD

Решайте научные задачи уровня аспирантуры и олимпиадные математические задачи, используя режим адаптивного глубокого размышления.

Автономные GUI-агенты

Автоматизируйте взаимодействие со смартфонами и компьютерами для выполнения рабочих процессов и кросс-платформенной навигации.

Визуальная разработка ПО

Практикуйте 'vibe coding', превращая инструкции на естественном языке и наброски UI в функциональный фронтенд-код.

Интеллектуальная обработка документов

Обрабатывайте сложные документы, графики и рукописные заметки для извлечения структурированных данных и восстановления структуры макетов.

Spatial AI приложения

Понимайте взаимосвязи на уровне пикселей для embodied AI задач, таких как анализ сцен автономного вождения и навигация роботов.

Преимущества

Ограничения

Превосходная поддержка видео: Поддерживает контекст в 1 миллион tokens, обеспечивая нативную обработку до 120 минут видео для агентных и кодинговых задач.

Высокий порог вхождения по железу: Полное развертывание требует серверных GPU-стоек с более чем 800 ГБ VRAM для несжатой точности 16-бит.

Эффективность инференса MoE: Архитектура с 397B общих/17B активных параметров обеспечивает 19-кратный прирост throughput при декодировании по сравнению с предыдущими плотными флагманскими моделями.

Пробелы в знаниях HLE: Несмотря на высокие баллы в науке и математике, модель набирает 28.7% в Humanity's Last Exam (HLE), что указывает на пробелы в абсолютной экспертной фактологии.

Reasoning state-of-the-art уровня: Достигает 91.3% в бенчмарке AIME и 88.4% в GPQA, конкурируя с ведущими closed-source моделями в научных и математических дисциплинах.

Самоуверенность при использовании инструментов: В сценариях с автономными агентами модель иногда галлюцинирует ответы инструментов или игнорирует результаты в пользу внутренних предсказаний.

Открытые веса Apache 2.0: Предоставляет интеллект уровня frontier model с гибкостью open-weights, позволяя развертывание в закрытых локальных контурах.

Производительность в терминальных задачах: Набирает 52.5% в Terminal-Bench 2.0, отставая от конкурентов в сложных задачах взаимодействия с командной строкой.

Быстрый старт API

alibaba/qwen3.5-plus

Посмотреть документацию

alibaba SDK

import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Qwen3.5-397B-A17B

Посмотрите, что думает сообщество о Qwen3.5-397B-A17B

“Qwen3.5-397B, это по сути модель класса GPT-5, но с открытыми весами. Архитектура DeltaNet идеально решает проблемы latency в MoE.”

— u/DeepLearningLover

“Нативный мультимодальный reasoning в Qwen3.5 выглядит невероятно. 1M контекста + анализ видео изменят работу агентов.”

— @AiDevDaily

twitter

“Решение использовать обучение FP8 от начала до конца при сохранении BF16 в чувствительных слоях, это мастер-класс по оптимизации стабильности.”

— cold_fusion

hackernews

“Впервые я вижу, чтобы открытая модель реально обходила Gemini 1.5 Pro в сложных мультимодальных агентных задачах.”

— AI Revolution

youtube

“19-кратное увеличение throughput декодирования по сравнению с Qwen3-Max делает её жизнеспособной альтернативой для продакшн-агентов.”

— u/ModelTester2026

“Я был удивлен тем, как хорошо она справляется с 4-битным квантованием. Она сохраняет почти все возможности reasoning на системе с двумя A100.”

— @GlobalTechReview

twitter

Видео о Qwen3.5-397B-A17B

Смотрите обучающие материалы, обзоры и обсуждения о Qwen3.5-397B-A17B

“Модель на 397 миллиардов параметров, но с 17 миллиардами активных параметров.”

“При декодировании на 256K эта модель в 19 раз быстрее, чем Qwen 3 Max.”

“Нативный визуально-языковой reasoning, это то, что выделяет её для агентных рабочих процессов.”

“Она обходит большинство закрытых моделей в стандартных математических бенчмарках.”

“Локальный запуск сложен, но квантованные версии отлично работают на топовых Mac.”

“Модель на 397 миллиардов параметров с 17 миллиардами активных параметров. Она нативно мультимодальна.”

“Вероятно, сейчас это лучшая open-source мультимодальная модель.”

“Способность нативно обрабатывать два часа видео, это огромное преимущество.”

“Посмотрите на эти показатели логики, она стабильно достигает уровня GPT-4o.”

“Лицензия Apache делает её очень привлекательной для корпоративной конфиденциальности данных.”

“Структурированное извлечение через OCR. У вас есть нечитаемый PDF... и вам нужно превратить его в чистый JSON. В этом модель превосходна.”

“Вы получаете интеллект гиганта на 400 миллиардов параметров... но платите за вычисления как за модель на 17 миллиардов параметров.”

“Она работает с поиском в длинном контексте лучше, чем предыдущая версия.”

“Интеграция tool use встроена в базовое обучение, а не добавлена для галочки.”

“Режим размышления позволяет ей корректировать собственную логику перед выдачей ответа.”

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты

Веб Автоматизация

Умные Процессы

Начать Бесплатно

Советы для Qwen3.5-397B-A17B

Экспертные советы для максимальной эффективности Qwen3.5-397B-A17B.

Включение режима размышления (Thinking Mode)

Передайте параметр 'enable_thinking: true' в вашем вызове API, чтобы активировать глубокий reasoning для математики, программирования и сложных логических задач.

Использование режима Fast

Используйте режим 'Fast' для простых запросов, чтобы получать мгновенные ответы без расходования tokens на избыточные внутренние фазы размышления.

Оптимизация prompt для видео

При анализе видео просите модель сфокусироваться на конечном динамическом результате, а не на анализе по кадрам, это обеспечит лучшую временную согласованность.

Использование квантования

Используйте 4-битное или 8-битное квантование (GGUF/EXL2) для запуска модели на потребительском оборудовании, если у вас достаточно VRAM (200 ГБ+).

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.