alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B — флагманская open-weight MoE модель от Alibaba. Нативный multimodal reasoning, context window 1M и 19-кратный прирост decoding throughput.

МультимодальныеMoEOpen-WeightsАгентский AIReasoning
alibaba logoalibabaQwen2026-02-16
Контекст
1.0Mтокенов
Макс. вывод
8Kтокенов
Цена ввода
$0.60/ 1M
Цена вывода
$3.60/ 1M
Модальность:TextImageVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
88.4%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Qwen3.5-397B-A17B набрал 88.4% в этом бенчмарке.
HLE
28.7%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Qwen3.5-397B-A17B набрал 28.7% в этом бенчмарке.
MMLU
88.6%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Qwen3.5-397B-A17B набрал 88.6% в этом бенчмарке.
MMLU Pro
87.8%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Qwen3.5-397B-A17B набрал 87.8% в этом бенчмарке.
SimpleQA
48%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Qwen3.5-397B-A17B набрал 48% в этом бенчмарке.
IFEval
92.6%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Qwen3.5-397B-A17B набрал 92.6% в этом бенчмарке.
AIME 2025
91.3%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Qwen3.5-397B-A17B набрал 91.3% в этом бенчмарке.
MATH
74.1%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Qwen3.5-397B-A17B набрал 74.1% в этом бенчмарке.
GSM8k
93.7%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Qwen3.5-397B-A17B набрал 93.7% в этом бенчмарке.
MGSM
92.1%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Qwen3.5-397B-A17B набрал 92.1% в этом бенчмарке.
MathVista
90.3%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Qwen3.5-397B-A17B набрал 90.3% в этом бенчмарке.
SWE-Bench
76.4%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Qwen3.5-397B-A17B набрал 76.4% в этом бенчмарке.
HumanEval
79.3%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Qwen3.5-397B-A17B набрал 79.3% в этом бенчмарке.
LiveCodeBench
83.6%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Qwen3.5-397B-A17B набрал 83.6% в этом бенчмарке.
MMMU
85%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Qwen3.5-397B-A17B набрал 85% в этом бенчмарке.
MMMU Pro
79%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Qwen3.5-397B-A17B набрал 79% в этом бенчмарке.
ChartQA
86.5%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Qwen3.5-397B-A17B набрал 86.5% в этом бенчмарке.
DocVQA
93.2%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Qwen3.5-397B-A17B набрал 93.2% в этом бенчмарке.
Terminal-Bench
52.5%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Qwen3.5-397B-A17B набрал 52.5% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Qwen3.5-397B-A17B набрал 12% в этом бенчмарке.

О модели Qwen3.5-397B-A17B

Узнайте о возможностях, функциях и способах использования Qwen3.5-397B-A17B.

Монументальный скачок в Open AI

Qwen3.5-397B-A17B представляет собой монументальный скачок в стратегии Alibaba Cloud в области AI, превращаясь из сильного open-source претендента в доминирующую систему уровня frontier model, созданную для эпохи agentic AI. Выпущенная 16 февраля 2026 года, она является флагманом серии Qwen3.5, используя массивную архитектуру Mixture-of-Experts (MoE) с 397 миллиардами параметров. Активируя всего 17 миллиардов parameters на каждый token, она достигает беспрецедентного 19-кратного ускорения decoding throughput по сравнению со своим предшественником Qwen3-Max, сокращая разрыв с самыми продвинутыми проприетарными моделями в мире.

Единая мультимодальная платформа

Модель является унифицированным, нативным мультимодальным решением. В отличие от предыдущих версий, требовавших отдельных vision-language адаптеров, Qwen3.5 обладает early-fusion multimodality, обученной на триллионах мультимодальных tokens. Это позволяет ей анализировать более двух часов видеоконтента, работать в качестве GUI-агента в десктопных и мобильных интерфейсах и решать сложные задачи кодинга в специализированном режиме Thinking mode. С расширенным словарем в 250 000 tokens и поддержкой 201 языка, она становится лучшим глобальным выбором для мультиязычной и мультимодальной автоматизации.

Архитектура для эпохи агентов

Помимо простого чата, Qwen3.5-397B оптимизирована для использования инструментов и автономных рабочих процессов. Высокие баллы в benchmarks на function-calling и следовании инструкциям делают ее идеальной основой для визуальной программной инженерии и исследований уровня PhD. Предлагая производительность уровня state-of-the-art под лицензией Apache 2.0, Alibaba предоставила сообществу надежную и высокоэффективную альтернативу самым закрытым closed-source моделям.

Qwen3.5-397B-A17B

Варианты использования Qwen3.5-397B-A17B

Откройте для себя различные способы использования Qwen3.5-397B-A17B для достижения отличных результатов.

Автономные GUI-агенты

Навигация в сложных интерфейсах ПК и смартфонов для автоматизации многоэтапных рабочих процессов.

Анализ длинных видео

Извлечение глубоких причинно-следственных связей и резюмирование видеофайлов длительностью до 120 минут.

Быстрое прототипирование («Vibe Coding»)

Прямой перевод набросков интерфейса в готовую к работе логику React и фронтенда за один проход.

Исследования уровня PhD

Решение задач STEM уровня магистратуры и выше с использованием специализированного внутреннего режима chain-of-thought (Thinking mode).

Глобальная мультиязычная поддержка

Работа с пользователями на 201 языке с высокой эффективностью токенизации для неанглийских шрифтов.

Визуальная программная инженерия

Преобразование вайрфреймов и скриншотов в чистый, адаптивный код на HTML, CSS и JavaScript.

Преимущества

Ограничения

Эффективность inference: Достигает 19-кратного прироста throughput декодирования за счет активации всего 17B parameters благодаря гибридной архитектуре MoE.
Огромные требования к железу: При 397B общих parameters запуск неквантованных версий локально требует серверной инфраструктуры высокого класса.
Нативный видео-reasoning: Обрабатывает до 120 минут непрерывного видео нативно, без необходимости использования адаптеров для извлечения кадров.
Отсутствие аудио-модальности: Нет нативной поддержки ввода и вывода аудио, которая есть в «omni» моделях вроде GPT-4o или Gemini.
Высочайшие возможности в STEM: Конкурирует с проприетарными reasoning моделями, набирая 88,4% в GPQA и 91,3% на математических экзаменах AIME 2025.
Отставание в тесте HLE: Уступает проприетарным лидерам в тесте Humanity's Last Exam (28,7%), что указывает на пробелы в узкоспециализированных экспертных знаниях.
Доступность open-weights: Предоставляет multimodal интеллект уровня frontier model под лицензией Apache 2.0 для приватного развертывания на предприятиях.
Объем занимаемой памяти: Масштаб модели требует значительного объема RAM (VRAM) даже при использовании разреженности, что ограничивает массовое использование на потребительском уровне.

Быстрый старт API

alibaba/qwen-3.5-plus

Посмотреть документацию
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3.5-397b-instruct',
    messages: [{ role: 'user', content: 'Проанализируй контекст этого 2-часового видео.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Qwen3.5-397B-A17B

Посмотрите, что думает сообщество о Qwen3.5-397B-A17B

Qwen3.5-397B — это, по сути, ответ open-source сообщества на GPT-4o. Сами по себе возможности генерации SVG просто безумны для веб-дизайна.
u/LLM_Reviewer
reddit
19-кратный прирост throughput делает Qwen3.5 значительно более отзывчивой, чем любая другая модель такого размера, которую я тестировал.
tech_enthusiast_99
reddit
Apache 2.0 для модели такого масштаба — это полный переворот в правилах игры для локальной разработки AI и предприятий, ориентированных на приватность.
TechInnovator88
twitter
Маршрутизация MoE в модели 3.5-397B заметно умнее, чем в предыдущем поколении 2.5; она действительно следует логике.
DistanceSolar1449
reddit
Контекст в 1M на open-weight модели такого калибра — это беспрецедентный случай в текущей экосистеме.
dev_logic
hackernews
Reasoning в видео — это не просто покадровый анализ; это реальное понимание временных связей, которое кажется на голову выше текущих vision LLM.
Matthew Berman (Context)
youtube

Видео о Qwen3.5-397B-A17B

Смотрите обучающие материалы, обзоры и обсуждения о Qwen3.5-397B-A17B

Она обходит Claude Opus 4.5 в работе с браузером, а также Gemini 3 Pro в ряде мультимодальных задач.

Сообщается, что она в 19 раз быстрее Qwen 3 Max, при этом поддерживает 201 язык и диалект.

Модель отлично справилась с фотореалистичной бабочкой... лучше большинства open-source моделей.

Модель 397B — это, по сути, первая open-weights модель, которая реально конкурирует на уровне frontier model в области AGI.

Масштабирование с помощью MoE явно работает для Alibaba, и их последние результаты в benchmark это доказывают.

Эта модель соответствует уровню Qwen Max... но делает это с ускорением throughput до 19 раз.

Токенизатор расширил словарь до 250K... сравнявшись с Gemini и токенизатором Google.

Команду Qwen стоит воспринимать как Frontier Lab... они берутся за задачи, на которых фокусируются закрытые лаборатории.

Токенизация гораздо эффективнее для нелатинских шрифтов по сравнению с ранними версиями Llama.

Режим Thinking заметно увеличивает latency, но прирост точности того стоит для задач по кодингу и reasoning.

Это унифицированная vision language модель... если раньше были отдельные VL-варианты, то здесь всё в одной модели.

Понимание видео позволяет ей улавливать временные детали, которые пропускают методы с извлечением кадров.

В плане написания кода она кажется такой же отзывчивой, как GPT-4o, но с лучшим следованием инструкциям.

Возможности GUI-агента для десктопа — это выдающаяся функция для реальной автоматизации.

Она обрабатывает 120 минут видео без потери контекста, что просто колоссально для анализа.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Qwen3.5-397B-A17B

Экспертные советы для максимальной эффективности Qwen3.5-397B-A17B.

Переключение режима Thinking

Используйте параметр enable_thinking для задач с высокой логической нагрузкой, чтобы активировать глубокие цепочки внутреннего reasoning.

Использование нативного поиска

Включите параметр search, чтобы проверять факты по веб-данным в реальном времени и исполнять код на Python.

Оптимизация видео-prompts

Указывайте конкретные временные метки, чтобы сфокусировать context window в 1M tokens на самых важных сегментах.

Выбор региональной точки доступа

Используйте эндпоинт dashscope-intl для пользователей за пределами материкового Китая, чтобы снизить network latency.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Часто задаваемые вопросы о Qwen3.5-397B-A17B

Найдите ответы на частые вопросы о Qwen3.5-397B-A17B