alibaba

Qwen3.5-397B-A17B

Qwen3.5-397B-A17B — это флагманская open-weight MoE-модель от Alibaba. Она поддерживает нативный мультимодальный reasoning, контекст 1M и 19-кратный throughput...

MultimodalMoEOpen-WeightsAgentic AIReasoning
alibaba logoalibabaQwen3.516 февраля 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
8Kтокенов
Цена ввода
$0.60/ 1M
Цена вывода
$3.60/ 1M
Модальность:TextImageVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
88.4%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Qwen3.5-397B-A17B набрал 88.4% в этом бенчмарке.
HLE
28.7%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Qwen3.5-397B-A17B набрал 28.7% в этом бенчмарке.
MMLU
88.6%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Qwen3.5-397B-A17B набрал 88.6% в этом бенчмарке.
MMLU Pro
87.8%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Qwen3.5-397B-A17B набрал 87.8% в этом бенчмарке.
SimpleQA
48%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Qwen3.5-397B-A17B набрал 48% в этом бенчмарке.
IFEval
92.6%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Qwen3.5-397B-A17B набрал 92.6% в этом бенчмарке.
AIME 2025
91.3%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Qwen3.5-397B-A17B набрал 91.3% в этом бенчмарке.
MATH
74.1%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Qwen3.5-397B-A17B набрал 74.1% в этом бенчмарке.
GSM8k
93.7%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Qwen3.5-397B-A17B набрал 93.7% в этом бенчмарке.
MGSM
92.1%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Qwen3.5-397B-A17B набрал 92.1% в этом бенчмарке.
MathVista
90.3%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Qwen3.5-397B-A17B набрал 90.3% в этом бенчмарке.
SWE-Bench
76.4%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Qwen3.5-397B-A17B набрал 76.4% в этом бенчмарке.
HumanEval
79.3%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Qwen3.5-397B-A17B набрал 79.3% в этом бенчмарке.
LiveCodeBench
83.6%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Qwen3.5-397B-A17B набрал 83.6% в этом бенчмарке.
MMMU
85%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Qwen3.5-397B-A17B набрал 85% в этом бенчмарке.
MMMU Pro
79%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Qwen3.5-397B-A17B набрал 79% в этом бенчмарке.
ChartQA
86.5%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Qwen3.5-397B-A17B набрал 86.5% в этом бенчмарке.
DocVQA
93.2%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Qwen3.5-397B-A17B набрал 93.2% в этом бенчмарке.
Terminal-Bench
52.5%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Qwen3.5-397B-A17B набрал 52.5% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Qwen3.5-397B-A17B набрал 12% в этом бенчмарке.

О модели Qwen3.5-397B-A17B

Узнайте о возможностях, функциях и способах использования Qwen3.5-397B-A17B.

Высокоэффективная смесь экспертов (Mixture of Experts)

Qwen3.5-397B-A17B, это флагманская нативно мультимодальная модель, использующая инновационную гибридную архитектуру, объединяющую линейное внимание через Gated Delta Networks с разреженной Mixture-of-Experts (MoE). Несмотря на общий объем в 397 миллиардов параметров, ее разреженная конструкция активирует лишь 17 миллиардов параметров на один проход, обеспечивая исключительную эффективность и скорость инференса без ущерба для глубоких способностей к reasoning. Модель оптимизирована как для языковых, так и для визуальных задач, поддерживая словарь в 250 тысяч tokens и более 201 языка и диалекта.

Нативные мультимодальные агентные процессы

Модель превосходно работает как нативный мультимодальный агент, способный обрабатывать до одного миллиона tokens контекста, что эквивалентно примерно двум часам видео. В ней представлен специализированный режим размышления (Thinking Mode) для сложного логического вывода. Модель нативно подготовлена для агентных рабочих процессов: веб-разработки, навигации по GUI и пространственного интеллекта в реальном мире. Ее архитектура поддерживает обучение FP8 «от начала до конца» (end-to-end) и дезагрегированный фреймворк для обучения и инференса, что делает ее одной из самых масштабируемых и эффективных моделей для корпоративных AI-решений.

Открытые веса для глобальной доступности

Выпущенная под лицензией Apache 2.0, эта модель предоставляет open-source сообществу возможности уровня frontier model, ранее доступные только в проприетарных системах. Она преодолевает разрыв между огромным количеством параметров и практическим применением, позволяя организациям запускать сложные задачи, требующие глубокого reasoning, на собственной инфраструктуре с значительно меньшими вычислительными затратами, чем у плотных 400B-аналогов.

Qwen3.5-397B-A17B

Варианты использования Qwen3.5-397B-A17B

Откройте для себя различные способы использования Qwen3.5-397B-A17B для достижения отличных результатов.

Анализ длинных видео

Анализируйте до двух часов видеоконтента для извлечения логики, обратной разработки кода из видеоряда или генерации структурированных резюме.

Научные исследования уровня PhD

Решайте научные задачи уровня аспирантуры и олимпиадные математические задачи, используя режим адаптивного глубокого размышления.

Автономные GUI-агенты

Автоматизируйте взаимодействие со смартфонами и компьютерами для выполнения рабочих процессов и кросс-платформенной навигации.

Визуальная разработка ПО

Практикуйте 'vibe coding', превращая инструкции на естественном языке и наброски UI в функциональный фронтенд-код.

Интеллектуальная обработка документов

Обрабатывайте сложные документы, графики и рукописные заметки для извлечения структурированных данных и восстановления структуры макетов.

Spatial AI приложения

Понимайте взаимосвязи на уровне пикселей для embodied AI задач, таких как анализ сцен автономного вождения и навигация роботов.

Преимущества

Ограничения

Превосходная поддержка видео: Поддерживает контекст в 1 миллион tokens, обеспечивая нативную обработку до 120 минут видео для агентных и кодинговых задач.
Высокий порог вхождения по железу: Полное развертывание требует серверных GPU-стоек с более чем 800 ГБ VRAM для несжатой точности 16-бит.
Эффективность инференса MoE: Архитектура с 397B общих/17B активных параметров обеспечивает 19-кратный прирост throughput при декодировании по сравнению с предыдущими плотными флагманскими моделями.
Пробелы в знаниях HLE: Несмотря на высокие баллы в науке и математике, модель набирает 28.7% в Humanity's Last Exam (HLE), что указывает на пробелы в абсолютной экспертной фактологии.
Reasoning state-of-the-art уровня: Достигает 91.3% в бенчмарке AIME и 88.4% в GPQA, конкурируя с ведущими closed-source моделями в научных и математических дисциплинах.
Самоуверенность при использовании инструментов: В сценариях с автономными агентами модель иногда галлюцинирует ответы инструментов или игнорирует результаты в пользу внутренних предсказаний.
Открытые веса Apache 2.0: Предоставляет интеллект уровня frontier model с гибкостью open-weights, позволяя развертывание в закрытых локальных контурах.
Производительность в терминальных задачах: Набирает 52.5% в Terminal-Bench 2.0, отставая от конкурентов в сложных задачах взаимодействия с командной строкой.

Быстрый старт API

alibaba/qwen3.5-plus

Посмотреть документацию
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.5-plus',
    messages: [{ role: 'user', content: 'Analyze the logic of this MoE architecture.' }],
    extra_body: { enable_thinking: true },
  });
  console.log(completion.choices[0].message.content);
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Qwen3.5-397B-A17B

Посмотрите, что думает сообщество о Qwen3.5-397B-A17B

Qwen3.5-397B, это по сути модель класса GPT-5, но с открытыми весами. Архитектура DeltaNet идеально решает проблемы latency в MoE.
u/DeepLearningLover
reddit
Нативный мультимодальный reasoning в Qwen3.5 выглядит невероятно. 1M контекста + анализ видео изменят работу агентов.
@AiDevDaily
twitter
Решение использовать обучение FP8 от начала до конца при сохранении BF16 в чувствительных слоях, это мастер-класс по оптимизации стабильности.
cold_fusion
hackernews
Впервые я вижу, чтобы открытая модель реально обходила Gemini 1.5 Pro в сложных мультимодальных агентных задачах.
AI Revolution
youtube
19-кратное увеличение throughput декодирования по сравнению с Qwen3-Max делает её жизнеспособной альтернативой для продакшн-агентов.
u/ModelTester2026
reddit
Я был удивлен тем, как хорошо она справляется с 4-битным квантованием. Она сохраняет почти все возможности reasoning на системе с двумя A100.
@GlobalTechReview
twitter

Видео о Qwen3.5-397B-A17B

Смотрите обучающие материалы, обзоры и обсуждения о Qwen3.5-397B-A17B

Модель на 397 миллиардов параметров, но с 17 миллиардами активных параметров.

При декодировании на 256K эта модель в 19 раз быстрее, чем Qwen 3 Max.

Нативный визуально-языковой reasoning, это то, что выделяет её для агентных рабочих процессов.

Она обходит большинство закрытых моделей в стандартных математических бенчмарках.

Локальный запуск сложен, но квантованные версии отлично работают на топовых Mac.

Модель на 397 миллиардов параметров с 17 миллиардами активных параметров. Она нативно мультимодальна.

Вероятно, сейчас это лучшая open-source мультимодальная модель.

Способность нативно обрабатывать два часа видео, это огромное преимущество.

Посмотрите на эти показатели логики, она стабильно достигает уровня GPT-4o.

Лицензия Apache делает её очень привлекательной для корпоративной конфиденциальности данных.

Структурированное извлечение через OCR. У вас есть нечитаемый PDF... и вам нужно превратить его в чистый JSON. В этом модель превосходна.

Вы получаете интеллект гиганта на 400 миллиардов параметров... но платите за вычисления как за модель на 17 миллиардов параметров.

Она работает с поиском в длинном контексте лучше, чем предыдущая версия.

Интеграция tool use встроена в базовое обучение, а не добавлена для галочки.

Режим размышления позволяет ей корректировать собственную логику перед выдачей ответа.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Qwen3.5-397B-A17B

Экспертные советы для максимальной эффективности Qwen3.5-397B-A17B.

Включение режима размышления (Thinking Mode)

Передайте параметр 'enable_thinking: true' в вашем вызове API, чтобы активировать глубокий reasoning для математики, программирования и сложных логических задач.

Использование режима Fast

Используйте режим 'Fast' для простых запросов, чтобы получать мгновенные ответы без расходования tokens на избыточные внутренние фазы размышления.

Оптимизация prompt для видео

При анализе видео просите модель сфокусироваться на конечном динамическом результате, а не на анализе по кадрам, это обеспечит лучшую временную согласованность.

Использование квантования

Используйте 4-битное или 8-битное квантование (GGUF/EXL2) для запуска модели на потребительском оборудовании, если у вас достаточно VRAM (200 ГБ+).

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M

Часто задаваемые вопросы о Qwen3.5-397B-A17B

Найдите ответы на частые вопросы о Qwen3.5-397B-A17B