alibaba

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview — это флагманская MoE модель от Alibaba с контекстом 1M, нативным Thinking Mode и SOTA результатами в agentic coding и reasoning.

MoEAgentic Coding1M ContextFrontier ModelAlibaba Qwen
alibaba logoalibabaQwen 3.620 апреля 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
8Kтокенов
Цена ввода
$1.25/ 1M
Цена вывода
$10.00/ 1M
Модальность:TextImageVideo
Возможности:ЗрениеИнструментыПотоковая передачаРассуждение
Бенчмарки
GPQA
86%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Qwen3.6-Max-Preview набрал 86% в этом бенчмарке.
HLE
51%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Qwen3.6-Max-Preview набрал 51% в этом бенчмарке.
MMLU
83%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Qwen3.6-Max-Preview набрал 83% в этом бенчмарке.
MMLU Pro
79%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Qwen3.6-Max-Preview набрал 79% в этом бенчмарке.
SimpleQA
52%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Qwen3.6-Max-Preview набрал 52% в этом бенчмарке.
IFEval
75%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Qwen3.6-Max-Preview набрал 75% в этом бенчмарке.
AIME 2025
93%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Qwen3.6-Max-Preview набрал 93% в этом бенчмарке.
MATH
95%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Qwen3.6-Max-Preview набрал 95% в этом бенчмарке.
GSM8k
98%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Qwen3.6-Max-Preview набрал 98% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Qwen3.6-Max-Preview набрал 92% в этом бенчмарке.
MathVista
86%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Qwen3.6-Max-Preview набрал 86% в этом бенчмарке.
SWE-Bench
73%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Qwen3.6-Max-Preview набрал 73% в этом бенчмарке.
HumanEval
91%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Qwen3.6-Max-Preview набрал 91% в этом бенчмарке.
LiveCodeBench
79%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Qwen3.6-Max-Preview набрал 79% в этом бенчмарке.
MMMU
82%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Qwen3.6-Max-Preview набрал 82% в этом бенчмарке.
MMMU Pro
75%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Qwen3.6-Max-Preview набрал 75% в этом бенчмарке.
ChartQA
85%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Qwen3.6-Max-Preview набрал 85% в этом бенчмарке.
DocVQA
89%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Qwen3.6-Max-Preview набрал 89% в этом бенчмарке.
Terminal-Bench
65%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Qwen3.6-Max-Preview набрал 65% в этом бенчмарке.
ARC-AGI
14%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Qwen3.6-Max-Preview набрал 14% в этом бенчмарке.

О модели Qwen3.6-Max-Preview

Узнайте о возможностях, функциях и способах использования Qwen3.6-Max-Preview.

Qwen3.6-Max-Preview, это флагманская проприетарная LLM от Alibaba, представляющая следующий шаг в их серии высокопроизводительного ИИ. Используя архитектуру Mixture-of-Experts (MoE), модель достигает глубины рассуждений системы с триллионами параметров, сохраняя при этом высокую операционную эффективность. Она специально оптимизирована для agentic coding, знаний о мире и сложного выполнения инструкций.

Отличительной чертой модели является нативный Thinking Mode, который позволяет системе генерировать видимую цепочку внутренних рассуждений (chain-of-thought) перед выдачей окончательного ответа. Эта прозрачность особенно ценна для разработчиков, создающих автономных агентов, так как она открывает окно в логическое планирование и этапы исправления ошибок. В сочетании с массивным контекстным окном в 1 миллион tokens, модель может обрабатывать целые репозитории проектов или обширные библиотеки документации за один проход.

Размещенная в Alibaba Cloud Model Studio, Qwen3.6-Max-Preview поддерживает отраслевые стандарты и совместима со спецификациями API в стиле OpenAI. Она спроектирована как основной выбор для предприятий, требующих возможностей frontier уровня для анализа multimodal данных и надежных рабочих процессов с агентами, предлагая высокопроизводительную альтернативу западным закрытым моделям.

Qwen3.6-Max-Preview

Варианты использования Qwen3.6-Max-Preview

Откройте для себя различные способы использования Qwen3.6-Max-Preview для достижения отличных результатов.

Автономная разработка ПО

Используйте модель как coding agent, способного ориентироваться в огромных кодовых базах, планировать архитектурные изменения и исправлять баги в нескольких файлах одновременно.

Масштабный технический анализ

Используйте контекстное окно в 1M tokens для загрузки полных наборов документации или правовых баз для глубокого анализа без ограничений, присущих RAG.

Сложный reasoning и планирование

Задействуйте нативный Thinking Mode для решения математических задач высокого уровня, где для точности требуется многоэтапный внутренний план.

Multimodal понимание контента

Анализируйте как статические изображения, так и сложные видеопоследовательности для извлечения данных и обобщения динамических визуальных событий.

Интерактивные операции в терминале

Создавайте инструменты, позволяющие ИИ взаимодействовать напрямую с оболочками и CLI средами, опираясь на производительность Terminal-Bench.

Корпоративные agentic рабочие процессы

Интегрируйте модель в сложные бизнес-процессы, где для автоматизации требуются высокая надежность инструкций и продвинутый tool-calling.

Преимущества

Ограничения

Мировой лидер в программировании: Достигает 57,3% в SWE-bench Pro, превосходя такие крупные frontier models, как Claude 4.5 Opus, в задачах автономного программирования.
Ограничение закрытого исходного кода: В отличие от версий Medium в линейке Qwen 3.6, модель Max-Preview является проприетарной и не может быть развернута локально на собственном оборудовании.
Огромное контекстное окно 1M tokens: Обрабатывает массивные наборы данных и полные технические библиотеки в рамках одного prompt без типичной деградации контекста, характерной для старых архитектур.
Высокая стоимость за output tokens: Цена $10.00/1M output tokens в 8 раз выше цены за ввод, что делает длинные цепочки рассуждений дороже, чем простое считывание данных.
Прозрачный нативный reasoning: Встроенный Thinking Mode раскрывает внутреннюю логику, что позволяет повысить надежность при решении сложных задач и упростить отладку.
Ограничение по дате знаний: Будучи статической preview-моделью, она не обладает информацией о событиях или обновлениях библиотек в реальном времени после окончания обучения в начале 2026 года.
Агрессивное ценообразование: При цене $1,25 за миллион input tokens модель предлагает производительность frontier уровня за долю стоимости западных проприетарных аналогов.
Региональная latency API: В зависимости от региона развертывания, международные пользователи могут столкнуться с более высокой latency по сравнению с локально оптимизированными вариантами.

Быстрый старт API

alibaba/qwen3.6-max-preview

Посмотреть документацию
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  base_url: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.6-max-preview',
    messages: [{ role: 'user', content: 'Design a system architecture for a real-time AI agent.' }],
    extra_body: { enable_thinking: true },
    stream: true
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Qwen3.6-Max-Preview

Посмотрите, что думает сообщество о Qwen3.6-Max-Preview

Производительность, которую ожидаешь от модели, работающей на огромной серверной ферме, теперь доступна на вашем рабочем столе.
softtechhubus
reddit
Qwen3.6-Max-Preview только что обошла Claude Opus 4.5 в SWE-Bench Pro. Китай стремительно догоняет.
BridgeMind
twitter
По цене $1,25 за миллион tokens, Qwen значительно дешевле, чем Claude для крупномасштабной загрузки данных.
TechReviewer2026
reddit
Тот факт, что Thinking Mode встроен как состояние по умолчанию, является значимым дизайнерским решением для надежности агентов.
DevGuru
twitter
Qwen выпустила Qwen 3.6 Max Preview в качестве новой флагманской проприетарной модели.
AICodeKing
youtube
Она демонстрирует улучшенное agentic coding и лучшую надежность агентов в реальных условиях по сравнению с моделью Plus.
Codedigipt
youtube

Видео о Qwen3.6-Max-Preview

Смотрите обучающие материалы, обзоры и обсуждения о Qwen3.6-Max-Preview

Qwen выпустила Qwen 3.6 Max Preview в качестве новой флагманской проприетарной модели.

Модель демонстрирует мощный скачок в benchmark для coding-agent, таких как SkillsBench и Terminal-Bench 2.0.

Qwen явно пытается серьезно конкурировать в премиум-сегменте с такими моделями, как Claude 4.5 Opus.

Эта модель представляет собой значительное улучшение в плане знаний о мире и следования инструкциям.

Скачок производительности в SWE-bench, это то, что действительно отличает её от варианта Plus.

История с benchmark на самом деле заключается в позиционировании облачной версии Max Preview как отдельной от семейства с открытыми весами.

Мы используем страницы Qwen Code и репозитории для оценки глубины экосистемы, выходящей за рамки просто весов модели.

Thinking mode удивительно быстрый по сравнению с моделями в стиле o1 прошлого года.

Это решение явно предназначено для корпоративных разработчиков, которым нужен надежный API для agentic задач.

Производительность в multimodal vision догоняет Gemini 2 в некоторых тестах по анализу документов.

В этом видео представлен Qwen3.6-Max-Preview, первый взгляд на следующую флагманскую модель от Qwen.

Она демонстрирует улучшенное agentic coding и лучшую надежность агентов в реальных условиях по сравнению с моделью Plus.

Контекстное окно 1M гораздо более стабильно, чем то, что мы видели в ранних версиях Qwen 2.

Если вы много программируете, Qwen 3.6 Max в данный момент является лидером benchmark.

Ценообразование остается очень конкурентоспособным даже для их флагманской закрытой модели.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Qwen3.6-Max-Preview

Экспертные советы для максимальной эффективности Qwen3.6-Max-Preview.

Включение внутренней логики

Установите параметр 'enable_thinking' в значение true в вашем API запросе, чтобы видеть внутреннюю логику модели для отладки сложных задач reasoning.

Сохранение долгосрочной логики

Используйте функцию 'preserve_thinking' для многоходовых диалогов, чтобы гарантировать, что модель поддерживает логическую последовательность на протяжении всей сессии.

Загрузка целых библиотек

Используйте контекстное окно 1M tokens, предоставляя полные исходные материалы вместо фрагментированных данных для лучшего понимания связей между файлами.

Использование совместимых эндпоинтов

Для глобальных приложений используйте эндпоинты в Сингапуре или Вирджинии (США) через Alibaba Cloud, чтобы минимизировать региональную latency для международных пользователей.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Часто задаваемые вопросы о Qwen3.6-Max-Preview

Найдите ответы на частые вопросы о Qwen3.6-Max-Preview