alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next — это элитная модель для программирования от Alibaba Cloud под лицензией Apache 2.0, с архитектурой MoE 80B и окном контекста 256k для...

Coding AIОткрытые весаMixture of ExpertsAgentic рабочие процессыЛокальная LLM
alibaba logoalibabaQwen33 февраля 2026 г.
Контекст
256Kтокенов
Макс. вывод
8Kтокенов
Цена ввода
$0.14/ 1M
Цена вывода
$0.42/ 1M
Модальность:Text
Возможности:ИнструментыПотоковая передача
Бенчмарки
GPQA
53.4%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Qwen3-Coder-Next набрал 53.4% в этом бенчмарке.
HLE
28.5%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Qwen3-Coder-Next набрал 28.5% в этом бенчмарке.
MMLU
86.2%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Qwen3-Coder-Next набрал 86.2% в этом бенчмарке.
MMLU Pro
78.4%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Qwen3-Coder-Next набрал 78.4% в этом бенчмарке.
SimpleQA
48.2%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Qwen3-Coder-Next набрал 48.2% в этом бенчмарке.
IFEval
89.1%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Qwen3-Coder-Next набрал 89.1% в этом бенчмарке.
AIME 2025
89.2%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Qwen3-Coder-Next набрал 89.2% в этом бенчмарке.
MATH
83.5%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Qwen3-Coder-Next набрал 83.5% в этом бенчмарке.
GSM8k
95.8%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Qwen3-Coder-Next набрал 95.8% в этом бенчмарке.
MGSM
92.5%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Qwen3-Coder-Next набрал 92.5% в этом бенчмарке.
MathVista
71.2%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Qwen3-Coder-Next набрал 71.2% в этом бенчмарке.
SWE-Bench
74.2%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Qwen3-Coder-Next набрал 74.2% в этом бенчмарке.
HumanEval
94.1%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Qwen3-Coder-Next набрал 94.1% в этом бенчмарке.
LiveCodeBench
74.5%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Qwen3-Coder-Next набрал 74.5% в этом бенчмарке.
MMMU
72.4%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Qwen3-Coder-Next набрал 72.4% в этом бенчмарке.
MMMU Pro
58.6%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Qwen3-Coder-Next набрал 58.6% в этом бенчмарке.
ChartQA
86.4%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Qwen3-Coder-Next набрал 86.4% в этом бенчмарке.
DocVQA
93.5%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Qwen3-Coder-Next набрал 93.5% в этом бенчмарке.
Terminal-Bench
58.2%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Qwen3-Coder-Next набрал 58.2% в этом бенчмарке.
ARC-AGI
12.5%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Qwen3-Coder-Next набрал 12.5% в этом бенчмарке.

О модели Qwen3-Coder-Next

Узнайте о возможностях, функциях и способах использования Qwen3-Coder-Next.

Архитектура модели

Qwen3-Coder-Next, это специализированная модель с открытыми весами, разработанная Alibaba Cloud для агентов в области программной инженерии. Она использует архитектуру Mixture-of-Experts (MoE) с 80 миллиардами общих parameters, но активирует только 3 миллиарда на каждый token. Такой дизайн объединяет интеллект массивной модели со скоростью inference маленькой. Архитектура включает гибридный механизм внимания, объединяющий Gated DeltaNet со стандартным Gated Attention для обработки контекста объемом до 262 144 tokens.

Agentic специализация

Модель обучена на более чем 800 000 проверяемых задачах программирования и исполняемых средах. Это обучение делает упор на рассуждения на больших дистанциях и способность восстанавливаться после сбоев выполнения. Модель получает 70.8% на SWE-Bench Verified, демонстрируя способность справляться с многоэтапными задачами разработки: от начального планирования до финального запуска кода. Она превосходно работает в автономных agentic фреймворках, таких как OpenClaw и Qwen Code.

Развертывание и конфиденциальность

Лицензированная под Apache 2.0, эта модель предоставляет безопасную альтернативу для разработчиков, которым требуются локальные, частные среды разработки. Ее можно запускать на потребительском оборудовании с достаточным объемом RAM с помощью квантования. Большое окно контекста позволяет проводить анализ в масштабе репозитория без деградации производительности, которая обычно наблюдается в моделях с меньшим контекстом.

Qwen3-Coder-Next

Варианты использования Qwen3-Coder-Next

Откройте для себя различные способы использования Qwen3-Coder-Next для достижения отличных результатов.

Автономные агенты для программирования

Обеспечивает работу фреймворков для выполнения многоэтапных задач разработки: от планирования до итоговой реализации.

Локальная приватная разработка

Запускает элитную помощь в написании кода на потребительских GPU с 16GB VRAM при использовании квантованных слоев MoE.

Анализ масштабных репозиториев

Обрабатывает целые кодовые базы в пределах своего окна 256k для выявления технического долга.

Исправление и рефакторинг кода

Обновляет устаревший код до современных стандартов, используя обратную связь от исполняемой среды.

Многоязычный скриптинг

Генерирует высококачественный код на более чем 40 языках программирования, включая Rust и Go.

Интерактивное 3D-моделирование

Создает сложные веб-визуализаторы и симуляции с помощью быстрой генерации в один проход.

Преимущества

Ограничения

Эффективность MoE: Работает с 3B активных parameters на потребительском оборудовании, сохраняя интеллект уровня 80B.
Требования к системной RAM: Общее количество параметров 80B требует примерно 45GB оперативной памяти для эффективной 4-битной квантованности.
Agentic специализация: Показывает результат 70.8% на SWE-Bench Verified, демонстрируя превосходные навыки решения задач в несколько итераций.
Ограничения рекуррентного состояния: Гибридная архитектура внимания делает self-speculative decoding неподдерживаемым в популярных движках inference.
Огромный нативный контекст: Окно в 262 144 tokens поддерживает анализ масштаба репозитория без снижения производительности.
Ограничение «только текст»: Отсутствуют возможности multimodal vision, что не позволяет проводить отладку макетов по скриншотам.
Либеральная лицензия: Выпущена под Apache 2.0, что позволяет неограниченное коммерческое использование и частный локальный хостинг.
Сложная физика: Может испытывать трудности с однократной генерацией экстремально сложной 3D-физики по сравнению с плотными flagship моделями.

Быстрый старт API

alibaba/qwen-3-coder-next

Посмотреть документацию
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Qwen3-Coder-Next

Посмотрите, что думает сообщество о Qwen3-Coder-Next

Почти достигает уровня Claude по общим возможностям программирования. Обходит Claude 3.5 Sonnet на HumanEval с результатом 92.7%.
Philipp Schmid
twitter
Эффективность версии MoE просто безумна для локального оборудования. Я получаю 26 TPS на системе среднего уровня.
LocalAI_Dev
reddit
Self-speculative decoding математически невозможно для Qwen Coder Next из-за рекуррентных состояний.
GodComplecs
reddit
Qwen3-Coder-Next основана на MoE, она намного сильнее и умнее, чем раньше!
JustinLin610
twitter
Демонстрация возможности переключения провайдеров прямо в середине проекта с новыми вариантами модели 480B.
saveralter
reddit
Агентский рецепт обучения на 800k задач виден в том, как она восстанавливается после ошибок сборки.
TechGurus
hackernews

Видео о Qwen3-Coder-Next

Смотрите обучающие материалы, обзоры и обсуждения о Qwen3-Coder-Next

Позволяет сделать ее доступной для тех, кто хочет поэкспериментировать с локальными AI coding агентами

Для меня это крик «протестируйте эту модель с открытым кодом», что я и сделаю

Эффективность использования памяти, это огромная победа

Она справляется со сложной логикой лучше, чем предыдущая плотная модель 72B

Это первая открытая модель, которая правильно выполняет мои команды в терминале

У Qwen 3 Coder Next также всего 3 миллиарда активных параметров, чтобы работать на потребительской видеокарте

Она работает великолепно. Я поражен, что могу получить такой результат за один проход от локального AI

Для 80 миллиардов параметров обычно нужен кластер, но подход MoE меняет всё

Она справляется с 40+ языками программирования без заметного падения производительности

Использование её с OpenClaw создает ощущение, что в команде появился младший разработчик

Модель с 3 миллиардами параметров соперничает с моделями в 10-20 раз больше её

У Qwen 3 много преимуществ при более низкой стоимости

Контекст 256k реален, она не начала галлюцинировать в середине моего проекта

Latency удивительно низкая, учитывая общий вес в 80B параметров

Она исправила баг в моем старом Go-репозитории, который GPT-4o пропустил три раза

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Qwen3-Coder-Next

Экспертные советы для максимальной эффективности Qwen3-Coder-Next.

Используйте длинные системные prompt

Предоставляйте модели подробные примеры и документацию, чтобы настроить ее agentic поведение.

Итеративная обратная связь по ошибкам

Отправляйте логи ошибок консоли браузера обратно в модель для самокоррекции с высоким уровнем успеха.

Оптимизация выгрузки слоев

Выгружайте специфические слои экспертов MoE в системную RAM для баланса между скоростью inference и качеством рассуждений.

Настройка параметров сэмплирования

Используйте temperature 1.0 с top_p 0.95 и top_k 40 для получения наиболее точных результатов написания кода.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Часто задаваемые вопросы о Qwen3-Coder-Next

Найдите ответы на частые вопросы о Qwen3-Coder-Next