alibaba

Qwen3-Coder-Next

Qwen3-Coder-Next 是阿里巴巴云顶尖的 Apache 2.0 编程 model,采用 80B MoE 架构和 256k context window,专为先进的本地开发而设计。

编程 AI开放权重混合专家架构Agentic 流程本地 LLM
alibaba logoalibabaQwen3-Coder2026年2月2日
上下文
256Ktokens
最大输出
8Ktokens
输入价格
$0.14/ 1M
输出价格
$0.42/ 1M
模态:Text
能力:工具流式传输
基准测试
GPQA
53.4%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Qwen3-Coder-Next 在此基准测试中得分 53.4%。
HLE
28.5%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Qwen3-Coder-Next 在此基准测试中得分 28.5%。
MMLU
86.2%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Qwen3-Coder-Next 在此基准测试中得分 86.2%。
MMLU Pro
78.4%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Qwen3-Coder-Next 在此基准测试中得分 78.4%。
SimpleQA
48.2%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Qwen3-Coder-Next 在此基准测试中得分 48.2%。
IFEval
89.1%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Qwen3-Coder-Next 在此基准测试中得分 89.1%。
AIME 2025
89.2%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Qwen3-Coder-Next 在此基准测试中得分 89.2%。
MATH
83.5%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Qwen3-Coder-Next 在此基准测试中得分 83.5%。
GSM8k
95.8%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Qwen3-Coder-Next 在此基准测试中得分 95.8%。
MGSM
92.5%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Qwen3-Coder-Next 在此基准测试中得分 92.5%。
MathVista
71.2%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Qwen3-Coder-Next 在此基准测试中得分 71.2%。
SWE-Bench
74.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Qwen3-Coder-Next 在此基准测试中得分 74.2%。
HumanEval
94.1%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Qwen3-Coder-Next 在此基准测试中得分 94.1%。
LiveCodeBench
74.5%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Qwen3-Coder-Next 在此基准测试中得分 74.5%。
MMMU
72.4%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Qwen3-Coder-Next 在此基准测试中得分 72.4%。
MMMU Pro
58.6%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Qwen3-Coder-Next 在此基准测试中得分 58.6%。
ChartQA
86.4%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Qwen3-Coder-Next 在此基准测试中得分 86.4%。
DocVQA
93.5%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Qwen3-Coder-Next 在此基准测试中得分 93.5%。
Terminal-Bench
58.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Qwen3-Coder-Next 在此基准测试中得分 58.2%。
ARC-AGI
12.5%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Qwen3-Coder-Next 在此基准测试中得分 12.5%。

关于 Qwen3-Coder-Next

了解 Qwen3-Coder-Next 的功能、特性以及它如何帮助您获得更好的效果。

Model 概览

Qwen3-Coder-Next 是由阿里巴巴云 Qwen 团队设计的 state-of-the-art 开放权重语言 model,专门针对 agentic 编程和本地开发环境进行了优化。该 model 基于 Qwen3-Next-80B-A3B-Base 架构,采用了复杂的混合专家架构 (MoE) 设计,结合混合注意力机制(Gated DeltaNet 和 Gated Attention)。这使得 model 在保持海量 800亿 parameters 知识库的同时,每个 token 仅激活 30亿 parameters,从而在仅需小型 model 的 inference 速度和内存占用的情况下,实现 flagship 级别的 reasoning 能力。

Agentic 专业化

该 model 标志着向扩展 agentic 训练信号 而非单纯堆叠 parameter 数量的转变。它在超过 800,000 个配有可执行环境的可验证编程任务上进行了训练,使其能够直接从环境反馈中学习。这种专门的训练方案强调了长程 reasoning、工具使用以及从执行失败中恢复的能力——这些能力对于现代的“氛围编程 (vibe coding)”流程和像 OpenClaw 这样的自主 agentic 框架至关重要。

本地性能

凭借原生支持且可进一步外推的 256K context window,Qwen3-Coder-Next 独特地定位为目前最强大的本地优先编程助手。它以 Apache 2.0 协议 发布,赋予开发者在安全、私有的环境中构建、调试和发布整个代码库的能力,而无需依赖闭源的云端 API。

Qwen3-Coder-Next

Qwen3-Coder-Next 的使用案例

发现使用 Qwen3-Coder-Next 获得出色效果的不同方式。

本地 Agentic 开发

:驱动自主编程 agentic,使其能够在本地进行计划、执行和 debug 软件,确保敏感数据不离开机器。

复杂 Web 原型设计

:仅需单个自然语言 prompt 即可生成功能齐全的全栈应用,包括 3D 可视化和交互式游戏。

大规模代码库分析

:利用 256K context window 对整个多文件项目结构进行理解和 reasoning,从而完成重构和优化。

自动化安全审计

:扫描代码库以发现 SQL 注入和明文凭据泄露等复杂漏洞,并提供基于实际情况的修复建议。

技术研究总结

:抓取并解析密集的学术或技术文档,生成条理清晰、具有行动参考价值的 HTML 报告。

跨语言系统迁移

:在高保真度下完成不同编程语言间复杂业务逻辑和硬件特定约束的迁移转换。

优势

局限性

极高的效率: :采用 3B active parameters 的 MoE 架构,以降低 10 倍的 inference 成本提供 flagship 级别的编程 reasoning 能力。
Zero-Shot 复杂度: :对于高度复杂的 3D 模拟或架构任务,通常需要 2-3 次迭代 prompt 才能达到完美的功能状态。
顶尖的 Agentic 训练: :在超过 80 万个可验证任务上进行训练,使其在多步规划和执行错误恢复方面表现卓越。
内存门槛: :高质量量化版本所需的 45GB+ RAM 要求,对于许多标准的开发笔记本电脑来说仍然是一个门槛。
海量本地上下文: :256K context window 是目前本地 model 中容量最大的之一,支持全代码库 reasoning。
极简审美偏好: :除非在 prompt 中明确要求视觉风格,否则默认生成极其简单、未经美化的 UI 设计。
宽松的授权协议: :以 Apache 2.0 协议发布,允许开发者自由地进行 fine-tuning 和部署,不受闭源协议限制。
模态限制: :与 VL 系列不同,Coder-Next model 完全基于文本,无法直接处理视觉资产。

API快速入门

alibaba/qwen-3-coder-next

查看文档
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen-3-coder-next',
    messages: [{ role: 'user', content: 'Write a React hook for debouncing a value.' }],
  });

  console.log(completion.choices[0].message.content);
}

main();

安装SDK并在几分钟内开始进行API调用。

人们对 Qwen3-Coder-Next 的评价

看看社区对 Qwen3-Coder-Next 的看法

"这款 model 在编程方面表现惊人,与竞争对手相比极具优势"
Becky Jane
youtube
"该架构允许海量的 context length,而不会导致 VRAM 膨胀"
bjan
youtube
"阿里巴巴凭借这种 MoE 架构在开放权重领域遥遥领先"
DevGuru88
reddit
"终于有一个本地 model 能处理 256k context 却不会慢得像蜗牛了"
AI_Explorer
x
"我在 CPU 上看到了稳定的 ~7.8 tok/s 解码速度,作为本地代码审查工具已经绰绰有余了"
Express-Jicama-9827
reddit
"Qwen3 Coder 基本上是本地开发环境的终极选择。"
TechTrend_AI
x

关于 Qwen3-Coder-Next 的视频

观看关于 Qwen3-Coder-Next 的教程、评测和讨论

它拥有 256k 的 context length,非常稳健,特别是对于一个可以在本地运行的 model 来说。

我们的生成速度达到了每秒 26.17 个 tokens... 这是一个相当长的结果。

这是一个非常令人兴奋的 model... 它展示了在 agentic 编程方面的巨大潜力。

对于一个开放权重 model 来说,它在 Python 任务上的准确性简直惊人。

我认为这款 model 正式终结了大多数开发者对付费编程助手的需求。

它构建在 80B total parameters 架构之上,每个 token 仅激活 3B parameters。

它不仅仅是一个拥有 200k context window 的编程 AI model... 它绝对具有直觉性。

对于日常用户,你可以直接让它抓取网页、分析内容并生成整洁的报告。

它在本地处理多文件项目的方式彻底改变了隐私保护的游戏规则。

与旧版本相比,function calling 的响应感更加干脆利落。

写故事的速度达到每秒 62 个 tokens。砰。太快了。

在 batching 模式下达到了每秒 150 个 tokens... 这太不可思议了。

这个赛车游戏居然比 Claude 生成的版本还要好... 必须给它点赞。

当你观察每瓦特 token 的效率时,MoE 架构真的大放异彩。

量化似乎并没有像我预期的那样对逻辑能力造成多大损害。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Qwen3-Coder-Next专业提示

专家提示助您充分利用Qwen3-Coder-Next。

硬件带宽优化:针对 80B 规模,请确保系统使用高通道内存,以防止在纯 CPU 设置下出现 inference 瓶颈。

迭代式 Debugging:尝试将 model 自身的运行时错误反馈回 prompt;它经过专门训练,能够识别执行失败并优化其逻辑。

强化上下文的 Prompting:通过提供相关的依赖文件和架构图来充分利用 256K 的 context window,以减少 hallucinations(幻觉)。

审美细化:在生成 UI 时,明确要求颜色和 CSS 过渡效果,以覆盖 model 默认的极简主义布局倾向。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
other

PixVerse-R1

Other

PixVerse-R1 is a next-gen real-time world model by AIsphere, offering interactive 1080p video generation with instant response and physics-aware continuity.

关于Qwen3-Coder-Next的常见问题

查找关于Qwen3-Coder-Next的常见问题答案