通过 API 使用 Qwen3-Coder-Next 需要多少费用？

通过 API 使用 Qwen3-Coder-Next 的价格为每百万输入 tokens 0.12 美元，每百万输出 tokens 0.75 美元。此价格远低于闭源竞争对手。

我可以在单张消费级 GPU 上运行该 model 吗？

可以。通过卸载 expert layers，您可以在 16GB VRAM 的显卡上运行量化版本。但为了保证性能，建议总系统内存达到 45GB。

什么是 Mixture of Experts (MoE) 设计？

该 model 总计拥有 800 亿 parameters，但在生成时每个 token 仅激活 30 亿。这种设计既实现了海量的知识存储，又保证了快速的 inference。

它支持 agent 的 function calling 吗？

是的，它具备原生工具调用支持，并针对 CLI agent 进行了优化。它在这些架构内进行长跨度 reasoning 表现尤为出色。

它与 Claude 3.5 Sonnet 相比如何？

在 HumanEval 等关键编码 benchmark 上，它的表现与 Sonnet 持平或更优。同时它还提供了 open-source model 的隐私保护和成本优势。

最大 context window 是多少？

其原生 context window 为 262,144 tokens。对于大型代码库，还可以通过 YaRN 外推技术进一步扩展。

该 model 是 multimodal 的吗？

不是。Qwen3-Coder-Next 是一款专用的纯文本 model，不支持处理图像、音频或视频。

它具备 reasoning 或思维模式吗？

该 model 仅支持标准模式。它不会像 OpenAI o1 或 DeepSeek R1 那样生成内部思维链（thinking blocks）。

Qwen3-Coder-Next

Qwen3-Coder-Next 是阿里云推出的精英级 Apache 2.0 编码 model，具有 80B MoE 架构和 256k 上下文 window，适用于高级本地开发。

编码 AI开放权重混合专家模型Agentic 工作流本地 LLM

alibabaQwen32026年2月3日

上下文

256Ktokens

最大输出

8Ktokens

输入价格

$0.14/ 1M

输出价格

$0.42/ 1M

模态:Text

能力:工具流式传输

基准测试

GPQA

53.4%

HLE

28.5%

MMLU

86.2%

MMLU Pro

78.4%

SimpleQA

48.2%

IFEval

89.1%

AIME 2025

89.2%

MATH

83.5%

GSM8k

95.8%

MGSM

92.5%

MathVista

71.2%

SWE-Bench

74.2%

HumanEval

94.1%

LiveCodeBench

74.5%

MMMU

72.4%

MMMU Pro

58.6%

ChartQA

86.4%

DocVQA

93.5%

Terminal-Bench

58.2%

ARC-AGI

12.5%

查看API文档

关于 Qwen3-Coder-Next

了解 Qwen3-Coder-Next 的功能、特性以及它如何帮助您获得更好的效果。

Model 架构

Qwen3-Coder-Next 是阿里云为软件工程 agent 设计的专用 open-weight model。它采用 Mixture-of-Experts (MoE) 架构，总计 800 亿 parameters，但每个 token 仅激活 30 亿。这种设计结合了海量 model 的智能与小型 model 的 inference 速度。该架构包含一种混合注意力机制，集成了 Gated DeltaNet 和标准 Gated Attention，以处理高达 262,144 tokens 的上下文。

Agentic 专业化

该 model 在超过 80 万个可验证的编码任务和可执行环境中进行了训练。这种训练强调长跨度的 reasoning 以及从执行失败中恢复的能力。它在 SWE-Bench Verified 上得分 70.8%，展示了其处理从初始规划到最终代码执行的多步骤开发任务的能力。它在 OpenClaw 和 Qwen Code 等自主 agentic 框架中表现优异。

部署与隐私

该 model 在 Apache 2.0 协议下发布，为需要本地私有开发环境的开发者提供了安全选择。通过量化，它可以在配备足够 RAM 的消费级硬件上运行。高 context window 支持存储库规模的分析，且不会出现通常在较小上下文 model 中看到的性能下降。

Qwen3-Coder-Next 的使用案例

发现使用 Qwen3-Coder-Next 获得出色效果的不同方式。

自主编码 Agent

赋能各类框架处理从规划到最终执行的多步骤开发任务。

本地私有开发

通过量化 MoE layers，在 16GB VRAM 的消费级 GPU 上运行精英级编码辅助。

大规模代码库分析

在其 256k 的 window 内处理完整代码库，识别技术债。

代码修复与重构

通过提供可执行的环境反馈，将旧代码更新为现代标准。

多语言脚本编写

生成包括 Rust 和 Go 在内的 40 多种编程语言的高质量代码。

交互式 3D 模拟

利用快速单次生成功能构建复杂的基于 Web 的可视化工具和模拟程序。

优势

局限性

MoE 高效性: 在消费级硬件上以 3B 活跃 parameters 运行，同时保持 80B 级别的智能水平。

系统 RAM 要求: 80B 的总 parameter 量在进行 4-bit 量化时，大约需要 45GB 的总 RAM。

Agentic 专业化: 在 SWE-Bench Verified 上得分 70.8%，展示了卓越的多轮问题解决能力。

循环状态限制: 混合注意力架构导致常见的 inference 引擎不支持自我投机解码（self-speculative decoding）。

海量原生上下文: 262,144 token 的 window 支持存储库规模的分析，且不会出现性能下降。

仅支持文本: 缺乏 multimodal 视觉能力，无法通过截图进行布局调试。

宽松的许可协议: 以 Apache 2.0 协议发布，支持无限制的商业用途和私有本地部署。

高复杂度物理模拟: 相比稠密型 flagship model，在一次性生成极端 3D 物理逻辑时可能会遇到困难。

API快速入门

alibaba/qwen-3-coder-next

查看文档

alibaba SDK

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

安装SDK并在几分钟内开始进行API调用。

人们对 Qwen3-Coder-Next 的评价

看看社区对 Qwen3-Coder-Next 的看法

“整体编码能力几乎与 Claude 持平。在 HumanEval 上以 92.7% 的成绩击败了 Claude 3.5 Sonnet。”

— Philipp Schmid

twitter

“MoE 版本的效率对于本地硬件来说简直疯狂。我在中端系统上获得了 26 TPS 的速度。”

— LocalAI_Dev

“由于循环状态的存在，自我投机解码在数学上对 Qwen Coder Next 是不可能的。”

— GodComplecs

“Qwen3-Coder-Next 基于 MoE，比以前更强大、更聪明了！”

— JustinLin610

twitter

“展示了使用新的 480B model 变体在项目过程中切换提供商的能力。”

— saveralter

“它在 80 万个任务上的 agentic 训练配方在它从构建错误中恢复的方式中得到了体现。”

— TechGurus

hackernews

关于 Qwen3-Coder-Next 的视频

观看关于 Qwen3-Coder-Next 的教程、评测和讨论

“让想要使用本地 AI 编码 agent 的用户更易于上手”

“这简直在呼唤我进行开源代码测试，我待会就去尝试”

“它的内存效率是巨大的优势”

“它处理复杂逻辑的能力比之前的 72B 稠密 model 更好”

“这是第一个能准确遵循我终端命令的开源 model”

“Qwen 3 Coder Next 只有 30 亿活跃 parameters，可以在消费级显卡上运行”

“它运行得非常完美。我真的很惊讶能从本地 AI 一次性得到这个结果”

“800 亿 parameters 通常需要集群支持，但 MoE 方法改变了一切”

“它处理 40 多种编程语言时性能没有明显下降”

“结合 OpenClaw 使用，感觉就像团队里多了个初级开发人员”

“一个 30 亿参数的 model 与比它大 10 到 20 倍的 model 正面交锋”

“Qwen 3 带来了很多优势，且成本更低”

“256k 上下文是真实的，它没有在项目中间产生幻觉”

“考虑到 80B 的总 parameter 量，其 latency 低得惊人”

“它修复了我陈旧 Go 代码库中一个 GPT-4o 错过三次的 bug”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量，帮助您在更短的时间内完成更多工作。

AI代理

网页自动化

智能工作流

免费开始

Qwen3-Coder-Next专业提示

专家提示助您充分利用Qwen3-Coder-Next。

使用长 System Prompts

向 model 提供详细的示例和文档，以引导其 agentic 行为。

迭代式错误反馈

将浏览器控制台的错误日志回传给 model，以实现高成功率的自我修正。

优化层卸载

将特定的 MoE expert layers 卸载到系统 RAM，以平衡 inference 速度和 reasoning 能力。

校准采样参数

使用 temperature 1.0、top_p 0.95 和 top_k 40，以获得最精确的编码结果。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.