alibaba

Qwen3-Coder-Next

Qwen3-Coder-NextはAlibaba CloudによるApache 2.0コーディングモデルです。80B MoEアーキテクチャと256k context windowを備え、高度なローカル開発を支援します。

コーディングAIオープンウェイトMixture of ExpertsagenticワークフローローカルLLM
alibaba logoalibabaQwen32026年2月3日
コンテキスト
256Kトークン
最大出力
8Kトークン
入力価格
$0.14/ 1M
出力価格
$0.42/ 1M
モダリティ:Text
機能:ツールストリーミング
ベンチマーク
GPQA
53.4%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Qwen3-Coder-Nextはこのベンチマークで53.4%を記録しました。
HLE
28.5%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Qwen3-Coder-Nextはこのベンチマークで28.5%を記録しました。
MMLU
86.2%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Qwen3-Coder-Nextはこのベンチマークで86.2%を記録しました。
MMLU Pro
78.4%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Qwen3-Coder-Nextはこのベンチマークで78.4%を記録しました。
SimpleQA
48.2%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Qwen3-Coder-Nextはこのベンチマークで48.2%を記録しました。
IFEval
89.1%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Qwen3-Coder-Nextはこのベンチマークで89.1%を記録しました。
AIME 2025
89.2%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Qwen3-Coder-Nextはこのベンチマークで89.2%を記録しました。
MATH
83.5%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Qwen3-Coder-Nextはこのベンチマークで83.5%を記録しました。
GSM8k
95.8%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Qwen3-Coder-Nextはこのベンチマークで95.8%を記録しました。
MGSM
92.5%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Qwen3-Coder-Nextはこのベンチマークで92.5%を記録しました。
MathVista
71.2%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Qwen3-Coder-Nextはこのベンチマークで71.2%を記録しました。
SWE-Bench
74.2%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Qwen3-Coder-Nextはこのベンチマークで74.2%を記録しました。
HumanEval
94.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Qwen3-Coder-Nextはこのベンチマークで94.1%を記録しました。
LiveCodeBench
74.5%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Qwen3-Coder-Nextはこのベンチマークで74.5%を記録しました。
MMMU
72.4%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Qwen3-Coder-Nextはこのベンチマークで72.4%を記録しました。
MMMU Pro
58.6%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Qwen3-Coder-Nextはこのベンチマークで58.6%を記録しました。
ChartQA
86.4%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Qwen3-Coder-Nextはこのベンチマークで86.4%を記録しました。
DocVQA
93.5%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Qwen3-Coder-Nextはこのベンチマークで93.5%を記録しました。
Terminal-Bench
58.2%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Qwen3-Coder-Nextはこのベンチマークで58.2%を記録しました。
ARC-AGI
12.5%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Qwen3-Coder-Nextはこのベンチマークで12.5%を記録しました。

Qwen3-Coder-Nextについて

Qwen3-Coder-Nextの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

モデルアーキテクチャ

Qwen3-Coder-Nextは、ソフトウェアエンジニアリングagent向けにAlibaba Cloudによって設計された、オープンウェイトの特化型モデルです。合計800億のパラメータを持つMixture-of-Experts (MoE) アーキテクチャを採用していますが、推論時にはtokenごとに30億パラメータのみがアクティブ化されます。この設計により、巨大モデルの知能と小型モデルの推論速度を両立させています。アーキテクチャにはハイブリッドなattentionメカニズムが含まれており、Gated DeltaNetと標準的なGated Attentionを統合することで、最大262,144 tokensまでのcontextを処理可能です。

agentへの専門性

このモデルは、80万件以上の検証可能なコーディングタスクと実行環境で学習されています。長期的なreasoningや実行失敗からの復旧能力が特に重視されています。SWE-Bench Verifiedでは70.8%のスコアを達成し、初期計画から最終的なコード実行に至るまで、マルチステップの開発タスクを遂行する能力を実証しています。OpenClawやQwen Codeといった自律型agentフレームワークでの運用に優れています。

デプロイとプライバシー

Apache 2.0ライセンスの下で提供されており、ローカルでプライベートな開発環境を必要とする開発者にとって安全な代替案となります。量子化により、十分なRAMを搭載したコンシューマー向けハードウェアで実行可能です。広大なcontext windowにより、小さなcontextしか持たないモデルでありがちなパフォーマンスの低下なしに、リポジトリ単位の分析を行うことができます。

Qwen3-Coder-Next

Qwen3-Coder-Nextのユースケース

Qwen3-Coder-Nextを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型コーディングagent

計画から最終実行まで、マルチステップの開発タスクを処理するフレームワークを駆動します。

ローカル環境でのプライベート開発

量子化されたMoE layersを活用し、16GB VRAM搭載のコンシューマー向けGPU上で高度なコーディング支援を実行します。

大規模リポジトリ分析

256kのcontext window内にコードベース全体を読み込み、技術的負債の特定を行います。

コード修正とリファクタリング

実行環境からのフィードバックを提供することで、レガシーコードを最新の標準にアップデートします。

多言語スクリプティング

RustやGoを含む40以上のプログラミング言語で、高精度なコードを生成します。

インタラクティブな3Dシミュレーション

迅速なワンショット生成により、複雑なWebベースのビジュアライザやシミュレーションを構築します。

強み

制限

MoEの効率性: コンシューマー向けハードウェアで動作可能な3Bのアクティブパラメータを持ちつつ、80Bクラスの知能を維持しています。
システムRAMの要件: 合計80Bのパラメータがあるため、効果的な4-bit量子化には約45GBのシステムRAMが必要です。
agenticな専門性: SWE-Bench Verifiedで70.8%を記録し、優れたマルチターン問題解決能力を実証しています。
リカレント状態の制限: ハイブリッドなattentionアーキテクチャを採用しているため、一般的な推論エンジンでは自己推測デコーディングがサポートされていません。
巨大なネイティブコンテキスト: 262,144 tokensのwindowにより、パフォーマンスを低下させることなくリポジトリスケールの分析が可能です。
テキスト限定の制約: multimodalなvision機能を持たないため、スクリーンショットからレイアウトのデバッグを行うことはできません。
寛容なライセンス: Apache 2.0でリリースされており、商用利用やプライベートなローカルホスティングが無制限に行えます。
高難度の物理演算: denseなフラッグシップモデルと比較すると、極めて複雑な3D物理演算ロジックのワンショット生成には苦戦する場合があります。

APIクイックスタート

alibaba/qwen-3-coder-next

ドキュメントを見る
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "qwen3-coder-next",
    messages: [
      { role: "system", content: "You are a professional coding assistant." },
      { role: "user", content: "Write a React component for a sortable list." },
    ],
  });
  console.log(completion.choices[0].message.content);
}
main();

SDKをインストールして、数分でAPIコールを開始しましょう。

Qwen3-Coder-Nextについてのユーザーの声

Qwen3-Coder-Nextについてコミュニティがどう思っているか見てください

全体的なコーディング能力でClaudeにほぼ匹敵する。HumanEvalでは92.7%でClaude 3.5 Sonnetを凌駕。
Philipp Schmid
twitter
MoEバージョンの効率性はローカルハードウェアにとって最高。ミドルレンジのシステムで26 TPSが出ている。
LocalAI_Dev
reddit
自己推測デコーディングは、リカレント状態の都合上、数学的にQwen Coder Nextでは不可能である。
GodComplecs
reddit
Qwen3-Coder-NextはMoEベースで、これまでより遥かに強力で賢い!
JustinLin610
twitter
新しい480Bモデルバリエーションにより、プロジェクトの途中でプロバイダーを切り替えられる能力を示している。
saveralter
reddit
80万タスクで行われたagenticなトレーニングの成果が、ビルドエラーからの復旧能力に表れている。
TechGurus
hackernews

Qwen3-Coder-Nextについての動画

Qwen3-Coder-Nextについてのチュートリアル、レビュー、ディスカッションを見る

ローカルAIコーディングagentを試したいユーザーにとって非常に親しみやすい

これはオープンコードで試すべきだと確信した

メモリ効率の高さは大きな強みです

以前の72Bのdenseモデルよりも複雑なロジックをうまく扱える

私のターミナルコマンドに正確に従う最初のオープンモデルです

Qwen 3 Coder Nextは、コンシューマー向けGPUで動かせる3Bのアクティブパラメータを備えています

見事に動作します。ローカルAIからこのクオリティが一度で得られるとは驚きです

80Bのパラメータは通常クラスターが必要ですが、MoEアプローチが全てを変えました

40以上のプログラミング言語をパフォーマンスの低下なしに処理します

OpenClawと組み合わせると、チームにジュニアエンジニアがいるような感覚です

3Bパラメータのモデルが、10〜20倍のサイズを持つモデルと互角に渡り合っている

Qwen 3は低コストで多くのメリットを享受できる

256kのcontextは本物で、プロジェクトの途中でハルシネーションを起こさなかった

80Bの総パラメータ数を考えれば、レイテンシは驚くほど低い

GPT-4oが3回失敗したレガシーGoリポジトリのバグを修正した

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Qwen3-Coder-Nextのプロのヒント

Qwen3-Coder-Nextを最大限に活用し、より良い結果を得るための専門家のヒント。

長いシステムプロンプトの活用

モデルのagenticな挙動を適切に調整するため、詳細な例やドキュメントをプロンプトとして提供してください。

反復的なエラーフィードバック

ブラウザのコンソールエラーログをモデルにフィードバックすることで、高い成功率で自己修正を行わせることができます。

レイヤーオフロードの最適化

特定のMoE Expert layersをシステムRAMにオフロードすることで、推論速度とreasoning能力のバランスを調整できます。

サンプリングパラメータの調整

最も正確なコーディング結果を得るために、temperatureは1.0、top_pは0.95、top_kは40に設定することをお勧めします。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
openai

GPT-4o mini

OpenAI

OpenAI's most cost-efficient small model, GPT-4o mini offers multimodal intelligence and high-speed performance at a significantly lower price point.

128K context
$0.15/$0.60/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Qwen3-Coder-Nextについてのよくある質問

Qwen3-Coder-Nextに関するよくある質問への回答を見つけてください