alibaba

Qwen 3.7 Max

Qwen 3.7 Maxは、256kのcontext windowと最高クラスのコーディング性能を備えた、Alibabaのdeep reasoningおよび自律型エージェント向けflagship modelです。

Thinking ModelコーディングアシスタントAgentic AIAlibaba CloudMoE Architecture
alibaba logoalibabaQwen32026年5月20日
コンテキスト
256Kトークン
最大出力
66Kトークン
入力価格
$1.20/ 1M
出力価格
$6.00/ 1M
モダリティ:Text
機能:ツールストリーミング推論
ベンチマーク
GPQA
92.4%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Qwen 3.7 Maxはこのベンチマークで92.4%を記録しました。
HLE
38.2%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Qwen 3.7 Maxはこのベンチマークで38.2%を記録しました。
MMLU
92.8%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Qwen 3.7 Maxはこのベンチマークで92.8%を記録しました。
MMLU Pro
82%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Qwen 3.7 Maxはこのベンチマークで82%を記録しました。
SimpleQA
45%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Qwen 3.7 Maxはこのベンチマークで45%を記録しました。
IFEval
95%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Qwen 3.7 Maxはこのベンチマークで95%を記録しました。
AIME 2025
99.7%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Qwen 3.7 Maxはこのベンチマークで99.7%を記録しました。
MATH
94.8%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Qwen 3.7 Maxはこのベンチマークで94.8%を記録しました。
GSM8k
99.2%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Qwen 3.7 Maxはこのベンチマークで99.2%を記録しました。
MGSM
98%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Qwen 3.7 Maxはこのベンチマークで98%を記録しました。
SWE-Bench
60.6%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Qwen 3.7 Maxはこのベンチマークで60.6%を記録しました。
HumanEval
94.5%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Qwen 3.7 Maxはこのベンチマークで94.5%を記録しました。
LiveCodeBench
78.2%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Qwen 3.7 Maxはこのベンチマークで78.2%を記録しました。
Terminal-Bench
69.7%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Qwen 3.7 Maxはこのベンチマークで69.7%を記録しました。
ARC-AGI
12.4%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Qwen 3.7 Maxはこのベンチマークで12.4%を記録しました。

Qwen 3.7 Maxについて

Qwen 3.7 Maxの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

高度なreasoningエンジン

Qwen 3.7 Maxは、約1.6兆のparametersを持つ大規模なMoEシステムです。高度なエンジニアリングや研究タスクのための、論理優先のエンジンとして設計されています。このモデルは、Always-On Thinkingモードを統合しており、回答を生成する前に論理を検証しステップを計画することを強制します。このアーキテクチャ上の選択により、長文出力における論理的な逸脱が大幅に減少し、ソフトウェアアーキテクチャや数学的証明の信頼できる基盤となります。

自律型エージェントのための設計

このモデルは、次世代の自律型エージェントのための専門的な基盤として機能します。長期的なタスク管理と複雑なツール使用に重点を置いています。内部評価では、30時間以上のセッションにわたって論理的な一貫性を維持し、ハードウェアレベルのエンジニアリング問題を解決するために何千ものシーケンシャルなツール呼び出しを管理しました。reasoning密度を高く維持するためにテキストとコードに最適化されていますが、マルチエージェントのオーケストレーションを介して、外部の視覚や音声モジュールとも容易に統合可能です。

大規模contextにおける効率性

256,000 tokenのcontext windowを備え、大規模なリポジトリ分析や複雑なドキュメント検索をサポートします。windowが埋まった状態でも高い検索精度を維持するため、法的な証拠開示や企業レベルのRAGワークフローに最適です。競争力のある価格構造により、開発者はWesternのラボの同等モデルと比較して、わずかなコストでfrontierレベルの論理を利用することができます。

Qwen 3.7 Max

Qwen 3.7 Maxのユースケース

Qwen 3.7 Maxを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なカーネルエンジニアリング

再帰的なツール呼び出しを使用して、ドキュメントが存在しない新しいチップ向けのハードウェア固有のコードカーネルを生成および最適化します。

企業のリポジトリリファクタリング

レガシーなソフトウェアリポジトリ全体を分析し、フレームワークの更新や技術的負債の解消を論理的整合性を保ちながら実行します。

長期的なエージェントプランニング

30時間以上の連続セッションにわたり、自律的な意思決定とプランニングを必要とするマルチステップのワークフローを管理します。

科学的研究の検証

複雑な数学的証明の検証や、論理的精度が求められる多段階の科学的クエリの解決に使用されます。

高度な財務リスクモデリング

何千ページもの財務データを読み込み、異常を検知し、構造化されたreasoningに基づいてROIを予測します。

クロスフレームワークUIエンジニアリング

高度な自然言語指示から直接、状態管理と複雑な論理を統合した機能的なフロントエンドプロトタイプを構築します。

強み

制限

卓越したreasoning効率: GPQAで92.4%を達成し、最高クラスのreasoning modelに匹敵、あるいはそれを上回る性能を低コストで提供します。
テキスト専用のflagship model: Maxモデルはネイティブな画像・音声サポートを備えていないため、multimodalなワークロードには別のモデルへの切り替えが必要です。
自律型エージェントの習熟度: Terminal-Benchで69.7というスコアを記録し、実際のターミナル環境の操作や自律的なツール呼び出しの管理において優れた能力を発揮します。
デザイン性のギャップ: 論理的には正確ですが、生成されるUIやクリエイティブな成果物は、Claudeのような競合モデルに見られるような視覚的な洗練さに欠ける場合があります。
大規模なMoE: 1.6Tのparametersを持つMoEアーキテクチャにより、一般的な論理を損なうことなく、多様なタスクに対する高度な専門性を実現しています。
プレビュー版の安定性: 初期のプレビュー版では、非常に長いドキュメント抽出において、安定版の3.6ビルドと比較して時折論理ループが見られることがあります。
指示追従の精度: IFEvalでの95.0%のスコアは、複雑な複数の制約を伴うフォーマットや論理的な指示に従う能力が優れていることを示しています。
地域的なコンテキストの偏り: ドキュメントやデフォルトの文化的背景が東アジア市場を優先する傾向があり、特定のニッチな欧米向けクリエイティブタスクに影響を与える可能性があります。

APIクイックスタート

alibaba/qwen-3.7-max

ドキュメントを見る
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QWEN_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

async function runReasoningTask() {
  const completion = await client.chat.completions.create({
    model: "qwen-3.7-max",
    messages: [
      { role: "system", content: "You are a senior software architect." },
      { role: "user", content: "Analyze this legacy kernel for potential race conditions." }
    ],
    temperature: 0.1,
  });
  console.log(completion.choices[0].message.content);
}

runReasoningTask();

SDKをインストールして、数分でAPIコールを開始しましょう。

Qwen 3.7 Maxについてのユーザーの声

Qwen 3.7 Maxについてコミュニティがどう思っているか見てください

中国の新しいQwen 3.7はヤバい。4つの複雑な入力を持つSEO ROI計算機を5分未満で構築した。シリコンバレーは気が気じゃないはずだ。
Julian Goldie
youtube
Qwen3.7-Maxは1.6T parameterのmodelだ。3.6からわずか1ヶ月での品質向上は、これまで見た中で最も速いイテレーションだ。
AJ
twitter
NL2Repoにおける進歩こそが最大のニュースだ。リポジトリレベルのコーディングでClaude Opusに匹敵すると主張している。
TeortaxesTex
twitter
Qwenはついに3.5の過度な思考ループから脱却した。3.7 Maxのプレビューは、論理の深さを維持しながら、より決断力がある。
LocalLLaMA
reddit
Qwen 3.7 Maxは、技術的なタスクにおいてClaude Opus 4.6に真剣に対抗し、場合によっては凌駕する最初のmodelとなった。
TechInsights
twitter
QWEN 3.6 27Bのローカル動作には成功したが、3.7 Maxのクラウドパフォーマンスは複雑なreasoningにおいては別次元だ。
DevArchitect
hackernews

Qwen 3.7 Maxについての動画

Qwen 3.7 Maxについてのチュートリアル、レビュー、ディスカッションを見る

Chain of Thoughtプロセスは以前のバージョンと比較して非常に高速です。

モデルが弾痕の影響を風景に正しく実装しているのを見たのは今回で2回目です。

マルチターンのコードデバッグにおける論理的一貫性は、3.6プレビュー版よりも明らかに安定しています。

256kのcontext windowをほとんど損失なく処理できています。

このmodelは、静的な補完から真の自律的なプランニングへの架け橋となるものです。

Maxのcontext windowは256K tokenで、重要なのはテキスト専用であるという点です。

3.5と比較して、思考や考えすぎ(overthinking)の量がかなり減っているのが確認できます。

ターミナルベースの環境でのパフォーマンスは、実際にサーバーを管理できる可能性を示唆しています。

Qwen 3.7 Maxは、高度な論理を必要とする企業ワークロードにおいて大幅に低コストです。

一部の初期のモデルで見られたような文化的整合性の問題で苦労することはありません。

Qwen 3.7 Max PreviewはText Arenaで総合13位にランクインしました。

Thinkingモードとは、モデルが回答前に問題を小さなステップに分解することを意味します。

完璧な状態管理を備えた複雑な計算機を5分以内に構築します。

これはAgentic AI向けに最適化されており、単に話すだけでなく実行することを目的としています。

この価格設定は、開発者市場におけるOpenAIの優位性に対する直接的な挑戦です。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Qwen 3.7 Maxのプロのヒント

Qwen 3.7 Maxを最大限に活用し、より良い結果を得るための専門家のヒント。

論理検証の強制

「最終的なコードを提示する前に思考プロセスを検証すること」といった指示を含めることで、モデルのネイティブな慎重なreasoningモードをトリガーできます。

Context Cachingの活用

同じ膨大なコードベースを扱うタスクでは、context cachingを使用してlatencyを削減し、入力tokenのコストを抑えることができます。

フェーズごとのチェックリスト定義

長期タスクに対して番号付きのチェックリストを提供することで、長い生成プロセスの途中でモデルが手順を省略するのを防ぐことができます。

制約設計パラメータの設定

UIを生成する際は、特定のCSS変数を指定することで、モデルが美観よりも論理を優先する傾向を補完できます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context
$5.00/$30.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Qwen 3.7 Maxについてのよくある質問

Qwen 3.7 Maxに関するよくある質問への回答を見つけてください