alibaba

Qwen 3.7 Max

Qwen 3.7 Max مدل پرچمدار هوش مصنوعی علی‌بابا برای استدلال عمیق و کارهای Agentic، با context window ۲۵۶ هزارتایی و عملکرد کدنویسی تراز اول است.

مدل تفکریدستیار کدنویسیAgentic AIAlibaba Cloudمعماری MoE
alibaba logoalibabaQwen3۲۰ مه ۲۰۲۶
پنجره زمینه
256Kتوکن
حداکثر خروجی
66Kتوکن
قیمت ورودی
$1.20/ 1M
قیمت خروجی
$6.00/ 1M
حالت:Text
قابلیت‌ها:ابزارهااستریمینگاستدلال
معیارها
GPQA
92.4%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Qwen 3.7 Max امتیاز 92.4% در این معیار کسب کرد.
HLE
38.2%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Qwen 3.7 Max امتیاز 38.2% در این معیار کسب کرد.
MMLU
92.8%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Qwen 3.7 Max امتیاز 92.8% در این معیار کسب کرد.
MMLU Pro
82%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Qwen 3.7 Max امتیاز 82% در این معیار کسب کرد.
SimpleQA
45%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Qwen 3.7 Max امتیاز 45% در این معیار کسب کرد.
IFEval
95%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Qwen 3.7 Max امتیاز 95% در این معیار کسب کرد.
AIME 2025
99.7%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Qwen 3.7 Max امتیاز 99.7% در این معیار کسب کرد.
MATH
94.8%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Qwen 3.7 Max امتیاز 94.8% در این معیار کسب کرد.
GSM8k
99.2%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Qwen 3.7 Max امتیاز 99.2% در این معیار کسب کرد.
MGSM
98%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Qwen 3.7 Max امتیاز 98% در این معیار کسب کرد.
SWE-Bench
60.6%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Qwen 3.7 Max امتیاز 60.6% در این معیار کسب کرد.
HumanEval
94.5%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Qwen 3.7 Max امتیاز 94.5% در این معیار کسب کرد.
LiveCodeBench
78.2%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Qwen 3.7 Max امتیاز 78.2% در این معیار کسب کرد.
Terminal-Bench
69.7%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Qwen 3.7 Max امتیاز 69.7% در این معیار کسب کرد.
ARC-AGI
12.4%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Qwen 3.7 Max امتیاز 12.4% در این معیار کسب کرد.

درباره Qwen 3.7 Max

درباره قابلیت‌های Qwen 3.7 Max، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

موتور استدلال سطح بالا

Qwen 3.7 Max یک سیستم عظیم Mixture-of-Experts است که تقریباً ۱.۶ تریلیون parameter دارد. این مدل برای عملکرد به عنوان یک موتور منطق‌محور برای وظایف مهندسی و تحقیقاتی با پیچیدگی بالا طراحی شده است. این مدل یک حالت بومی Always-On Thinking را ادغام می‌کند که مدل را مجبور می‌کند قبل از تولید پاسخ، منطق را تأیید کرده و مراحل را برنامه‌ریزی کند. این انتخاب معماری به طور قابل‌توجهی نوسانات منطقی را در خروجی‌های طولانی کاهش می‌دهد و پایه‌ای قابل‌اعتماد برای معماری نرم‌افزار و اثبات‌های ریاضی فراهم می‌کند.

معماری شده برای Agentic AI

این مدل به عنوان پایه‌ای تخصصی برای نسل بعدی Agentها عمل می‌کند. تمرکز آن بر مدیریت وظایف با افق طولانی و استفاده پیچیده از ابزارهاست. در ارزیابی‌های داخلی، مدل ثبات منطقی را در جلساتی که بیش از ۳۰ ساعت طول می‌کشید حفظ کرد و هزاران فراخوانی ابزاری متوالی را برای حل مشکلات مهندسی در سطح سخت‌افزار مدیریت کرد. در حالی که مدل برای متن و کد بهینه‌سازی شده تا چگالی استدلالی بالایی را حفظ کند، به راحتی از طریق ارکستراسیون چند-عاملی (multi-agent orchestration) با ماژول‌های بصری یا صوتی خارجی یکپارچه می‌شود.

کارایی در Contextهای بزرگ

با یک context window برابر با ۲۵۶,۰۰۰ توکن، این مدل از تحلیل مخازن در مقیاس بزرگ و بازیابی پیچیده اسناد پشتیبانی می‌کند. این مدل دقت بازیابی بالایی را حتی با پر شدن پنجره حفظ می‌کند، که آن را برای کشف قانونی و گردش‌کارهای RAG در سطح سازمانی ایده‌آل می‌سازد. ساختار قیمت‌گذاری رقابتی به توسعه‌دهندگان اجازه می‌دهد تا منطق در سطح frontier را با کسری از هزینه مدل‌های قابل‌مقایسه از آزمایشگاه‌های غربی مستقر کنند.

Qwen 3.7 Max

موارد استفاده برای Qwen 3.7 Max

روش‌های مختلف استفاده از Qwen 3.7 Max برای دستیابی به نتایج عالی را کشف کنید.

مهندسی هسته (Kernel) خودکار

این مدل با استفاده از فراخوانی‌های ابزاری بازگشتی (recursive tool calls)، کدهای هسته مخصوص سخت‌افزار را برای تراشه‌های جدید بدون مستندات موجود، تولید و بهینه‌سازی می‌کند.

بازسازی مخازن سازمانی (Repo Refactoring)

Qwen 3.7 Max کل مخازن نرم‌افزاری قدیمی را تحلیل می‌کند تا فریم‌ورک‌ها را به‌روزرسانی کرده و بدهی فنی را در حالی که از هم‌ترازی منطقی اطمینان حاصل می‌کند، رفع نماید.

برنامه‌ریزی Agentic با افق طولانی

این مدل گردش‌کارهای چندمرحله‌ای را که نیاز به تصمیم‌گیری خودکار و برنامه‌ریزی در طول جلسات مداوم ۳۰ ساعته و بیشتر دارند، مدیریت می‌کند.

تأیید تحقیقات علمی

محققان از این مدل برای تأیید اثبات‌های پیچیده ریاضی و حل پرسش‌های علمی چندمرحله‌ای با دقت منطقی بالا استفاده می‌کنند.

مدل‌سازی پیشرفته ریسک مالی

این مدل هزاران صفحه داده مالی را برای شناسایی ناهنجاری‌ها و پیش‌بینی بازگشت سرمایه (ROI) با استفاده از استدلال ساختاریافته دریافت می‌کند.

مهندسی UI بین‌فریم‌ورکی

این مدل نمونه‌های اولیه فرانت‌اند کاربردی را با مدیریت وضعیت (state management) یکپارچه و منطق پیچیده، مستقیماً از دستورالعمل‌های زبان طبیعی سطح بالا می‌سازد.

نقاط قوت

محدودیت‌ها

بهره‌وری استدلالی فوق‌العاده: این مدل امتیاز ۹۲.۴٪ را در GPQA کسب کرده که با بهترین مدل‌های استدلالی تراز اول برابری می‌کند یا از آن‌ها فراتر می‌رود، آن هم با هزینه‌ای بسیار کمتر.
مدل پرچمدار صرفاً متنی: نسخه Max فاقد پشتیبانی بومی از بینایی (vision) و صوت است و برای بارهای کاری multimodal نیاز به تغییر مدل دارد.
مهارت در Agentic AI: با امتیاز ۶۹.۷ در Terminal-Bench، این مدل در هدایت محیط‌های ترمینال واقعی و مدیریت فراخوانی‌های خودکار ابزارها عالی عمل می‌کند.
شکاف در طراحی زیبایی‌شناختی: اگرچه از نظر منطقی قوی است، اما UI تولید شده و دارایی‌های خلاقانه اغلب فاقد ظرافت بصری موجود در رقبایی مانند Claude هستند.
معماری MoE در مقیاس عظیم: معماری Mixture-of-Experts با ۱.۶ تریلیون parameters، تخصص بالایی را برای کارهای متنوع بدون از دست دادن منطق کلی تضمین می‌کند.
مشکلات پایداری نسخه پیش‌نمایش: نسخه‌های پیش‌نمایش اولیه در مقایسه با بیلد‌های پایدار ۳.۶، گاهی در استخراج‌های بسیار طولانی از اسناد، دچار حلقه‌های منطقی شده‌اند.
دقت در پیروی از دستورالعمل‌ها: امتیاز ۹۵.۰٪ در IFEval توانایی برتر مدل را در پیروی از فرمت‌بندی‌های پیچیده با محدودیت‌های چندگانه و دستورالعمل‌های منطقی نشان می‌دهد.
سوگیری در زمینه منطقه‌ای: مستندات و ارجاعات فرهنگی پیش‌فرض ممکن است گاهی بازارهای شرقی را در اولویت قرار دهند که بر برخی کارهای خلاقانه خاص در غرب تأثیر می‌گذارد.

شروع سریع API

alibaba/qwen-3.7-max

مشاهده مستندات
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QWEN_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

async function runReasoningTask() {
  const completion = await client.chat.completions.create({
    model: "qwen-3.7-max",
    messages: [
      { role: "system", content: "You are a senior software architect." },
      { role: "user", content: "Analyze this legacy kernel for potential race conditions." }
    ],
    temperature: 0.1,
  });
  console.log(completion.choices[0].message.content);
}

runReasoningTask();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Qwen 3.7 Max چه می‌گویند

ببینید جامعه درباره Qwen 3.7 Max چه فکر می‌کند

مدل جدید Qwen 3.7 چین دیوانه‌کننده است. یک ماشین‌حساب بازگشت سرمایه سئو با چهار ورودی پیچیده را در کمتر از ۵ دقیقه ساخت. سیلیکون‌ولی نگران است.
Julian Goldie
youtube
Qwen3.7-Max یک مدل با ۱.۶ تریلیون parameter است. بهبود کیفیت تنها در یک ماه از نسخه ۳.۶، سریع‌ترین تکراری است که تا به حال دیده‌ام.
AJ
twitter
پیشرفت در NL2Repo داستان اصلی است. آن‌ها ادعا می‌کنند که در کدنویسی در سطح مخزن (repository-level) با Claude Opus برابری کرده‌اند.
TeortaxesTex
twitter
Qwen بالاخره دارد از حلقه‌های بیش‌ازحد فکر کردنِ مدل ۳.۵ فاصله می‌گیرد. پیش‌نمایش ۳.۷ Max بسیار قاطع‌تر است و در عین حال عمق منطقی را حفظ می‌کند.
LocalLLaMA
reddit
Qwen 3.7 Max به اولین مدلی تبدیل شد که به‌طور جدی با Claude Opus 4.6 رقابت می‌کند و در برخی موارد در کارهای فنی از آن پیشی می‌گیرد.
TechInsights
twitter
موفق شدم Qwen 3.6 27B را به‌صورت محلی اجرا کنم، اما عملکرد ابری ۳.۷ Max در استدلال‌های پیچیده در سطح دیگری است.
DevArchitect
hackernews

ویدیوهای درباره Qwen 3.7 Max

آموزش‌ها، بررسی‌ها و بحث‌های درباره Qwen 3.7 Max را تماشا کنید

فرآیند Chain of Thought در مقایسه با نسخه‌های قبلی به‌طور استثنایی سریع است.

این تنها دومین باری است که می‌بینم یک مدل به‌درستی علائم برخورد مهمات روی صحنه‌ها را پیاده‌سازی می‌کند.

ثبات منطقی در دیباگ کردن کد چندمرحله‌ای به‌طور قابل‌توجهی پایدارتر از پیش‌نمایش ۳.۶ است.

این مدل context window ۲۵۶ هزارتایی را تقریباً بدون هیچ‌گونه افت دقت در جستجو مدیریت می‌کند.

این مدل پلی میان تکمیل خودکار ایستا و برنامه‌ریزی واقعاً خودکار است.

Context window برای مدل Max برابر ۲۵۶ هزار توکن است و مهم‌تر اینکه، فقط متن است.

ما در مقایسه با مدل ۳.۵ شاهد تفکر یا بیش‌ازحد فکر کردنِ بسیار کمتری هستیم.

عملکرد در محیط‌های مبتنی بر ترمینال نشان می‌دهد که واقعاً می‌تواند یک سرور را مدیریت کند.

Qwen 3.7 Max برای بارهای کاری سازمانی که به منطق سطح بالا نیاز دارند، به‌طور قابل‌توجهی ارزان‌تر است.

این مدل با همان مشکلات هم‌ترازی فرهنگی که در برخی مدل‌های قبلی دیده می‌شد، دست‌وپنج نرم نمی‌کند.

پیش‌نمایش Qwen 3.7 Max در رتبه ۱۳ کلی در Text Arena قرار گرفت.

حالت Thinking به این معنی است که مدل قبل از پاسخ دادن، مسائل را به مراحل کوچک‌تر تقسیم می‌کند.

این مدل ماشین‌حساب‌های پیچیده را در کمتر از پنج دقیقه با مدیریت وضعیت عالی می‌سازد.

این مدل به‌طور اختصاصی برای Agentic AI بهینه‌سازی شده است، به این معنی که عمل می‌کند نه اینکه فقط صحبت کند.

این قیمت‌گذاری تیر خلاصی به سلطه OpenAI در بازار توسعه‌دهندگان است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Qwen 3.7 Max

نکات تخصصی برای کمک به شما در استفاده حداکثری از Qwen 3.7 Max و دستیابی به نتایج بهتر.

اعمال تأیید منطقی

عبارت 'قبل از ارائه کد نهایی، مراحل تفکر خود را تأیید کن' را به prompt خود اضافه کنید تا حالت تفکر تأملی بومی مدل فعال شود.

استفاده از Context Caching

برای وظایفی که شامل همان codebase حجیم هستند، از context caching استفاده کنید تا latency کاهش یافته و هزینه توکن‌های ورودی کمتر شود.

تعریف چک‌لیست‌های مرحله‌ای

برای وظایف طولانی، یک چک‌لیست شماره‌گذاری شده ارائه دهید تا اطمینان حاصل شود که مدل در طول تولیدات طولانی‌مدت، مراحل میانی را حذف نمی‌کند.

تعیین پارامترهای محدودکننده طراحی

هنگام تولید UI، متغیرهای CSS خاصی را برای استایل‌دهی ارائه دهید تا تمرکز مدل بر منطق، باعث نادیده گرفتن جنبه‌های زیبایی‌شناسی نشود.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context
$5.00/$30.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

سوالات متداول درباره Qwen 3.7 Max

پاسخ سوالات رایج درباره Qwen 3.7 Max را بیابید

Qwen 3.7 Max: پیشگام در Agentic AI با هزینه ۱.۲۰ دلار به ازای هر میلیون توکن