alibaba

Qwen 3.7 Max

Qwen 3.7 Max là model AI flagship của Alibaba dành cho các tác vụ suy luận sâu và autonomous agent, với context window 256k và hiệu suất lập trình hàng đầu.

Thinking ModelHỗ trợ lập trìnhAgentic AIAlibaba CloudKiến trúc MoE
alibaba logoalibabaQwen320 tháng 5, 2026
Ngu canh
256Ktoken
Dau ra toi da
66Ktoken
Gia dau vao
$1.20/ 1M
Gia dau ra
$6.00/ 1M
Phuong thuc:Text
Kha nang:Cong cuTruyen truc tiepSuy luan
Diem chuan
GPQA
92.4%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Qwen 3.7 Max dat 92.4% trong benchmark nay.
HLE
38.2%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Qwen 3.7 Max dat 38.2% trong benchmark nay.
MMLU
92.8%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Qwen 3.7 Max dat 92.8% trong benchmark nay.
MMLU Pro
82%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Qwen 3.7 Max dat 82% trong benchmark nay.
SimpleQA
45%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Qwen 3.7 Max dat 45% trong benchmark nay.
IFEval
95%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Qwen 3.7 Max dat 95% trong benchmark nay.
AIME 2025
99.7%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Qwen 3.7 Max dat 99.7% trong benchmark nay.
MATH
94.8%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Qwen 3.7 Max dat 94.8% trong benchmark nay.
GSM8k
99.2%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Qwen 3.7 Max dat 99.2% trong benchmark nay.
MGSM
98%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Qwen 3.7 Max dat 98% trong benchmark nay.
SWE-Bench
60.6%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Qwen 3.7 Max dat 60.6% trong benchmark nay.
HumanEval
94.5%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Qwen 3.7 Max dat 94.5% trong benchmark nay.
LiveCodeBench
78.2%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Qwen 3.7 Max dat 78.2% trong benchmark nay.
Terminal-Bench
69.7%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Qwen 3.7 Max dat 69.7% trong benchmark nay.
ARC-AGI
12.4%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Qwen 3.7 Max dat 12.4% trong benchmark nay.

Ve Qwen 3.7 Max

Tim hieu ve kha nang cua Qwen 3.7 Max, tinh nang va cach no co the giup ban dat ket qua tot hon.

Công cụ suy luận cấp độ cao

Qwen 3.7 Max là một hệ thống Mixture-of-Experts khổng lồ chứa khoảng 1,6 nghìn tỷ parameters. Nó được thiết kế để vận hành như một công cụ ưu tiên logic cho các tác vụ kỹ thuật và nghiên cứu phức tạp. Model tích hợp chế độ Always-On Thinking, buộc model phải xác minh logic và lập kế hoạch các bước trước khi đưa ra phản hồi. Lựa chọn kiến trúc này giảm thiểu đáng kể sự chệch hướng logic trong các câu trả lời dài và cung cấp nền tảng đáng tin cậy cho kiến trúc phần mềm và chứng minh toán học.

Kiến trúc cho Autonomous Agency

Model này đóng vai trò là cơ sở chuyên biệt cho thế hệ các autonomous agents tiếp theo. Nó tập trung vào quản lý tác vụ dài hạn và sử dụng các công cụ phức tạp. Trong các đánh giá nội bộ, model duy trì sự mạch lạc logic xuyên suốt các phiên làm việc kéo dài hơn 30 giờ, quản lý hàng nghìn lượt tool call tuần tự để giải quyết các vấn đề kỹ thuật ở mức độ phần cứng. Mặc dù được tối ưu hóa cho văn bản và code để duy trì mật độ suy luận cao, nó vẫn dễ dàng tích hợp với các module vision hoặc audio bên ngoài thông qua việc điều phối đa tác nhân (multi-agent orchestration).

Hiệu quả trong ngữ cảnh lớn

Với context window 256.000 token, model hỗ trợ phân tích kho lưu trữ quy mô lớn và truy xuất tài liệu phức tạp. Nó duy trì độ chính xác truy xuất cao ngay cả khi cửa sổ ngữ cảnh đầy, giúp nó trở nên lý tưởng cho các quy trình RAG doanh nghiệp và tìm kiếm pháp lý. Cấu trúc giá cạnh tranh cho phép các nhà phát triển triển khai logic cấp frontier với chi phí chỉ bằng một phần nhỏ so với các model tương đương từ các phòng thí nghiệm phương Tây.

Qwen 3.7 Max

Truong hop su dung cho Qwen 3.7 Max

Kham pha cac cach khac nhau ban co the su dung Qwen 3.7 Max de dat ket qua tuyet voi.

Kỹ thuật Kernel tự động

Model tạo và tối ưu hóa các code kernel đặc thù cho phần cứng mới mà không cần tài liệu sẵn có, thông qua việc sử dụng các công cụ đệ quy.

Tái cấu trúc Repo doanh nghiệp

Qwen 3.7 Max phân tích toàn bộ các kho lưu trữ phần mềm cũ để cập nhật framework và giải quyết nợ kỹ thuật trong khi vẫn đảm bảo sự tương đương về logic.

Lập kế hoạch Agent dài hạn

Quản lý các quy trình làm việc đa bước đòi hỏi khả năng ra quyết định tự động và lập kế hoạch xuyên suốt trong các phiên làm việc kéo dài hơn 30 giờ.

Xác thực nghiên cứu khoa học

Các nhà nghiên cứu sử dụng model để xác minh các chứng minh toán học phức tạp và giải quyết các truy vấn khoa học đa giai đoạn với độ chính xác logic cao.

Mô hình hóa rủi ro tài chính nâng cao

Model xử lý hàng nghìn trang dữ liệu tài chính để xác định các điểm bất thường và dự báo ROI với khả năng suy luận có cấu trúc.

Kỹ thuật UI đa framework

Xây dựng các bản mẫu frontend chức năng với hệ thống quản lý trạng thái tích hợp và logic phức tạp trực tiếp từ các hướng dẫn ngôn ngữ tự nhiên cấp cao.

Diem manh

Han che

Hiệu suất suy luận vượt trội: Model đạt 92,4% trên GPQA, ngang bằng hoặc vượt qua các model suy luận hàng đầu với chi phí chỉ bằng một phần nhỏ.
Model flagship chỉ hỗ trợ văn bản: Phiên bản Max thiếu hỗ trợ native cho vision và audio, yêu cầu chuyển đổi model cho các tác vụ multimodal.
Khả năng làm Autonomous Agent chuyên nghiệp: Với số điểm 69,7 trên Terminal-Bench, model thể hiện sự xuất sắc trong việc điều hướng môi trường terminal thực tế và quản lý các tool call tự động.
Hạn chế về thiết kế thẩm mỹ: Mặc dù logic chặt chẽ, các giao diện UI và tài sản sáng tạo được tạo ra thường thiếu sự bóng bẩy về hình ảnh như các đối thủ như Claude.
Kiến trúc MoE quy mô lớn: Kiến trúc Mixture-of-Experts với 1,6 nghìn tỷ parameters đảm bảo mức độ chuyên biệt hóa cao cho các tác vụ đa dạng mà vẫn giữ được logic tổng quát.
Vấn đề ổn định của bản Preview: Các bản preview sớm đôi khi gặp vòng lặp logic trong việc trích xuất tài liệu cực dài so với các bản stable 3.6.
Độ chính xác khi tuân thủ hướng dẫn: Số điểm 95,0% trên IFEval chứng minh khả năng vượt trội trong việc tuân thủ các hướng dẫn về định dạng và logic phức tạp với nhiều ràng buộc.
Thiên kiến ngữ cảnh khu vực: Tài liệu và các tham chiếu văn hóa mặc định đôi khi ưu tiên thị trường phương Đông, ảnh hưởng đến một số tác vụ sáng tạo ở thị trường phương Tây.

Bat dau nhanh API

alibaba/qwen-3.7-max

Xem tai lieu
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QWEN_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

async function runReasoningTask() {
  const completion = await client.chat.completions.create({
    model: "qwen-3.7-max",
    messages: [
      { role: "system", content: "Bạn là một kiến trúc sư phần mềm cấp cao." },
      { role: "user", content: "Phân tích kernel cũ này để tìm các race condition tiềm ẩn." }
    ],
    temperature: 0.1,
  });
  console.log(completion.choices[0].message.content);
}

runReasoningTask();

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Qwen 3.7 Max

Xem cong dong nghi gi ve Qwen 3.7 Max

Qwen 3.7 mới của Trung Quốc thật điên rồ. Nó đã xây dựng một bộ tính toán ROI SEO với 4 đầu vào phức tạp trong chưa đầy 5 phút. Thung lũng Silicon đang bắt đầu lo lắng.
Julian Goldie
youtube
Qwen3.7-Max là một model với 1,6 nghìn tỷ parameters. Sự cải thiện chất lượng chỉ trong một tháng kể từ bản 3.6 là bước tiến nhanh nhất mà tôi từng thấy.
AJ
twitter
Tiến bộ trong NL2Repo mới là câu chuyện chính. Họ khẳng định đã đạt được trình độ lập trình ở cấp độ repository ngang bằng với Claude Opus.
TeortaxesTex
twitter
Qwen cuối cùng cũng thoát khỏi các vòng lặp overthinking của bản 3.5. Bản preview 3.7 Max quyết đoán hơn nhiều trong khi vẫn giữ được độ sâu logic.
LocalLLaMA
reddit
Qwen 3.7 Max vừa trở thành model đầu tiên thực sự cạnh tranh và trong một số trường hợp đánh bại Claude Opus 4.6 trong các tác vụ kỹ thuật.
TechInsights
twitter
Đã chạy được QWEN 3.6 27B cục bộ, nhưng hiệu suất cloud của 3.7 Max thực sự ở một đẳng cấp khác về suy luận phức tạp.
DevArchitect
hackernews

Video ve Qwen 3.7 Max

Xem huong dan, danh gia va thao luan ve Qwen 3.7 Max

Quy trình Chain of Thought nhanh hơn đáng kể so với các phiên bản trước.

Đây là lần thứ hai tôi thấy một model thể hiện chính xác các vết va chạm của đạn trên phong cảnh.

Sự nhất quán về logic trong việc gỡ lỗi code nhiều lượt ổn định hơn rõ rệt so với bản preview 3.6.

Nó xử lý context window 256k với gần như không mất mát dữ liệu (needle-in-a-haystack).

Model này là cầu nối giữa việc hoàn thành tĩnh và lập kế hoạch tự động thực sự.

Context window là 256K token cho bản Max và quan trọng là nó chỉ xử lý văn bản.

Chúng ta thấy lượng suy nghĩ hoặc suy nghĩ thừa (overthinking) ít hơn hẳn so với bản 3.5.

Hiệu suất trong các môi trường terminal cho thấy nó thực sự có thể quản lý một máy chủ.

Qwen 3.7 Max rẻ hơn đáng kể cho các khối lượng công việc doanh nghiệp cần logic cao cấp.

Nó không gặp phải các vấn đề về định hướng văn hóa giống như một số model trước đó.

Qwen 3.7 Max Preview đứng thứ 13 tổng thể trên Text Arena.

Chế độ Thinking nghĩa là model chia nhỏ các vấn đề thành các bước nhỏ trước khi trả lời.

Nó xây dựng các máy tính phức tạp trong chưa đầy 5 phút với khả năng quản lý trạng thái hoàn hảo.

Model này được tối ưu hóa riêng cho Agentic AI, nghĩa là nó hành động thay vì chỉ nói chuyện.

Mức giá này là một đòn đánh trực diện vào sự thống trị của OpenAI trong thị trường lập trình viên.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Qwen 3.7 Max

Meo chuyen gia giup ban tan dung toi da Qwen 3.7 Max va dat ket qua tot hon.

Thực thi xác thực logic

Hãy thêm yêu cầu 'Xác minh các bước suy nghĩ của bạn trước khi cung cấp code cuối cùng' để kích hoạt chế độ suy luận chuyên sâu của model.

Sử dụng context caching

Đối với các tác vụ liên quan đến cùng một codebase khổng lồ, hãy sử dụng context caching để giảm latency và chi phí cho input tokens.

Định nghĩa danh sách kiểm tra (checklists) theo giai đoạn

Cung cấp danh sách kiểm tra được đánh số cho các tác vụ dài để đảm bảo model không bỏ sót các bước trung gian trong quá trình tạo nội dung dài.

Thiết kế tham số ràng buộc

Khi tạo UI, hãy cung cấp các biến CSS cụ thể để tạo kiểu, nhằm bù đắp cho việc model tập trung vào logic hơn là thẩm mỹ.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context
$5.00/$30.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Cau hoi thuong gap ve Qwen 3.7 Max

Tim cau tra loi cho cac cau hoi thuong gap ve Qwen 3.7 Max