alibaba

Qwen 3.7 Max

Qwen 3.7 Max är Alibabas flagship AI-modell för djup reasoning och autonoma agentuppgifter, med ett 256k context window och kodningsprestanda i toppklass.

Thinking ModelKodassistentAgentic AIAlibaba CloudMoE Architecture
alibaba logoalibabaQwen320 maj 2026
Kontext
256Ktokens
Max utdata
66Ktokens
Inmatningspris
$1.20/ 1M
Utdatapris
$6.00/ 1M
Modalitet:Text
Kapaciteter:VerktygStreamingResonemang
Benchmarks
GPQA
92.4%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Qwen 3.7 Max fick 92.4% pa detta benchmark.
HLE
38.2%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Qwen 3.7 Max fick 38.2% pa detta benchmark.
MMLU
92.8%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Qwen 3.7 Max fick 92.8% pa detta benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Qwen 3.7 Max fick 82% pa detta benchmark.
SimpleQA
45%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Qwen 3.7 Max fick 45% pa detta benchmark.
IFEval
95%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Qwen 3.7 Max fick 95% pa detta benchmark.
AIME 2025
99.7%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Qwen 3.7 Max fick 99.7% pa detta benchmark.
MATH
94.8%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Qwen 3.7 Max fick 94.8% pa detta benchmark.
GSM8k
99.2%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Qwen 3.7 Max fick 99.2% pa detta benchmark.
MGSM
98%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Qwen 3.7 Max fick 98% pa detta benchmark.
SWE-Bench
60.6%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Qwen 3.7 Max fick 60.6% pa detta benchmark.
HumanEval
94.5%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Qwen 3.7 Max fick 94.5% pa detta benchmark.
LiveCodeBench
78.2%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Qwen 3.7 Max fick 78.2% pa detta benchmark.
Terminal-Bench
69.7%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Qwen 3.7 Max fick 69.7% pa detta benchmark.
ARC-AGI
12.4%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Qwen 3.7 Max fick 12.4% pa detta benchmark.

Om Qwen 3.7 Max

Lar dig om Qwen 3.7 Maxs kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Reasoning-motor i toppklass

Qwen 3.7 Max är ett massivt Mixture-of-Experts-system med cirka 1,6 biljoner parametrar. Den är utformad för att fungera som en logikfokuserad motor för ingenjörs- och forskningsuppgifter med hög komplexitet. Modellen integrerar ett Always-On Thinking-läge, vilket tvingar modellen att verifiera logik och planera stegen innan ett svar genereras. Detta arkitektoniska val minskar logisk drift avsevärt i långa utdata och ger en pålitlig grund för mjukvaruarkitektur och matematiska bevis.

Arkitektur för autonoma agenter

Denna modell fungerar som en specialiserad bas för nästa generations autonoma agenter. Den fokuserar på uppgiftshantering över långa horisonter och komplex användning av verktyg. Under interna utvärderingar bibehöll modellen logisk koherens över sessioner som varade i över 30 timmar, där den hanterade tusentals sekventiella tool calls för att lösa ingenjörsproblem på hårdvarunivå. Även om modellen är optimerad för text och kod för att bibehålla en hög densitet i sin reasoning, integreras den enkelt med externa moduler för bild eller ljud via multi-agent-orkestrering.

Effektivitet i stora sammanhang

Med ett context window på 256 000 tokens stödjer modellen storskalig analys av källkod och komplex dokumenthämtning. Den bibehåller hög precision vid informationshämtning även när windowet fylls, vilket gör den idealisk för juridisk bevisföring och RAG-arbetsflöden på företagsnivå. Den konkurrenskraftiga prisstrukturen gör att utvecklare kan använda frontier-level logik till en bråkdel av kostnaden för jämförbara modeller från västerländska labb.

Qwen 3.7 Max

Anvandningsfall for Qwen 3.7 Max

Upptack de olika satten du kan anvanda Qwen 3.7 Max for att uppna fantastiska resultat.

Autonom kernel-utveckling

Modellen genererar och optimerar hårdvaruspecifika kod-kernels för nya chip utan befintlig dokumentation genom rekursiva tool calls.

Refaktorisering av företags-repo

Qwen 3.7 Max analyserar hela legacy-mjukvarurepositorier för att uppdatera ramverk och lösa teknisk skuld samtidigt som logisk paritet säkerställs.

Agent-planering för långa horisonter

Den hanterar arbetsflöden i flera steg som kräver autonomt beslutsfattande och planering under sessioner på över 30 timmar.

Verifiering av vetenskaplig forskning

Forskare använder modellen för att verifiera komplexa matematiska bevis och lösa vetenskapliga frågor i flera steg med hög logisk precision.

Avancerad finansiell riskmodellering

Modellen bearbetar tusentals sidor finansiell data för att identifiera avvikelser och projicera ROI med strukturerad reasoning.

Cross-framework UI-utveckling

Den bygger funktionella frontend-prototyper med integrerad state management och komplex logik direkt från instruktioner på naturligt språk.

Styrkor

Begransningar

Elit-effektivitet i reasoning: Modellen uppnår 92,4 % på GPQA och matchar eller överträffar de mest avancerade reasoning-modellerna till en bråkdel av kostnaden.
Endast text som flagship: Max-varianten saknar inbyggt stöd för bild och ljud, vilket kräver ett modellbyte för multimodala arbetsflöden.
Kompetens för autonoma agenter: Med ett resultat på 69,7 på Terminal-Bench utmärker den sig i att navigera i verkliga terminalmiljöer och hantera autonoma tool calls.
Gap i estetisk design: Även om logiken är sund, saknar genererat UI och kreativa tillgångar ofta den visuella finess som syns hos konkurrenter som Claude.
Massiv MoE-skala: Mixture-of-Experts-arkitekturen med 1,6 biljoner parametrar säkerställer hög specialisering för olika uppgifter utan att förlora generell logik.
Stabilitetsproblem i preview: Tidiga preview-versioner har visat tillfälliga logikloopar vid extrahering ur extremt långa dokument jämfört med stabila 3.6-builds.
Precision i instruktionsföljande: Ett resultat på 95,0 % på IFEval visar en överlägsen förmåga att följa komplexa instruktioner med många begränsningar gällande formatering och logik.
Regional kontextbias: Dokumentation och förvalda kulturella referenser kan ibland prioritera östliga marknader, vilket påverkar vissa nischade västerländska kreativa uppgifter.

API snabbstart

alibaba/qwen-3.7-max

Visa dokumentation
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QWEN_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

async function runReasoningTask() {
  const completion = await client.chat.completions.create({
    model: "qwen-3.7-max",
    messages: [
      { role: "system", content: "You are a senior software architect." },
      { role: "user", content: "Analyze this legacy kernel for potential race conditions." }
    ],
    temperature: 0.1,
  });
  console.log(completion.choices[0].message.content);
}

runReasoningTask();

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Qwen 3.7 Max

Se vad communityt tycker om Qwen 3.7 Max

Kinas nya Qwen 3.7 är galen. Den byggde en SEO ROI-kalkylator med fyra komplexa input-fält på under 5 minuter. Silicon Valley är nervösa.
Julian Goldie
youtube
Qwen3.7-Max är en modell med 1,6 biljoner parametrar. Kvalitetsförbättringen på bara en månad sedan 3.6 är den snabbaste iteration jag någonsin sett.
AJ
twitter
Framstegen inom NL2Repo är den riktiga storyn. De påstår sig ha matchat Claude Opus i kodning på repo-nivå.
TeortaxesTex
twitter
Qwen rör sig äntligen bort från 3.5-versionens loopar av överanalysering. 3.7 Max-preview är mycket mer beslutsam samtidigt som den bibehåller logiskt djup.
LocalLLaMA
reddit
Qwen 3.7 Max blev precis den första modellen att på allvar utmana, och i vissa fall slå, Claude Opus 4.6 i tekniska uppgifter.
TechInsights
twitter
Lyckades köra QWEN 3.6 27B lokalt, men 3.7 Max molnprestanda är på en annan nivå för komplex reasoning.
DevArchitect
hackernews

Videor om Qwen 3.7 Max

Se handledningar, recensioner och diskussioner om Qwen 3.7 Max

Chain of Thought-processen är exceptionellt snabb jämfört med tidigare iterationer.

Detta är bara andra gången jag sett en modell korrekt implementera effekten av ammunition på omgivningen.

Den logiska konsekvensen vid kod-debugging i flera steg är märkbart stabilare än 3.6-preview.

Den hanterar context window på 256k med nästan noll förlust av information.

Denna modell representerar bryggan mellan statisk completion och genuin autonom planering.

Context window är 256K tokens för Max, och viktigt att notera är att den bara hanterar text.

Vi observerar en hel del mindre 'tänkande' eller överanalyserande jämfört med 3.5.

Prestandan i terminalbaserade miljöer tyder på att den faktiskt kan hantera en server.

Qwen 3.7 Max är betydligt billigare för företagsarbetsflöden som kräver logik på hög nivå.

Den kämpar inte med samma problem gällande kulturell anpassning som setts hos tidigare modeller.

Qwen 3.7 Max Preview landade på plats 13 totalt i Text Arena.

Thinking mode innebär att modellen bryter ner problem i mindre steg innan den svarar.

Den bygger komplexa kalkylatorer på under fem minuter med perfekt state management.

Den är specifikt optimerad för Agentic AI, vilket innebär att den agerar istället för att bara prata.

Prissättningen är en direkt attack på OpenAIs dominans på utvecklarmarknaden.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Qwen 3.7 Max

Experttips for att hjalpa dig fa ut det mesta av Qwen 3.7 Max och uppna battre resultat.

Framtvinga logisk verifiering

Inkludera "Verifiera dina tankesteg innan du tillhandahåller den slutgiltiga koden" för att aktivera modellens inbyggda deliberativa reasoning-läge.

Använd context caching

För uppgifter som involverar samma omfattande kodbas, använd context caching för att minska latency och sänka kostnaden för dina input tokens.

Definiera fas-checklistor

Tillhandahåll en numrerad checklista för långa uppgifter för att säkerställa att modellen inte hoppar över mellanliggande steg under genereringar med lång räckvidd.

Begränsa designparametrar

Vid generering av UI, ange specifika CSS-variabler för styling för att kompensera för modellens fokus på logik framför estetik.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context
$5.00/$30.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Vanliga fragor om Qwen 3.7 Max

Hitta svar pa vanliga fragor om Qwen 3.7 Max