alibaba

Qwen 3.7 Max

Qwen 3.7 Max is Alibaba’s flagship AI-model voor deep reasoning en autonome agenttaken, met een 256k context window en top-tier prestaties bij het programmeren.

Thinking ModelCoding AssistantAgentic AIAlibaba CloudMoE Architecture
alibaba logoalibabaQwen320 mei 2026
Context
256Ktokens
Max output
66Ktokens
Invoerprijs
$1.20/ 1M
Uitvoerprijs
$6.00/ 1M
Modaliteit:Text
Mogelijkheden:ToolsStreamingRedeneren
Benchmarks
GPQA
92.4%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Qwen 3.7 Max scoorde 92.4% op deze benchmark.
HLE
38.2%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Qwen 3.7 Max scoorde 38.2% op deze benchmark.
MMLU
92.8%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Qwen 3.7 Max scoorde 92.8% op deze benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Qwen 3.7 Max scoorde 82% op deze benchmark.
SimpleQA
45%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Qwen 3.7 Max scoorde 45% op deze benchmark.
IFEval
95%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Qwen 3.7 Max scoorde 95% op deze benchmark.
AIME 2025
99.7%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Qwen 3.7 Max scoorde 99.7% op deze benchmark.
MATH
94.8%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Qwen 3.7 Max scoorde 94.8% op deze benchmark.
GSM8k
99.2%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Qwen 3.7 Max scoorde 99.2% op deze benchmark.
MGSM
98%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Qwen 3.7 Max scoorde 98% op deze benchmark.
SWE-Bench
60.6%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Qwen 3.7 Max scoorde 60.6% op deze benchmark.
HumanEval
94.5%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Qwen 3.7 Max scoorde 94.5% op deze benchmark.
LiveCodeBench
78.2%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Qwen 3.7 Max scoorde 78.2% op deze benchmark.
Terminal-Bench
69.7%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Qwen 3.7 Max scoorde 69.7% op deze benchmark.
ARC-AGI
12.4%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Qwen 3.7 Max scoorde 12.4% op deze benchmark.

Over Qwen 3.7 Max

Leer over de mogelijkheden van Qwen 3.7 Max, functies en hoe het je kan helpen betere resultaten te behalen.

Reasoning-engine van de hoogste orde

Qwen 3.7 Max is een massaal Mixture-of-Experts systeem met ongeveer 1,6 biljoen parameters. Het is ontworpen om te functioneren als een logica-first engine voor engineering- en onderzoekstaken met een hoge complexiteit. Het model integreert een eigen Always-On Thinking-modus, die het model dwingt om logica te verifiëren en stappen te plannen voordat er een reactie wordt gegenereerd. Deze architecturale keuze vermindert logische drift in lange output aanzienlijk en biedt een betrouwbare basis voor softwarearchitectuur en wiskundige bewijsvoering.

Architectuur voor autonome agency

Dit model dient als een gespecialiseerde basis voor de volgende generatie autonome agents. Het richt zich op taakbeheer op de lange termijn en complex tool usage. Tijdens interne evaluaties behield het model logische samenhang gedurende sessies van meer dan 30 uur, waarbij duizenden opeenvolgende tool calls werden beheerd om problemen op hardware-niveau op te lossen. Hoewel het model is geoptimaliseerd voor tekst en code om een hoge reasoning-dichtheid te behouden, kan het via multi-agent orchestratie eenvoudig worden geïntegreerd met externe vision- of audio-modules.

Efficiëntie in grote contexten

Met een context window van 256.000 tokens ondersteunt het model analyse van grootschalige repositories en complexe document-retrieval. Het behoudt een hoge nauwkeurigheid bij retrieval, zelfs wanneer het window volloopt, wat het ideaal maakt voor juridische discovery en RAG-workflows op bedrijfsniveau. De concurrerende prijsstructuur stelt ontwikkelaars in staat om frontier-level logica in te zetten tegen een fractie van de kosten van vergelijkbare modellen uit westerse laboratoria.

Qwen 3.7 Max

Gebruikscases voor Qwen 3.7 Max

Ontdek de verschillende manieren waarop je Qwen 3.7 Max kunt gebruiken voor geweldige resultaten.

Autonome Kernel Engineering

Het model genereert en optimaliseert hardware-specifieke code kernels voor nieuwe chips zonder bestaande documentatie door recursieve tool calls te gebruiken.

Refactoring van bedrijfsrepositories

Qwen 3.7 Max analyseert volledige legacy software-repositories om frameworks bij te werken en technische schuld op te lossen, terwijl de logische pariteit gewaarborgd blijft.

Long-Horizon Agent Planning

Het beheert workflows met meerdere stappen die autonoom besluitvormings- en planningsvermogen vereisen gedurende sessies van meer dan 30 uur.

Verificatie van wetenschappelijk onderzoek

Onderzoekers gebruiken het model om complexe wiskundige bewijzen te verifiëren en wetenschappelijke vragen in meerdere fasen met hoge logische nauwkeurigheid op te lossen.

Geavanceerde financiële risicomodellering

Het model verwerkt duizenden pagina's aan financiële gegevens om afwijkingen te identificeren en de ROI te projecteren met gestructureerde reasoning.

Cross-Framework UI Engineering

Het bouwt functionele frontend-prototypes met geïntegreerd state management en complexe logica, direct op basis van instructies in natuurlijke taal.

Sterke punten

Beperkingen

Elite Reasoning Efficiëntie: Het model levert 92,4% op GPQA, wat gelijk is aan of beter is dan reasoning-modellen uit het topsegment, tegen een fractie van de kosten.
Alleen tekst voor flagship: De Max-variant mist ingebouwde vision- en audio-ondersteuning, waardoor een andere modelkeuze nodig is voor multimodale workloads.
Autonome Agent Vaardigheden: Met een score van 69,7 op Terminal-Bench blinkt het uit in het navigeren door echte terminal-omgevingen en het beheren van autonome tool calls.
Kloof in esthetisch ontwerp: Hoewel logisch correct, missen gegenereerde UI en creatieve assets vaak de visuele afwerking die bij concurrenten zoals Claude te zien is.
Massale MoE-schaal: De Mixture-of-Experts architectuur met 1,6T parameters zorgt voor een hoge specialisatie voor diverse taken zonder algemene logica te verliezen.
Stabiliteitsproblemen in preview: Vroege preview-versies vertoonden af en toe logische lussen bij extreem lange document-extracties in vergelijking met de stabiele 3.6-builds.
Nauwkeurigheid in het volgen van instructies: Een score van 95,0% op IFEval toont een superieur vermogen om complexe, meervoudige beperkingen qua opmaak en logische instructies op te volgen.
Regionale context bias: Documentatie en standaard culturele referenties kunnen af en toe prioriteit geven aan oosterse markten, wat van invloed kan zijn op sommige niche westerse creatieve taken.

API snelstart

alibaba/qwen-3.7-max

Bekijk documentatie
alibaba SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QWEN_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

async function runReasoningTask() {
  const completion = await client.chat.completions.create({
    model: "qwen-3.7-max",
    messages: [
      { role: "system", content: "Je bent een senior software architect." },
      { role: "user", content: "Analyseer deze legacy kernel op mogelijke race conditions." }
    ],
    temperature: 0.1,
  });
  console.log(completion.choices[0].message.content);
}

runReasoningTask();

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Qwen 3.7 Max

Bekijk wat de community denkt over Qwen 3.7 Max

China's nieuwe Qwen 3.7 is gek. Het bouwde een SEO ROI-calculator met vier complexe inputs in minder dan 5 minuten. Silicon Valley wordt zenuwachtig.
Julian Goldie
youtube
Qwen3.7-Max is een model met 1,6T parameters. De kwaliteitsverbetering in slechts één maand sinds 3.6 is de snelste iteratie die ik ooit heb gezien.
AJ
twitter
De vooruitgang in NL2Repo is het echte nieuws. Ze beweren dat ze Claude Opus hebben geëvenaard op het gebied van coding op repository-niveau.
TeortaxesTex
twitter
Qwen stapt eindelijk af van de overdenkende lussen van 3.5. De 3.7 Max preview is veel besluitvaardiger terwijl de diepgang in logica behouden blijft.
LocalLLaMA
reddit
Qwen 3.7 Max is zojuist het eerste model geworden dat serieus de concurrentie aangaat met Claude Opus 4.6 bij technische taken, en deze in sommige gevallen zelfs overtreft.
TechInsights
twitter
Gelukt om QWEN 3.6 27B lokaal te draaien, maar de cloudprestaties van 3.7 Max zijn voor complexe reasoning van een heel ander niveau.
DevArchitect
hackernews

Video's over Qwen 3.7 Max

Bekijk tutorials, reviews en discussies over Qwen 3.7 Max

Het Chain of Thought-proces is uitzonderlijk snel in vergelijking met eerdere iteraties.

Dit is pas de tweede keer dat ik een model correct impactmarkeringen van munitie op landschappen zie implementeren.

De logische consistentie bij het debuggen van code over meerdere beurten is merkbaar stabieler dan in de 3.6-preview.

Het verwerkt de 256k context window met vrijwel nul verlies van informatie ('needle-in-a-haystack').

Dit model vormt de brug tussen statische voltooiing en echte autonome planning.

De context window is 256K tokens voor Max, en belangrijk: het is alleen tekst.

We zien aanzienlijk minder 'denkwerk' of overdenken in vergelijking met 3.5.

De prestaties in terminal-gebaseerde omgevingen suggereren dat het daadwerkelijk een server kan beheren.

Qwen 3.7 Max is aanzienlijk goedkoper voor zakelijke workloads die high-end logica vereisen.

Het heeft geen moeite met dezelfde culturele afstemmingsproblemen die bij eerdere modellen werden gezien.

Qwen 3.7 Max Preview belandde op plek 13 in de Text Arena.

Thinking-modus betekent dat het model problemen opdeelt in kleinere stappen voordat het antwoord geeft.

Het bouwt complexe rekenmachines in minder dan vijf minuten met perfect state management.

Dit is specifiek geoptimaliseerd voor Agentic AI, wat betekent dat het actie onderneemt in plaats van alleen maar praat.

De prijsstelling is een directe aanval op de dominantie van OpenAI in de ontwikkelaarsmarkt.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Qwen 3.7 Max

Experttips om je te helpen het maximale uit Qwen 3.7 Max te halen en betere resultaten te behalen.

Logische verificatie afdwingen

Voeg 'Verifieer je denkstappen voordat je de uiteindelijke code geeft' toe om de ingebouwde deliberatieve reasoning-modus van het model te activeren.

Gebruik context caching

Gebruik voor taken waarbij dezelfde enorme codebase betrokken is, context caching om de latency te verminderen en je uitgaven aan input tokens te verlagen.

Definieer fase-checklists

Geef een genummerde checklist voor langdurige taken om te garanderen dat het model geen tussenstappen overslaat tijdens generaties die veel tijd in beslag nemen.

Beperk ontwerpparameters

Geef bij het genereren van UI specifieke CSS-variabelen op voor de styling, om de focus van het model op logica boven esthetiek te compenseren.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.5

OpenAI

GPT-5.5 is OpenAI's flagship frontier model with a 1M context window and five reasoning effort levels, optimized for autonomous agentic workflows and coding.

1M context
$5.00/$30.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Veelgestelde vragen over Qwen 3.7 Max

Vind antwoorden op veelvoorkomende vragen over Qwen 3.7 Max