alibaba

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview는 1M context, 기본 Thinking Mode, 그리고 agentic coding 및 reasoning 분야에서 SOTA 점수를 자랑하는 Alibaba의 flagship MoE 모델입니다.

MoEAgentic Coding1M ContextFrontier ModelAlibaba Qwen
alibaba logoalibabaQwen 3.62026년 4월 20일
컨텍스트
1.0M토큰
최대 출력
8K토큰
입력 가격
$1.25/ 1M
출력 가격
$10.00/ 1M
모달리티:TextImageVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
86%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 86%점을 기록했습니다.
HLE
51%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 51%점을 기록했습니다.
MMLU
83%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Qwen3.6-Max-Preview이 이 벤치마크에서 83%점을 기록했습니다.
MMLU Pro
79%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Qwen3.6-Max-Preview이 이 벤치마크에서 79%점을 기록했습니다.
SimpleQA
52%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 52%점을 기록했습니다.
IFEval
75%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 75%점을 기록했습니다.
AIME 2025
93%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Qwen3.6-Max-Preview이 이 벤치마크에서 93%점을 기록했습니다.
MATH
95%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Qwen3.6-Max-Preview이 이 벤치마크에서 95%점을 기록했습니다.
GSM8k
98%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Qwen3.6-Max-Preview이 이 벤치마크에서 98%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Qwen3.6-Max-Preview이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
86%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 86%점을 기록했습니다.
SWE-Bench
73%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 73%점을 기록했습니다.
HumanEval
91%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Qwen3.6-Max-Preview이 이 벤치마크에서 91%점을 기록했습니다.
LiveCodeBench
79%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 79%점을 기록했습니다.
MMMU
82%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Qwen3.6-Max-Preview이 이 벤치마크에서 82%점을 기록했습니다.
MMMU Pro
75%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Qwen3.6-Max-Preview이 이 벤치마크에서 75%점을 기록했습니다.
ChartQA
85%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 85%점을 기록했습니다.
DocVQA
89%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Qwen3.6-Max-Preview이 이 벤치마크에서 89%점을 기록했습니다.
Terminal-Bench
65%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 65%점을 기록했습니다.
ARC-AGI
14%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Qwen3.6-Max-Preview이 이 벤치마크에서 14%점을 기록했습니다.

Qwen3.6-Max-Preview 소개

Qwen3.6-Max-Preview의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

Qwen3.6-Max-Preview는 Alibaba의 고성능 AI 시리즈의 다음 단계를 나타내는 flagship proprietary LLM입니다. 희소(sparse) Mixture-of-Experts (MoE) 아키텍처를 사용하여, 운영 효율성을 유지하면서도 수조 개의 매개변수를 가진 시스템 수준의 reasoning 깊이를 달성했습니다. 이 모델은 agentic coding, 세계 지식, 그리고 복잡한 지시 이행에 최적화되어 있습니다.

이 모델의 가장 큰 특징은 시스템이 최종 답변을 제공하기 전에 가시적인 내부 chain-of-thought을 생성할 수 있는 기본 Thinking Mode입니다. 이러한 투명성은 논리 계획 및 오류 수정 단계를 명확하게 보여주기 때문에 자율 agent를 구축하는 개발자들에게 매우 가치 있습니다. 방대한 100만 tokens context window와 결합하여, 단 한 번의 통과로 전체 프로젝트 저장소나 방대한 문서 라이브러리를 처리할 수 있습니다.

Alibaba Cloud Model Studio에서 호스팅되는 Qwen3.6-Max-Preview는 업계 표준 프로토콜을 지원하며 OpenAI 스타일의 API 사양과 호환됩니다. 이 모델은 multimodal 데이터 분석 및 강력한 agentic 워크플로우를 위해 frontier급 AI 기능을 필요로 하는 기업들에게 서구권 closed-source 모델을 대체할 고성능 선택지를 제공합니다.

Qwen3.6-Max-Preview

Qwen3.6-Max-Preview 사용 사례

Qwen3.6-Max-Preview을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

전체 코드베이스를 탐색하고, 아키텍처 변경을 계획하며, 여러 파일에 걸친 버그를 수정할 수 있는 코딩 agent로 모델을 배포하세요.

대규모 기술 분석

1M tokens context window를 활용하여 RAG 제한 없이 전체 문서 세트나 법적 프레임워크를 수집해 심층 분석하세요.

복잡한 reasoning 및 계획 수립

기본 Thinking Mode를 활용하여 정확성을 위해 다단계 내부 계획이 필요한 고차원적 수학 문제를 해결하세요.

Multimodal 콘텐츠 이해

정적 이미지와 복잡한 비디오 시퀀스를 모두 분석하여 데이터를 추출하고 동적인 시각적 이벤트를 요약하세요.

대화형 터미널 작업

최적화된 Terminal-Bench 성능을 활용하여 AI가 셸 및 CLI 환경과 직접 상호 작용할 수 있는 도구를 구축하세요.

기업용 agentic 워크플로우

자동화를 위해 높은 지시 신뢰성과 정교한 tool-calling이 요구되는 복잡한 비즈니스 파이프라인에 모델을 통합하세요.

강점

제한

세계 최고 수준의 코딩 능력: SWE-bench Pro에서 57.3% 점수를 달성하여 Claude 4.5 Opus와 같은 주요 frontier model을 능가하는 자율 소프트웨어 작업 수행력을 갖췄습니다.
Closed Source 제한: Qwen 3.6의 Medium 버전과 달리, Max-Preview는 proprietary이며 로컬 하드웨어에서 직접 호스팅할 수 없습니다.
압도적인 1M tokens context: 기존 아키텍처의 일반적인 context 저하 문제 없이 단일 prompt 내에서 방대한 데이터셋과 전체 기술 라이브러리를 처리합니다.
높은 output token 비용: 100만 output tokens당 $10.00의 가격은 input 가격보다 8배 높으며, 긴 reasoning chain 사용 시 ingestion보다 높은 비용이 발생합니다.
투명한 기본 reasoning: 내장된 Thinking Mode는 내부 논리를 노출하여 복잡한 문제 해결에서 더 높은 신뢰성을 제공하고 디버깅을 용이하게 합니다.
지식 컷오프 제약: 정적 preview 모델로서, 2026년 초 학습 데이터 이후의 이벤트나 라이브러리 업데이트에 대한 실시간 인식이 부족합니다.
공격적인 가격 포지셔닝: 100만 input tokens당 $1.25라는 가격으로, 서구권 proprietary 모델들의 일부분에 불과한 비용으로 frontier급 성능을 제공합니다.
지역별 API latency: 배포 지역에 따라, 국제 사용자들은 고도로 최적화된 로컬 변형 모델보다 더 높은 latency를 경험할 수 있습니다.

API 빠른 시작

alibaba/qwen3.6-max-preview

문서 보기
alibaba SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  base_url: 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'qwen3.6-max-preview',
    messages: [{ role: 'user', content: 'Design a system architecture for a real-time AI agent.' }],
    extra_body: { enable_thinking: true },
    stream: true
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Qwen3.6-Max-Preview에 대한 사람들의 의견

커뮤니티가 Qwen3.6-Max-Preview에 대해 어떻게 생각하는지 확인하세요

대규모 서버 팜에서 실행되는 모델에서 기대할 수 있는 성능을 이제 데스크탑에서 경험할 수 있습니다.
softtechhubus
reddit
Qwen3.6-Max-Preview가 SWE-Bench Pro에서 Claude Opus 4.5를 이겼습니다. 중국의 발전 속도가 엄청나네요.
BridgeMind
twitter
100만 tokens당 $1.25라는 가격은 대규모 데이터 수집 시 Claude보다 현저히 저렴합니다.
TechReviewer2026
reddit
Thinking Mode가 기본 상태로 포함되어 있다는 점은 agentic 신뢰성을 위해 매우 의미 있는 설계 선택입니다.
DevGuru
twitter
Qwen은 새로운 최고급 proprietary flagship 모델로 Qwen 3.6 Max Preview를 출시했습니다.
AICodeKing
youtube
Plus 모델에 비해 개선된 agentic 코딩 및 실제 agent 신뢰성을 보여줍니다.
Codedigipt
youtube

Qwen3.6-Max-Preview에 대한 동영상

Qwen3.6-Max-Preview에 대한 튜토리얼, 리뷰 및 토론 시청

Qwen은 새로운 최고급 proprietary flagship 모델로 Qwen 3.6 Max Preview를 출시했습니다.

이 모델은 SkillsBench 및 Terminal-Bench 2.0과 같은 코딩-agent benchmark에서 강력한 도약을 보여줍니다.

Qwen은 Claude 4.5 Opus와 같은 모델들을 상대로 고성능 영역에서 진지하게 경쟁하려 하고 있습니다.

이 모델은 세계 지식과 지시 이행 능력 면에서 의미 있는 개선을 나타냅니다.

SWE-bench에서의 성능 향상이 이 모델을 Plus 변형 버전과 차별화하는 핵심 요소입니다.

이 benchmark 이야기는 hosted Max Preview가 open-weight 제품군과 차별화된다는 점을 강조합니다.

모델 가중치 이상의 생태계 깊이를 판단하기 위해 Qwen Code 페이지와 repo 표면을 사용합니다.

thinking mode는 작년의 o1 스타일 모델들에 비해 놀라울 정도로 빠릅니다.

이 제품은 agentic 작업을 위해 신뢰할 수 있는 API가 필요한 엔터프라이즈 개발자들을 위해 설계되었습니다.

multimodal vision 성능은 일부 문서 분석 테스트에서 Gemini 2를 따라잡고 있습니다.

이 영상은 Qwen의 차기 flagship 모델을 미리 살펴볼 수 있는 Qwen3.6-Max-Preview를 소개합니다.

Plus 모델에 비해 개선된 agentic 코딩 및 실제 agent 신뢰성을 보여줍니다.

1M context window는 초기 Qwen 2 버전에서 보았던 것보다 훨씬 안정적입니다.

코딩 작업이 많다면 현재 Qwen 3.6 Max가 benchmark 선두주자입니다.

가격 또한 flagship closed-source 모델임에도 매우 경쟁력이 있습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Qwen3.6-Max-Preview 프로 팁

Qwen3.6-Max-Preview을 최대한 활용하기 위한 전문가 팁.

Internal Reasoning 활성화

API 요청 시 'enable_thinking' 파라미터를 true로 설정하면 복잡한 reasoning의 디버깅을 위해 모델의 내부 논리 과정을 확인할 수 있습니다.

Long-Horizon Logic 유지

멀티턴 대화 시 'preserve_thinking' 기능을 사용하여 세션 전반에 걸쳐 논리적 일관성을 유지하도록 하세요.

전체 라이브러리 공급

1M context window를 활용하여 데이터를 쪼개지 말고 전체 소스 자료를 제공함으로써 더 나은 파일 간 이해도를 확보하세요.

호환 가능한 엔드포인트 사용

글로벌 애플리케이션의 경우, 해외 사용자의 regional latency를 최소화하기 위해 Alibaba Cloud의 싱가포르 또는 미국 버지니아 엔드포인트를 사용하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Qwen3.6-Max-Preview에 대한 자주 묻는 질문

Qwen3.6-Max-Preview에 대한 일반적인 질문에 대한 답변 찾기