zhipu

GLM-5.2

GLM-5.2는 100만 token context window와 MIT 라이선스 기반의 전문적인 agentic 코딩 역량을 갖춘 Zhipu AI의 flagship open-weights 모델입니다.

Open WeightsMIT 라이선스코딩 어시스턴트1M ContextReasoning
zhipu logozhipuGLM-52026년 6월 16일
컨텍스트
1.0M토큰
최대 출력
4K토큰
입력 가격
$1.40/ 1M
출력 가격
$4.40/ 1M
모달리티:Text
기능:도구스트리밍추론
벤치마크
GPQA
83%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. GLM-5.2이 이 벤치마크에서 83%점을 기록했습니다.
HLE
40%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. GLM-5.2이 이 벤치마크에서 40%점을 기록했습니다.
MMLU
94%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. GLM-5.2이 이 벤치마크에서 94%점을 기록했습니다.
MMLU Pro
86%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. GLM-5.2이 이 벤치마크에서 86%점을 기록했습니다.
IFEval
85%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. GLM-5.2이 이 벤치마크에서 85%점을 기록했습니다.
AIME 2025
99%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. GLM-5.2이 이 벤치마크에서 99%점을 기록했습니다.
MATH
97%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. GLM-5.2이 이 벤치마크에서 97%점을 기록했습니다.
GSM8k
98%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. GLM-5.2이 이 벤치마크에서 98%점을 기록했습니다.
MGSM
91%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. GLM-5.2이 이 벤치마크에서 91%점을 기록했습니다.
SWE-Bench
62%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. GLM-5.2이 이 벤치마크에서 62%점을 기록했습니다.
HumanEval
97%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. GLM-5.2이 이 벤치마크에서 97%점을 기록했습니다.
LiveCodeBench
65%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. GLM-5.2이 이 벤치마크에서 65%점을 기록했습니다.
Terminal-Bench
81%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. GLM-5.2이 이 벤치마크에서 81%점을 기록했습니다.
ARC-AGI
14%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. GLM-5.2이 이 벤치마크에서 14%점을 기록했습니다.

GLM-5.2 소개

GLM-5.2의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

Mixture of Experts 아키텍처

GLM-5.2는 long horizon 과제와 자율적인 agentic 워크플로우를 위해 설계된 Mixture of Experts(MoE) flagship model입니다. 이 모델은 7,530억 개의 거대한 parameter 아키텍처를 활용하며, token당 약 400억 개의 활성 parameter를 사용합니다. 이러한 설계는 복잡한 논리 과제의 성능을 유지하면서도 컴퓨팅 비용을 절감하여 GLM 시리즈의 효율성을 크게 높였습니다.

IndexShare 효율성

이 모델은 희소 어텐션(sparse attention) 레이어 전반에서 인덱서를 재사용하는 혁신적인 아키텍처 개선 기술인 IndexShare를 도입했습니다. 이 혁신은 100만 token의 최대 context 길이에서 token당 부동 소수점 연산(FLOPs)을 2.9배 감소시킵니다. 이러한 효율성 덕분에 방대한 context window가 이론적 한계를 넘어 실제 대규모 프로젝트에서 실용적으로 사용될 수 있게 되었습니다.

전문적인 Agentic 학습

GLM-5.2가 다른 모델과 차별화되는 점은 long horizon 코딩 궤적에 집중했다는 것입니다. 전체 코드베이스에 걸친 복잡한 디버깅 및 구현 과제에 대해 특별히 학습되었습니다. 개발자는 HighMax thinking 노력 수준을 전환할 수 있어, 시스템 최적화나 고급 수학 문제 해결을 위해 모델이 내부 reasoning에 더 많은 컴퓨팅 자원을 할애하도록 조정할 수 있습니다.

GLM-5.2

GLM-5.2 사용 사례

GLM-5.2을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

Agentic 소프트웨어 엔지니어링

모델을 자율 프레임워크에 배포하여 요구사항 수집부터 최종 배포까지의 개발 과제를 처리합니다.

대규모 코드 리팩토링

100만 token의 context window에 전체 코드베이스를 로드하여 다중 파일 소프트웨어 프로젝트를 분석하고 재작성합니다.

자동 문서 검토

방대한 법률 또는 기술 문서 세트를 처리하여 불일치를 식별하거나 높은 reasoning 정확도로 구조화된 데이터를 추출합니다.

3D 장면 생성

WebGL 및 HTML5에서의 강점을 활용하여 텍스트 prompt로부터 복잡한 인터랙티브 3D 시각화 요소를 생성합니다.

비즈니스 로직 자동화

모델을 에이전트 운영 체제에 연결하여 공유 메모리를 관리하고 감독 없이 예약된 다시간 워크플로우를 실행합니다.

로컬 프라이버시 우선 개발

민감한 기업 엔지니어링 프로젝트의 완전한 데이터 주권을 보장하기 위해 private 하드웨어 클러스터에서 open-weights 모델을 실행합니다.

강점

제한

탁월한 코딩 지능: FrontierSWE에서 74.4%의 점수로 3위를 차지하여 다시간 엔지니어링 프로젝트 수행 능력을 입증했습니다.
높은 token 상세도: 이 모델은 결과를 얻기 위해 이전 모델보다 약 2배 더 많은 token을 생성하는 경향이 있어 latency가 증가합니다.
파격적인 가성비: 100만 token당 $1.40/$4.40의 비용으로 독점적 경쟁사 모델 가격의 약 1/6 수준에서 frontier 수준의 지능을 제공합니다.
엄청난 하드웨어 요구 사항: 753B parameter 규모로 인해 상당한 양자화 없이는 일반적인 개별 개발자가 로컬에 배포하기 어렵습니다.
실사용 가능한 1M Context: 이전 모델들이 일관성을 유지하지 못했던 long horizon의 복잡한 코딩 작업에 최적화되어 있습니다.
느린 실시간 응답 속도: 확장된 내부 reasoning 주기 때문에 서구권 모델보다 응답 시간이 최대 3배까지 길어질 수 있습니다.
완벽한 주권 및 프라이버시: MIT 라이선스 open-weights를 통해 개발자가 모델을 로컬에서 직접 실행하여 외부 API 위험과 데이터 유출을 방지할 수 있습니다.
디자인 창의성 정체: 프론트엔드 코딩에는 기술적으로 능숙하지만, Claude Opus와 비교했을 때 심미적인 디자인 창의성은 다소 낮을 수 있습니다.

API 빠른 시작

zhipu/glm-5.2

문서 보기
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

GLM-5.2에 대한 사람들의 의견

커뮤니티가 GLM-5.2에 대해 어떻게 생각하는지 확인하세요

몇 달 전부터 오픈소스 AI 모델이 frontier 모델을 6개월 차이로 추격 중이라고 말해왔는데, 드디어 따라잡았습니다. GLM 5.2는 Opus 4.8만큼 훌륭합니다.
Alex Finn
twitter
5.1에서 5.2로의 도약은 매우 큽니다. 긴 chain-of-thought를 잘 활용하며 독점적 모델들을 앞서고 있습니다.
Sam Witteveen
youtube
1.51TB에서 238GB로 압축한 후에도 2-bit 모델이 약 82%의 정확도를 유지합니다. GLM-5.2는 지금까지 나온 가장 강력한 오픈 모델입니다.
Unsloth AI
twitter
open-weights 모델을 선도하고 있으며 Design Arena에서 1위를 차지해 지금은 사용할 수 없는 Claude Fable 5를 넘어섰습니다.
Brian Roemmele
twitter
100만 token context window는 손실이 없으며, open-weights 모델로서는 대단히 인상적입니다.
DevGuru
reddit
벤치마크 점수도 중요하지만, 실제 에이전트 워크플로우에서 매우 견고하게 느껴집니다.
TechInnovator
hackernews

GLM-5.2에 대한 동영상

GLM-5.2에 대한 튜토리얼, 리뷰 및 토론 시청

5.1에서 5.2로의 도약은 매우 큽니다... 여기서 긴 chain-of-thought를 정말 잘 활용합니다.

이 모델이 훨씬 저렴하게 대체할 수 있는데 Sonnet이나 Gemini Flash 같은 모델을 왜 쓰는지 모르겠네요.

100만 token context window는 손실이 없는데, open-weights 모델로서는 인상적입니다.

자신의 reasoning 엔진에 대한 로컬 통제권이 필요한 개발자들을 확실히 겨냥했습니다.

벤치마크 점수도 중요하지만, 실제 에이전트 워크플로우에서 매우 견고하게 느껴집니다.

Terminal Bench에서 80점을 넘긴 최초의 open-weights 모델이며 GPT 5.5와 어깨를 나란히 합니다.

15,000 token에서 30,000으로 넘어갔네요. 이건 token 남용입니다... 두 배는 더 기다려야 할 거예요.

로컬 테스트 결과 복잡한 파일 구조를 DeepSeek v4보다 더 잘 다룹니다.

Reasoning effort Max는 하드웨어를 상당히 괴롭히지만, 로직은 확실합니다.

MIT 라이선스 덕분에 조건 걱정 없이 거의 모든 용도로 사용할 수 있습니다.

Design bench에서 Fable보다 높은 점수를 받는 걸 봤고 화제가 되고 있습니다.

GLM 5.2에게 앱을 다시 디자인해달라고 요청했는데... 실패한 편집이 전혀 없습니다. 정말 깔끔하네요.

이 버전에서는 프론트엔드 역량이 크게 돋보입니다.

단순한 챗봇이라기보다 다른 도구를 구축하기 위한 도구처럼 느껴집니다.

Thinking token을 검사할 수 있는 기능은 로직 디버깅을 하는 개발자에게는 꿈같은 기능입니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

GLM-5.2 프로 팁

GLM-5.2을 최대한 활용하기 위한 전문가 팁.

논리 작업을 위한 Max Reasoning 활성화

생성 속도보다 정확도가 중요한 복잡한 코딩이나 수학 과제에서는 Max reasoning 노력을 활성화하세요.

전체 프로젝트 로드

100만 token의 context window를 사용하여 전체 프로젝트 문서와 스타일 가이드를 제공함으로써 일관된 코드 출력을 보장하세요.

양자화(Quantization)를 통한 최적화

거대한 753B parameter를 고사양 하드웨어에 맞추기 위해 로컬 배포 시 FP8 또는 2-bit 양자화를 활용하세요.

Thinking token 검사

native로 지원되는 thinking token 기능을 활용하여 최종 답변 이전에 내부 로직을 검사하고 잠재적인 오류를 조기에 발견하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

GLM-5.2에 대한 자주 묻는 질문

GLM-5.2에 대한 일반적인 질문에 대한 답변 찾기