zhipu

GLM-5

GLM-5는 Zhipu AI의 744B parameters 규모 open-weight 모델로, 200k context window를 기반으로 long-horizon agentic task, 코딩 및 사실적 정확성에서 뛰어난 성능을 발휘합니다.

Open WeightsAgentic EngineeringMoEZhipu AI코딩 AI
zhipu logozhipuGLMFebruary 11, 2026
컨텍스트
200K토큰
최대 출력
128K토큰
입력 가격
$1.00/ 1M
출력 가격
$3.20/ 1M
모달리티:Text
기능:도구스트리밍추론
벤치마크
GPQA
68.2%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. GLM-5이 이 벤치마크에서 68.2%점을 기록했습니다.
HLE
32%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. GLM-5이 이 벤치마크에서 32%점을 기록했습니다.
MMLU
85%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. GLM-5이 이 벤치마크에서 85%점을 기록했습니다.
MMLU Pro
70.4%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. GLM-5이 이 벤치마크에서 70.4%점을 기록했습니다.
SimpleQA
48%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. GLM-5이 이 벤치마크에서 48%점을 기록했습니다.
IFEval
88%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. GLM-5이 이 벤치마크에서 88%점을 기록했습니다.
AIME 2025
84%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. GLM-5이 이 벤치마크에서 84%점을 기록했습니다.
MATH
88%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. GLM-5이 이 벤치마크에서 88%점을 기록했습니다.
GSM8k
97%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. GLM-5이 이 벤치마크에서 97%점을 기록했습니다.
MGSM
90%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. GLM-5이 이 벤치마크에서 90%점을 기록했습니다.
MathVista
0%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. GLM-5이 이 벤치마크에서 0%점을 기록했습니다.
SWE-Bench
77.8%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. GLM-5이 이 벤치마크에서 77.8%점을 기록했습니다.
HumanEval
90%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. GLM-5이 이 벤치마크에서 90%점을 기록했습니다.
LiveCodeBench
52%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. GLM-5이 이 벤치마크에서 52%점을 기록했습니다.
MMMU
0%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. GLM-5이 이 벤치마크에서 0%점을 기록했습니다.
MMMU Pro
0%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. GLM-5이 이 벤치마크에서 0%점을 기록했습니다.
ChartQA
0%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. GLM-5이 이 벤치마크에서 0%점을 기록했습니다.
DocVQA
0%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. GLM-5이 이 벤치마크에서 0%점을 기록했습니다.
Terminal-Bench
56.2%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. GLM-5이 이 벤치마크에서 56.2%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. GLM-5이 이 벤치마크에서 12%점을 기록했습니다.

GLM-5 소개

GLM-5의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

GLM-5는 open-weight 시스템을 위한 Agentic Engineering의 기준을 재정의하기 위해 설계된 Zhipu AI의 차세대 flagship foundation model입니다. 7,440억 개의 parameters를 가진 거대한 Mixture of Experts (MoE) 아키텍처와 400억 개의 활성 parameters를 기반으로 구축되었으며, Claude 4.5와 같은 유료 frontier model들과의 성능 격차를 줄인 최초의 open-weight model입니다. 이 model은 논리 밀도와 소프트웨어 엔지니어링 분야에서 탁월하며, SWE-Bench Verified에서 77.8%라는 획기적인 점수를 기록했습니다.

기술적으로 GLM-5는 고급 Multi-head Latent Attention (MLA) 및 Sparse Attention 메커니즘을 통합하여 token 효율성을 최적화하고 메모리 오버헤드를 33% 줄였습니다. 100,000개의 화웨이 어센드(Huawei Ascend) 칩으로 구성된 순수 자체 클러스터에서 28.5조 개의 token으로 학습된 GLM-5는, 고성능 NVIDIA 하드웨어 없이도 최첨단 reasoning이 가능함을 증명했습니다. 200,000 token의 context window와 특화된 'Thinking Mode'를 통해 고정밀 기술 워크플로우에서 강력하고 hallucination이 적은 결과물을 제공합니다.

신뢰성에 최적화된 GLM-5는 long-horizon 실행 전반에 걸쳐 지속적인 상태를 유지할 수 있는 자율 기술 agent의 기반 역할을 수행합니다. 관대한 MIT 라이선스와 100만 input token당 $1.00라는 경쟁력 있는 가격 덕분에, 유료 대안 모델의 제한적인 약관 없이 로컬 배포나 대규모 API 통합을 원하는 기업에 이상적인 선택이 됩니다.

GLM-5

GLM-5 사용 사례

GLM-5을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

복잡한 시스템 엔지니어링

자율적인 의존성 관리를 포함한 마이크로서비스 아키텍처 설계 및 유지 관리.

Long-Horizon Agentic Task

1시간 이상의 실행 시간 동안 지속적인 메모리가 필요한 멀티스텝 기술 워크플로우 수행.

레거시 코드베이스 마이그레이션

200k token window를 활용하여 전체 저장소 리팩토링 및 오래된 의존성 업데이트.

Hallucination이 적은 기술 연구

사실적 정확성과 답변 거부 능력이 매우 중요한 고정밀 기술 연구 수행.

자율 터미널 운영

보안 감사 및 시스템 관리 명령을 자율적으로 실행할 수 있는 개발용 agent 구동.

이중 언어 글로벌 배포

대규모 로컬라이징 기업 애플리케이션을 위해 최상급의 영어 및 중국어 reasoning 제공.

강점

제한

최상급 Agentic Intelligence: 멀티스텝 작업 실행력에서 open-weight model 중 가장 높은 Agentic Index 점수(63) 기록.
네이티브 Multimodality 부재: GPT-4o와 같은 multimodal 경쟁 모델이 보유한 비전, 오디오, 비디오 처리 기능이 없음.
낮은 Hallucination 비율: 이전 세대 대비 hallucination을 56% 감소시켜 사실적 정확성을 우선시함.
높은 호스팅 요구 사양: 1.5TB의 BF16 가중치로 인해 클라우드 인프라 없이는 거의 모든 사용자가 로컬 배포를 할 수 없음.
거대한 MoE 효율성: 744B parameters 아키텍처가 flagship급 논리 밀도를 제공하며, MLA를 통해 메모리 오버헤드를 33% 절감.
높은 Inference Latency: 소형 'flash' model들에 비해 공개 API에서 초기 time-to-first-token이 7초 이상으로 길 수 있음.
관대한 MIT 라이선스: 진정한 오픈 소스 라이선스로 출시되어 제한적인 사용자 조항 없이 자유로운 상업적 이용 가능.
프론트엔드 디자인의 미묘한 차이: 논리는 뛰어나지만, 세밀한 CSS 미학적 보정 작업에서는 Claude에 비해 다소 어려움을 겪을 수 있음.

API 빠른 시작

zai/glm-5

문서 보기
zhipu SDK
import { ZhipuAI } from "zhipuai-sdk";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-5",
    messages: [{ role: "user", content: "Analyze this repo for security vulnerabilities." }],
    stream: true,
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

GLM-5에 대한 사람들의 의견

커뮤니티가 GLM-5에 대해 어떻게 생각하는지 확인하세요

"GLM-5는 새로운 open-weight의 리더입니다! Intelligence Index에서 50점을 기록하며 격차를 크게 좁혔습니다."
Artificial Analysis
x
"이 model은 믿기지 않습니다. 1시간 넘게 걸리는 작업을 성공적으로 수행했어요... 정말 놀랍습니다."
Theo - t3.gg
youtube
"GLM-5는 NVIDIA 칩 없이 745B params를 구현했고, 비용은 100만 input token당 $1입니다. 이것이 미래입니다."
Legendary
x
"hallucination 비율이 놀랍습니다. 거짓말을 하기보다는 차라리 '모른다'고 말할 줄 아는 모델입니다."
DevUser456
reddit
"Zhipu AI가 오픈 소스 코딩 model 시장에 도전장을 내밀었습니다."
AIExplorer
hackernews
"드디어 복잡한 작업 도중에 정신을 놓지 않는 open-weight model이 나왔네요."
CodeMaster
reddit

GLM-5에 대한 동영상

GLM-5에 대한 튜토리얼, 리뷰 및 토론 시청

지금까지 본 open-weight model 중 단연 최고입니다. 특히 코딩 관련해서요.

1시간 넘게 걸리는 작업을 성공적으로 수행한 첫 번째 open-weight model이라는 사실에 정말 놀랐습니다.

현재까지 나온 모든 model 중 hallucination이 가장 적은 model로 보입니다.

우리는 open-weight model이 실제 서비스 환경에서 무엇을 할 수 있는지에 대한 거대한 변화를 목격하고 있습니다.

장시간 도구 사용 세션 동안 이 model이 보여주는 안정성은 진정으로 전례가 없는 수준입니다.

코딩할 때의 느낌이 매우 강력합니다... 이미 독보적이었던 GLM 4.7과 견줄 만합니다.

UI 목업에 다이내믹 아일랜드를 도입한 것은 매우 멋지고 예상치 못한 특별한 기능이었습니다.

복잡한 논리 영역에서 동급의 거의 모든 다른 model을 압도하고 있습니다.

reasoning의 깊이가 마치 처음 o1을 사용했을 때를 떠올리게 하지만, 이건 open-weight입니다.

텍스트 전용 model임에도 불구하고, 코드 내의 시각적 논리를 많은 비전 model보다 더 잘 처리합니다.

메모리 사용량이 급감했습니다... 이전 방식에 비해 메모리 효율이 33배나 개선되었습니다.

thinking 기능을 켰을 때 car wash 논리 테스트를 통과하며 Claude와 GPT-4o를 이겼습니다.

이를 배포하려면 진지하게 서버 랙이 필요하겠지만, 와트당 성능은 정말 미쳤습니다.

단 하나의 잘못된 라이브러리 이름(hallucination) 없이 내 레거시 저장소 마이그레이션을 처리했습니다.

Thinking mode는 단순한 눈속임이 아닙니다. 출력의 품질을 근본적으로 바꿔놓습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

GLM-5 프로 팁

GLM-5을 최대한 활용하기 위한 전문가 팁.

Thinking Mode 활성화

GLM-5는 reasoning 기능이 활성화되었을 때 'car wash' 테스트와 같은 복잡한 논리 퍼즐에서 훨씬 더 뛰어난 성능을 발휘합니다.

MIT 라이선스 활용

제한 없는 상업적 개발 및 내부 호스팅을 위해 관대한 라이선스 혜택을 활용하세요.

도구 사용 최적화

GLM-5는 agentic 도구 실행 시 높은 안정성을 유지하도록 설계되었으므로 멀티스텝 작업에 활용하기 좋습니다.

Context Window 활용

전체 코드베이스를 200k window에 입력하여 저장소 전체의 보안 감사나 리팩토링을 수행할 수 있습니다.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
anthropic

Claude Sonnet 4.5

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
alibaba

Qwen-Image-2.0

alibaba

Qwen-Image-2.0 is Alibaba's unified 7B model for professional infographics, photorealism, and precise image editing with native 2K resolution and 1k-token...

1K context
$0.07/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M

GLM-5에 대한 자주 묻는 질문

GLM-5에 대한 일반적인 질문에 대한 답변 찾기