zhipu

GLM-4.7

Zhipu AI의 GLM-4.7은 200K context window, 73.8%의 뛰어난 SWE-bench 성능, 에이전트를 위한 네이티브 Deep Thinking을 갖춘 flagship 358B MoE 모델입니다.

zhipu logozhipuGLM2025년 12월 22일
컨텍스트
200K토큰
최대 출력
131K토큰
입력 가격
$0.60/ 1M
출력 가격
$2.20/ 1M
모달리티:TextImage
기능:비전도구스트리밍추론
벤치마크
GPQA
85.7%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. GLM-4.7이 이 벤치마크에서 85.7%점을 기록했습니다.
HLE
42.8%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 42.8%점을 기록했습니다.
MMLU
90.1%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. GLM-4.7이 이 벤치마크에서 90.1%점을 기록했습니다.
MMLU Pro
84.3%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. GLM-4.7이 이 벤치마크에서 84.3%점을 기록했습니다.
SimpleQA
46%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 46%점을 기록했습니다.
IFEval
88%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. GLM-4.7이 이 벤치마크에서 88%점을 기록했습니다.
AIME 2025
95.7%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. GLM-4.7이 이 벤치마크에서 95.7%점을 기록했습니다.
MATH
92%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. GLM-4.7이 이 벤치마크에서 92%점을 기록했습니다.
GSM8k
98%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. GLM-4.7이 이 벤치마크에서 98%점을 기록했습니다.
MGSM
94%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. GLM-4.7이 이 벤치마크에서 94%점을 기록했습니다.
MathVista
74%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 74%점을 기록했습니다.
SWE-Bench
73.8%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. GLM-4.7이 이 벤치마크에서 73.8%점을 기록했습니다.
HumanEval
94.2%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. GLM-4.7이 이 벤치마크에서 94.2%점을 기록했습니다.
LiveCodeBench
84.9%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 84.9%점을 기록했습니다.
MMMU
74.2%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. GLM-4.7이 이 벤치마크에서 74.2%점을 기록했습니다.
MMMU Pro
58%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. GLM-4.7이 이 벤치마크에서 58%점을 기록했습니다.
ChartQA
86%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 86%점을 기록했습니다.
DocVQA
93%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. GLM-4.7이 이 벤치마크에서 93%점을 기록했습니다.
Terminal-Bench
41%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 41%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. GLM-4.7이 이 벤치마크에서 12%점을 기록했습니다.

GLM-4.7 소개

GLM-4.7의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

모델 개요

GLM-4.7Zhipu AI에서 개발한 flagship LLM입니다. 3580억 개의 총 매개변수(parameters)를 가진 Mixture-of-Experts (MoE) 아키텍처를 채택했습니다. 이 모델은 고유한 Preserved ThinkingInterleaved Thinking 기능을 통해 복잡한 agentic 작업과 long-context 추론을 처리하도록 특별히 설계되었습니다. 이러한 기능 덕분에 모델은 다중 턴 세션 전반에서 논리적 안정성과 중간 추론 상태를 유지할 수 있으며, 자율 워크플로우에서 흔히 발생하는 컨텍스트 저하 문제를 해결합니다.

성능 및 아키텍처

이 모델은 방대한 200,000 token context window와 131,072 token의 대규모 출력 용량을 결합하여 제공합니다. 이 덕분에 한 번의 실행으로 전체 애플리케이션을 생성하거나 방대한 문서를 분석하는 데 적합합니다. MIT 라이선스로 공개된 open-weights 모델로서, 독점적인 대안보다 훨씬 낮은 비용으로 고성능 코딩 및 추론 능력을 제공합니다.

통합 및 사용

OpenAI API 형식과 완벽하게 호환되어 기존 소프트웨어 생태계에 쉽게 통합할 수 있습니다. 개발자들은 SWE-bench Verified에서 73.8%라는 점수를 기록한 이 모델을 고위험 소프트웨어 엔지니어링 작업에 활용합니다. 또한 영어와 중국어 사이의 대량의 기술 문서를 원어민 수준의 언어적 뉘앙스를 살려 처리하고 분석할 수 있어 국제적인 개발 팀에게 매우 다재다능한 도구입니다.

GLM-4.7

GLM-4.7 사용 사례

GLM-4.7을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

73.8%의 SWE-bench 역량을 활용하여 복잡한 저장소 전반에서 자율적으로 디버깅하고 리팩토링하며 새로운 기능을 구현합니다.

고용량 문서 합성

131k 출력 제한을 활용하여 대규모 데이터 세트로부터 종합적인 기술 매뉴얼이나 전체 서적 챕터를 생성합니다.

장기 호흡의 Agentic 워크플로우

Preserved Thinking을 사용하는 에이전트를 배포하여 수백 개의 순차적 작업 전반에서 컨텍스트 손실 없이 일관성과 논리를 유지합니다.

이중 언어 비즈니스 인텔리전스

영어와 중국어 간의 방대한 기술 문서를 원어민 수준의 언어적 미묘함을 살려 처리하고 분석합니다.

자동화된 UI/UX 코드 생성

고급 애니메이션과 실무 수준의 스타일링이 포함된 전체 React 또는 Next.js 프론트엔드 아키텍처를 한 번에 생성합니다.

경시대회 수준의 수학 문제 해결

추론 중심의 전용 thinking mode를 사용하여 복잡한 올림피아드 수준의 수학 문제와 기호 논리 퍼즐을 해결합니다.

강점

제한

최상급 코딩 성능: SWE-bench Verified에서 73.8%를 기록하며, 거의 모든 open-source 모델을 능가하고 최상위 독점 API와 어깨를 나란히 합니다.
텍스트 전용 modality: Gemini나 GPT-4o와 달리 GLM-4.7은 네이티브 비전이나 오디오 처리가 부족하여 multimodal 작업 시 외부 모델이 필요합니다.
압도적인 출력 한도: 131,072 token의 출력 제한은 업계 최고 수준으로, 전체 애플리케이션을 한 번의 턴으로 생성할 수 있습니다.
엄청난 로컬 실행 사양: 358B parameters 규모로 인해 로컬에서 모델을 실행하려면 상당한 하드웨어(약 710GB VRAM)가 필요하여 일반 소비자용 GPU로는 접근이 어렵습니다.
에이전트 중심 아키텍처: Preserved Thinking 기능을 통해 장기 작업 전반에서 논리적 일관성을 유지하며, 자율 에이전트의 컨텍스트 저하 문제를 해결합니다.
간헐적인 지연 발생: 개인용 API 티어 사용자들은 대형 제공업체의 인프라에 비해 피크 시간대에 간헐적인 속도 저하를 보고합니다.
높은 경제적 가치: OpenAI나 Anthropic과 같은 서구권 경쟁사 대비 약 4~7배 저렴한 비용으로 frontier-level의 지능을 제공합니다.
지시 사항 준수 관련 미세한 문제: 추론 능력은 뛰어나지만, 매우 복잡한 코딩 세션에서 특정 파일 구조 제약 조건을 가끔 무시하는 경향이 있습니다.

API 빠른 시작

zai/glm-4.7

문서 보기
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_ZAI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const response = await client.chat.completions.create({
    model: 'glm-4.7',
    messages: [{ role: 'user', content: 'Design a scalable React architecture.' }],
    thinking: { type: 'enabled' }
  });
  console.log(response.choices[0].message.content);
}
main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

GLM-4.7에 대한 사람들의 의견

커뮤니티가 GLM-4.7에 대해 어떻게 생각하는지 확인하세요

GLM-4.7은 128k context를 통해 대규모 코드베이스를 안정적으로 처리합니다. 기본 API 비용을 절감하기 위한 서브 에이전트 작업에 놀라울 정도로 유용했습니다.
IulianHI
reddit
Zhipu AI의 GLM-4.7은 코딩 분야에서 GPT-5.1 High와 같은 독점 frontier model과 대등합니다. Preserved Thinking 기능은 자율 에이전트에게 엄청난 이점입니다.
Etienne Noumen
youtube
GLM-4.7은 Intelligence Index v4.0에서 DeepSeek V3.2를 앞서며 가장 지능적인 open weights 모델 자리를 지키고 있습니다.
Artificial Analysis
twitter
중국 모델들이 코딩 유틸리티 부문에서 격차를 빠르게 좁히고 있습니다. 이 73%의 SWE-bench 점수는 open weights 출시작으로서는 결코 가볍게 볼 수 없습니다.
Epoch AI
hackernews
이 정도 규모의 모델치고 추론 속도가 상당히 괜찮습니다. 이전 버전보다 복잡한 논리를 훨씬 더 잘 다룹니다.
Bijan Bowen
youtube
GLM-4.7은 Kimi K2를 제치고 AI Index 6위에 올랐습니다. 왜 이 $2짜리 모델이 코딩 워크플로우에서 GPT-5.2를 대체하고 있는지 확인해보세요.
TowardsAI
twitter

GLM-4.7에 대한 동영상

GLM-4.7에 대한 튜토리얼, 리뷰 및 토론 시청

여기 context length는 200k이고 최대 출력 token은 128k인데, 실제로 상당히 강력합니다.

좋습니다, 정말 인상적이네요. 그 어떤 모델도 이 정도 수준의 복잡성을 가진 특수 기능을 탑재하지 않았습니다.

이 정도 규모의 모델치고 추론 속도가 상당히 괜찮습니다.

이전 버전보다 복잡한 논리를 훨씬 더 잘 다룹니다.

이 모델은 논리적 일관성 측면에서 상당한 도약을 이뤄냈습니다.

GLM 모델은 실제로 모든 모의 데이터를 한 파일에 배치하여 더 나은 아키텍처를 구현했습니다.

이건 확실히 큰 도약입니다. 제가 테스트해 본 결과, 벤치마크 점수가 납득이 갑니다.

제가 굳이 상기시키지 않아도 프로젝트 전체의 맥락을 이해했습니다.

코딩 능력은 현존하는 최고의 모델들과 견줄 만합니다.

최상급 추론 능력을 경쟁사 대비 훨씬 저렴한 비용으로 사용할 수 있습니다.

Swaybench verified에서 73.8%를 기록했는데, open-source 모델로서는 정말 놀라운 결과입니다.

실제로 작동하는 것을 볼 수 있습니다. 반면 Gemini 3 Pro가 생성한 것은 전혀 작동하지 않았죠.

이 수준의 지능을 제공하는 모델치고 생성 속도가 주목할 만합니다.

신뢰할 수 있는 코드 출력이 필요한 개발자들을 위해 설계된 것이 분명합니다.

Zhipu AI는 이번 MoE 아키텍처 튜닝으로 스스로를 뛰어넘었습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

GLM-4.7 프로 팁

GLM-4.7을 최대한 활용하기 위한 전문가 팁.

논리적 작업을 위한 Thinking Mode 활성화

코딩이나 수학 문제 해결 시 thinking parameter를 enabled로 설정하여 모델 내부의 추론 과정을 활용하고 정확도를 높이세요.

OpenAI 호환 SDK 사용

OpenAI SDK를 사용하고 base URL을 Z.ai 엔드포인트로 변경하여 기존 워크플로우에 GLM-4.7을 통합하세요.

131K 출력 용량 극대화

긴 형식의 콘텐츠를 생성할 때는 먼저 상세한 개요를 제공하여 방대한 token 제한 내에서도 모델이 구조적 일관성을 유지하도록 하세요.

에이전트를 위한 시스템 prompt 최적화

시스템 메시지에 Preserved Thinking 요구 사항을 정의하여 모델이 다중 턴 세션 전반에 걸쳐 추론 상태를 재사용하도록 하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

GLM-4.7에 대한 자주 묻는 질문

GLM-4.7에 대한 일반적인 질문에 대한 답변 찾기