zhipu

GLM-4.7

Zhipu AI의 GLM-4.7은 200K context window와 73.8%의 뛰어난 SWE-bench 성능, 그리고 agentic 코딩을 위한 네이티브 Deep Thinking 기능을 갖춘 flagship 358B MoE model입니다.

zhipu logozhipuGLM2025년 12월 22일
컨텍스트
200K토큰
최대 출력
131K토큰
입력 가격
$0.60/ 1M
출력 가격
$2.20/ 1M
모달리티:TextImage
기능:비전도구스트리밍추론
벤치마크
GPQA
85.7%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. GLM-4.7이 이 벤치마크에서 85.7%점을 기록했습니다.
HLE
42.8%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 42.8%점을 기록했습니다.
MMLU
90.1%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. GLM-4.7이 이 벤치마크에서 90.1%점을 기록했습니다.
MMLU Pro
84.3%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. GLM-4.7이 이 벤치마크에서 84.3%점을 기록했습니다.
SimpleQA
46%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 46%점을 기록했습니다.
IFEval
88%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. GLM-4.7이 이 벤치마크에서 88%점을 기록했습니다.
AIME 2025
95.7%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. GLM-4.7이 이 벤치마크에서 95.7%점을 기록했습니다.
MATH
92%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. GLM-4.7이 이 벤치마크에서 92%점을 기록했습니다.
GSM8k
98%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. GLM-4.7이 이 벤치마크에서 98%점을 기록했습니다.
MGSM
94%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. GLM-4.7이 이 벤치마크에서 94%점을 기록했습니다.
MathVista
74%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 74%점을 기록했습니다.
SWE-Bench
73.8%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. GLM-4.7이 이 벤치마크에서 73.8%점을 기록했습니다.
HumanEval
94.2%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. GLM-4.7이 이 벤치마크에서 94.2%점을 기록했습니다.
LiveCodeBench
84.9%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 84.9%점을 기록했습니다.
MMMU
74.2%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. GLM-4.7이 이 벤치마크에서 74.2%점을 기록했습니다.
MMMU Pro
58%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. GLM-4.7이 이 벤치마크에서 58%점을 기록했습니다.
ChartQA
86%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 86%점을 기록했습니다.
DocVQA
93%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. GLM-4.7이 이 벤치마크에서 93%점을 기록했습니다.
Terminal-Bench
41%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. GLM-4.7이 이 벤치마크에서 41%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. GLM-4.7이 이 벤치마크에서 12%점을 기록했습니다.

GLM-4.7 무료 체험

GLM-4.7과 무료로 채팅하세요. 기능을 테스트하고, 질문하고, 이 AI 모델이 할 수 있는 것을 탐색하세요.

프롬프트
응답
zhipu/glm-4-7

AI 응답이 여기에 표시됩니다

GLM-4.7 소개

GLM-4.7의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

GLM-4.7은 Zhipu AI의 최신 flagship AI 모델로, open-weight 지능의 비약적인 도약을 상징합니다. 3,580억 개의 parameter를 가진 이 거대한 MoE(Mixture-of-Experts) 모델은 고급 reasoning, 코딩 자동화, 그리고 복잡한 agentic 워크플로우를 위해 특별히 설계되었습니다. 멀티스텝 계획 수립과 오류 복구가 가능한 전용 Deep Thinking 모드를 도입하여, 전례 없는 신뢰성으로 난이도 높은 소프트웨어 엔지니어링 과제를 해결할 수 있습니다.

이 모델은 독보적인 기술적 성능을 자랑하며, SWE-bench Verified에서 73.8%의 state-of-the-art 점수를, LiveCodeBench v6에서는 84.9를 기록했습니다. 200,000 token의 context window와 131,072 token에 달하는 대규모 출력 용량을 갖춘 GLM-4.7은 전체 애플리케이션 생성 및 방대한 데이터 세트에 대한 심층 연구에 최적화되어 있습니다.

MIT 라이선스로 공개된 open-weight 모델로서, 클라우드 기반 통합과 로컬 호스팅을 모두 지원하며 폐쇄형 API에 대한 강력하고 유연한 대안을 제공합니다. 또한 고급 UI 디자인 및 문서 분석까지 확장된 multimodal 성능을 갖추고 있어, 현대적인 AI 기반 개발을 위한 다재다능한 파워하우스 역할을 수행합니다.

GLM-4.7

GLM-4.7 사용 사례

GLM-4.7을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

Agentic 소프트웨어 엔지니어링

복잡한 GitHub 이슈를 해결하고 전체 저장소에 걸쳐 풀스택 기능을 자율적으로 구현합니다.

고성능 Vibe Coding

Tailwind CSS와 대화형 Framer Motion 컴포넌트를 사용하여 현대적이고 즉시 배포 가능한 웹 인터페이스를 빠르게 생성합니다.

다국어 기술 지원

10개 이상의 국제 프로그래밍 환경에서 고급 코딩 지원 및 논리적 문제 해결을 제공합니다.

심층 학술 연구

BrowseComp 검색 프레임워크를 사용하여 방대한 문서 세트를 분석하고 검증 가능한 다단계 정보를 추출합니다.

자동화된 프레젠테이션 디자인

단 한 줄의 prompt로 정확한 레이아웃과 타이포그래피를 갖춘 구조화되고 시각적으로 균형 잡힌 슬라이드를 제작합니다.

터미널 기반 자동화

터미널 샌드박스 내에서 복잡한 시스템 관리 및 DevOps 작업을 직접 실행하며, benchmark에서 41%의 정확도를 기록했습니다.

강점

제한

독보적인 코딩 숙련도: 현재 73.8%의 SWE-bench 점수를 기록하며 open-weight 모델 중 선두를 달리고 있으며, 많은 폐쇄형 경쟁 모델을 능가합니다.
극심한 하드웨어 요구 사양: 355B parameter 규모로 인해 멀티 GPU 환경을 갖추지 않은 개인 개발자가 로컬 호스팅을 하기에 제약이 큽니다.
방대한 출력 token: 131K의 출력 제한을 지원하여 한 번의 실행으로 거대한 규모의 배포 가능한 codebase를 생성할 수 있습니다.
API와 웹 버전의 차이: 즉각적인 API 응답과 웹 인터페이스에서 제공되는 더 깊은 수준의 reasoning 사이에 눈에 띄는 성능 차이가 존재합니다.
네이티브 Reasoning 엔진: 'Deep Thinking' 기능을 내장하여 장시간 실행되는 agentic 작업에서 더 나은 계획 수립과 오류 감소가 가능합니다.
시간적 환각: 모델 출시 직후의 현재 날짜나 사건에 대해 간혹 부정확한 정보를 제공한다는 사용자 보고가 있습니다.
압도적인 가성비: 입력 100만 token당 단 $0.60의 비용으로 frontier model 수준의 지능을 제공합니다.
높은 Reasoning Latency: 전체 Deep Thinking 모드를 활성화할 경우 복잡한 멀티스텝 prompt에 대한 응답 시간이 크게 늘어날 수 있습니다.

API 빠른 시작

zhipu/glm-4-7

문서 보기
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

GLM-4.7에 대한 사람들의 의견

커뮤니티가 GLM-4.7에 대해 어떻게 생각하는지 확인하세요

"GLM 4.7이 오픈 소스 기록을 갈아치우고 있습니다! ... Humanity's Last Exam에서 42.8% 달성"
MindColliers
x/twitter
"GLM-4.7... 100만 token당 $0.6라는 가격에 SWE-Bench 73.8% 기록... AI 경쟁이 진정으로 다극화되고 있습니다."
MateusGalasso
x/twitter
"GLM 4.7은 다국어 agentic 코딩과 터미널 기반 작업에서 명확한 이점을 제공합니다."
Dear-Success-1441
reddit
"이 모델은 많은 2025년 코딩 benchmark를 휩쓸고 있습니다."
cloris_rust
reddit
"GLM 4.7은 속도와 안정성 면에서 승리했고, Minimax M2.1은 멀티 에이전트 코딩에서 우위를 점하네요."
JamMasterJulian
youtube
"Zhipu AI는 open-weight 모델이 미국의 대형 연구소들에 맞서 무엇을 할 수 있는지 제대로 보여주고 있습니다."
DevGuru
hackernews

GLM-4.7에 대한 동영상

GLM-4.7에 대한 튜토리얼, 리뷰 및 토론 시청

GLM 4.7은 코드 품질, 복잡한 reasoning, 그리고 도구 활용 능력에서 비약적인 발전을 보여주는 모델입니다

SWE-bench verified에서 73.8%를 기록했는데, 이는 오픈 소스 모델로서는 정말 놀라운 수치입니다

도구 활용 benchmark에서는 Claude Sonnet 4.5와 GPT 5.1마저 능가합니다

이 모델의 mixture of experts 접근 방식은 매우 정교하여, 거대한 크기에도 불구하고 높은 효율성을 보여줍니다

기본적으로 헤비한 코딩 작업을 위해 Claude 3.5의 실행 가능한 대안을 제공하는 최초의 open-weight 모델입니다

현재까지 출시된 오픈 모델 중 단연 최고입니다

더 깔끔하고 현대적인 웹 페이지를 제작하며, 슬라이드 생성 디자인도 더 훌륭합니다

reasoning 능력이 뛰어나지만, 코딩 플랜 API에서는 thinking traces를 확인할 수 없습니다

복잡한 Tailwind 애니메이션이 포함된 바이브 코딩(vibe coding) 결과물은 거의 완벽에 가깝습니다

200k context는 이전 GLM 버전들에 비해 정보 손실(needle loss)이 거의 없이 긴 레포지토리를 처리합니다

가장 중요한 업그레이드는 실행 전 사고(thinking before acting) 단계로, 모델이 복잡한 작업을 안정적으로 처리하도록 돕습니다

GLM 4.7이 UI 품질을 한 차원 높여주는 바이브 코딩 능력을 강조하고 싶습니다

API 가격이 약 $3 내외로 유지되어 매우 가성비 높은 옵션이 될 것입니다

multimodal 성능 덕분에 Figma 디자인을 높은 정확도로 코드로 변환할 수 있습니다

대규모 워크스테이션이 있다면 로컬 배포도 가능하지만, API 속도가 놀라울 정도로 빠릅니다

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로
데모 영상 보기

전문가 팁

이 모델을 최대한 활용하고 더 나은 결과를 얻기 위한 전문가 팁.

Deep Thinking 활성화

복잡한 논리적 과제를 해결할 때는 멀티스텝 계획 수립이 가능하도록 API parameters를 통해 명시적으로 thinking 모드를 트리거하세요.

추론 과정 유지

모델이 여러 턴에 걸쳐 reasoning 흔적을 유지할 수 있도록 긴 대화 기록을 활용하세요.

로컬 양자화 활용

고사양 소비자용 하드웨어에서 이 대규모 parameter 모델을 실행하려면 Unsloth로 최적화된 2-bit 또는 4-bit GGUF 버전을 사용하세요.

날짜 주입

시간적 환각(temporal hallucinations)을 방지하고 스케줄링 정확도를 높이려면 system prompt에 현재 날짜를 직접 포함하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

자주 묻는 질문

이 모델에 대한 일반적인 질문의 답변 찾기