zhipu

GLM-5.2

GLM-5.2 adalah flagship open-weight model dari Zhipu AI yang menampilkan context window 1M dan kemampuan agentic coding khusus di bawah lisensi MIT.

Open WeightsLisensi MITAsisten CodingContext 1MReasoning
zhipu logozhipuGLM-516 Juni 2026
Konteks
1.0Mtoken
Output maks.
4Ktoken
Harga input
$1.40/ 1M
Harga output
$4.40/ 1M
Modalitas:Text
Kemampuan:AlatStreamingPenalaran
Benchmarks
GPQA
83%
GPQA: Tanya Jawab Sains Tingkat Doktoral. Benchmark ketat dengan 448 pertanyaan pilihan ganda dalam biologi, fisika, dan kimia yang dibuat oleh pakar domain. Para ahli PhD hanya mencapai akurasi 65-74%, sementara non-ahli hanya mendapat 34% bahkan dengan akses web tak terbatas (sehingga disebut 'tahan Google'). GLM-5.2 meraih skor 83% pada benchmark ini.
HLE
40%
HLE: Penalaran Keahlian Tingkat Tinggi. Menguji kemampuan model untuk mendemonstrasikan penalaran tingkat ahli di domain khusus. Mengevaluasi pemahaman mendalam tentang topik kompleks yang membutuhkan pengetahuan tingkat profesional. GLM-5.2 meraih skor 40% pada benchmark ini.
MMLU
94%
MMLU: Pemahaman Bahasa Multitugas Masif. Benchmark komprehensif dengan 16.000 pertanyaan pilihan ganda meliputi 57 mata pelajaran akademik termasuk matematika, filsafat, hukum, dan kedokteran. Menguji pengetahuan luas dan kemampuan penalaran. GLM-5.2 meraih skor 94% pada benchmark ini.
MMLU Pro
86%
MMLU Pro: MMLU Edisi Profesional. Versi MMLU yang ditingkatkan dengan 12.032 pertanyaan menggunakan format 10 pilihan yang lebih sulit. Mencakup Matematika, Fisika, Kimia, Hukum, Teknik, Ekonomi, Kesehatan, Psikologi, Bisnis, Biologi, Filsafat, dan Ilmu Komputer. GLM-5.2 meraih skor 86% pada benchmark ini.
IFEval
85%
IFEval: Evaluasi Kepatuhan Instruksi. Mengukur seberapa baik model mengikuti instruksi dan batasan tertentu. Menguji kemampuan untuk mematuhi aturan format, batas panjang, dan persyaratan eksplisit lainnya. GLM-5.2 meraih skor 85% pada benchmark ini.
AIME 2025
99%
AIME 2025: Ujian Matematika Undangan Amerika. Soal matematika tingkat kompetisi dari ujian AIME bergengsi yang dirancang untuk siswa SMA berbakat. Menguji pemecahan masalah matematika tingkat lanjut yang membutuhkan penalaran abstrak, bukan sekadar pencocokan pola. GLM-5.2 meraih skor 99% pada benchmark ini.
MATH
97%
MATH: Pemecahan Masalah Matematika. Benchmark matematika komprehensif yang menguji pemecahan masalah dalam aljabar, geometri, kalkulus, dan domain matematika lainnya. Membutuhkan penalaran multi-langkah dan pengetahuan matematika formal. GLM-5.2 meraih skor 97% pada benchmark ini.
GSM8k
98%
GSM8k: Matematika SD 8K. 8.500 soal cerita matematika tingkat SD yang membutuhkan penalaran multi-langkah. Menguji aritmatika dasar dan pemikiran logis melalui skenario dunia nyata seperti belanja atau perhitungan waktu. GLM-5.2 meraih skor 98% pada benchmark ini.
MGSM
91%
MGSM: Matematika SD Multibahasa. Benchmark GSM8k yang diterjemahkan ke 10 bahasa termasuk Spanyol, Prancis, Jerman, Rusia, Cina, dan Jepang. Menguji penalaran matematika dalam berbagai bahasa. GLM-5.2 meraih skor 91% pada benchmark ini.
SWE-Bench
62%
SWE-Bench: Benchmark Rekayasa Perangkat Lunak. Model AI mencoba menyelesaikan masalah GitHub nyata dalam proyek Python open-source dengan verifikasi manusia. Menguji keterampilan rekayasa perangkat lunak praktis pada codebase produksi. Model terbaik meningkat dari 4,4% di 2023 menjadi lebih dari 70% di 2024. GLM-5.2 meraih skor 62% pada benchmark ini.
HumanEval
97%
HumanEval: Masalah Pemrograman Python. 164 masalah pemrograman yang ditulis tangan di mana model harus menghasilkan implementasi fungsi Python yang benar. Setiap solusi diverifikasi dengan unit test. Model terbaik sekarang mencapai akurasi lebih dari 90%. GLM-5.2 meraih skor 97% pada benchmark ini.
LiveCodeBench
65%
LiveCodeBench: Benchmark Koding Langsung. Menguji kemampuan koding pada tantangan pemrograman dunia nyata yang terus diperbarui. Berbeda dengan benchmark statis, menggunakan masalah baru untuk mencegah kontaminasi data dan mengukur keterampilan koding yang sebenarnya. GLM-5.2 meraih skor 65% pada benchmark ini.
Terminal-Bench
81%
Terminal-Bench: Tugas Terminal/CLI. Menguji kemampuan untuk melakukan operasi baris perintah, menulis skrip shell, dan menavigasi lingkungan terminal. Mengukur keterampilan administrasi sistem praktis dan alur kerja pengembangan. GLM-5.2 meraih skor 81% pada benchmark ini.
ARC-AGI
14%
ARC-AGI: Abstraksi dan Penalaran. Abstraction and Reasoning Corpus untuk AGI - menguji kecerdasan fluida melalui teka-teki pengenalan pola baru. Setiap tugas membutuhkan penemuan aturan yang mendasari dari contoh, mengukur kemampuan penalaran umum daripada menghafal. GLM-5.2 meraih skor 14% pada benchmark ini.

Tentang GLM-5.2

Pelajari tentang kemampuan, fitur, dan cara menggunakan GLM-5.2.

Arsitektur Mixture of Experts

GLM-5.2 adalah flagship model berbasis Mixture of Experts (MoE) yang dirancang untuk tugas berdurasi panjang dan workflow agentic otonom. Model ini menggunakan arsitektur masif 753 miliar parameter dengan sekitar 40 miliar parameter aktif per token. Desain ini merepresentasikan lompatan besar dalam efisiensi seri GLM dengan mengurangi biaya compute sembari mempertahankan performa untuk tugas logika yang kompleks.

Efisiensi IndexShare

Model ini memperkenalkan IndexShare, sebuah peningkatan arsitektur baru yang menggunakan kembali indexer di seluruh sparse attention layers. Inovasi ini mengurangi floating point operations per token sebanyak 2,9 kali pada context length penuh 1 juta tokens. Efisiensi ini membuat context window yang masif menjadi benar-benar bisa digunakan untuk proyek berskala besar, bukan sekadar batas teoretis.

Pelatihan Agentic Khusus

Yang membedakan GLM-5.2 dari alternatif lainnya adalah fokus pada trajektori coding yang panjang. Model ini secara khusus dilatih pada tugas debugging dan implementasi yang kompleks di seluruh codebase. Developer dapat beralih antara tingkat thinking effort High dan Max, memungkinkan model menghabiskan lebih banyak compute pada reasoning internal untuk optimasi sistem dan pemecahan masalah matematika tingkat lanjut.

GLM-5.2

Kasus Penggunaan untuk GLM-5.2

Temukan berbagai cara menggunakan GLM-5.2 untuk hasil yang luar biasa.

Agentic Software Engineering

Deploy model ini ke dalam kerangka kerja otonom untuk menangani tugas pengembangan, mulai dari pengumpulan requirement hingga final deployment.

Refactoring Kode Skala Besar

Analisis dan tulis ulang proyek perangkat lunak multi-file dengan memuat seluruh codebase ke dalam context window 1M tokens.

Review Dokumen Otomatis

Proses dokumentasi hukum atau teknis yang masif untuk mengidentifikasi ketidakkonsistenan atau mengekstrak data terstruktur dengan akurasi reasoning yang tinggi.

Generasi Adegan 3D

Manfaatkan kekuatan khusus dalam WebGL dan HTML5 untuk menghasilkan visualisasi 3D interaktif yang kompleks dari prompt teks.

Otomatisasi Logika Bisnis

Hubungkan model ke dalam sistem operasi agent untuk mengelola shared memory dan menjalankan alur kerja multi-jam terjadwal tanpa pengawasan.

Pengembangan Lokal yang Mengutamakan Privasi

Jalankan open weight model pada klaster hardware pribadi untuk memastikan kedaulatan data penuh bagi proyek engineering perusahaan yang sensitif.

Kelebihan

Keterbatasan

Kecerdasan Coding Luar Biasa: Model ini berada di peringkat #3 pada FrontierSWE dengan skor 74,4%, membuktikan kemampuannya untuk proyek engineering berdurasi panjang.
Verbosity Token yang Tinggi: Model ini cenderung menghasilkan sekitar 2 kali lebih banyak token dibandingkan pendahulunya untuk mencapai hasil, yang meningkatkan latency.
Harga/Performa yang Disruptif: Dengan harga $1,40/$4,40 per juta tokens, model ini menawarkan kecerdasan tingkat frontier dengan biaya sekitar 1/6 dari kompetitor proprietary.
Kebutuhan Hardware Masif: Dengan footprint 753B parameter, deployment lokal tidak terjangkau bagi sebagian besar developer individu tanpa kuantisasi yang signifikan.
Context 1M yang Benar-benar Berguna: Dioptimalkan untuk trajektori coding panjang dan kompleks di mana model sebelumnya sering gagal menjaga koherensi.
Respons Wall-Clock Lebih Lambat: Waktu respons bisa mencapai 3 kali lebih lama daripada model Barat karena siklus reasoning internal yang diperpanjang.
Kedaulatan dan Privasi Penuh: Open weights berlisensi MIT memungkinkan developer menjalankan model secara lokal, menghindari risiko API eksternal dan kebocoran data.
Plato Kreativitas Desain: Meskipun secara teknis mahir dalam frontend coding, model ini bisa jadi kurang kreatif dalam desain estetika dibandingkan Claude Opus.

Mulai Cepat API

zhipu/glm-5.2

Lihat Dokumentasi
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

Instal SDK dan mulai melakukan panggilan API dalam hitungan menit.

Apa Kata Orang Tentang GLM-5.2

Lihat apa yang dipikirkan komunitas tentang GLM-5.2

Sudah berbulan-bulan saya katakan bahwa open source AI model tertinggal 6 bulan dari frontier model. Mereka sudah mengejar. GLM 5.2 sebagus Opus 4.8.
Alex Finn
twitter
Lompatan antara 5.1 dan 5.2 cukup besar... model ini sangat menyukai long chain of thought dan mengalahkan model proprietary.
Sam Witteveen
youtube
Model 2-bit mempertahankan akurasi ~82% setelah kami mengecilkannya dari 1,51TB menjadi 238GB. GLM-5.2 adalah model open yang paling kuat hingga saat ini.
Unsloth AI
twitter
Memimpin di jajaran open-weight model dan merebut posisi teratas di Design Arena, melampaui Claude Fable 5 yang kini tidak tersedia.
Brian Roemmele
twitter
Context window 1 juta tokens-nya lossless, yang sangat impresif untuk sebuah open weight model.
DevGuru
reddit
Angka benchmark adalah satu hal, tapi dalam workflow agent yang sebenarnya, performanya sangat tangguh.
TechInnovator
hackernews

Video Tentang GLM-5.2

Tonton tutorial, ulasan, dan diskusi tentang GLM-5.2

Lompatan antara 5.1 ke 5.2 sangat besar... model ini benar-benar menyukai chain of thought yang panjang.

Saya rasa tidak perlu menggunakan model seperti Sonnet atau Gemini Flash jika ini bisa menggantikannya dengan harga jauh lebih murah.

Context window 1 juta tokens-nya lossless, yang sangat impresif untuk sebuah open weight model.

Jelas ditargetkan untuk developer yang membutuhkan kendali lokal atas mesin reasoning mereka.

Angka benchmark adalah satu hal, tapi dalam workflow agent yang sebenarnya, performanya sangat tangguh.

Ini adalah open-weight model pertama yang menembus angka 80 di Terminal Bench dan setara dengan GPT 5.5.

Dari 15.000 tokens menjadi 30.000. Ini penyalahgunaan token... Anda harus menunggu dua kali lebih lama.

Pengujian lokal menunjukkan model ini menangani struktur file kompleks lebih baik daripada DeepSeek v4.

Reasoning effort 'Max' benar-benar menekan hardware, tapi logikanya sangat solid.

Lisensi MIT berarti Anda bisa menggunakannya untuk hampir apa saja tanpa perlu mengkhawatirkan ketentuan.

Saya melihat beberapa benchmark gila yang mencetak skor lebih tinggi dari Fable di design bench dan ini mulai ramai dibicarakan.

Saya meminta GLM 5.2 untuk mendesain ulang aplikasi ini... tidak ada edit yang gagal. Sangat bersih sejujurnya.

Kemampuan frontend adalah keunggulan utama versi ini.

Lebih terasa seperti alat untuk membangun alat lain daripada sekadar chatbot.

Kemampuan untuk memeriksa thinking tokens adalah impian developer untuk debugging logika.

Lebih dari sekadar prompt

Tingkatkan alur kerja Anda dengan Otomatisasi AI

Automatio menggabungkan kekuatan agen AI, otomatisasi web, dan integrasi cerdas untuk membantu Anda mencapai lebih banyak dalam waktu lebih singkat.

Agen AI
Otomasi Web
Alur Kerja Cerdas

Tips Pro untuk GLM-5.2

Tips ahli untuk memaksimalkan GLM-5.2.

Aktifkan Max Reasoning untuk Logika

Aktifkan reasoning effort 'Max' untuk tugas coding atau matematika kompleks di mana akurasi lebih penting daripada kecepatan generasi.

Muat Seluruh Proyek

Gunakan context window 1M untuk memberikan dokumentasi proyek dan panduan gaya (style guide) secara menyeluruh kepada model guna memastikan output kode yang konsisten.

Optimalkan dengan Kuantisasi

Gunakan kuantisasi FP8 atau 2-bit untuk deployment lokal agar footprint model sebesar 753B parameter dapat berjalan pada hardware kelas atas.

Periksa Thinking Tokens

Manfaatkan dukungan bawaan untuk thinking tokens guna memeriksa logika internal sebelum jawaban akhir muncul agar potensi kesalahan bisa dideteksi lebih awal.

Testimoni

Apa Kata Pengguna Kami

Bergabunglah dengan ribuan pengguna puas yang telah mengubah alur kerja mereka

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Terkait AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

Pertanyaan yang Sering Diajukan tentang GLM-5.2

Temukan jawaban untuk pertanyaan umum tentang GLM-5.2