zhipu

GLM-5.2

GLM-5.2, Zhipu AI'ın 1M context window ve MIT lisansı altında özel agentic kodlama yeteneklerine sahip flagship open-weight modelidir.

Open WeightsMIT LisansıKodlama Asistanı1M ContextReasoning
zhipu logozhipuGLM-516 Haziran 2026
Bağlam
1.0Mtoken
Maks. çıktı
4Ktoken
Giriş fiyatı
$1.40/ 1M
Çıkış fiyatı
$4.40/ 1M
Modalite:Text
Yetenekler:AraçlarAkışAkıl Yürütme
Benchmarks
GPQA
83%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). GLM-5.2 bu benchmark'ta 83% puan aldı.
HLE
40%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. GLM-5.2 bu benchmark'ta 40% puan aldı.
MMLU
94%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. GLM-5.2 bu benchmark'ta 94% puan aldı.
MMLU Pro
86%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. GLM-5.2 bu benchmark'ta 86% puan aldı.
IFEval
85%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. GLM-5.2 bu benchmark'ta 85% puan aldı.
AIME 2025
99%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. GLM-5.2 bu benchmark'ta 99% puan aldı.
MATH
97%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. GLM-5.2 bu benchmark'ta 97% puan aldı.
GSM8k
98%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. GLM-5.2 bu benchmark'ta 98% puan aldı.
MGSM
91%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. GLM-5.2 bu benchmark'ta 91% puan aldı.
SWE-Bench
62%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. GLM-5.2 bu benchmark'ta 62% puan aldı.
HumanEval
97%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. GLM-5.2 bu benchmark'ta 97% puan aldı.
LiveCodeBench
65%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. GLM-5.2 bu benchmark'ta 65% puan aldı.
Terminal-Bench
81%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. GLM-5.2 bu benchmark'ta 81% puan aldı.
ARC-AGI
14%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. GLM-5.2 bu benchmark'ta 14% puan aldı.

GLM-5.2 Hakkında

GLM-5.2'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

Mixture of Experts Mimarisi

GLM-5.2, uzun vadeli görevler ve otonom agentic iş akışları için tasarlanmış bir Mixture of Experts (MoE) flagship modelidir. Token başına yaklaşık 40 milyar aktif parametre ile 753 milyar parametrelik devasa bir mimari kullanır. Bu tasarım, karmaşık mantıksal görevlerde performansı korurken compute maliyetlerini düşürerek GLM serisi için verimlilikte önemli bir sıçramayı temsil eder.

IndexShare Verimliliği

Model, sparse attention katmanlarında indexer'ları yeniden kullanan yenilikçi bir mimari geliştirme olan IndexShare'i tanıtır. Bu inovasyon, tam 1 milyon token context uzunluğunda token başına kayan nokta işlemlerini 2.9 kat azaltır. Bu verimlilik, devasa context window'u teorik bir sınırdan ziyade büyük ölçekli projeler için gerçekten kullanılabilir hale getirir.

Uzmanlaşmış Agentic Eğitim

GLM-5.2'yi alternatiflerinden ayıran şey, uzun vadeli kodlama süreçlerine odaklanmasıdır. Tüm kod tabanlarında karmaşık hata ayıklama ve uygulama görevleri üzerinde özel olarak eğitilmiştir. Geliştiriciler, sistem optimizasyonu ve ileri matematiksel problem çözme için modelin dahili reasoning'e daha fazla compute ayırmasına izin vererek High ve Max thinking çaba seviyeleri arasında geçiş yapabilirler.

GLM-5.2

GLM-5.2 için Kullanım Alanları

Harika sonuçlar elde etmek için GLM-5.2'i kullanmanın farklı yollarını keşfedin.

Agentic Yazılım Mühendisliği

Gereksinim toplamadan nihai dağıtıma kadar tüm geliştirme görevlerini ele almak için modeli otonom çerçeveler içinde devreye alın.

Büyük Ölçekli Kod Yeniden Düzenleme

Tüm kod tabanını 1M token context window'una yükleyerek çok dosyalı yazılım projelerini analiz edin ve yeniden yazın.

Otomatik Doküman İnceleme

Tutarsızlıkları belirlemek veya yüksek reasoning doğruluğu ile yapılandırılmış verileri ayıklamak için devasa yasal veya teknik dokümantasyon setlerini işleyin.

3D Sahne Oluşturma

WebGL ve HTML5 konusundaki özel yeteneklerini kullanarak, text prompt'larından karmaşık interaktif 3D görselleştirmeler oluşturun.

İş Mantığı Otomasyonu

Paylaşılan belleği yönetmek ve gözetim olmaksızın planlanmış, saatlerce süren iş akışlarını yürütmek için modeli agent işletim sistemlerine entegre edin.

Yerel Gizlilik Odaklı Geliştirme

Hassas kurumsal mühendislik projeleri için tam veri egemenliği sağlamak amacıyla open weights modelini özel donanım kümelerinde çalıştırın.

Güçlü Yönler

Sınırlamalar

Olağanüstü Kodlama Zekası: Model, 74.4 puanla FrontierSWE'de #3 sırada yer alarak saatlerce süren mühendislik projeleri için yeteneğini kanıtlıyor.
Yüksek Token Gevşekliği (Verbosity): Model, sonuç elde etmek için selefine göre yaklaşık 2 kat daha fazla token üretme eğilimindedir, bu da latency'i artırır.
Ezber Bozan Fiyat/Performans: Milyon token başına 1.40$/4.40$ fiyatla, kapalı kaynaklı rakiplerinin yaklaşık 1/6'sı maliyetle frontier seviyesinde zeka sunuyor.
Devasa Donanım Gereksinimleri: 753B parameter boyutuyla, ciddi bir kuantizasyon olmadan yerel kurulum çoğu bireysel geliştirici için ulaşılmazdır.
Gerçekten Kullanılabilir 1M Context: Önceki modellerin tutarlılığı korumakta başarısız olduğu, uzun vadeli ve karmaşık kodlama süreçleri için optimize edilmiştir.
Daha Yavaş Yanıt Süreleri: Genişletilmiş dahili reasoning döngüleri nedeniyle yanıt süreleri Batılı modellere göre 3 kat daha uzun olabilir.
Tam Egemenlik ve Gizlilik: MIT lisanslı open weights, geliştiricilerin modeli yerel olarak çalıştırmasına olanak tanıyarak harici API risklerini ve veri sızıntılarını önler.
Tasarım Yaratıcılığında Platonik: Frontend kodlamada teknik olarak başarılı olsa da, estetik tasarım konusunda Claude Opus'tan daha az yaratıcı olabilir.

API Hızlı Başlangıç

zhipu/glm-5.2

Belgeleri Görüntüle
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar GLM-5.2 Hakkında Ne Diyor

Topluluğun GLM-5.2 hakkında ne düşündüğünü görün

Aylardır open-source AI modellerinin frontier modellerin 6 ay gerisinde olduğunu söylüyordum. Yakaladılar. GLM 5.2, Opus 4.8 kadar iyi.
Alex Finn
twitter
5.1 ve 5.2 arasındaki sıçrama oldukça büyük... uzun chain of thought süreçlerini seviyor ve özel mülk modelleri geçiyor.
Sam Witteveen
youtube
2-bit model, 1.51TB'den 238GB'a küçülttükten sonra ~%82 doğruluk payını koruyor. GLM-5.2 bugüne kadarki en güçlü açık model.
Unsloth AI
twitter
Open-weight modellere liderlik ediyor ve artık kullanılamayan Claude Fable 5'i geride bırakarak Design Arena'da zirveye yerleşti.
Brian Roemmele
twitter
1 milyon token context window kayıpsız; bu bir open weight model için etkileyici.
DevGuru
reddit
Benchmark sayıları bir şeydir ama gerçek agent iş akışlarında çok sağlam hissettiriyor.
TechInnovator
hackernews

GLM-5.2 Hakkında Videolar

GLM-5.2 hakkında eğitimler, incelemeler ve tartışmalar izleyin

5.1 ile 5.2 arasındaki sıçrama oldukça büyük... burada uzun chain of thought süreçlerini gerçekten seviyor.

Bununla çok daha ucuza aynı işi yapabiliyorken, Sonnet veya Gemini Flash gibi modelleri kullanmanın mantığını anlamıyorum.

1 milyon token'lık context window kayıpsız, bu bir open weight model için etkileyici.

Açıkça kendi reasoning motorları üzerinde yerel kontrole ihtiyaç duyan geliştiricileri hedefliyor.

Benchmark sayıları bir şeydir ama gerçek agent iş akışlarında çok sağlam hissettiriyor.

Terminal Bench'te 80'i geçen ilk open-weight model ve GPT 5.5 ile aynı seviyede.

15.000 token'dan 30.000'e çıktınız. Bu token istismarı... iki kat daha uzun bekleyeceksiniz.

Yerel testler, karmaşık dosya yapılarını DeepSeek v4'ten daha iyi ele aldığını gösteriyor.

Reasoning effort Max donanımı gerçekten zorluyor ama mantık sağlam.

MIT lisansı, şartlar konusunda endişelenmeden bunu neredeyse her şey için kullanabileceğiniz anlamına geliyor.

Design bench'te Fable'dan daha yüksek puan alan bazı çılgın benchmark sonuçları gördüm ve ilgi topluyor.

GLM 5.2'den bu uygulamayı yeniden tasarlamasını istedim... hatalı düzenleme yok. Dürüst olmak gerekirse gerçekten çok temiz.

Frontend yetenekleri bu sürüm için önemli bir öne çıkan özellik.

Sadece bir chatbot'tan çok, başka araçlar inşa etmek için bir araç gibi hissettiriyor.

Thinking token'larını inceleme yeteneği, mantıkta hata ayıklamak isteyen geliştiriciler için bir hayal.

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları

GLM-5.2 için Pro İpuçları

GLM-5.2'den en iyi şekilde yararlanmak için uzman ipuçları.

Mantık için Max Reasoning'i Etkinleştirin

Doğruluğun üretim hızından daha kritik olduğu karmaşık kodlama veya matematik görevleri için Max reasoning çabasını aktif hale getirin.

Tüm Projeleri Yükleyin

Tutarlı kod çıktısı sağlamak için modelin 1M context window'unu kullanarak tüm proje dokümantasyonunu ve stil kılavuzlarını modele sağlayın.

Kuantizasyon ile Optimize Edin

Devasa 753B parameter boyutunu üst düzey donanımlara sığdırmak için yerel kurulumlarda FP8 veya 2-bit kuantizasyon kullanın.

Thinking Token'ları İnceleyin

Olası hataları erkenden yakalamak için nihai cevaptan önce dahili mantığı incelemek amacıyla thinking token desteğinden yararlanın.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

GLM-5.2 Hakkında Sık Sorulan Sorular

GLM-5.2 hakkında sık sorulan soruların cevaplarını bulun