zhipu

GLM-4.7

Zhipu AI imzalı GLM-4.7; 200K context window, %73,8 SWE-bench performansı ve agentic kodlama için yerel Deep Thinking özelliklerine sahip flagship bir 358B MoE...

zhipu logozhipuGLMDecember 22, 2025
Bağlam
200Ktoken
Maks. çıktı
131Ktoken
Giriş fiyatı
$0.60/ 1M
Çıkış fiyatı
$2.20/ 1M
Modalite:TextImage
Yetenekler:GörüntüAraçlarAkışAkıl Yürütme
Benchmarks
GPQA
85.7%
GPQA: Doktora Düzeyinde Bilim Soruları. Biyoloji, fizik ve kimya alanlarında uzmanlar tarafından oluşturulmuş 448 çoktan seçmeli soru içeren zorlu bir benchmark. Doktora uzmanları sadece %65-74 doğruluk oranına ulaşırken, uzman olmayanlar sınırsız web erişimiyle bile sadece %34 puan alır (bu yüzden 'Google'a dayanıklı' olarak adlandırılır). GLM-4.7 bu benchmark'ta 85.7% puan aldı.
HLE
42.8%
HLE: Yüksek Düzey Uzmanlık Akıl Yürütme. Bir modelin özelleşmiş alanlarda uzman düzeyinde akıl yürütme sergileme yeteneğini test eder. Profesyonel düzeyde bilgi gerektiren karmaşık konuların derin anlaşılmasını değerlendirir. GLM-4.7 bu benchmark'ta 42.8% puan aldı.
MMLU
90.1%
MMLU: Kapsamlı Çoklu Görev Dil Anlama. Matematik, felsefe, hukuk ve tıp dahil 57 akademik konuyu kapsayan 16.000 çoktan seçmeli soru içeren kapsamlı bir benchmark. Geniş bilgi ve akıl yürütme yeteneklerini test eder. GLM-4.7 bu benchmark'ta 90.1% puan aldı.
MMLU Pro
84.3%
MMLU Pro: MMLU Profesyonel Sürüm. Daha zor 10 seçenekli format kullanan 12.032 soru içeren geliştirilmiş MMLU sürümü. Matematik, Fizik, Kimya, Hukuk, Mühendislik, Ekonomi, Sağlık, Psikoloji, İşletme, Biyoloji, Felsefe ve Bilgisayar Bilimlerini kapsar. GLM-4.7 bu benchmark'ta 84.3% puan aldı.
SimpleQA
46%
SimpleQA: Olgusal Doğruluk Benchmark'ı. Bir modelin basit sorulara doğru, olgusal yanıtlar verme yeteneğini test eder. Bilgi alma görevlerinde güvenilirliği ölçer ve halüsinasyonları azaltır. GLM-4.7 bu benchmark'ta 46% puan aldı.
IFEval
88%
IFEval: Talimat Takip Değerlendirmesi. Bir modelin belirli talimatları ve kısıtlamaları ne kadar iyi takip ettiğini ölçer. Biçimlendirme kurallarına, uzunluk sınırlarına ve diğer açık gereksinimlere uyma yeteneğini test eder. GLM-4.7 bu benchmark'ta 88% puan aldı.
AIME 2025
95.7%
AIME 2025: Amerikan Davetiye Matematik Sınavı. Yetenekli lise öğrencileri için tasarlanmış prestijli AIME sınavından yarışma düzeyinde matematik problemleri. Sadece kalıp eşleştirme değil, soyut akıl yürütme gerektiren ileri düzey matematiksel problem çözmeyi test eder. GLM-4.7 bu benchmark'ta 95.7% puan aldı.
MATH
92%
MATH: Matematiksel Problem Çözme. Cebir, geometri, kalkülüs ve diğer matematiksel alanlarda problem çözmeyi test eden kapsamlı bir matematik benchmark'ı. Çok adımlı akıl yürütme ve formal matematiksel bilgi gerektirir. GLM-4.7 bu benchmark'ta 92% puan aldı.
GSM8k
98%
GSM8k: İlkokul Matematiği 8K. Çok adımlı akıl yürütme gerektiren 8.500 ilkokul düzeyinde matematik sözel problemi. Alışveriş veya zaman hesaplamaları gibi gerçek dünya senaryoları aracılığıyla temel aritmetik ve mantıksal düşünmeyi test eder. GLM-4.7 bu benchmark'ta 98% puan aldı.
MGSM
94%
MGSM: Çok Dilli İlkokul Matematiği. GSM8k benchmark'ı İspanyolca, Fransızca, Almanca, Rusça, Çince ve Japonca dahil 10 dile çevrilmiştir. Farklı dillerde matematiksel akıl yürütmeyi test eder. GLM-4.7 bu benchmark'ta 94% puan aldı.
MathVista
74%
MathVista: Matematiksel Görsel Akıl Yürütme. Grafikler, geometri diyagramları ve bilimsel şekiller gibi görsel öğeler içeren matematik problemlerini çözme yeteneğini test eder. Görsel anlayışı matematiksel akıl yürütme ile birleştirir. GLM-4.7 bu benchmark'ta 74% puan aldı.
SWE-Bench
73.8%
SWE-Bench: Yazılım Mühendisliği Benchmark'ı. Yapay zeka modelleri, insan doğrulaması ile açık kaynak Python projelerindeki gerçek GitHub sorunlarını çözmeye çalışır. Üretim kod tabanlarında pratik yazılım mühendisliği becerilerini test eder. En iyi modeller 2023'te %4,4'ten 2024'te %70'in üzerine çıktı. GLM-4.7 bu benchmark'ta 73.8% puan aldı.
HumanEval
94.2%
HumanEval: Python Programlama Problemleri. Modellerin doğru Python fonksiyon implementasyonları üretmesi gereken 164 el yazımı programlama problemi. Her çözüm birim testlerle doğrulanır. En iyi modeller artık %90'ın üzerinde doğruluk oranına ulaşıyor. GLM-4.7 bu benchmark'ta 94.2% puan aldı.
LiveCodeBench
84.9%
LiveCodeBench: Canlı Kodlama Benchmark'ı. Sürekli güncellenen gerçek dünya programlama zorlukları üzerinde kodlama yeteneklerini test eder. Statik benchmark'ların aksine, veri kirliliğini önlemek ve gerçek kodlama becerilerini ölçmek için taze problemler kullanır. GLM-4.7 bu benchmark'ta 84.9% puan aldı.
MMMU
74.2%
MMMU: Çok Modlu Anlama. Görüntü anlama ve uzman bilgisi gerektiren 30 konuda üniversite düzeyinde problemlerde görme-dil modellerini test eden Kapsamlı Çok Disiplinli Çok Modlu Anlama benchmark'ı. GLM-4.7 bu benchmark'ta 74.2% puan aldı.
MMMU Pro
58%
MMMU Pro: MMMU Profesyonel Sürüm. Daha zor sorular ve daha katı değerlendirme içeren geliştirilmiş MMMU sürümü. Profesyonel ve uzman seviyelerinde ileri düzey çok modlu akıl yürütmeyi test eder. GLM-4.7 bu benchmark'ta 58% puan aldı.
ChartQA
86%
ChartQA: Grafik Soru Cevaplama. Grafiklerde ve tablolarda sunulan bilgileri anlama ve akıl yürütme yeteneğini test eder. Görsel veri gösterimlerinden veri çıkarma, değerleri karşılaştırma ve hesaplamalar yapma gerektirir. GLM-4.7 bu benchmark'ta 86% puan aldı.
DocVQA
93%
DocVQA: Belge Görsel Soru Cevaplama. Formlar, raporlar ve taranmış metin dahil belge görüntülerinden bilgi çıkarma ve akıl yürütme yeteneğini test eden Belge Görsel Soru Cevaplama benchmark'ı. GLM-4.7 bu benchmark'ta 93% puan aldı.
Terminal-Bench
41%
Terminal-Bench: Terminal/CLI Görevleri. Komut satırı işlemleri yapma, shell betikleri yazma ve terminal ortamlarında gezinme yeteneğini test eder. Pratik sistem yönetimi ve geliştirme iş akışı becerilerini ölçer. GLM-4.7 bu benchmark'ta 41% puan aldı.
ARC-AGI
12%
ARC-AGI: Soyutlama ve Akıl Yürütme. AGI için Soyutlama ve Akıl Yürütme Corpus'u - yeni örüntü tanıma bulmacaları aracılığıyla akışkan zekayı test eder. Her görev, örneklerden temel kuralı keşfetmeyi gerektirir ve ezberleme yerine genel akıl yürütme yeteneğini ölçer. GLM-4.7 bu benchmark'ta 12% puan aldı.

GLM-4.7'i Ücretsiz Dene

GLM-4.7 ile ücretsiz sohbet edin. Yeteneklerini test edin, sorular sorun ve bu AI modelinin neler yapabileceğini keşfedin.

Prompt
Yanıt
zhipu/glm-4-7

Yapay zeka yanıtınız burada görünecek

GLM-4.7 Hakkında

GLM-4.7'in yetenekleri, özellikleri ve kullanım yolları hakkında bilgi edinin.

GLM-4.7, Zhipu AI'nın open-weight zeka alanında önemli bir atılımı temsil eden en son flagship AI modelidir. Bu devasa 358 milyar parameters içeren Mixture-of-Experts (MoE) model; gelişmiş reasoning, kodlama otomasyonu ve karmaşık agentic iş akışları için özel olarak tasarlanmıştır. Model, çok adımlı planlama ve hata giderme sağlayan özel bir Deep Thinking modunu tanıtarak, modelin yüksek riskli yazılım mühendisliği görevlerini eşsiz bir güvenilirlikle çözmesine olanak tanır.

Model, SWE-bench Verified testinde %73,8 ve LiveCodeBench v6'da 84,9 puan alarak olağanüstü bir teknik performans sergiler ve kendini rakiplerinden ayırır. 200.000 tokens context window ve devasa 131.072 tokens çıktı kapasitesi ile GLM-4.7, tüm uygulamaları sıfırdan oluşturmak ve geniş veri kümeleri üzerinde derin araştırmalar yürütmek için optimize edilmiştir.

MIT lisansı altında bir open-weight sürümü olarak sunulan bu model, hem bulut tabanlı entegrasyonu hem de yerel barındırmayı destekleyerek kapalı kaynaklı API'lara güçlü ve esnek bir alternatif sunar. Multimodal yetenekleri, gelişmiş UI tasarımı ve belge analizine kadar uzanarak onu modern AI odaklı geliştirme süreçleri için çok yönlü bir güç merkezi haline getirir.

GLM-4.7

GLM-4.7 için Kullanım Alanları

Harika sonuçlar elde etmek için GLM-4.7'i kullanmanın farklı yollarını keşfedin.

Agentic Yazılım Mühendisliği

Karmaşık GitHub sorunlarını çözme ve tüm depolar genelinde otonom olarak full-stack özellikler uygulama.

Yüksek Sadakatli Vibe Coding

Tailwind CSS ve etkileşimli Framer Motion bileşenlerini kullanarak modern, üretime hazır web arayüzlerini hızla oluşturma.

Çok Dilli Teknik Destek

10'dan fazla uluslararası programlama ortamında gelişmiş kodlama yardımı ve mantıksal problem çözme sağlama.

Derin Akademik Araştırma

BrowseComp arama çerçevesini kullanarak çok adımlı, doğrulanabilir bilgileri çıkarmak için devasa belge kümelerini analiz etme.

Otomatik Sunum Tasarımı

Tek cümlelik prompt girişlerinden doğru düzenlere ve tipografiye sahip yapılandırılmış, görsel olarak dengeli slaytlar oluşturma.

Terminal Tabanlı Otomasyon

%41 benchmark doğruluğu ile doğrudan bir terminal sandbox içinde karmaşık sistem yönetimi ve DevOps görevlerini yürütme.

Güçlü Yönler

Sınırlamalar

Üst Düzey Kodlama Yetkinliği: %73,8'lik SWE-bench puanıyla şu anda open-weight modeller arasında lider konumdadır ve birçok kapalı kaynaklı rakibini geride bırakır.
Aşırı Donanım Yoğunluğu: 355B parameters sayısı, çoklu GPU kurulumu olmayan bireysel geliştiriciler için yerel barındırmayı imkansız hale getirir.
Devasa Çıktı Tokens Kapasitesi: Tek seferde devasa, üretime hazır kod tabanlarının oluşturulmasına olanak tanıyan 131K çıktı sınırına sahiptir.
API ve Web Farklılığı: Anlık API yanıtları ile web arayüzündeki daha derin reasoning arasında fark edilebilir bir performans boşluğu vardır.
Yerel Reasoning Motoru: Uzun süreli agentic görevlerde daha iyi planlama sağlayan ve sapmaları azaltan 'Deep Thinking' yeteneklerini içerir.
Zamansal Halüsinasyonlar: Kullanıcılar, modelin lansmanından hemen sonraki güncel tarihler ve olaylarla ilgili zaman zaman tutarsızlıklar bildirmiştir.
Rakipsiz Maliyet-Performans: Milyon giriş tokens başına sadece 0,60$'dan başlayan fiyatlarla, maliyetin çok küçük bir kısmına frontier model düzeyinde zeka sunar.
Yüksek Reasoning Gecikmesi: Tam Deep Thinking modunu etkinleştirmek, karmaşık ve çok adımlı prompt yanıtları için latency süresini önemli ölçüde artırabilir.

API Hızlı Başlangıç

zhipu/glm-4-7

Belgeleri Görüntüle
zhipu SDK
import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

SDK'yı yükleyin ve dakikalar içinde API çağrıları yapmaya başlayın.

İnsanlar GLM-4.7 Hakkında Ne Diyor

Topluluğun GLM-4.7 hakkında ne düşündüğünü görün

"GLM 4.7 AÇIK KAYNAK REKORLARINI PARÇALIYOR! ... Humanity's Last Exam testinde %42,8'e ulaştı"
MindColliers
x/twitter
"GLM-4.7... 1 milyon tokens başına 0,6$ maliyetle SWE-Bench'te %73,8 puan alıyor... AI yarışı artık gerçekten çok kutuplu hale geliyor."
MateusGalasso
x/twitter
"GLM 4.7; çok dilli agentic kodlama ve terminal tabanlı görevlerde net kazanımlar getiriyor"
Dear-Success-1441
reddit
"Bu model, birçok 2025 kodlama benchmarks testini domine ediyor"
cloris_rust
reddit
"GLM 4.7 hız ve kararlılıkta kazanırken, Minimax M2.1 çoklu agent kodlamasında baskın çıkıyor"
JamMasterJulian
youtube
"Zhipu, open-weight modellerin ABD'deki büyük laboratuvarlara karşı neler yapabileceğini gerçekten gösteriyor."
DevGuru
hackernews

GLM-4.7 Hakkında Videolar

GLM-4.7 hakkında eğitimler, incelemeler ve tartışmalar izleyin

GLM 4.7; kod kalitesi, karmaşık reasoning ve araç kullanımı konularında büyük iyileştirmeler sunan bir modeldir

SWE-bench verified testinde %73,8 puan aldı; bu, bir open-source model için kesinlikle inanılmaz

Araç kullanımı benchmarks testlerinde Claude Sonnet 4.5 ve GPT 5.1'i bile geride bırakıyor

Buradaki mixture of experts yaklaşımı oldukça rafine, bu da boyutuna rağmen daha yüksek verimlilik sağlıyor

Esasen, yoğun kodlama işleri için Claude 3.5'e uygulanabilir bir alternatif sunan ilk open-weight modeldir

Şu ana kadarki açık ara en iyi açık model

Daha temiz, daha modern web sayfaları üretiyor ve daha iyi görünen slaytlar oluşturuyor

Reasoning yapıyor ancak düşünce izleri kodlama planı API tarafında mevcut değil

Vibe coding sonuçları, karmaşık Tailwind animasyonlarında bile mükemmele yakın

200k context, önceki GLM versiyonlarına kıyasla çok az kayıpla uzun depoları yönetebiliyor

En önemli güncelleme, hareket etmeden önce düşünmesi; bu da modelin karmaşık görevleri güvenilir bir şekilde yerine getirmesine yardımcı oluyor

GLM 4.7'nin UI kalitesini artırdığı vibe coding özelliğini vurgulayın

API fiyatlandırmasının 3$ civarında olması bekleniyor, bu da onu oldukça maliyet etkin bir seçenek haline getiriyor

Multimodal performansı, Figma tasarımlarını yüksek doğrulukla koda dönüştürmesine olanak tanıyor

Devasa bir iş istasyonunuz varsa yerel dağıtım mümkün, ancak API dikkate değer ölçüde hızlı

Sadece promptlardan fazlasi

İş akışınızı güçlendirin Yapay Zeka Otomasyonu

Automatio, yapay zeka ajanlari, web otomasyonu ve akilli entegrasyonlarin gucunu birlestirerek daha az zamanda daha fazlasini basarmaniza yardimci olur.

Yapay Zeka Ajanları
Web Otomasyonu
Akıllı İş Akışları
Demo videoyu izle

Profesyonel İpuçları

Bu modelden en iyi şekilde yararlanmanız için uzman ipuçları.

Deep Thinking'i Etkinleştirin

Karmaşık mantıksal görevler için, çok adımlı planlamayı etkinleştirmek amacıyla API parameters üzerinden thinking modunu açıkça tetikleyin.

Korunan Düşünce Sürecinden Yararlanın

modelin reasoning izlerini birden fazla tur boyunca koruma yeteneğinden faydalanmak için uzun konuşma geçmişlerini sürdürün.

Yerel Quantization

Bu yüksek parameters modelini tüketici sınıfı donanımlarda çalıştırmak için Unsloth tarafından optimize edilmiş 2-bit veya 4-bit GGUF versiyonlarını kullanın.

Tarih Enjeksiyonu

Zamanla ilgili halüsinasyonlardan kaçınmak ve planlama doğruluğunu artırmak için sistem prompt metnine mevcut tarihi manuel olarak ekleyin.

Referanslar

Kullanicilarimiz Ne Diyor

Is akisini donusturen binlerce memnun kullaniciya katilin

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

İlgili AI Models

anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Sık Sorulan Sorular

Bu model hakkında sık sorulan soruların cevaplarını bulun