zhipu

GLM-5.2

GLM-5.2 est le flagship model open-weight de Zhipu AI, doté d'une context window de 1M et de capacités de codage agentic spécialisées sous licence MIT.

Open WeightsLicence MITAssistant de codageContexte 1MReasoning
zhipu logozhipuGLM-516 juin 2026
Contexte
1.0Mtokens
Sortie max.
4Ktokens
Prix entrée
$1.40/ 1M
Prix sortie
$4.40/ 1M
Modalité:Text
Capacités:OutilsStreamingRaisonnement
Benchmarks
GPQA
83%
GPQA: Questions-Réponses Scientifiques Niveau Doctorat. Un benchmark rigoureux avec 448 questions à choix multiples en biologie, physique et chimie créées par des experts du domaine. Les experts en doctorat n'atteignent que 65-74% de précision, tandis que les non-experts obtiennent seulement 34% même avec un accès web illimité (d'où le terme 'résistant à Google'). GLM-5.2 a obtenu 83% sur ce benchmark.
HLE
40%
HLE: Raisonnement d'Expertise de Haut Niveau. Teste la capacité d'un modèle à démontrer un raisonnement de niveau expert dans des domaines spécialisés. Évalue la compréhension approfondie de sujets complexes nécessitant des connaissances de niveau professionnel. GLM-5.2 a obtenu 40% sur ce benchmark.
MMLU
94%
MMLU: Compréhension Linguistique Multitâche Massive. Un benchmark complet avec 16 000 questions à choix multiples couvrant 57 matières académiques incluant les mathématiques, la philosophie, le droit et la médecine. Teste les connaissances générales et les capacités de raisonnement. GLM-5.2 a obtenu 94% sur ce benchmark.
MMLU Pro
86%
MMLU Pro: MMLU Édition Professionnelle. Une version améliorée du MMLU avec 12 032 questions utilisant un format plus difficile à 10 options. Couvre les mathématiques, la physique, la chimie, le droit, l'ingénierie, l'économie, la santé, la psychologie, les affaires, la biologie, la philosophie et l'informatique. GLM-5.2 a obtenu 86% sur ce benchmark.
IFEval
85%
IFEval: Évaluation du Suivi d'Instructions. Mesure la capacité d'un modèle à suivre des instructions et contraintes spécifiques. Teste la capacité à respecter les règles de formatage, les limites de longueur et autres exigences explicites. GLM-5.2 a obtenu 85% sur ce benchmark.
AIME 2025
99%
AIME 2025: Examen d'Invitation Américain en Mathématiques. Problèmes mathématiques de niveau compétition issus du prestigieux examen AIME conçu pour les lycéens talentueux. Teste la résolution de problèmes mathématiques avancés nécessitant un raisonnement abstrait, pas simplement de la correspondance de motifs. GLM-5.2 a obtenu 99% sur ce benchmark.
MATH
97%
MATH: Résolution de Problèmes Mathématiques. Un benchmark mathématique complet testant la résolution de problèmes en algèbre, géométrie, calcul et autres domaines mathématiques. Nécessite un raisonnement en plusieurs étapes et des connaissances mathématiques formelles. GLM-5.2 a obtenu 97% sur ce benchmark.
GSM8k
98%
GSM8k: Mathématiques Niveau Primaire 8K. 8 500 problèmes de mathématiques niveau primaire nécessitant un raisonnement en plusieurs étapes. Teste l'arithmétique de base et la pensée logique à travers des scénarios réels comme les achats ou les calculs de temps. GLM-5.2 a obtenu 98% sur ce benchmark.
MGSM
91%
MGSM: Mathématiques Niveau Primaire Multilingue. Le benchmark GSM8k traduit en 10 langues incluant l'espagnol, le français, l'allemand, le russe, le chinois et le japonais. Teste le raisonnement mathématique dans différentes langues. GLM-5.2 a obtenu 91% sur ce benchmark.
SWE-Bench
62%
SWE-Bench: Benchmark d'Ingénierie Logicielle. Les modèles d'IA tentent de résoudre de vrais problèmes GitHub dans des projets Python open-source avec vérification humaine. Teste les compétences pratiques en ingénierie logicielle sur des bases de code en production. Les meilleurs modèles sont passés de 4,4% en 2023 à plus de 70% en 2024. GLM-5.2 a obtenu 62% sur ce benchmark.
HumanEval
97%
HumanEval: Problèmes de Programmation Python. 164 problèmes de programmation écrits à la main où les modèles doivent générer des implémentations de fonctions Python correctes. Chaque solution est vérifiée par des tests unitaires. Les meilleurs modèles atteignent maintenant plus de 90% de précision. GLM-5.2 a obtenu 97% sur ce benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark de Code en Direct. Teste les capacités de codage sur des défis de programmation réels continuellement mis à jour. Contrairement aux benchmarks statiques, utilise des problèmes frais pour éviter la contamination des données et mesurer les vraies compétences de codage. GLM-5.2 a obtenu 65% sur ce benchmark.
Terminal-Bench
81%
Terminal-Bench: Tâches Terminal/CLI. Teste la capacité à effectuer des opérations en ligne de commande, écrire des scripts shell et naviguer dans les environnements terminal. Mesure les compétences pratiques en administration système et flux de travail de développement. GLM-5.2 a obtenu 81% sur ce benchmark.
ARC-AGI
14%
ARC-AGI: Abstraction et Raisonnement. Corpus d'Abstraction et de Raisonnement pour l'AGI - teste l'intelligence fluide à travers des puzzles de reconnaissance de motifs nouveaux. Chaque tâche nécessite de découvrir la règle sous-jacente à partir d'exemples, mesurant la capacité de raisonnement général plutôt que la mémorisation. GLM-5.2 a obtenu 14% sur ce benchmark.

À propos de GLM-5.2

Découvrez les capacités, fonctionnalités et façons d'utiliser GLM-5.2.

Architecture Mixture of Experts

GLM-5.2 est un flagship model Mixture of Experts (MoE) conçu pour les tâches à long terme et les workflows agentic autonomes. Il utilise une architecture massive de 753 milliards de parameters avec environ 40 milliards de paramètres actifs par token. Cette conception représente un saut significatif en efficacité pour la série GLM en réduisant les coûts de compute tout en maintenant les performances pour les tâches logiques complexes.

Efficacité IndexShare

Le modèle introduit IndexShare, une innovation architecturale inédite qui réutilise les indexeurs à travers les couches d'attention creuses. Cette innovation réduit les opérations à virgule flottante par token de 2,9 fois sur la longueur totale de contexte de 1 million de tokens. Cette efficacité rend la context window massive réellement utilisable pour des projets à grande échelle plutôt que d'en faire une limite théorique.

Entraînement agentic spécialisé

Ce qui distingue GLM-5.2 des alternatives est son accent sur les trajectoires de codage à long terme. Il a été spécifiquement entraîné sur des tâches de débogage et d'implémentation complexes sur l'ensemble des bases de code. Les développeurs peuvent basculer entre les niveaux de réflexion High et Max, permettant au modèle de consacrer plus de compute au reasoning interne pour l'optimisation des systèmes et la résolution avancée de problèmes mathématiques.

GLM-5.2

Cas d'utilisation de GLM-5.2

Découvrez les différentes façons d'utiliser GLM-5.2 pour obtenir d'excellents résultats.

Ingénierie logicielle agentic

Déployez le modèle au sein de frameworks autonomes pour gérer les tâches de développement, de la collecte des besoins au déploiement final.

Refactoring de code à grande échelle

Analysez et réécrivez des projets logiciels multi-fichiers en chargeant l'intégralité de la base de code dans la context window de 1M tokens.

Revue de documents automatisée

Traitez des ensembles massifs de documentation juridique ou technique pour identifier les incohérences ou extraire des données structurées avec une grande précision de reasoning.

Génération de scènes 3D

Utilisez la force spécialisée en WebGL et HTML5 pour générer des visualisations 3D interactives complexes à partir de prompts textuels.

Automatisation de la logique métier

Connectez le modèle à des systèmes d'exploitation agentic pour gérer la mémoire partagée et exécuter des workflows planifiés de plusieurs heures sans supervision.

Développement local axé sur la confidentialité

Exécutez le modèle open weights sur des clusters matériels privés pour garantir une souveraineté totale des données pour les projets d'ingénierie d'entreprise sensibles.

Points forts

Limitations

Intelligence de codage exceptionnelle: Le modèle se classe n°3 sur FrontierSWE avec un score de 74,4 %, prouvant sa capacité pour des projets d'ingénierie de plusieurs heures.
Verbosité élevée des tokens: Le modèle a tendance à générer environ 2 fois plus de tokens que son prédécesseur pour obtenir des résultats, ce qui augmente la latence.
Rapport prix/performance disruptif: À 1,40 $/4,40 $ par million de tokens, il offre une intelligence de niveau frontier pour environ 1/6ème du coût des concurrents propriétaires.
Exigences matérielles massives: Avec une empreinte de 753B parameters, le déploiement local est hors de portée de la plupart des développeurs individuels sans une quantification significative.
Context window de 1M réellement utilisable: Il est optimisé pour les trajectoires de codage longues et complexes où les modèles précédents échouaient souvent à maintenir la cohérence.
Réponse plus lente: Les temps de réponse peuvent être jusqu'à 3 fois plus longs que ceux des modèles occidentaux en raison des cycles de reasoning interne étendus.
Souveraineté et confidentialité totales: Les open weights sous licence MIT permettent aux développeurs d'exécuter le modèle localement, évitant ainsi les risques liés aux API externes et les fuites de données.
Plafonds de créativité en design: Bien que techniquement compétent en codage frontend, il peut être moins créatif en design esthétique que Claude Opus.

Démarrage rapide API

zhipu/glm-5.2

Voir la documentation
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de GLM-5.2

Voyez ce que la communauté pense de GLM-5.2

Je dis depuis des mois que les modèles AI open source ont 6 mois de retard sur les frontier models. Ils ont rattrapé leur retard. GLM 5.2 est aussi bon que Opus 4.8.
Alex Finn
twitter
Le saut entre 5.1 et 5.2 est assez énorme... il aime vraiment les longues chains-of-thought ici et bat les modèles propriétaires.
Sam Witteveen
youtube
Le modèle 2-bit conserve environ 82 % de précision après l'avoir réduit de 1,51 To à 238 Go. GLM-5.2 est le modèle ouvert le plus puissant à ce jour.
Unsloth AI
twitter
Il mène les modèles open-weight et a pris la première place sur Design Arena, dépassant le Claude Fable 5 désormais indisponible.
Brian Roemmele
twitter
La context window de 1 million de tokens est sans perte, ce qui est impressionnant pour un modèle open weight.
DevGuru
reddit
Les scores des benchmarks sont une chose, mais dans les workflows agentic réels, il semble très robuste.
TechInnovator
hackernews

Vidéos sur GLM-5.2

Regardez des tutoriels, critiques et discussions sur GLM-5.2

Le saut entre le 5.1 et le 5.2 est assez énorme... il apprécie vraiment les longues chains-of-thought ici.

Je ne vois vraiment pas l'intérêt d'utiliser des modèles comme Sonnet ou Gemini Flash si celui-ci peut les remplacer pour beaucoup moins cher.

La context window de 1 million de tokens est sans perte, ce qui est impressionnant pour un modèle open weight.

Il est clairement ciblé vers les développeurs qui ont besoin d'un contrôle local sur leurs moteurs de reasoning.

Les scores des benchmarks sont une chose, mais dans les workflows agentic réels, il semble très robuste.

C'est le premier modèle open-weight à dépasser les 80 sur Terminal Bench et il se place aux côtés de GPT 5.5.

Vous êtes passé de 15 000 à 30 000 tokens. C'est de l'abus de tokens... vous allez attendre deux fois plus longtemps.

Les tests locaux montrent qu'il gère les structures de fichiers complexes mieux que DeepSeek v4.

Le niveau de reasoning Max pousse vraiment le matériel, mais la logique est solide.

La licence MIT signifie que vous pouvez l'utiliser pour pratiquement tout sans vous soucier des conditions.

J'ai vu des benchmarks fous marquant plus haut que Fable sur Design Bench et ça fait du bruit.

J'ai demandé à GLM 5.2 de refaire cette application... aucune erreur d'édition. Vraiment très propre pour être honnête.

Les capacités frontend sont un point fort majeur pour cette version.

Cela ressemble plus à un outil pour construire d'autres outils qu'à un simple chatbot.

La possibilité d'inspecter les thinking tokens est un rêve de développeur pour le débogage de la logique.

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA
Automatisation Web
Flux Intelligents

Conseils Pro pour GLM-5.2

Conseils d'experts pour tirer le meilleur parti de GLM-5.2.

Activer le Max reasoning pour la logique

Activez le niveau de reasoning Max pour les tâches complexes de codage ou de mathématiques où la précision est plus critique que la vitesse de génération.

Charger des projets entiers

Utilisez la context window de 1M pour fournir au modèle l'intégralité de la documentation de projet et les guides de style afin d'assurer une sortie de code cohérente.

Optimiser avec la quantification

Utilisez la quantification FP8 ou 2-bit pour les déploiements locaux afin de faire tenir l'empreinte massive de 753B parameters sur du matériel haut de gamme.

Inspecter les thinking tokens

Tirez parti du support natif des thinking tokens pour inspecter la logique interne avant la réponse finale afin de détecter rapidement les erreurs potentielles.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

Questions Fréquentes sur GLM-5.2

Trouvez des réponses aux questions courantes sur GLM-5.2