zhipu

GLM-5.2

GLM-5.2 es el modelo flagship de open-weights de Zhipu AI, que cuenta con un context window de 1M y capacidades de coding agentic especializadas bajo licencia...

Open WeightsLicencia MITAsistente de Coding1M ContextReasoning
zhipu logozhipuGLM-516 de junio de 2026
Contexto
1.0Mtokens
Salida máx.
4Ktokens
Precio entrada
$1.40/ 1M
Precio salida
$4.40/ 1M
Modalidad:Text
Capacidades:HerramientasStreamingRazonamiento
Benchmarks
GPQA
83%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GLM-5.2 obtuvo 83% en este benchmark.
HLE
40%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GLM-5.2 obtuvo 40% en este benchmark.
MMLU
94%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GLM-5.2 obtuvo 94% en este benchmark.
MMLU Pro
86%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GLM-5.2 obtuvo 86% en este benchmark.
IFEval
85%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GLM-5.2 obtuvo 85% en este benchmark.
AIME 2025
99%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GLM-5.2 obtuvo 99% en este benchmark.
MATH
97%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GLM-5.2 obtuvo 97% en este benchmark.
GSM8k
98%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GLM-5.2 obtuvo 98% en este benchmark.
MGSM
91%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GLM-5.2 obtuvo 91% en este benchmark.
SWE-Bench
62%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GLM-5.2 obtuvo 62% en este benchmark.
HumanEval
97%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GLM-5.2 obtuvo 97% en este benchmark.
LiveCodeBench
65%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GLM-5.2 obtuvo 65% en este benchmark.
Terminal-Bench
81%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GLM-5.2 obtuvo 81% en este benchmark.
ARC-AGI
14%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GLM-5.2 obtuvo 14% en este benchmark.

Acerca de GLM-5.2

Conoce las capacidades, características y formas de uso de GLM-5.2.

Arquitectura Mixture of Experts

GLM-5.2 es un modelo flagship de tipo Mixture of Experts (MoE) diseñado para tareas de larga duración y flujos de trabajo de agentes autónomos. Utiliza una arquitectura masiva de 753 mil millones de parámetros con aproximadamente 40 mil millones de parámetros activos por token. Este diseño representa un salto significativo en eficiencia para la serie GLM, al reducir los costes de cómputo mientras mantiene el rendimiento en tareas lógicas complejas.

Eficiencia IndexShare

El modelo introduce IndexShare, una innovación arquitectónica novedosa que reutiliza indexadores a través de capas de atención dispersa. Esta innovación reduce las operaciones de punto flotante por token en 2,9 veces con la longitud total del context window de 1 millón de tokens. Esta eficiencia hace que el enorme context window sea realmente utilizable para proyectos a gran escala y no solo un límite teórico.

Entrenamiento especializado para agentes

Lo que distingue a GLM-5.2 de las alternativas es su enfoque en trayectorias de coding de largo alcance. Fue entrenado específicamente en tareas complejas de depuración e implementación a través de bases de código completas. Los desarrolladores pueden alternar entre niveles de esfuerzo de thinking High y Max, permitiendo al modelo dedicar más cómputo al reasoning interno para la optimización de sistemas y la resolución avanzada de problemas matemáticos.

GLM-5.2

Casos de uso de GLM-5.2

Descubre las diferentes formas de usar GLM-5.2 para lograr excelentes resultados.

Ingeniería de software agentic

Despliega el modelo dentro de frameworks autónomos para gestionar tareas de desarrollo, desde la toma de requisitos hasta el despliegue final.

Refactorización de código a gran escala

Analiza y reescribe proyectos de software con múltiples archivos cargando la base de código completa en el context window de 1M de tokens.

Revisión automatizada de documentos

Procesa conjuntos masivos de documentación legal o técnica para identificar inconsistencias o extraer datos estructurados con alta precisión en el reasoning.

Generación de escenas 3D

Utiliza su fortaleza especializada en WebGL y HTML5 para generar visualizaciones 3D interactivas complejas a partir de prompts.

Automatización de lógica de negocio

Integra el modelo en sistemas operativos de agentes para gestionar memoria compartida y ejecutar flujos de trabajo programados de varias horas sin supervisión.

Desarrollo local con privacidad garantizada

Ejecuta el modelo de open weights en clusters de hardware privados para garantizar la soberanía total de los datos en proyectos de ingeniería corporativos sensibles.

Fortalezas

Limitaciones

Inteligencia excepcional en coding: El modelo ocupa el puesto #3 en FrontierSWE con una puntuación del 74,4%, demostrando su capacidad para proyectos de ingeniería de varias horas.
Alta verbosidad de tokens: El modelo tiende a generar aproximadamente el doble de tokens que su predecesor para lograr resultados, lo que aumenta la latency.
Relación precio-rendimiento disruptiva: A 1,40 $ / 4,40 $ por millón de tokens, ofrece inteligencia de nivel frontier a aproximadamente 1/6 del coste de los competidores propietarios.
Requisitos de hardware masivos: Con una huella de 753B de parámetros, el despliegue local está fuera del alcance de la mayoría de los desarrolladores individuales sin una cuantización significativa.
Context window de 1M realmente útil: Está optimizado para trayectorias de coding complejas y de largo alcance donde los modelos anteriores fallaban al mantener la coherencia.
Respuesta más lenta: Los tiempos de respuesta pueden ser hasta 3 veces más largos que los modelos occidentales debido a los ciclos extendidos de reasoning interno.
Soberanía y privacidad total: Los open weights con licencia MIT permiten a los desarrolladores ejecutar el modelo localmente, evitando los riesgos de API externas y fugas de datos.
Meseta en la creatividad de diseño: Aunque es técnicamente competente en coding frontend, puede ser menos creativo en diseño estético que Claude Opus.

Inicio rápido de API

zhipu/glm-5.2

Ver documentación
zhipu SDK
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_Z_AI_API_KEY',
  baseURL: 'https://api.z.ai/api/paas/v4/',
});

async function main() {
  const completion = await client.chat.completions.create({
    model: 'glm-5.2',
    messages: [{ role: 'user', content: 'Design a WebGL 3D city scene.' }],
    // @ts-ignore - specialized Z.ai parameter
    thinking: { type: 'enabled' },
    reasoning_effort: 'max',
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GLM-5.2

Mira lo que la comunidad piensa sobre GLM-5.2

He estado diciendo durante meses que los modelos de AI open-source están 6 meses por detrás de los frontier. Se han puesto al día. GLM 5.2 es tan bueno como Opus 4.8.
Alex Finn
twitter
El salto entre 5.1 y 5.2 es bastante grande... realmente prefiere largas chains of thought aquí y está superando a los modelos propietarios.
Sam Witteveen
youtube
El modelo de 2 bits retiene ~82% de precisión después de reducirlo de 1.51TB a 238GB. GLM-5.2 es el modelo abierto más fuerte hasta la fecha.
Unsloth AI
twitter
Lidera los modelos de open-weights y ha reclamado el primer puesto en Design Arena, superando al ya no disponible Claude Fable 5.
Brian Roemmele
twitter
El context window de 1 millón de tokens es lossless, lo cual es impresionante para un modelo de open weights.
DevGuru
reddit
Los números de los benchmarks son una cosa, pero en flujos de trabajo de agentes reales, se siente muy robusto.
TechInnovator
hackernews

Videos sobre GLM-5.2

Mira tutoriales, reseñas y discusiones sobre GLM-5.2

El salto entre 5.1 y 5.2 es enorme... realmente le gustan las largas chains of thought aquí.

Realmente no veo el sentido de usar modelos como Sonnet o Gemini Flash si esto puede reemplazarlo por mucho menos dinero.

El context window de 1 millón de tokens es lossless, lo cual es impresionante para un modelo de open weights.

Está claramente dirigido a desarrolladores que necesitan control local sobre sus motores de reasoning.

Los números de los benchmarks son una cosa, pero en flujos de trabajo de agentes reales, se siente muy robusto.

Es el primer modelo de open-weight en superar los 80 en Terminal Bench y está al nivel de GPT 5.5.

Pasaste de 15.000 tokens a 30.000. Esto es abuso de tokens... vas a esperar el doble de tiempo.

Las pruebas locales muestran que maneja estructuras de archivos complejas mejor que DeepSeek v4.

El esfuerzo de reasoning 'Max' realmente presiona el hardware, pero la lógica es sólida.

La licencia MIT significa que puedes usar esto para prácticamente cualquier cosa sin preocuparte por los términos.

He visto algunos benchmarks locos puntuando más alto que Fable en design bench y está generando mucho ruido.

Le pedí a GLM 5.2 que rediseñara esta app... cero ediciones fallidas. Muy limpio, la verdad.

Las capacidades de frontend son un punto destacado importante para esta versión.

Se siente más como una herramienta para construir otras herramientas que solo un chatbot.

La capacidad de inspeccionar tokens de thinking es el sueño de un desarrollador para depurar la lógica.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para GLM-5.2

Consejos de expertos para ayudarte a sacar el máximo provecho de GLM-5.2.

Activa Max Reasoning para lógica

Activa el esfuerzo de reasoning 'Max' para tareas complejas de coding o matemáticas donde la precisión sea más crítica que la velocidad de generación.

Carga proyectos completos

Utiliza el context window de 1M para proporcionar al modelo la documentación completa del proyecto y las guías de estilo, asegurando un output de código consistente.

Optimiza con cuantización

Utiliza cuantización FP8 o de 2 bits para despliegues locales y así adaptar los enormes 753B de parámetros a hardware de alta gama.

Inspecciona los tokens de thinking

Aprovecha el soporte nativo para tokens de thinking para inspeccionar la lógica interna antes de obtener la respuesta final y detectar posibles errores a tiempo.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
zhipu

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context
$1.40/$4.40/1M

Preguntas Frecuentes Sobre GLM-5.2

Encuentra respuestas a preguntas comunes sobre GLM-5.2