¿Cuál es el context window de GLM-4.7?

GLM-4.7 cuenta con un enorme context window de 200,000 tokens con un límite de salida máximo de 131,072 tokens.

¿Cuánto cuesta la API de GLM-4.7?

La API tiene un precio de $0.60 por cada 1 millón de tokens de entrada y $2.20 por cada 1 millón de tokens de salida, lo que la hace significativamente más asequible que muchos de sus rivales occidentales.

¿Es GLM-4.7 open-source?

Sí, GLM-4.7 es un model open-weight lanzado bajo la licencia MIT, lo que permite tanto el uso comercial como el hosting local personal.

¿Soporta GLM-4.7 un modo de reasoning o pensamiento?

Sí, incluye una arquitectura nativa de 'Deep Thinking' que intercala el reasoning antes de cada llamada a herramientas y respuesta.

¿Cómo se compara GLM-4.7 con Claude 3.5 Sonnet?

Iguala o supera a Claude 3.5 Sonnet en benchmarks de programación específicos como LiveCodeBench y SWE-bench, siendo además un model open-weight.

¿Qué hardware se requiere para ejecutar GLM-4.7 localmente?

El model completo requiere aproximadamente 800GB de VRAM en BF16, pero las versiones cuantizadas (4-bit) pueden funcionar en configuraciones de 140GB a 200GB de VRAM.

¿Soporta el model capacidades de visión?

Sí, GLM-4.7 es un model multimodal que puede analizar imágenes y generar diseños de UI sofisticados basados en el contexto visual.

¿Cuándo se lanzó oficialmente GLM-4.7?

El model fue lanzado oficialmente por Zhipu AI el 22 de diciembre de 2025.

GLM-4.7

GLM-4.7 de Zhipu AI es un flagship model MoE de 358B con un context window de 200K, un rendimiento élite del 73.8% en el benchmark SWE-bench y Deep Thinking...

zhipuGLMDecember 22, 2025

Contexto

200Ktokens

Salida máx.

131Ktokens

Precio entrada

$0.60/ 1M

Precio salida

$2.20/ 1M

Modalidad:TextImage

Capacidades:VisiónHerramientasStreamingRazonamiento

Benchmarks

GPQA

85.7%

HLE

42.8%

MMLU

90.1%

MMLU Pro

84.3%

SimpleQA

46%

IFEval

88%

AIME 2025

95.7%

MATH

92%

GSM8k

98%

MGSM

94%

MathVista

74%

SWE-Bench

73.8%

HumanEval

94.2%

LiveCodeBench

84.9%

MMMU

74.2%

MMMU Pro

58%

ChartQA

86%

DocVQA

93%

Terminal-Bench

41%

ARC-AGI

12%

Ver documentación API

Acerca de GLM-4.7

Conoce las capacidades, características y formas de uso de GLM-4.7.

GLM-4.7 es el último flagship model de IA de Zhipu AI, que representa un salto significativo en la inteligencia open-weight. Este enorme model Mixture-of-Experts (MoE) de 358 mil millones de parámetros está diseñado específicamente para reasoning avanzado, automatización de programación y flujos de trabajo agentic complejos. Introduce un modo de Deep Thinking dedicado que permite la planificación de múltiples pasos y la recuperación de errores, permitiendo al model resolver tareas críticas de ingeniería de software con una fiabilidad sin precedentes.

El model se distingue por su excepcional rendimiento técnico, logrando una puntuación state-of-the-art del 73.8% en SWE-bench Verified y un 84.9 en LiveCodeBench v6. Con su context window de 200,000 tokens y una capacidad de salida masiva de 131,072 tokens, GLM-4.7 está optimizado para generar aplicaciones completas y realizar investigaciones profundas en vastos conjuntos de datos.

Como un lanzamiento open-weight bajo la licencia MIT, ofrece una alternativa potente y flexible a las API propietarias, admitiendo tanto la integración basada en la nube como el hosting local. Sus capacidades multimodal se extienden al diseño avanzado de UI y al análisis de documentos, convirtiéndolo en una herramienta versátil y potente para el desarrollo moderno impulsado por IA.

Casos de uso de GLM-4.7

Descubre las diferentes formas de usar GLM-4.7 para lograr excelentes resultados.

Ingeniería de Software Agentic

Resolución de problemas complejos en GitHub e implementación de funcionalidades full-stack de forma autónoma en repositorios completos.

Vibe Coding de Alta Fidelidad

Generación rápida de interfaces web modernas y listas para producción utilizando Tailwind CSS y componentes interactivos de Framer Motion.

Soporte Técnico Multilingüe

Asistencia avanzada en programación y resolución de problemas lógicos en más de 10 entornos de programación internacionales.

Investigación Académica Profunda

Análisis de conjuntos masivos de documentos para extraer información verificable de múltiples saltos utilizando el framework de búsqueda BrowseComp.

Diseño Automatizado de Presentaciones

Creación de diapositivas estructuradas y visualmente equilibradas con diseños y tipografía precisos a partir de prompts de una sola frase.

Automatización basada en Terminal

Ejecución de tareas complejas de administración de sistemas y DevOps directamente en un sandbox de terminal con una precisión del 41% en benchmark.

Fortalezas

Limitaciones

Dominio Élite en Programación: Lidera actualmente los models open-weight con una puntuación del 73.8% en SWE-bench, superando a muchos competidores propietarios.

Intensidad de Hardware Extrema: El conteo de 355B parámetros hace que el hosting local sea prohibitivo para desarrolladores individuales sin configuraciones multi-GPU.

Tokens de Salida Masivos: Ofrece un límite de salida de 131K tokens, lo que permite la generación de bases de código masivas listas para producción en una sola iteración.

Disparidad entre API y Web: Existe una brecha de rendimiento notable entre las respuestas instantáneas de la API y el reasoning más profundo que se encuentra en la interfaz web.

Motor de Reasoning Nativo: Incorpora capacidades de 'Deep Thinking' que permiten una mejor planificación y reducen la desviación en tareas agentic de larga duración.

Alucinaciones Temporales: Los usuarios han reportado imprecisiones ocasionales con respecto a fechas y eventos actuales inmediatamente después del lanzamiento del model.

Relación Costo-Rendimiento Inbatible: Proporciona inteligencia de nivel frontier model a una fracción del costo, comenzando en solo $0.60 por millón de tokens de entrada.

Alta Latencia de Reasoning: Activar el modo Deep Thinking completo puede aumentar significativamente el tiempo de respuesta para prompts complejos de varios pasos.

Inicio rápido de API

zai/glm-4.7

Ver documentación

zhipu SDK

import { ZhipuAI } from "zhipuai";

const client = new ZhipuAI({ apiKey: "YOUR_API_KEY" });

async function main() {
  const response = await client.chat.completions.create({
    model: "glm-4.7",
    messages: [{ role: "user", content: "Build a real-time collaborative whiteboard using Next.js." }],
    stream: true,
    extra_body: { "thinking": true }
  });

  for await (const chunk of response) {
    process.stdout.write(chunk.choices[0].delta.content || "");
  }
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GLM-4.7

Mira lo que la comunidad piensa sobre GLM-4.7

“¡GLM 4.7 DESTROZA LOS RÉCORDS DE OPEN SOURCE! ... alcanzó un 42.8% en Humanity's Last Exam”

— MindColliers

x/twitter

“GLM-4.7... obtiene un 73.8% en SWE-Bench a $0.6/M de tokens... La carrera de la IA se está volviendo verdaderamente multipolar.”

— MateusGalasso

x/twitter

“GLM 4.7 aporta ganancias claras... en programación multilingüe agentic y tareas basadas en terminal”

— Dear-Success-1441

“Este model está arrasando en muchos benchmarks de programación de 2025”

— cloris_rust

“GLM 4.7 gana en velocidad y estabilidad, mientras que Minimax M2.1 domina en programación multi-agente”

— JamMasterJulian

youtube

“Zhipu realmente está demostrando lo que los pesos abiertos pueden hacer contra los grandes laboratorios de EE. UU.”

— DevGuru

hackernews

Videos sobre GLM-4.7

Mira tutoriales, reseñas y discusiones sobre GLM-4.7

“GLM 4.7 es un model que ofrece mejoras importantes en la calidad del código, reasoning complejo y uso de herramientas”

“Obtuvo un 73.8 por ciento en SWE-bench verified, lo cual es absolutamente increíble para un model open-source”

“Incluso supera a Claude Sonnet 4.5 y GPT 5.1 en benchmarks de uso de herramientas”

“El enfoque de mixture of experts aquí está muy refinado, lo que conduce a una mayor eficiencia a pesar del tamaño”

“Es esencialmente el primer model open-weight que ofrece una alternativa viable a Claude 3.5 para programación intensiva”

“Es, por mucho, el mejor model abierto hasta ahora”

“Produce páginas web más limpias y modernas, y genera mejores diapositivas”

“Razona, pero las trazas de pensamiento no están disponibles en la API de planes de programación”

“Los resultados de vibe coding son casi perfectos, incluso con animaciones complejas de Tailwind”

“El contexto de 200k maneja repositorios largos con muy poca pérdida de información en comparación con versiones anteriores de GLM”

“Una actualización importante es el pensar antes de actuar, lo que ayuda al model a manejar tareas complejas de forma fiable”

“Destaca el vibe coding, donde GLM 4.7 mejora la calidad de la UI”

“El precio de la API rondará los mismos $3, lo que la convierte en una opción muy rentable”

“El rendimiento multimodal le permite convertir diseños de Figma a código con alta precisión”

“El despliegue local es posible si tienes una estación de trabajo masiva, pero la API es notablemente rápida”

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA

Automatización Web

Flujos Inteligentes

Comenzar Gratis

Consejos Pro para GLM-4.7

Consejos de expertos para ayudarte a sacar el máximo provecho de GLM-4.7.

Activar Deep Thinking

Para tareas lógicas complejas, active explícitamente el modo de pensamiento mediante los parámetros de la API para permitir la planificación en varios pasos.

Aprovechar el Pensamiento Preservado

Mantenga historiales de conversación largos para utilizar la capacidad del model de retener trazas de reasoning a través de múltiples turnos.

Cuantización Local

Utilice versiones GGUF de 2 o 4 bits optimizadas con Unsloth para ejecutar este model de altos parámetros en hardware de consumo.

Inyección de Fecha

Incluya manualmente la fecha actual en el system prompt para evitar alucinaciones temporales y mejorar la precisión en la programación de tareas.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context

$3.00/$15.00/1M

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context

$3.00/$15.00/1M

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context

$0.25/$1.50/1M

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context

$2.50/$15.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context

$0.60/$2.50/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

Preguntas Frecuentes Sobre GLM-4.7

Encuentra respuestas a preguntas comunes sobre GLM-4.7