openai

GPT-5.2

GPT-5.2 es el flagship model de OpenAI para tareas profesionales, con un context window de 400K, codificación de élite y capacidades profundas de reasoning de...

openai logoopenaiGPT-5December 11, 2025
Contexto
400Ktokens
Salida máx.
100Ktokens
Precio entrada
$1.75/ 1M
Precio salida
$14.00/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
93%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GPT-5.2 obtuvo 93% en este benchmark.
HLE
45%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GPT-5.2 obtuvo 45% en este benchmark.
MMLU
88%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GPT-5.2 obtuvo 88% en este benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GPT-5.2 obtuvo 83% en este benchmark.
SimpleQA
58%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. GPT-5.2 obtuvo 58% en este benchmark.
IFEval
95%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GPT-5.2 obtuvo 95% en este benchmark.
AIME 2025
100%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GPT-5.2 obtuvo 100% en este benchmark.
MATH
98%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GPT-5.2 obtuvo 98% en este benchmark.
GSM8k
99%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GPT-5.2 obtuvo 99% en este benchmark.
MGSM
98%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GPT-5.2 obtuvo 98% en este benchmark.
MathVista
78%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. GPT-5.2 obtuvo 78% en este benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GPT-5.2 obtuvo 80% en este benchmark.
HumanEval
95%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GPT-5.2 obtuvo 95% en este benchmark.
LiveCodeBench
80%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GPT-5.2 obtuvo 80% en este benchmark.
MMMU
75%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. GPT-5.2 obtuvo 75% en este benchmark.
MMMU Pro
65%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. GPT-5.2 obtuvo 65% en este benchmark.
ChartQA
93%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. GPT-5.2 obtuvo 93% en este benchmark.
DocVQA
95%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. GPT-5.2 obtuvo 95% en este benchmark.
Terminal-Bench
60%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GPT-5.2 obtuvo 60% en este benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GPT-5.2 obtuvo 52.9% en este benchmark.

Prueba GPT-5.2 Gratis

Chatea con GPT-5.2 gratis. Prueba sus capacidades, haz preguntas y explora lo que este modelo de IA puede hacer.

Prompt
Respuesta
openai/gpt-5.2

Tu respuesta de IA aparecerá aquí

Acerca de GPT-5.2

Conoce las capacidades, características y formas de uso de GPT-5.2.

Reasoning profesional de élite

GPT-5.2 representa la frontera de OpenAI en inteligencia artificial de grado profesional, específicamente diseñado para el trabajo de conocimiento complejo y la ejecución autónoma de tareas. Lanzado a finales de 2025, introduce un modo Thinking dedicado que permite al model pausar y planificar una lógica de varios pasos, lo que lo hace excepcionalmente competente en ingeniería de software intrincada, demostraciones matemáticas avanzadas y análisis científico. Esta arquitectura de model integra visión multimodal y llamadas a herramientas en un motor de reasoning unificado, permitiéndole actuar como un socio agentic en workflows profesionales.

Arquitectura de inteligencia escalable

Técnicamente, GPT-5.2 cuenta con un context window de 400K, líder en la industria, con una precisión de recuperación cercana al 100%, lo que le permite procesar bases de código masivas o manuales técnicos densos sin perder información. Si bien destaca por su precisión y confiabilidad —reduciendo las alucinaciones en un 30% en comparación con iteraciones anteriores— el model adopta un tono conversacional más formal y estructurado. Está optimizado para entornos empresariales donde se priorizan la consistencia y la precisión sobre los adornos creativos, marcando un cambio hacia la AI como un trabajador del conocimiento confiable.

GPT-5.2

Casos de uso de GPT-5.2

Descubre las diferentes formas de usar GPT-5.2 para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas complejos en GitHub y gestión de depuración de bases de código a gran escala con un 80% de precisión.

Investigación financiera avanzada

Realización de análisis profundo de acciones fundamentales y síntesis de tendencias de mercado utilizando herramientas agentic integradas.

Automatización empresarial de varios pasos

Orquestación de workflows complejos a través de aplicaciones de productividad conectadas como Notion, Slack y Google Drive.

Síntesis de documentos técnicos

Procesamiento y resumen de documentos técnicos masivos utilizando su context window de 400K tokens.

Reasoning matemático científico

Resolución de ciencia a nivel de doctorado y matemáticas de nivel de competencia a través del modo Thinking especializado.

Generación de contenido profesional

Producción de prosa de alta calidad de estilo operístico e informes profesionales formateados a escala.

Fortalezas

Limitaciones

Excelencia en codificación: Su puntuación del 80% en SWE-bench Verified lo convierte en uno de los modelos más capaces para la ingeniería de software profesional.
Problemas de latency en visión: Las tareas de percepción y creación de imágenes son significativamente más lentas que el reasoning basado en texto debido a la alta carga computacional.
Reasoning de vanguardia (state-of-the-art): La variante especializada Thinking proporciona una lógica profunda para matemáticas de nivel de competencia y ciencia de nivel de doctorado.
Tono conversacional frío: El estilo de interacción del model a menudo se describe como formal y robótico, careciendo de la calidez natural de iteraciones anteriores.
Uso de herramientas agentic: Altamente eficaz en el uso de herramientas externas como navegadores y entornos Python para gestionar workflows profesionales de varios pasos.
Precio premium de salida: A $14 por millón de tokens en modo Thinking, los costos de salida siguen siendo significativamente más altos que los de modelos más antiguos y ágiles.
Recuperación de context a gran escala: Admite hasta 400K tokens con una precisión casi perfecta, ideal para analizar y sintetizar datasets masivos.
Discontinuidad conversacional: Su enfoque en la organización a veces puede interrumpir el flujo de discusiones naturales y sincrónicas con los usuarios.

Inicio rápido de API

openai/gpt-5.2

Ver documentación
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-thinking',
    messages: [{ role: 'user', content: 'Analyze this recursive reflection problem in WebGL 2.' }],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GPT-5.2

Mira lo que la comunidad piensa sobre GPT-5.2

"El modo Thinking de GPT-5.2 es un cambio total para tareas de codificación complejas; realmente construye apps funcionales de un solo golpe."
AI_Dev
reddit
"Encontró a Waldo en 13 minutos usando análisis de píxeles puros. Aterradoramente inteligente pero muy lento para tareas simples."
VisualLearner
youtube
"El recall del context window de 400k es casi perfecto, finalmente un competidor real para el dominio de context largo de Gemini."
LogicGate
hackernews
"Crear imágenes con GPT-5.2 todavía se siente más lento que la melaza subiendo una colina en enero. La velocidad es su mayor enemigo."
adventurepaul
reddit
"Los modelos de OpenAI se enfocan tanto en ser organizados ahora que básicamente dejan de sentirse como una conversación."
ArchMeta1868
reddit
"El premio ARC acaba de verificar una mejora de eficiencia de 390x en un año desde el model o3 al 5.2."
Fireship
x

Videos sobre GPT-5.2

Mira tutoriales, reseñas y discusiones sobre GPT-5.2

GPT 5.2 no es solo una mejor versión de GPT-4. Es una bestia completamente diferente.

En algunos modos, puedes alimentarlo con libros enteros, múltiples artículos de investigación y bases de código masivas a la vez.

En tareas de reasoning basadas en imágenes, el modo Thinking alcanza alrededor del 89% de precisión en benchmarks realmente desafiantes.

El parámetro de reasoning effort es la clave para desbloquear el verdadero potencial lógico de este model.

Espera a ver cómo maneja el prompt caching para tareas recurrentes de desarrolladores.

El model identificó correctamente que las abejas entran por una sola entrada en lugar de dispersarse al azar.

El model pasó 19 segundos 'pensando' para generar un clon funcional de Photoshop con capas y modos de fusión.

GPT 5.2 implementó con éxito ray tracing recursivo para esferas reflectantes en WebGL 2.

Es la primera vez que veo una AI mantener el estado a través de una cadena de lógica tan masiva.

Incluso con diseños de UI complejos, el módulo de visión nunca perdió de vista el CTA principal.

OpenAI acaba de lanzar su respuesta a Gemini: GPT 5.2, un model que una vez más inclina la balanza del hype de la AI a favor de OpenAI.

Sin embargo, el verdadero alarde es su ascenso a la cima del benchmark ARC AGI.

El premio ARC acaba de verificar una mejora de eficiencia de 390x en un año desde el model o3 al 5.2.

Si pensabas que los agentes de codificación anteriores eran buenos, esta cosa está en otro nivel de autonomía.

Lánzalo, simplemente lanza el model porque está resolviendo problemas de GitHub mientras dormimos.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes
Ver video demo

Consejos Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de este modelo.

Habilita el modo Thinking para la lógica

cambia explícitamente a la variante gpt-5.2-thinking cuando resuelvas problemas matemáticos o de codificación de alta complejidad para obtener la máxima precisión.

Aprovecha el Prompt Caching

saca ventaja del prompt caching de 24 horas para reducir la latency y los costos al trabajar con datasets grandes y recurrentes.

Utiliza el Model Context Protocol

conecta el model a tus herramientas de espacio de trabajo para permitir la ejecución de tareas del mundo real, como programar citas y enviar correos electrónicos.

Prompting paso a paso

solicita al model que muestre su proceso de reasoning para ayudar a auditar la toma de decisiones durante tareas de reasoning de context extremadamente largo.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.