openai

GPT-5.2

GPT-5.2 es el flagship model de OpenAI para tareas profesionales, con una context window de 400K, capacidades de coding de élite y razonamiento multietapa...

openai logoopenaiGPT-5December 11, 2025
Contexto
400Ktokens
Salida máx.
100Ktokens
Precio entrada
$1.75/ 1M
Precio salida
$14.00/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
93%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GPT-5.2 obtuvo 93% en este benchmark.
HLE
45%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GPT-5.2 obtuvo 45% en este benchmark.
MMLU
88%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GPT-5.2 obtuvo 88% en este benchmark.
MMLU Pro
83%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GPT-5.2 obtuvo 83% en este benchmark.
SimpleQA
58%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. GPT-5.2 obtuvo 58% en este benchmark.
IFEval
95%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GPT-5.2 obtuvo 95% en este benchmark.
AIME 2025
100%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GPT-5.2 obtuvo 100% en este benchmark.
MATH
98%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GPT-5.2 obtuvo 98% en este benchmark.
GSM8k
99%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GPT-5.2 obtuvo 99% en este benchmark.
MGSM
98%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GPT-5.2 obtuvo 98% en este benchmark.
MathVista
78%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. GPT-5.2 obtuvo 78% en este benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GPT-5.2 obtuvo 80% en este benchmark.
HumanEval
95%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GPT-5.2 obtuvo 95% en este benchmark.
LiveCodeBench
80%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GPT-5.2 obtuvo 80% en este benchmark.
MMMU
75%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. GPT-5.2 obtuvo 75% en este benchmark.
MMMU Pro
65%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. GPT-5.2 obtuvo 65% en este benchmark.
ChartQA
93%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. GPT-5.2 obtuvo 93% en este benchmark.
DocVQA
95%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. GPT-5.2 obtuvo 95% en este benchmark.
Terminal-Bench
60%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GPT-5.2 obtuvo 60% en este benchmark.
ARC-AGI
52.9%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GPT-5.2 obtuvo 52.9% en este benchmark.

Acerca de GPT-5.2

Conoce las capacidades, características y formas de uso de GPT-5.2.

Reasoning Profesional de Élite

GPT-5.2 representa la frontier de OpenAI en inteligencia artificial de grado profesional, específicamente diseñada para el trabajo de conocimiento complejo y la ejecución de tareas autónomas. Lanzado a finales de 2025, introduce un modo Thinking dedicado que permite al model pausar y planificar una lógica multietapa, lo que lo hace excepcionalmente competente en ingeniería de software intrincada, demostraciones matemáticas avanzadas y análisis científico. Esta arquitectura de model integra visión multimodal y llamadas a herramientas en un motor de reasoning unificado, permitiéndole actuar como un socio agentic en los flujos de trabajo profesionales.

Arquitectura de Inteligencia Escalable

Técnicamente, GPT-5.2 cuenta con una context window de 400K, líder en la industria, con una precisión de recuperación de casi el 100%, lo que le permite procesar bases de código masivas o manuales técnicos densos sin perder información. Aunque destaca en precisión y fiabilidad —reduciendo las alucinaciones en un 30% en comparación con iteraciones anteriores— el model adopta un tono conversacional más formal y estructurado. Está optimizado para entornos empresariales donde se priorizan la consistencia y la precisión sobre los adornos creativos, marcando un cambio hacia la IA como un trabajador del conocimiento confiable.

GPT-5.2

Casos de uso de GPT-5.2

Descubre las diferentes formas de usar GPT-5.2 para lograr excelentes resultados.

Ingeniería de Software Autónoma

Resolución de problemas complejos en GitHub y gestión de depuración de bases de código a gran escala con un 80% de precisión.

Investigación Financiera Avanzada

Realización de análisis profundo de acciones fundamentales y síntesis de tendencias de mercado utilizando herramientas agentic integradas.

Automatización de Negocios Multietapa

Orquestación de flujos de trabajo complejos a través de aplicaciones de productividad conectadas como Notion, Slack y Google Drive.

Síntesis de Documentos Técnicos

Procesamiento y resumen de documentos técnicos masivos utilizando su context window de 400K tokens.

Reasoning Matemático Científico

Resolución de problemas científicos de nivel de doctorado y matemáticas de nivel de competición a través del modo Thinking especializado.

Generación de Contenido Profesional

Producción de prosa de estilo operístico de alta calidad e informes profesionales formateados a escala.

Fortalezas

Limitaciones

Competencia de Coding de Élite: Su puntuación del 80% en SWE-bench Verified lo convierte en uno de los models más capaces para la ingeniería de software profesional.
Problemas de Latency en Visión: Las tareas de percepción y creación de imágenes son significativamente más lentas que el reasoning basado en texto debido a la alta carga computacional.
Reasoning State-of-the-art: La variante especializada Thinking proporciona una lógica profunda para matemáticas de nivel de competición y ciencia de nivel de doctorado.
Tono Conversacional Frío: El estilo de interacción del model a menudo se describe como formal y robótico, careciendo de la calidez natural de iteraciones anteriores.
Uso de Herramientas Agentic: Altamente eficaz en el uso de herramientas externas como navegadores y entornos de Python para gestionar flujos de trabajo profesionales multietapa.
Precios de Salida Premium: A $14 por cada millón de tokens en modo Thinking, los costes de salida siguen siendo significativamente más altos que los de models más antiguos y ágiles.
Recuperación de Contexto a Gran Escala: Soporta hasta 400K tokens con una precisión casi perfecta, ideal para analizar y sintetizar conjuntos de datos masivos.
Discontinuidad Conversacional: Su enfoque en la organización a veces puede interrumpir el flujo de discusiones naturales y sincrónicas con los usuarios.

Inicio rápido de API

openai/gpt-5.2

Ver documentación
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-thinking',
    messages: [{ role: 'user', content: 'Analyze this recursive reflection problem in WebGL 2.' }],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GPT-5.2

Mira lo que la comunidad piensa sobre GPT-5.2

"El modo thinking de GPT-5.2 cambia las reglas del juego para tareas de coding complejas; realmente construye aplicaciones funcionales de una sola vez."
AI_Dev
reddit
"Encontró a Waldo en 13 minutos usando análisis de píxeles puros. Aterradoramente inteligente pero muy lento para tareas sencillas."
VisualLearner
youtube
"El recuerdo de la context window de 400k es casi perfecto, finalmente un competidor real para el dominio de context window larga de Gemini."
LogicGate
hackernews
"Crear imágenes con GPT-5.2 todavía se siente más lento que una tortuga en enero. La velocidad es su mayor enemigo."
adventurepaul
reddit
"Los models de OpenAI se enfocan tanto en ser organizados ahora que básicamente deja de sentirse como una conversación."
ArchMeta1868
reddit
"El premio ARC acaba de verificar una mejora de eficiencia de 390x en un año desde el model o3 al 5.2."
Fireship
x

Videos sobre GPT-5.2

Mira tutoriales, reseñas y discusiones sobre GPT-5.2

GPT 5.2 no es solo una versión mejorada de GPT-4. Es una bestia completamente diferente.

En algunos modos, puedes alimentarlo con libros enteros, múltiples artículos de investigación y bases de código masivas a la vez.

En tareas de reasoning basadas en imágenes, el modo thinking logra alrededor de un 89% de precisión en benchmarks realmente desafiantes.

El parámetro de reasoning effort es la clave para desbloquear el verdadero potencial lógico de este model.

Espera a ver cómo maneja el prompt caching para tareas recurrentes de desarrollador.

El model identificó correctamente que las abejas entran por una sola entrada en lugar de dispersarse aleatoriamente.

El model dedicó 19 segundos a 'pensar' para generar un clon funcional de Photoshop con capas y modos de fusión.

GPT 5.2 implementó con éxito el rastreo de rayos recursivo para esferas reflectantes en WebGL 2.

Es la primera vez que veo una IA mantener el estado a través de una cadena de lógica tan masiva.

Incluso con diseños de interfaz de usuario complejos, el módulo de visión nunca perdió de vista la llamada a la acción principal.

OpenAI acaba de lanzar su respuesta a Gemini: GPT 5.2, un model que una vez más inclina la balanza del hype de la IA a favor de OpenAI.

El verdadero alarde, sin embargo, es su ascenso a la cima del benchmark ARC AGI.

El premio ARC acaba de verificar una mejora de eficiencia de 390x en un año desde el model o3 al 5.2.

Si pensabas que los agentes de coding anteriores eran buenos, esta cosa está en otro nivel de autonomía.

Lánzalo, simplemente lanza el model porque está resolviendo problemas de GitHub mientras dormimos.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes
Ver video demo

Consejos Pro para GPT-5.2

Consejos de expertos para ayudarte a sacar el máximo provecho de GPT-5.2.

Habilita el modo Thinking para lógica

Cambia explícitamente a la variante gpt-5.2-thinking al resolver problemas de matemáticas o coding de alta complejidad para obtener la máxima precisión.

Aprovecha el prompt caching

Saca ventaja del prompt caching de 24 horas para reducir la latency y los costes al trabajar con conjuntos de datos grandes y recurrentes.

Utiliza el Model Context Protocol

Conecta el model a tus herramientas de espacio de trabajo para permitir la ejecución de tareas en el mundo real, como programar citas y enviar correos electrónicos.

Prompting paso a paso

Pide al model que muestre su proceso de reasoning para ayudar a auditar la toma de decisiones durante tareas de reasoning de context window extremadamente larga.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Preguntas Frecuentes Sobre GPT-5.2

Encuentra respuestas a preguntas comunes sobre GPT-5.2