openai

GPT-5.2 Pro

GPT-5.2 Pro es el reasoning model insignia de OpenAI para 2025, que presenta Pensamiento Extendido para alcanzar un rendimiento SOTA en matemáticas,...

openai logoopenaiGPT-5December 11, 2025
Contexto
400Ktokens
Salida máx.
128Ktokens
Precio entrada
$21.00/ 1M
Precio salida
$168.00/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
93.2%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GPT-5.2 Pro obtuvo 93.2% en este benchmark.
HLE
36.6%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GPT-5.2 Pro obtuvo 36.6% en este benchmark.
MMLU
89.6%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GPT-5.2 Pro obtuvo 89.6% en este benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GPT-5.2 Pro obtuvo 82% en este benchmark.
SimpleQA
52%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. GPT-5.2 Pro obtuvo 52% en este benchmark.
IFEval
93.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GPT-5.2 Pro obtuvo 93.5% en este benchmark.
AIME 2025
100%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GPT-5.2 Pro obtuvo 100% en este benchmark.
MATH
97%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GPT-5.2 Pro obtuvo 97% en este benchmark.
GSM8k
99.2%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GPT-5.2 Pro obtuvo 99.2% en este benchmark.
MGSM
96%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GPT-5.2 Pro obtuvo 96% en este benchmark.
MathVista
76.5%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. GPT-5.2 Pro obtuvo 76.5% en este benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GPT-5.2 Pro obtuvo 80% en este benchmark.
HumanEval
94.5%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GPT-5.2 Pro obtuvo 94.5% en este benchmark.
LiveCodeBench
78%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GPT-5.2 Pro obtuvo 78% en este benchmark.
MMMU
79.5%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. GPT-5.2 Pro obtuvo 79.5% en este benchmark.
MMMU Pro
79.5%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. GPT-5.2 Pro obtuvo 79.5% en este benchmark.
ChartQA
91.2%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. GPT-5.2 Pro obtuvo 91.2% en este benchmark.
DocVQA
94.8%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. GPT-5.2 Pro obtuvo 94.8% en este benchmark.
Terminal-Bench
55.6%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GPT-5.2 Pro obtuvo 55.6% en este benchmark.
ARC-AGI
54.2%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GPT-5.2 Pro obtuvo 54.2% en este benchmark.

Acerca de GPT-5.2 Pro

Conoce las capacidades, características y formas de uso de GPT-5.2 Pro.

Una Nueva Frontera en el Razonamiento

GPT-5.2 Pro es el reasoning model state-of-the-art de OpenAI, diseñado específicamente para tareas intelectuales de alta complejidad. Lanzado a finales de 2025, introduce un modo de 'pensamiento extendido' que permite al model procesar problemas complejos durante periodos prolongados para garantizar la coherencia lógica. Es ampliamente considerado el líder de la industria para demostraciones matemáticas profesionales y programación competitiva avanzada, resolviendo frecuentemente problemas que las generaciones anteriores consideraban imposibles.

Precisión Técnica y Resultados

El model se caracteriza por su estricto cumplimiento de instrucciones complejas y tasas de alucinación significativamente más bajas en la inferencia lógica en comparación con sus competidores. Mantiene un tono conversacional altamente organizado y profesional, aunque se destaca por un estilo de interacción más 'frío' y una mayor latency debido a su pesada carga de reasoning. Se ha convertido en un elemento básico para desarrolladores que requieren verificaciones mecánicas en toda la base de código e investigadores que necesitan una precisión de nivel de doctorado a través de su masiva context window de 400,000 tokens.

Rendimiento de Nivel Experto

Más allá de los benchmarks, GPT-5.2 Pro es el primer model que supera consistentemente a expertos humanos de la industria con más de 14 años de experiencia en benchmarks de tareas laborales especializadas. Su capacidad para generar decenas de miles de líneas de código funcional en un solo paso marca un cambio significativo respecto a los problemas de 'pereza' observados en modelos anteriores, convirtiéndolo en la opción principal para flujos de trabajo agentic complejos.

GPT-5.2 Pro

Casos de uso de GPT-5.2 Pro

Descubre las diferentes formas de usar GPT-5.2 Pro para lograr excelentes resultados.

Matemáticas de Olimpiada

Destaca en la resolución de problemas de nivel profesional y de la OMI con demostraciones extensas.

Tareas de Programación Mecánica

Procesa eficientemente listas masivas de actualizaciones y revisiones de código mecánico sin mostrar pereza.

Inferencia Lógica

Realiza reasoning profundo para la creación de mundos complejos y análisis de historias alternativas.

Investigación Técnica

Recupera y sintetiza con precisión datos técnicos de nicho a partir de documentación especializada.

Seguimiento de Instrucciones

Ejecuta estrictamente requisitos de usuario altamente complejos o contraintuitivos con extrema precisión.

Escritura Creativa

Capaz de producir escritura creativa de alta densidad que imita la textura de los clásicos literarios.

Fortalezas

Limitaciones

SOTA Matemático: Actualmente el único model que logra el 100% en el benchmark AIME 2025 sin herramientas externas.
Alta Latencia: El modo de 'Pensamiento Extendido' puede tardar entre 30 y 40 minutos para una sola respuesta compleja en algunos escenarios.
Programación sin Pereza: Capaz de generar más de 24,000 líneas de código funcional en una sola respuesta sin truncamiento.
Personalidad Fría: Los usuarios describen el estilo de interacción como estéril, clínico y pretencioso en comparación con modelos más conversacionales.
Paridad de Conocimiento Experto: El primer model que supera a expertos de la industria con 14 años de experiencia en las tareas GDP-Val.
Precios Premium: A $21 por 1 millón de tokens de entrada, es significativamente más caro que muchos modelos competidores como Gemini 3 Pro.
Contexto de Razonamiento Profundo: Mantiene una recuperación y lógica casi perfectas a lo largo de su enorme context window de 400,000 tokens.
Brechas de Implementación: A pesar de su inteligencia, ocasionalmente puede omitir importaciones de librerías poco comunes en scripts complejos de renderizado 3D.

Inicio rápido de API

openai/gpt-5.2-pro

Ver documentación
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [
      { role: 'user', content: 'Prove the existence of infinite primes using the extended thinking mode.' }
    ],
    reasoning_effort: 'high'
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GPT-5.2 Pro

Mira lo que la comunidad piensa sobre GPT-5.2 Pro

"GPT-5.2-codex xhigh es una bestia que recorre todo tu código base y no deja nada pendiente."
Rafael Bittencourt
x
"GPT Pro es absolutamente SOTA en esta área [Matemáticas]. A veces incluso puede resolver el tercer y sexto problema."
ArchMeta1868
reddit
"GPT-5.2 Pro sigue dejándome boquiabierto... recibí un análisis riguroso en un libro de Excel profesional."
Simon Smith
x
"Este model es como una persona muy inteligente y creativa que es poco confiable pero brillante."
Narrador
youtube
"Las alucinaciones de 5.2 son en realidad menores que las de Opus, y puede ejecutar mis requisitos de manera muy estricta."
ArchMeta1868
reddit
"La carga de reasoning es masiva, pero los resultados para demostraciones matemáticas son literalmente de nivel Nobel."
QuantumDev
hackernews

Videos sobre GPT-5.2 Pro

Mira tutoriales, reseñas y discusiones sobre GPT-5.2 Pro

Esta es la primera vez en la historia que un humano es superado en promedio... por una AGI.

El razonamiento de GPT 5.2 establece una nueva puntuación state-of-the-art del 70%... nuestro primer model que rinde al nivel de un experto humano o por encima.

Es un model singular que supera a 44 ocupaciones del mundo real en EE. UU.

La traza de reasoning interna finalmente muestra signos de autocorrección genuina.

Estamos ante un model que no solo predice texto, sino que simula la lógica.

Generar 24,000 líneas de código en una sola respuesta es algo nunca visto.

Ahora hay una opción de tiempo de pensamiento seleccionable aquí... permitiendo un modo de 'Pensamiento Extendido'.

Este model obtuvo una puntuación más alta que todos los demás modelos en el test de Mensa Noruega... CI de 145 a 147.

La recuperación en la context window es esencialmente perfecta incluso a 400k tokens.

No es solo más datos, es una arquitectura completamente diferente para la profundidad lógica.

Superar a expertos humanos en GDP-Val más del 50% de las veces es un hito aterrador para el mercado laboral.

Todo simplemente funciona... estoy realmente impresionado por las capacidades de programación de GPT 5.2.

La función canvas hace que la depuración de código 3JS sea instantánea.

OpenAI finalmente ha resuelto el problema de la 'pereza' que afectaba a GPT-4.

Este es el AI con el sonido más 'profesional' con el que jamás he interactuado.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes
Ver video demo

Consejos Pro para GPT-5.2 Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de GPT-5.2 Pro.

Pensamiento Extendido

Utiliza el modo de 'pensamiento extendido' para problemas de matemáticas o lógica donde la precisión sea más crítica que la velocidad.

Integración con Codex

Aprovecha su alto rendimiento en entornos especializados como Codex para la gestión mecánica de bases de código.

Verifica las Premisas

Si la primera premisa de una respuesta larga es incorrecta, interrumpe y corrígela de inmediato.

Refinamiento Iterativo

Si el código inicial falla, proporciona el error de la consola de vuelta para obtener una corrección de segundo intento altamente efectiva.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Preguntas Frecuentes Sobre GPT-5.2 Pro

Encuentra respuestas a preguntas comunes sobre GPT-5.2 Pro