openai

GPT-5.2 Pro

GPT-5.2 Pro es el modelo de reasoning insignia de OpenAI para 2025, con Extended Thinking para un rendimiento SOTA en matemáticas, programación y trabajo...

openai logoopenaiGPT-52025-12-11
Contexto
400Ktokens
Salida máx.
128Ktokens
Precio entrada
$21.00/ 1M
Precio salida
$168.00/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreamingRazonamiento
Benchmarks
GPQA
93.2%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GPT-5.2 Pro obtuvo 93.2% en este benchmark.
HLE
36.6%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GPT-5.2 Pro obtuvo 36.6% en este benchmark.
MMLU
89.6%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GPT-5.2 Pro obtuvo 89.6% en este benchmark.
MMLU Pro
82%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GPT-5.2 Pro obtuvo 82% en este benchmark.
SimpleQA
52%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. GPT-5.2 Pro obtuvo 52% en este benchmark.
IFEval
93.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GPT-5.2 Pro obtuvo 93.5% en este benchmark.
AIME 2025
100%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GPT-5.2 Pro obtuvo 100% en este benchmark.
MATH
97%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GPT-5.2 Pro obtuvo 97% en este benchmark.
GSM8k
99.2%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GPT-5.2 Pro obtuvo 99.2% en este benchmark.
MGSM
96%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GPT-5.2 Pro obtuvo 96% en este benchmark.
MathVista
76.5%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. GPT-5.2 Pro obtuvo 76.5% en este benchmark.
SWE-Bench
80%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GPT-5.2 Pro obtuvo 80% en este benchmark.
HumanEval
94.5%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GPT-5.2 Pro obtuvo 94.5% en este benchmark.
LiveCodeBench
78%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GPT-5.2 Pro obtuvo 78% en este benchmark.
MMMU
79.5%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. GPT-5.2 Pro obtuvo 79.5% en este benchmark.
MMMU Pro
79.5%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. GPT-5.2 Pro obtuvo 79.5% en este benchmark.
ChartQA
91.2%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. GPT-5.2 Pro obtuvo 91.2% en este benchmark.
DocVQA
94.8%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. GPT-5.2 Pro obtuvo 94.8% en este benchmark.
Terminal-Bench
55.6%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GPT-5.2 Pro obtuvo 55.6% en este benchmark.
ARC-AGI
54.2%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GPT-5.2 Pro obtuvo 54.2% en este benchmark.

Acerca de GPT-5.2 Pro

Conoce las capacidades, características y formas de uso de GPT-5.2 Pro.

Un nuevo estándar en inteligencia basada en reasoning

GPT-5.2 Pro representa el nivel de alto cómputo de los modelos de OpenAI centrados en el reasoning. Está diseñado específicamente para flujos de trabajo empresariales que requieren investigación científica a nivel de doctorado e inference lógica compleja. A diferencia de los modelos de lenguaje estándar, utiliza una arquitectura de cómputo en tiempo de inference sofisticada que permite a los usuarios escalar el esfuerzo de pensamiento del modelo. Esto permite que el sistema descomponga problemas internamente, verifique su propia lógica y anule sesgos estadísticos que a menudo conducen a errores en modelos más pequeños.

Especializado en precisión técnica

Aunque comparte el entrenamiento central con la familia GPT-5, la variante Pro se distingue por su masiva context window de 400 000 tokens y tasas de alucinación significativamente más bajas. Se ha documentado como un colaborador fiable en física teórica y pruebas matemáticas de alto riesgo. Su rendimiento en benchmarks resistentes a la contaminación como ARC-AGI-2 y GPQA Diamond lo establece como un motor de proceso principal para agentes autónomos que deben manejar instrucciones técnicas de varios pasos sin intervención humana.

Rendimiento y salida empresarial

El modelo se caracteriza por su estricto cumplimiento de instrucciones complejas y su tono conversacional profesional. Es el primer modelo que supera consistentemente a expertos humanos de la industria con más de 14 años de experiencia en benchmarks de tareas laborales especializadas. Con una capacidad de generación de hasta 128 000 tokens, marca un cambio significativo con respecto a la pereza observada en generaciones anteriores, lo que lo hace capaz de producir módulos de código completos o informes de investigación exhaustivos en una sola pasada.

GPT-5.2 Pro

Casos de uso de GPT-5.2 Pro

Descubre las diferentes formas de usar GPT-5.2 Pro para lograr excelentes resultados.

Ingeniería de software autónoma

Resolución de problemas complejos de GitHub que abarcan múltiples archivos y refactorización de módulos completos con una tasa de éxito del 84.5% en SWE-Bench Verified.

Matemáticas de olimpiada

Resolución del 100% de los problemas de la competición AIME 2025 y aportación de pruebas originales a cuestiones abiertas en teoría del aprendizaje estadístico.

Orquestación de agentes empresariales

Actúa como un motor de procesos de alto cómputo capaz de secuenciar decenas de herramientas para gestionar modelado financiero y logística de múltiples pasos.

Investigación científica a nivel de doctorado

Análisis de problemas de física, química y biología con una puntuación GPQA del 93.2%, superando a muchos expertos humanos en la materia.

Síntesis de documentos de contexto largo

Ingesta de hasta 400 000 tokens de datos de archivo para generar informes legales exhaustivos o manuales técnicos.

Simulación 3D interactiva

Generación de simulaciones 3D de miles de líneas en Three.js o C++, incluyendo física de partículas compleja y lógica mecánica.

Fortalezas

Limitaciones

Precisión matemática perfecta: Logra una tasa de resolución impecable del 100% en el benchmark AIME 2025, agotando la señal en exámenes modernos de matemáticas a nivel de concurso.
Precios prohibitivos: A $168 por millón de tokens de salida, el modelo es aproximadamente 16 veces más caro que GPT-5.1, lo que limita su uso a flujos de trabajo de alto riesgo.
Programación state-of-the-art: Alcanza una tasa de resolución del 84.5% en SWE-Bench Verified, funcionando eficazmente como un ingeniero junior capaz de gestionar un backlog de errores no trivial.
Falta de funciones de memoria: Carece de soporte para Saved Memories y Reference Chat History, funciones que son estándar en los modelos de nivel inferior ChatGPT 5.2.
Reasoning abstracto avanzado: Triple del rendimiento en ARC-AGI-2 de su predecesor (54.2% frente a 17.6%), lo que indica un avance en el manejo de tareas novedosas de inducción de reglas.
Latencia significativa: El deep reasoning interno puede hacer que el modelo tarde más de 15 minutos en un solo prompt, especialmente en modo de esfuerzo xhigh.
Capacidad de salida masiva de 128K: Diseñado para generar libros completos, repositorios de código o informes científicos exhaustivos en una sola pasada de inference.
Errores en la selección de frames: Fallo ocasional al anular sesgos estadísticos en tareas de sentido común, incluso cuando identifica correctamente las restricciones lógicas en los procesos de pensamiento.

Inicio rápido de API

openai/gpt-5.2-pro

Ver documentación
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Design a leveraged buyout model for a take-private project.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GPT-5.2 Pro

Mira lo que la comunidad piensa sobre GPT-5.2 Pro

El reasoning estaba presente; la conclusión simplemente no se derivaba de ahí. Si eso no te hace dudar, debería.
Ok_Entrance_4380
reddit
GPT-5.2 Pro obtuvo un nuevo resultado en física teórica que superó el escrutinio de expertos, algo que 5.1 no pudo hacer.
kevinweil
twitter
GPT-5.2 Pro empieza a parecer un ingeniero junior que puede hacerse cargo de una parte no trivial del seguimiento de incidencias.
Due_Woodpecker2882
reddit
OpenAI admite que el modelo Pro carece de memoria. Es devastador para mí como académico.
Oldschool728603
hackernews
La lógica es impecable, pero la latencia hace que parezca que estoy colaborando con un genio muy lento.
User123
reddit
Por fin, un modelo que no alucina al realizar una simple contracción de tensores.
PhysicsProf
hackernews

Videos sobre GPT-5.2 Pro

Mira tutoriales, reseñas y discusiones sobre GPT-5.2 Pro

se rumorean puntuaciones de CI de Mensa Noruega entre 145 y 147

produjo más de 24 000 líneas de código

inclusión de una opción de tiempo de pensamiento seleccionable

el precio del nivel Pro es estrictamente para presupuestos empresariales

este modelo resolvió todo mi backlog de desarrollo en una tarde

30% de reducción en alucinaciones

el diseño general es sorprendentemente bueno comparado con donde estábamos con 5.1

Exactamente 300 palabras. Es la primera vez que le doy un recuento de palabras y lo clavó en el número exacto

Las capacidades de visión en planos arquitectónicos son inigualables

Se siente significativamente más frío y robótico que 5.1

GPT5 Pro de $200 pensó durante 25 minutos y 36 segundos

asignando el doble de cómputo de inference

convirtió un problema complicado... en un tipo diferente de maquinaria de un campo llamado análisis complejo

es efectivamente un doctorado en una caja por $200 al mes

el rastro de pensamiento muestra que realmente está verificando sus propios pasos

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para GPT-5.2 Pro

Consejos de expertos para ayudarte a sacar el máximo provecho de GPT-5.2 Pro.

Ajusta el esfuerzo de reasoning

Usa el parámetro de API reasoning_effort y configúralo en xhigh para tareas donde la consistencia lógica es más importante que la velocidad de generación.

Aborda los sesgos estadísticos

Si el modelo cae en trampas de sentido común, proporciona una breve indicación contextual para activar su capa de reasoning activo y anular su entrenamiento base.

Utiliza la salida masiva

Solicita directorios completos de proyectos o archivos de documentación completos en un solo prompt para aprovechar el presupuesto de salida de 128K.

Aprovecha la integración de herramientas

Habilita siempre el function calling para tareas de visión; el rendimiento multimodal del modelo aumenta cuando puede usar herramientas para verificar datos visuales.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Preguntas Frecuentes Sobre GPT-5.2 Pro

Encuentra respuestas a preguntas comunes sobre GPT-5.2 Pro