openai

GPT-4o mini

GPT-4o mini es el model pequeño más eficiente de OpenAI, ofreciendo inteligencia de nivel GPT-4 con una velocidad superior y visión multimodal para tareas de...

Model pequeñoEficiente en costosCon visiónIA rápidaMultimodal
openai logoopenaiGPT-4o18 de julio de 2024
Contexto
128Ktokens
Salida máx.
16Ktokens
Precio entrada
$0.15/ 1M
Precio salida
$0.60/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreaming
Benchmarks
GPQA
40.2%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GPT-4o mini obtuvo 40.2% en este benchmark.
HLE
2.3%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GPT-4o mini obtuvo 2.3% en este benchmark.
MMLU
82%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GPT-4o mini obtuvo 82% en este benchmark.
MMLU Pro
57%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GPT-4o mini obtuvo 57% en este benchmark.
SimpleQA
8.6%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. GPT-4o mini obtuvo 8.6% en este benchmark.
IFEval
76.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GPT-4o mini obtuvo 76.5% en este benchmark.
AIME 2025
5%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GPT-4o mini obtuvo 5% en este benchmark.
MATH
50.2%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GPT-4o mini obtuvo 50.2% en este benchmark.
GSM8k
91.3%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GPT-4o mini obtuvo 91.3% en este benchmark.
MGSM
87%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GPT-4o mini obtuvo 87% en este benchmark.
MathVista
42%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. GPT-4o mini obtuvo 42% en este benchmark.
SWE-Bench
8.7%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GPT-4o mini obtuvo 8.7% en este benchmark.
HumanEval
87.2%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GPT-4o mini obtuvo 87.2% en este benchmark.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GPT-4o mini obtuvo 32.5% en este benchmark.
MMMU
59.4%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. GPT-4o mini obtuvo 59.4% en este benchmark.
MMMU Pro
34%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. GPT-4o mini obtuvo 34% en este benchmark.
ChartQA
78%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. GPT-4o mini obtuvo 78% en este benchmark.
DocVQA
88%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. GPT-4o mini obtuvo 88% en este benchmark.
Terminal-Bench
40%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GPT-4o mini obtuvo 40% en este benchmark.
ARC-AGI
8%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GPT-4o mini obtuvo 8% en este benchmark.

Acerca de GPT-4o mini

Conoce las capacidades, características y formas de uso de GPT-4o mini.

Un nuevo estándar para modelos pequeños

GPT-4o mini representa un salto significativo en la eficiencia de la IA, diseñado para reemplazar a GPT-3.5 Turbo como el model de referencia para desarrolladores. Construido con una arquitectura multimodal nativa, ofrece rendimiento de clase GPT-4 a una fracción del costo y la latency. Cuenta con una enorme context window de 128,000 tokens y admite salidas complejas de hasta 16,384 tokens, lo que lo hace ideal para procesar documentos largos y flujos de datos de alto volumen.

La inteligencia se une a la asequibilidad

A diferencia de los modelos pequeños anteriores que sacrificaban inteligencia por velocidad, GPT-4o mini mantiene altas capacidades de reasoning en tareas de texto y visión. Es 60% más barato que GPT-3.5 Turbo y significativamente más capaz, obteniendo un 82% en el benchmark MMLU. Este model está optimizado específicamente para aplicaciones donde la baja latency y la alta fiabilidad son primordiales, como asistentes de clientes en tiempo real y motores de clasificación de datos a gran escala.

GPT-4o mini

Casos de uso de GPT-4o mini

Descubre las diferentes formas de usar GPT-4o mini para lograr excelentes resultados.

Automatización de atención al cliente

Manejo de grandes volúmenes de consultas de clientes con baja latency y alta precisión a una fracción del costo.

Resumen de contenido

Procesamiento de documentos extensos o contenido largo en resúmenes concisos dentro de la context window de 128k.

Extracción de datos

Conversión de texto no estructurado o imágenes en formatos de datos estructurados como JSON para su ingesta en bases de datos.

Traducción multilingüe

Provisión de traducción en tiempo real en docenas de idiomas para aplicaciones de chat y comunicación global.

Tutoría educativa

Servir como asistente de estudio interactivo para estudiantes que necesitan ayuda con matemáticas, ciencias y artes del lenguaje.

Tareas básicas de visión

Análisis de imágenes para identificar objetos, extraer texto mediante OCR o proporcionar descripciones para accesibilidad.

Fortalezas

Limitaciones

Relación precio-rendimiento increíble: A $0.15 por millón de tokens de entrada, ofrece un reasoning de nivel frontier con una puntuación MMLU del 82%.
Brechas en reasoning complejo: Está por detrás de modelos más grandes como GPT-4o o o1 en ciencia de nivel experto, obteniendo un 40.2% en GPQA.
Alta velocidad de throughput: El model entrega respuestas con una latency extremadamente baja, lo que lo hace ideal para interfaces de usuario en tiempo real.
Limitaciones de codificación: Carece de la comprensión arquitectónica profunda necesaria para la ingeniería de software compleja en comparación con Claude 3.5 Sonnet.
Gran context window: Mantiene una context window completa de 128k, lo que permite un procesamiento de documentos complejo que rara vez se encuentra en modelos pequeños.
Ventana de salida reducida: El límite de salida de 16k puede ser restrictivo para tareas que requieren migraciones de código masivas o generación de libros enteros.
Soporte de visión nativo: Incluye capacidades multimodales en un factor de forma pequeño, destacando en tareas de análisis de imágenes y OCR.
Estabilidad factual: Los modelos más pequeños siguen siendo más propensos a alucinaciones en dominios de nicho que sus contrapartes flagship.

Inicio rápido de API

openai/gpt-4o-mini

Ver documentación
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explica la física cuántica." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GPT-4o mini

Mira lo que la comunidad piensa sobre GPT-4o mini

GPT-4o mini básicamente ha matado el mercado del fine-tuning de modelos antiguos para RAG básico. Los costos son demasiado bajos para ignorarlos.
AI_Dev_Central
reddit
La velocidad es simplemente una locura. Recibo los tokens casi al instante para mi agente de traducción.
TechCruncher
twitter
OpenAI realmente obligó a Anthropic y Google a reaccionar con este precio. $0.15 por 1M de tokens es un nuevo estándar.
hn_reader_99
hackernews
Cambié 3.5 por mini y la mejora en la lógica fue visible en los primeros cinco minutos de prueba.
PromptEngineerPro
youtube
Por fin es lo suficientemente barato como para usar LLMs para limpieza de datos básica a escala sin una factura masiva en la nube.
DataVizWiz
reddit
El rendimiento de visión para OCR es en realidad mejor que el de algunos modelos especializados que cuestan 10 veces más.
VisionDev
twitter

Videos sobre GPT-4o mini

Mira tutoriales, reseñas y discusiones sobre GPT-4o mini

Es más rápido y barato que GPT-3.5 Turbo en todos los ámbitos.

Las capacidades de visión para un model tan pequeño son realmente sorprendentes.

El precio es básicamente una carrera hacia cero con este lanzamiento.

Consigue mantener una context window enorme siendo muy pequeño.

Los benchmark muestran que supera a Claude Haiku en casi todas las categorías.

GPT 40 mini es un model ligero, así que es mucho más rápido que GPT 40.

Es mucho, mucho más rápido que GPT 4.

Para tareas diarias, la mayoría de los usuarios ni siquiera notará la diferencia en el reasoning.

El reconocimiento de imágenes es muy consistente para objetos básicos.

Maneja instrucciones complejas mucho mejor que el antiguo model 3.5.

Actualmente supera a gbd4 en las preferencias de chat en la tabla de clasificación LMC.

Todo se ve perfecto y este recibo en particular se ve como un recibo típico.

El tiempo de respuesta es prácticamente de sub-segundo para prompts cortos.

Es muy efectivo resumiendo archivos PDF largos a través de la API.

Puedes ejecutar millones de tokens por solo unos pocos dólares.

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para GPT-4o mini

Consejos de expertos para ayudarte a sacar el máximo provecho de GPT-4o mini.

Uso para RAG

Utilice el bajo costo de entrada para realizar Retrieval Augmented Generation a gran escala sin gastos elevados.

Estructuración con JSON Mode

Utilice el modo JSON o los parámetros de function calling para garantizar estructuras de datos consistentes para flujos de trabajo de backend.

Batch Processing

Emplee la Batch API de OpenAI con este model para reducir los costos en un 50% para tareas que no sean urgentes.

Ajuste de temperatura

Establezca una temperatura más baja, entre 0.1 y 0.3, para tareas de extracción factual con el fin de maximizar la precisión.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Preguntas Frecuentes Sobre GPT-4o mini

Encuentra respuestas a preguntas comunes sobre GPT-4o mini