openai

GPT-4o mini

GPT-4o mini es el model pequeño más rentable de OpenAI, ofreciendo inteligencia de clase GPT-4 con velocidad superior y visión multimodal para tareas de alto...

Model pequeñoRentableCapacidad de visiónAI rápidaMultimodal
openai logoopenaiGPT-418 de julio de 2024
Contexto
128Ktokens
Salida máx.
16Ktokens
Precio entrada
$0.15/ 1M
Precio salida
$0.60/ 1M
Modalidad:TextImage
Capacidades:VisiónHerramientasStreaming
Benchmarks
GPQA
40.2%
GPQA: Q&A Científico Nivel Posgrado. Un riguroso benchmark con 448 preguntas de opción múltiple en biología, física y química creadas por expertos. Los doctores solo logran 65-74% de precisión, mientras que los no expertos obtienen solo 34% incluso con acceso ilimitado a internet (por eso 'a prueba de Google'). GPT-4o mini obtuvo 40.2% en este benchmark.
HLE
2.3%
HLE: Razonamiento de Alto Nivel de Experticia. Evalúa la capacidad de un modelo para demostrar razonamiento a nivel experto en dominios especializados. Evalúa la comprensión profunda de temas complejos que requieren conocimiento profesional. GPT-4o mini obtuvo 2.3% en este benchmark.
MMLU
82%
MMLU: Comprensión Masiva Multitarea del Lenguaje. Un benchmark completo con 16,000 preguntas de opción múltiple en 57 materias académicas incluyendo matemáticas, filosofía, derecho y medicina. Evalúa conocimiento amplio y capacidades de razonamiento. GPT-4o mini obtuvo 82% en este benchmark.
MMLU Pro
57%
MMLU Pro: MMLU Edición Profesional. Una versión mejorada de MMLU con 12,032 preguntas usando un formato más difícil de 10 opciones. Cubre Matemáticas, Física, Química, Derecho, Ingeniería, Economía, Salud, Psicología, Negocios, Biología, Filosofía e Informática. GPT-4o mini obtuvo 57% en este benchmark.
SimpleQA
8.6%
SimpleQA: Benchmark de Precisión Factual. Evalúa la capacidad de un modelo para proporcionar respuestas precisas y factuales a preguntas directas. Mide la fiabilidad y reduce las alucinaciones en tareas de recuperación de conocimiento. GPT-4o mini obtuvo 8.6% en este benchmark.
IFEval
76.5%
IFEval: Evaluación de Seguimiento de Instrucciones. Mide qué tan bien un modelo sigue instrucciones y restricciones específicas. Evalúa la capacidad de adherirse a reglas de formato, límites de longitud y otros requisitos explícitos. GPT-4o mini obtuvo 76.5% en este benchmark.
AIME 2025
5%
AIME 2025: Examen de Matemáticas Invitacional Americano. Problemas de matemáticas a nivel de competencia del prestigioso examen AIME diseñado para estudiantes talentosos de secundaria. Evalúa resolución avanzada de problemas matemáticos que requiere razonamiento abstracto. GPT-4o mini obtuvo 5% en este benchmark.
MATH
50.2%
MATH: Resolución de Problemas Matemáticos. Un benchmark completo de matemáticas que evalúa la resolución de problemas en álgebra, geometría, cálculo y otros dominios matemáticos. Requiere razonamiento en múltiples pasos y conocimiento matemático formal. GPT-4o mini obtuvo 50.2% en este benchmark.
GSM8k
91.3%
GSM8k: Matemáticas de Primaria 8K. 8,500 problemas de matemáticas de nivel primaria que requieren razonamiento en múltiples pasos. Evalúa aritmética básica y pensamiento lógico a través de escenarios cotidianos. GPT-4o mini obtuvo 91.3% en este benchmark.
MGSM
87%
MGSM: Matemáticas de Primaria Multilingüe. El benchmark GSM8k traducido a 10 idiomas incluyendo español, francés, alemán, ruso, chino y japonés. Evalúa el razonamiento matemático en diferentes idiomas. GPT-4o mini obtuvo 87% en este benchmark.
MathVista
42%
MathVista: Razonamiento Visual Matemático. Evalúa la capacidad de resolver problemas matemáticos que involucran elementos visuales como gráficos, diagramas de geometría y figuras científicas. Combina comprensión visual con razonamiento matemático. GPT-4o mini obtuvo 42% en este benchmark.
SWE-Bench
8.7%
SWE-Bench: Benchmark de Ingeniería de Software. Los modelos de IA intentan resolver issues reales de GitHub en proyectos Python de código abierto con verificación humana. Evalúa habilidades prácticas de ingeniería de software. Los mejores modelos pasaron de 4.4% (2023) a más del 70% (2024). GPT-4o mini obtuvo 8.7% en este benchmark.
HumanEval
87.2%
HumanEval: Problemas de Programación Python. 164 problemas de programación escritos a mano donde los modelos deben generar implementaciones correctas de funciones Python. Cada solución se verifica con tests unitarios. Los mejores modelos ahora logran más del 90%. GPT-4o mini obtuvo 87.2% en este benchmark.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark de Codificación en Vivo. Evalúa habilidades de codificación con desafíos de programación del mundo real continuamente actualizados. A diferencia de benchmarks estáticos, usa problemas frescos para prevenir contaminación de datos. GPT-4o mini obtuvo 32.5% en este benchmark.
MMMU
59.4%
MMMU: Comprensión Multimodal. Benchmark de Comprensión Multimodal Multidisciplinaria Masiva que evalúa modelos de visión-lenguaje en problemas universitarios en 30 materias que requieren tanto comprensión de imágenes como conocimiento experto. GPT-4o mini obtuvo 59.4% en este benchmark.
MMMU Pro
34%
MMMU Pro: MMMU Edición Profesional. Versión mejorada de MMMU con preguntas más desafiantes y evaluación más estricta. Evalúa razonamiento multimodal avanzado a niveles profesional y experto. GPT-4o mini obtuvo 34% en este benchmark.
ChartQA
78%
ChartQA: Respuesta a Preguntas sobre Gráficos. Evalúa la capacidad de comprender y razonar sobre información presentada en gráficos y diagramas. Requiere extracción de datos, comparación de valores y cálculos desde representaciones visuales. GPT-4o mini obtuvo 78% en este benchmark.
DocVQA
88%
DocVQA: Q&A Visual de Documentos. Benchmark de Respuesta a Preguntas Visuales de Documentos que evalúa la capacidad de extraer y razonar sobre información de imágenes de documentos incluyendo formularios, reportes y texto escaneado. GPT-4o mini obtuvo 88% en este benchmark.
Terminal-Bench
40%
Terminal-Bench: Tareas de Terminal/CLI. Evalúa la capacidad de realizar operaciones de línea de comandos, escribir scripts de shell y navegar en entornos de terminal. Mide habilidades prácticas de administración de sistemas y flujos de trabajo de desarrollo. GPT-4o mini obtuvo 40% en este benchmark.
ARC-AGI
8%
ARC-AGI: Abstracción y Razonamiento. Corpus de Abstracción y Razonamiento para AGI - evalúa inteligencia fluida a través de puzzles de reconocimiento de patrones novedosos. Cada tarea requiere descubrir la regla subyacente a partir de ejemplos, midiendo capacidad de razonamiento general en lugar de memorización. GPT-4o mini obtuvo 8% en este benchmark.

Acerca de GPT-4o mini

Conoce las capacidades, características y formas de uso de GPT-4o mini.

Un nuevo estándar para models pequeños

GPT-4o mini representa un salto significativo en la eficiencia de la AI, diseñado para reemplazar a GPT-3.5 Turbo como el model de referencia para desarrolladores. Construido con una arquitectura multimodal nativa, ofrece un rendimiento de clase GPT-4 a una fracción del coste y la latency. Cuenta con un enorme context window de 128,000 tokens y soporta outputs complejos de hasta 16,384 tokens, lo que lo hace ideal para procesar documentos largos y flujos de datos de gran volumen.

La inteligencia se une a la asequibilidad

A diferencia de los models pequeños anteriores que sacrificaban inteligencia por velocidad, GPT-4o mini mantiene altas capacidades de reasoning en tareas de texto y visión. Es un 60% más barato que GPT-3.5 Turbo y significativamente más capaz, con una puntuación del 82% en el benchmark MMLU. Este model está específicamente optimizado para aplicaciones donde la baja latency y la alta fiabilidad son fundamentales, como asistentes de clientes en tiempo real y motores de clasificación de datos a gran escala.

GPT-4o mini

Casos de uso de GPT-4o mini

Descubre las diferentes formas de usar GPT-4o mini para lograr excelentes resultados.

Automatización de atención al cliente

Despliega chatbots de baja latency y rentables que pueden gestionar miles de consultas rutinarias con alta precisión.

Extracción de datos estructurados

Convierte grandes volúmenes de texto no estructurado o datos de imagen en esquemas JSON limpios y formateados para bases de datos.

Traducción en tiempo real

Potencia aplicaciones de mensajería con traducción casi instantánea en docenas de idiomas con un coste operativo mínimo.

Resumen de documentos

Resume informes largos y transcripciones de reuniones utilizando el amplio context window de 128k.

Análisis visual y OCR

Extrae texto de imágenes, analiza gráficos y describe contenido visual para fines de accesibilidad.

Prototipado rápido

Construye e itera rápidamente aplicaciones de AI con un gasto mínimo en la API antes de escalar a models más grandes.

Fortalezas

Limitaciones

Relación precio-rendimiento inigualable: A $0.15/1M de input tokens, ofrece una reducción de costes del 99% en comparación con GPT-4 manteniendo una lógica alta.
Profundidad de reasoning limitada: No posee las capacidades avanzadas de chain-of-thought presentes en models como OpenAI o1.
Tiempo de respuesta de baja latency: Diseñado para la velocidad, proporcionando respuestas casi instantáneas críticas para agentes conversacionales en tiempo real.
Restricción de output tokens: El límite de 16,384 tokens de salida es inferior al de models especializados que ofrecen paridad total con los 128k de salida.
Visión multimodal nativa: A diferencia de los models pequeños heredados, procesa imágenes de forma nativa con altas puntuaciones en el benchmark ChartQA (78.0).
Brechas en programación compleja: Presenta dificultades con el diseño arquitectónico de alto nivel y la depuración de repositorios de múltiples archivos de gran tamaño.
Seguimiento de instrucciones sólido: Logra un 76.5% en IFEval, demostrando una capacidad superior para adherirse a reglas de formato complejas.
Sin input de audio nativo: No soporta el procesamiento directo de audio a audio a través del endpoint estándar de la API de texto/visión.

Inicio rápido de API

openai/gpt-4o-mini

Ver documentación
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "You are a helpful assistant." },
      { role: "user", content: "Analyze this data and return JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

Instala el SDK y comienza a hacer llamadas API en minutos.

Lo que la gente dice sobre GPT-4o mini

Mira lo que la comunidad piensa sobre GPT-4o mini

GPT-4o mini es básicamente el fin de GPT-3.5. Es más rápido, más barato y más inteligente. Ya no hay razón para usar el model antiguo.
rowqi
reddit
OpenAI realmente ha cambiado las reglas del juego con el precio. 15 centavos por un millón de tokens es una locura para este nivel de lógica.
peterm1598
hackernews
Estoy viendo respuestas casi instantáneas en mi chatbot. La latency en 4o-mini es impresionante para ese precio.
WesternCat5211
twitter
¡GPT-4o mini se lanzó hace 4 días y ya está procesando más de 200 mil millones de tokens al día!
Sam Altman
twitter
El rendimiento de visión para algo tan barato es la verdadera noticia. Maneja gráficos mejor de lo que lo hacían algunos flagship models hace un año.
VisionDev99
reddit
Sigue las instrucciones del sistema perfectamente para la extracción de JSON. Una mejora masiva respecto a la fiabilidad de 3.5 Turbo.
LLM_Master
hackernews

Videos sobre GPT-4o mini

Mira tutoriales, reseñas y discusiones sobre GPT-4o mini

La era del model pequeño ha llegado

Tiene un precio de 15 centavos por millón de input tokens... eso es increíblemente barato

GPT-4o mini es muy, muy rápido... increíblemente rápido

Este model básicamente reemplaza a GPT-3.5 Turbo y es un 60% más barato

Mira qué rápido genera el texto, es casi instantáneo

GPT-4o mini es gratis, es rápido y realmente es bastante bueno

GPT-3.5 ha desaparecido por completo... ahora te redirige a GPT-4o mini

Mira esa velocidad, mucho más rápido, ¿verdad?

Es un model multimodal, lo que significa que puede ver imágenes

Supera a GPT-3.5 Turbo e incluso a GPT-4 en algunos benchmarks

OpenAI básicamente ha lanzado un competidor que parece estar superando a muchos de estos models

Es el model que han optimizado para que el coste sea el mínimo posible

Poder generar 16,000 output tokens a la vez es algo realmente útil

El context window es de 128k, lo cual es genial para aplicaciones RAG

Las medidas de seguridad en este model están integradas desde el principio

Mas que solo prompts

Potencia tu flujo de trabajo con Automatizacion IA

Automatio combina el poder de agentes de IA, automatizacion web e integraciones inteligentes para ayudarte a lograr mas en menos tiempo.

Agentes de IA
Automatización Web
Flujos Inteligentes

Consejos Pro para GPT-4o mini

Consejos de expertos para ayudarte a sacar el máximo provecho de GPT-4o mini.

Instrucciones directas del sistema

Proporciona prompts de sistema concisos para guiar al model hacia formatos de salida específicos como JSON o Markdown.

Agrupación de contexto (Batching)

Utiliza el context window de 128k agrupando tareas pequeñas relacionadas en un solo prompt para reducir costes operativos.

Etiquetado de visión

Solicita atributos visuales específicos al procesar imágenes para mejorar la precisión en la extracción de metadatos.

Streaming para UX

Activa siempre el parámetro de stream para proporcionar un feedback inmediato de tokens a los usuarios finales.

Ajuste de temperatura

Establece la temperatura en 0 para tareas de datos estructurados para asegurar outputs deterministas y consistentes.

Testimonios

Lo Que Dicen Nuestros Usuarios

Unete a miles de usuarios satisfechos que han transformado su flujo de trabajo

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

Preguntas Frecuentes Sobre GPT-4o mini

Encuentra respuestas a preguntas comunes sobre GPT-4o mini