openai

GPT-4o mini

O GPT-4o mini é o modelo pequeno mais eficiente em termos de custo da OpenAI, oferecendo inteligência nível GPT-4 com velocidade superior e visão multimodal...

Modelo pequenoEficiente em custoCapacidade de visãoIA RápidaMultimodal
openai logoopenaiGPT-4o18 de julho de 2024
Contexto
128Ktokens
Saida Max
16Ktokens
Preco Entrada
$0.15/ 1M
Preco Saida
$0.60/ 1M
Modalidade:TextImage
Capacidades:VisaoFerramentasStreaming
Benchmarks
GPQA
40.2%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. GPT-4o mini pontuou 40.2% neste benchmark.
HLE
2.3%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. GPT-4o mini pontuou 2.3% neste benchmark.
MMLU
82%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. GPT-4o mini pontuou 82% neste benchmark.
MMLU Pro
57%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. GPT-4o mini pontuou 57% neste benchmark.
SimpleQA
8.6%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. GPT-4o mini pontuou 8.6% neste benchmark.
IFEval
76.5%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. GPT-4o mini pontuou 76.5% neste benchmark.
AIME 2025
5%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. GPT-4o mini pontuou 5% neste benchmark.
MATH
50.2%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. GPT-4o mini pontuou 50.2% neste benchmark.
GSM8k
91.3%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. GPT-4o mini pontuou 91.3% neste benchmark.
MGSM
87%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. GPT-4o mini pontuou 87% neste benchmark.
MathVista
42%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. GPT-4o mini pontuou 42% neste benchmark.
SWE-Bench
8.7%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. GPT-4o mini pontuou 8.7% neste benchmark.
HumanEval
87.2%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. GPT-4o mini pontuou 87.2% neste benchmark.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. GPT-4o mini pontuou 32.5% neste benchmark.
MMMU
59.4%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. GPT-4o mini pontuou 59.4% neste benchmark.
MMMU Pro
34%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. GPT-4o mini pontuou 34% neste benchmark.
ChartQA
78%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. GPT-4o mini pontuou 78% neste benchmark.
DocVQA
88%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. GPT-4o mini pontuou 88% neste benchmark.
Terminal-Bench
40%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. GPT-4o mini pontuou 40% neste benchmark.
ARC-AGI
8%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. GPT-4o mini pontuou 8% neste benchmark.

Sobre GPT-4o mini

Aprenda sobre as capacidades do GPT-4o mini, recursos e como ele pode ajuda-lo a obter melhores resultados.

Um novo padrão para modelos pequenos

O GPT-4o mini representa um salto significativo na eficiência de IA, projetado para substituir o GPT-3.5 Turbo como o modelo de referência para desenvolvedores. Construído com uma arquitetura multimodal nativa, ele oferece desempenho nível GPT-4 por uma fração do custo e da latência. Ele possui uma massiva context window de 128.000 tokens e suporta saídas complexas de até 16.384 tokens, tornando-o ideal para processar documentos longos e fluxos de dados de alto volume.

Inteligência aliada à acessibilidade

Ao contrário de modelos pequenos anteriores que sacrificavam a inteligência pela velocidade, o GPT-4o mini mantém altas capacidades de reasoning em tarefas de texto e visão. Ele é 60% mais barato que o GPT-3.5 Turbo e significativamente mais capaz, pontuando 82% no benchmark MMLU. Este modelo é otimizado especificamente para aplicações onde a baixa latência e a alta confiabilidade são fundamentais, como assistentes de atendimento ao cliente em tempo real e mecanismos de classificação de dados em grande escala.

GPT-4o mini

Casos de Uso para GPT-4o mini

Descubra as diferentes maneiras de usar GPT-4o mini para obter otimos resultados.

Automação de suporte ao cliente

Lidando com grandes volumes de consultas de clientes com baixa latência e alta precisão por uma fração do custo.

Resumo de conteúdo

Processando documentos grandes ou conteúdo longo em resumos concisos dentro da context window de 128k.

Extração de dados

Convertendo texto não estruturado ou imagens em formatos de dados estruturados como JSON para ingestão em bancos de dados.

Tradução multilíngue

Fornecendo tradução em tempo real entre dezenas de idiomas para aplicativos de chat e comunicação global.

Tutoria educacional

Servindo como um assistente de estudos interativo para estudantes que precisam de ajuda com matemática, ciências e artes da linguagem.

Tarefas básicas de visão

Analisando imagens para identificar objetos, extrair texto via OCR ou fornecer descrições para acessibilidade.

Pontos Fortes

Limitacoes

Relação custo-benefício incrível: A $0,15 por milhão de tokens de entrada, ele oferece reasoning de nível frontier com uma pontuação de 82% no MMLU.
Lacunas em reasoning complexo: Fica atrás de modelos maiores como o GPT-4o ou o1 em ciência de nível especialista, pontuando 40,2% no GPQA.
Alta velocidade de throughput: O modelo entrega respostas com latência extremamente baixa, tornando-o ideal para interfaces de usuário em tempo real.
Limitações de codificação: Carece do entendimento arquitetural profundo para engenharia de software complexa em comparação com o Claude 3.5 Sonnet.
Grande context window: Mantém uma context window completa de 128k, permitindo o processamento de documentos complexos raramente encontrado em modelos pequenos.
Janela de saída reduzida: O limite de saída de 16k pode ser restritivo para tarefas que exigem migrações de código massivas ou geração de conteúdo do tamanho de livros.
Suporte nativo a visão: Inclui capacidades multimodais em um formato compacto, destacando-se em análise de imagens e tarefas de OCR.
Estabilidade factual: Modelos menores permanecem mais propensos a alucinações em domínios de nicho do que seus equivalentes flagship.

Inicio Rapido da API

openai/gpt-4o-mini

Ver Documentacao
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explique física quântica." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre GPT-4o mini

Veja o que a comunidade pensa sobre GPT-4o mini

O GPT-4o mini praticamente matou o mercado de fine-tuning de modelos antigos para RAG básico. Os custos são baixos demais para ignorar.
AI_Dev_Central
reddit
A velocidade é simplesmente insana. Estou recebendo tokens de volta quase instantaneamente para meu agente de tradução.
TechCruncher
twitter
A OpenAI realmente forçou a mão da Anthropic e do Google com esse preço. $0,15 por 1M de tokens é um novo patamar mínimo.
hn_reader_99
hackernews
Substituí o 3.5 pelo mini e a melhoria na lógica foi visível nos primeiros cinco minutos de teste.
PromptEngineerPro
youtube
Finalmente está barato o suficiente para usar LLMs para limpeza de dados básica em escala sem uma conta de nuvem enorme.
DataVizWiz
reddit
O desempenho de visão para OCR é, na verdade, melhor do que alguns modelos especializados que custam 10x mais.
VisionDev
twitter

Videos Sobre GPT-4o mini

Assista tutoriais, analises e discussoes sobre GPT-4o mini

Ele é mais rápido e mais barato que o GPT-3.5 Turbo em todos os aspectos.

As capacidades de visão para um modelo tão pequeno são genuinamente surpreendentes.

O preço é basicamente uma corrida para o zero agora com este lançamento.

Ele consegue manter a context window enorme sendo minúsculo.

Os benchmarks mostram que ele supera o Claude Haiku em quase todas as categorias.

O GPT 4o mini é um modelo leve, então é muito mais rápido que o GPT 4o.

É muito, muito mais rápido que o GPT 4.

Para tarefas diárias, a maioria dos usuários nem notará a diferença no reasoning.

O reconhecimento de imagem é muito consistente para objetos básicos.

Ele lida com instruções complexas muito melhor do que o antigo modelo 3.5.

Atualmente, ele supera o gbd4 nas preferências de chat no ranking do LMSYS.

Tudo parece perfeito e, você sabe, este recibo específico parece um recibo típico.

O tempo de resposta é praticamente sub-segundo para prompts curtos.

Ele é muito eficaz ao resumir PDFs longos através da API.

Você pode executar milhões de tokens por apenas alguns dólares.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para GPT-4o mini

Dicas de especialistas para ajuda-lo a aproveitar ao maximo GPT-4o mini e obter melhores resultados.

Use para RAG

Utilize o baixo custo de entrada para realizar Retrieval Augmented Generation extensivo sem gastos elevados.

Estruture com JSON Mode

Use o JSON mode ou os parâmetros de function calling para garantir estruturas de dados consistentes para fluxos de trabalho de backend.

Processamento em lote

Empregue a Batch API da OpenAI com este modelo para reduzir os custos em 50% para tarefas não urgentes.

Ajuste de temperatura

Defina uma temperatura mais baixa, entre 0,1 e 0,3, para tarefas de extração de fatos para maximizar a precisão.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Perguntas Frequentes Sobre GPT-4o mini

Encontre respostas para perguntas comuns sobre GPT-4o mini