openai

GPT-4o mini

GPT-4o mini est le modèle compact le plus rentable d'OpenAI, offrant une intelligence de classe GPT-4 avec une vitesse supérieure et une vision multimodale...

Petit modèleRentableCapable en visionIA rapideMultimodal
openai logoopenaiGPT-4o18 juillet 2024
Contexte
128Ktokens
Sortie max.
16Ktokens
Prix entrée
$0.15/ 1M
Prix sortie
$0.60/ 1M
Modalité:TextImage
Capacités:VisionOutilsStreaming
Benchmarks
GPQA
40.2%
GPQA: Questions-Réponses Scientifiques Niveau Doctorat. Un benchmark rigoureux avec 448 questions à choix multiples en biologie, physique et chimie créées par des experts du domaine. Les experts en doctorat n'atteignent que 65-74% de précision, tandis que les non-experts obtiennent seulement 34% même avec un accès web illimité (d'où le terme 'résistant à Google'). GPT-4o mini a obtenu 40.2% sur ce benchmark.
HLE
2.3%
HLE: Raisonnement d'Expertise de Haut Niveau. Teste la capacité d'un modèle à démontrer un raisonnement de niveau expert dans des domaines spécialisés. Évalue la compréhension approfondie de sujets complexes nécessitant des connaissances de niveau professionnel. GPT-4o mini a obtenu 2.3% sur ce benchmark.
MMLU
82%
MMLU: Compréhension Linguistique Multitâche Massive. Un benchmark complet avec 16 000 questions à choix multiples couvrant 57 matières académiques incluant les mathématiques, la philosophie, le droit et la médecine. Teste les connaissances générales et les capacités de raisonnement. GPT-4o mini a obtenu 82% sur ce benchmark.
MMLU Pro
57%
MMLU Pro: MMLU Édition Professionnelle. Une version améliorée du MMLU avec 12 032 questions utilisant un format plus difficile à 10 options. Couvre les mathématiques, la physique, la chimie, le droit, l'ingénierie, l'économie, la santé, la psychologie, les affaires, la biologie, la philosophie et l'informatique. GPT-4o mini a obtenu 57% sur ce benchmark.
SimpleQA
8.6%
SimpleQA: Benchmark de Précision Factuelle. Teste la capacité d'un modèle à fournir des réponses précises et factuelles à des questions directes. Mesure la fiabilité et réduit les hallucinations dans les tâches de récupération de connaissances. GPT-4o mini a obtenu 8.6% sur ce benchmark.
IFEval
76.5%
IFEval: Évaluation du Suivi d'Instructions. Mesure la capacité d'un modèle à suivre des instructions et contraintes spécifiques. Teste la capacité à respecter les règles de formatage, les limites de longueur et autres exigences explicites. GPT-4o mini a obtenu 76.5% sur ce benchmark.
AIME 2025
5%
AIME 2025: Examen d'Invitation Américain en Mathématiques. Problèmes mathématiques de niveau compétition issus du prestigieux examen AIME conçu pour les lycéens talentueux. Teste la résolution de problèmes mathématiques avancés nécessitant un raisonnement abstrait, pas simplement de la correspondance de motifs. GPT-4o mini a obtenu 5% sur ce benchmark.
MATH
50.2%
MATH: Résolution de Problèmes Mathématiques. Un benchmark mathématique complet testant la résolution de problèmes en algèbre, géométrie, calcul et autres domaines mathématiques. Nécessite un raisonnement en plusieurs étapes et des connaissances mathématiques formelles. GPT-4o mini a obtenu 50.2% sur ce benchmark.
GSM8k
91.3%
GSM8k: Mathématiques Niveau Primaire 8K. 8 500 problèmes de mathématiques niveau primaire nécessitant un raisonnement en plusieurs étapes. Teste l'arithmétique de base et la pensée logique à travers des scénarios réels comme les achats ou les calculs de temps. GPT-4o mini a obtenu 91.3% sur ce benchmark.
MGSM
87%
MGSM: Mathématiques Niveau Primaire Multilingue. Le benchmark GSM8k traduit en 10 langues incluant l'espagnol, le français, l'allemand, le russe, le chinois et le japonais. Teste le raisonnement mathématique dans différentes langues. GPT-4o mini a obtenu 87% sur ce benchmark.
MathVista
42%
MathVista: Raisonnement Mathématique Visuel. Teste la capacité à résoudre des problèmes mathématiques impliquant des éléments visuels comme les graphiques, les diagrammes de géométrie et les figures scientifiques. Combine la compréhension visuelle avec le raisonnement mathématique. GPT-4o mini a obtenu 42% sur ce benchmark.
SWE-Bench
8.7%
SWE-Bench: Benchmark d'Ingénierie Logicielle. Les modèles d'IA tentent de résoudre de vrais problèmes GitHub dans des projets Python open-source avec vérification humaine. Teste les compétences pratiques en ingénierie logicielle sur des bases de code en production. Les meilleurs modèles sont passés de 4,4% en 2023 à plus de 70% en 2024. GPT-4o mini a obtenu 8.7% sur ce benchmark.
HumanEval
87.2%
HumanEval: Problèmes de Programmation Python. 164 problèmes de programmation écrits à la main où les modèles doivent générer des implémentations de fonctions Python correctes. Chaque solution est vérifiée par des tests unitaires. Les meilleurs modèles atteignent maintenant plus de 90% de précision. GPT-4o mini a obtenu 87.2% sur ce benchmark.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark de Code en Direct. Teste les capacités de codage sur des défis de programmation réels continuellement mis à jour. Contrairement aux benchmarks statiques, utilise des problèmes frais pour éviter la contamination des données et mesurer les vraies compétences de codage. GPT-4o mini a obtenu 32.5% sur ce benchmark.
MMMU
59.4%
MMMU: Compréhension Multimodale. Benchmark de Compréhension Multimodale Multi-discipline Massive testant les modèles vision-langage sur des problèmes universitaires dans 30 matières nécessitant à la fois la compréhension d'images et des connaissances expertes. GPT-4o mini a obtenu 59.4% sur ce benchmark.
MMMU Pro
34%
MMMU Pro: MMMU Édition Professionnelle. Version améliorée du MMMU avec des questions plus difficiles et une évaluation plus stricte. Teste le raisonnement multimodal avancé aux niveaux professionnel et expert. GPT-4o mini a obtenu 34% sur ce benchmark.
ChartQA
78%
ChartQA: Questions-Réponses sur Graphiques. Teste la capacité à comprendre et raisonner sur les informations présentées dans les graphiques. Nécessite l'extraction de données, la comparaison de valeurs et l'exécution de calculs à partir de représentations visuelles de données. GPT-4o mini a obtenu 78% sur ce benchmark.
DocVQA
88%
DocVQA: Q&R Visuelle sur Documents. Benchmark de Questions-Réponses Visuelles sur Documents testant la capacité à extraire et raisonner sur les informations des images de documents incluant les formulaires, rapports et textes numérisés. GPT-4o mini a obtenu 88% sur ce benchmark.
Terminal-Bench
40%
Terminal-Bench: Tâches Terminal/CLI. Teste la capacité à effectuer des opérations en ligne de commande, écrire des scripts shell et naviguer dans les environnements terminal. Mesure les compétences pratiques en administration système et flux de travail de développement. GPT-4o mini a obtenu 40% sur ce benchmark.
ARC-AGI
8%
ARC-AGI: Abstraction et Raisonnement. Corpus d'Abstraction et de Raisonnement pour l'AGI - teste l'intelligence fluide à travers des puzzles de reconnaissance de motifs nouveaux. Chaque tâche nécessite de découvrir la règle sous-jacente à partir d'exemples, mesurant la capacité de raisonnement général plutôt que la mémorisation. GPT-4o mini a obtenu 8% sur ce benchmark.

À propos de GPT-4o mini

Découvrez les capacités, fonctionnalités et façons d'utiliser GPT-4o mini.

Un nouveau standard pour les petits modèles

GPT-4o mini représente un saut significatif dans l'efficacité de l'IA, conçu pour remplacer GPT-3.5 Turbo en tant que modèle de référence pour les développeurs. Construit avec une architecture multimodale native, il offre des performances de classe GPT-4 à une fraction du coût et de la latency. Il dispose d'une massive context window de 128 000 tokens et prend en charge des sorties complexes allant jusqu'à 16 384 tokens, ce qui le rend idéal pour le traitement de documents longs et de flux de données à haut volume.

L'intelligence rencontre l'accessibilité financière

Contrairement aux précédents petits modèles qui sacrifiaient l'intelligence pour la vitesse, GPT-4o mini maintient des capacités de raisonnement élevées sur les tâches de texte et de vision. Il est 60 % moins cher que GPT-3.5 Turbo et nettement plus performant, obtenant un score de 82 % sur le benchmark MMLU. Ce modèle est spécifiquement optimisé pour les applications où la faible latency et la haute fiabilité sont primordiales, telles que les assistants clients en temps réel et les moteurs de classification de données à grande échelle.

GPT-4o mini

Cas d'utilisation de GPT-4o mini

Découvrez les différentes façons d'utiliser GPT-4o mini pour obtenir d'excellents résultats.

Automatisation du support client

Traitement de gros volumes de demandes clients avec une faible latency et une haute précision, à une fraction du coût habituel.

Résumé de contenu

Transformation de documents volumineux ou de contenus longs en résumés concis grâce à la context window de 128k.

Extraction de données

Conversion de texte non structuré ou d'images en formats de données structurées comme le JSON pour l'intégration en base de données.

Traduction multilingue

Traduction en temps réel dans des dizaines de langues pour les applications de chat et la communication mondiale.

Tutorat éducatif

Assistant d'étude interactif pour les élèves ayant besoin d'aide en mathématiques, en sciences et en langues.

Tâches de vision basiques

Analyse d'images pour identifier des objets, extraire du texte via OCR ou fournir des descriptions pour l'accessibilité.

Points forts

Limitations

Rapport performance/prix incroyable: À 0,15 $ par million de tokens en entrée, il offre un raisonnement de niveau frontier model avec un score MMLU de 82 %.
Lacunes en raisonnement complexe: En retrait par rapport aux modèles plus larges comme GPT-4o ou o1 pour les sciences de haut niveau, avec 40,2 % au test GPQA.
Vitesse de débit élevée: Le modèle fournit des réponses avec une latency extrêmement faible, ce qui le rend idéal pour les interfaces utilisateur en temps réel.
Limites en programmation: Manque de compréhension architecturale profonde pour l'ingénierie logicielle complexe par rapport à Claude 3.5 Sonnet.
Grande context window: Conserve une context window complète de 128k, permettant un traitement complexe de documents rarement atteint par les petits modèles.
Fenêtre de sortie réduite: La limite de sortie de 16k peut être restrictive pour des tâches nécessitant des migrations de code massives ou la génération de livres.
Prise en charge native de la vision: Inclut des capacités multimodales dans un format compact, excellent pour l'analyse d'images et les tâches d'OCR.
Stabilité factuelle: Les modèles plus petits restent plus sujets aux hallucinations dans les domaines de niche que leurs homologues flagship.

Démarrage rapide API

openai/gpt-4o-mini

Voir la documentation
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Explique la physique quantique." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de GPT-4o mini

Voyez ce que la communauté pense de GPT-4o mini

GPT-4o mini a pratiquement tué le marché du fine-tuning des anciens modèles pour le RAG basique. Les coûts sont trop bas pour être ignorés.
AI_Dev_Central
reddit
La vitesse est tout simplement folle. Je reçois mes tokens presque instantanément pour mon agent de traduction.
TechCruncher
twitter
OpenAI a vraiment forcé la main à Anthropic et Google avec cette tarification. 0,15 $ pour 1M de tokens, c'est un nouveau plancher.
hn_reader_99
hackernews
J'ai remplacé 3.5 par mini et l'amélioration de la logique était visible dès les cinq premières minutes de test.
PromptEngineerPro
youtube
C'est enfin assez bon marché pour utiliser des LLM pour le nettoyage de données de base à grande échelle sans facture cloud massive.
DataVizWiz
reddit
La performance de vision pour l'OCR est en fait meilleure que certains modèles spécialisés qui coûtent 10 fois plus cher.
VisionDev
twitter

Vidéos sur GPT-4o mini

Regardez des tutoriels, critiques et discussions sur GPT-4o mini

Il est plus rapide et moins cher que GPT-3.5 Turbo sur tous les aspects.

Les capacités de vision pour un modèle aussi petit sont vraiment surprenantes.

La tarification est devenue une véritable course vers le bas avec ce lancement.

Il parvient à garder une context window massive tout en étant minuscule.

Les benchmarks montrent qu'il surpasse Claude Haiku dans presque toutes les catégories.

GPT 40 mini est un modèle léger donc il est beaucoup plus rapide que GPT 40.

C'est bien plus rapide que GPT 4.

Pour les tâches quotidiennes, la plupart des utilisateurs ne remarqueront même pas la différence de raisonnement.

La reconnaissance d'images est très cohérente pour les objets de base.

Il gère les instructions complexes beaucoup mieux que l'ancien modèle 3.5.

Il surpasse actuellement leur gbd4 sur les préférences de chat du leaderboard LMC.

Tout semble parfait et ce reçu spécifique ressemble à un ticket de caisse classique.

Le temps de réponse est pratiquement inférieur à la seconde pour les prompts courts.

Il est très efficace pour résumer de longs PDF via l'API.

Vous pouvez traiter des millions de tokens pour seulement quelques dollars.

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA
Automatisation Web
Flux Intelligents

Conseils Pro pour GPT-4o mini

Conseils d'experts pour tirer le meilleur parti de GPT-4o mini.

Utilisation pour le RAG

Exploitez le faible coût d'entrée pour effectuer une Retrieval Augmented Generation intensive sans frais élevés.

Structurer avec le mode JSON

Utilisez le mode JSON ou les paramètres de function calling pour garantir des structures de données cohérentes pour vos workflows backend.

Batch Processing

Utilisez l'API Batch d'OpenAI avec ce modèle pour réduire les coûts de 50 % pour les tâches non urgentes.

Réglage de la température

Définissez une température plus basse entre 0,1 et 0,3 pour les tâches d'extraction factuelle afin de maximiser la précision.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Questions Fréquentes sur GPT-4o mini

Trouvez des réponses aux questions courantes sur GPT-4o mini