openai

GPT-5.5

GPT-5.5 est le flagship frontier model d'OpenAI avec un context window d'1M et cinq niveaux d'effort de raisonnement, optimisé pour les workflows agentic...

Agentic AIOpenAIGPT-5Autonomous CodingFrontier Models
openai logoopenaiGPT-523 avril 2026
Contexte
1.0Mtokens
Sortie max.
128Ktokens
Prix entrée
$5.00/ 1M
Prix sortie
$30.00/ 1M
Modalité:TextImage
Capacités:VisionOutilsStreamingRaisonnement
Benchmarks
GPQA
93.6%
GPQA: Questions-Réponses Scientifiques Niveau Doctorat. Un benchmark rigoureux avec 448 questions à choix multiples en biologie, physique et chimie créées par des experts du domaine. Les experts en doctorat n'atteignent que 65-74% de précision, tandis que les non-experts obtiennent seulement 34% même avec un accès web illimité (d'où le terme 'résistant à Google'). GPT-5.5 a obtenu 93.6% sur ce benchmark.
HLE
52.2%
HLE: Raisonnement d'Expertise de Haut Niveau. Teste la capacité d'un modèle à démontrer un raisonnement de niveau expert dans des domaines spécialisés. Évalue la compréhension approfondie de sujets complexes nécessitant des connaissances de niveau professionnel. GPT-5.5 a obtenu 52.2% sur ce benchmark.
MMLU
92.5%
MMLU: Compréhension Linguistique Multitâche Massive. Un benchmark complet avec 16 000 questions à choix multiples couvrant 57 matières académiques incluant les mathématiques, la philosophie, le droit et la médecine. Teste les connaissances générales et les capacités de raisonnement. GPT-5.5 a obtenu 92.5% sur ce benchmark.
MMLU Pro
88.1%
MMLU Pro: MMLU Édition Professionnelle. Une version améliorée du MMLU avec 12 032 questions utilisant un format plus difficile à 10 options. Couvre les mathématiques, la physique, la chimie, le droit, l'ingénierie, l'économie, la santé, la psychologie, les affaires, la biologie, la philosophie et l'informatique. GPT-5.5 a obtenu 88.1% sur ce benchmark.
SimpleQA
57%
SimpleQA: Benchmark de Précision Factuelle. Teste la capacité d'un modèle à fournir des réponses précises et factuelles à des questions directes. Mesure la fiabilité et réduit les hallucinations dans les tâches de récupération de connaissances. GPT-5.5 a obtenu 57% sur ce benchmark.
IFEval
92.1%
IFEval: Évaluation du Suivi d'Instructions. Mesure la capacité d'un modèle à suivre des instructions et contraintes spécifiques. Teste la capacité à respecter les règles de formatage, les limites de longueur et autres exigences explicites. GPT-5.5 a obtenu 92.1% sur ce benchmark.
AIME 2025
100%
AIME 2025: Examen d'Invitation Américain en Mathématiques. Problèmes mathématiques de niveau compétition issus du prestigieux examen AIME conçu pour les lycéens talentueux. Teste la résolution de problèmes mathématiques avancés nécessitant un raisonnement abstrait, pas simplement de la correspondance de motifs. GPT-5.5 a obtenu 100% sur ce benchmark.
MATH
98%
MATH: Résolution de Problèmes Mathématiques. Un benchmark mathématique complet testant la résolution de problèmes en algèbre, géométrie, calcul et autres domaines mathématiques. Nécessite un raisonnement en plusieurs étapes et des connaissances mathématiques formelles. GPT-5.5 a obtenu 98% sur ce benchmark.
GSM8k
98.5%
GSM8k: Mathématiques Niveau Primaire 8K. 8 500 problèmes de mathématiques niveau primaire nécessitant un raisonnement en plusieurs étapes. Teste l'arithmétique de base et la pensée logique à travers des scénarios réels comme les achats ou les calculs de temps. GPT-5.5 a obtenu 98.5% sur ce benchmark.
MGSM
96.4%
MGSM: Mathématiques Niveau Primaire Multilingue. Le benchmark GSM8k traduit en 10 langues incluant l'espagnol, le français, l'allemand, le russe, le chinois et le japonais. Teste le raisonnement mathématique dans différentes langues. GPT-5.5 a obtenu 96.4% sur ce benchmark.
MathVista
76%
MathVista: Raisonnement Mathématique Visuel. Teste la capacité à résoudre des problèmes mathématiques impliquant des éléments visuels comme les graphiques, les diagrammes de géométrie et les figures scientifiques. Combine la compréhension visuelle avec le raisonnement mathématique. GPT-5.5 a obtenu 76% sur ce benchmark.
SWE-Bench
58.6%
SWE-Bench: Benchmark d'Ingénierie Logicielle. Les modèles d'IA tentent de résoudre de vrais problèmes GitHub dans des projets Python open-source avec vérification humaine. Teste les compétences pratiques en ingénierie logicielle sur des bases de code en production. Les meilleurs modèles sont passés de 4,4% en 2023 à plus de 70% en 2024. GPT-5.5 a obtenu 58.6% sur ce benchmark.
HumanEval
94.2%
HumanEval: Problèmes de Programmation Python. 164 problèmes de programmation écrits à la main où les modèles doivent générer des implémentations de fonctions Python correctes. Chaque solution est vérifiée par des tests unitaires. Les meilleurs modèles atteignent maintenant plus de 90% de précision. GPT-5.5 a obtenu 94.2% sur ce benchmark.
LiveCodeBench
78%
LiveCodeBench: Benchmark de Code en Direct. Teste les capacités de codage sur des défis de programmation réels continuellement mis à jour. Contrairement aux benchmarks statiques, utilise des problèmes frais pour éviter la contamination des données et mesurer les vraies compétences de codage. GPT-5.5 a obtenu 78% sur ce benchmark.
MMMU
88.3%
MMMU: Compréhension Multimodale. Benchmark de Compréhension Multimodale Multi-discipline Massive testant les modèles vision-langage sur des problèmes universitaires dans 30 matières nécessitant à la fois la compréhension d'images et des connaissances expertes. GPT-5.5 a obtenu 88.3% sur ce benchmark.
MMMU Pro
62%
MMMU Pro: MMMU Édition Professionnelle. Version améliorée du MMMU avec des questions plus difficiles et une évaluation plus stricte. Teste le raisonnement multimodal avancé aux niveaux professionnel et expert. GPT-5.5 a obtenu 62% sur ce benchmark.
ChartQA
94%
ChartQA: Questions-Réponses sur Graphiques. Teste la capacité à comprendre et raisonner sur les informations présentées dans les graphiques. Nécessite l'extraction de données, la comparaison de valeurs et l'exécution de calculs à partir de représentations visuelles de données. GPT-5.5 a obtenu 94% sur ce benchmark.
DocVQA
95%
DocVQA: Q&R Visuelle sur Documents. Benchmark de Questions-Réponses Visuelles sur Documents testant la capacité à extraire et raisonner sur les informations des images de documents incluant les formulaires, rapports et textes numérisés. GPT-5.5 a obtenu 95% sur ce benchmark.
Terminal-Bench
82.7%
Terminal-Bench: Tâches Terminal/CLI. Teste la capacité à effectuer des opérations en ligne de commande, écrire des scripts shell et naviguer dans les environnements terminal. Mesure les compétences pratiques en administration système et flux de travail de développement. GPT-5.5 a obtenu 82.7% sur ce benchmark.
ARC-AGI
85%
ARC-AGI: Abstraction et Raisonnement. Corpus d'Abstraction et de Raisonnement pour l'AGI - teste l'intelligence fluide à travers des puzzles de reconnaissance de motifs nouveaux. Chaque tâche nécessite de découvrir la règle sous-jacente à partir d'exemples, mesurant la capacité de raisonnement général plutôt que la mémorisation. GPT-5.5 a obtenu 85% sur ce benchmark.

À propos de GPT-5.5

Découvrez les capacités, fonctionnalités et façons d'utiliser GPT-5.5.

Transition vers l'intelligence agentic

GPT-5.5 représente la transition des large language models vers les large agentic models. Il est conçu pour fonctionner comme un coéquipier autonome plutôt que comme un simple chatbot, capable de planifier, d'exécuter et d'auto-vérifier des workflows complexes dans des environnements numériques. L'innovation principale du modèle est la mise en œuvre de niveaux d'effort de raisonnement variables, qui offrent aux développeurs un contrôle granulaire sur le temps de réflexion du modèle et les coûts de calcul associés.

Efficacité technique et vision

Techniquement, GPT-5.5 maintient le context window d'un million de tokens de la famille GPT-5 mais introduit un gain de 40 % en efficacité des tokens. Cela signifie que bien que la tarification par token ait doublé par rapport à la série 5.4, le coût effectif pour des tâches complexes n'est que de 20 % plus élevé. Les capacités de vision du modèle ont également été considérablement améliorées, atteignant désormais des performances quasi humaines sur les schémas techniques et les tâches de raisonnement spatial comme ARC-AGI v2.

Optimisation pour l'autonomie

Il est particulièrement efficace pour le codage autonome, où il peut gérer des dépôts entiers et vérifier ses propres corrections de bugs. En utilisant le nouveau paramètre reasoning_effort, les utilisateurs peuvent basculer entre cinq profondeurs de logique distinctes, ce qui en fait le premier modèle à offrir une échelle d'intelligence ajustable pour la résolution de problèmes complexes.

GPT-5.5

Cas d'utilisation de GPT-5.5

Découvrez les différentes façons d'utiliser GPT-5.5 pour obtenir d'excellents résultats.

Ingénierie logicielle autonome

Gestion de dépôts de code complets, correction de bugs et déploiement de mises à jour sans intervention humaine.

Analyse de recherche scientifique

Traitement de milliers d'articles de recherche via un context window d'1M pour synthétiser des hypothèses inédites.

Modélisation financière complexe

Construction et audit de structures financières d'entreprise complexes avec une précision mathématique de niveau doctorat.

Workflows agentic multi-étapes

Création et exécution de listes de tâches récursives pour atteindre des objectifs numériques à long terme de manière autonome.

Analyse visuelle technique

Interprétation de plans d'ingénierie complexes et de schémas de circuits pour une assurance qualité automatisée.

Compression de données haute fidélité

Conversion de jeux de données massifs en résumés denses en tokens qui préservent les nuances sémantiques profondes.

Points forts

Limitations

Performance agentic d'élite: Atteint un score de 82,7, leader de l'industrie, sur Terminal-Bench 2.0 pour l'utilisation de l'ordinateur et les tâches en ligne de commande.
Taux d'hallucination élevé: Présente un taux d'hallucination de 86 % sur les benchmarks de connaissances factuelles malgré des capacités de raisonnement élevées.
Context window massif: Prend en charge un context window d'1M tokens en entrée, permettant l'analyse de dépôts de code complets et de vastes corpus de recherche.
Stratégie de tarification premium: À 5 $/30 $ par million de tokens, il est nettement plus coûteux que les générations précédentes et ses concurrents open-source.
Raisonnement mathématique parfait: A obtenu un score parfait de 100 % sur le benchmark de raisonnement mathématique de niveau olympiade AIME 2025.
Absence d'entrée vidéo: Contrairement à certains concurrents multimodaux comme Gemini, GPT-5.5 manque de capacité native de traitement vidéo vers texte.
Effort de raisonnement flexible: Propose 5 niveaux d'effort de raisonnement distincts permettant aux développeurs d'équilibrer latency, coût et intelligence.
Lacunes en écriture créative: La performance aux benchmarks en écriture créative et expression poétique est en retrait par rapport aux modèles flagship d'Anthropic.

Démarrage rapide API

openai/gpt-5.5

Voir la documentation
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const response = await openai.chat.completions.create({
    model: "gpt-5.5",
    messages: [
      { role: "system", content: "You are an autonomous coding agent." },
      { role: "user", content: "Debug this Python repository and verify the fixes." }
    ],
    reasoning_effort: "xhigh"
  });

  console.log(response.choices[0].message.content);
}

main();

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de GPT-5.5

Voyez ce que la communauté pense de GPT-5.5

Le taux d'hallucination est fou, 86 % sur les faits ? C'est comme un génie qui refuse de dire 'Je ne sais pas'.
@ArtificialAnlys
twitter
GPT-5.5 Pro est à 180 $/million en sortie. Nous sommes officiellement entrés dans l'ère du luxe de l'IA.
@skeptrune
twitter
L'ère de la proto-AGI est arrivée. Ce n'est plus un chatbot, c'est un coéquipier.
lostlifon
reddit
L'échelle de raisonnement avec 5 niveaux d'effort est la fonctionnalité la plus utile depuis le function calling.
DataLearnerAI
hackernews
OpenAI a fait fort sur ce coup. C'est cher, mais ça fonctionne réellement pour du travail agentic de haut niveau.
David Ondrej
youtube
Sur 20 benchmarks, GPT-5.5 score légèrement plus haut que Opus 4.7 mais il est aussi maintenant à 5 $/million de tokens.
@rxhit05
twitter

Vidéos sur GPT-5.5

Regardez des tutoriels, critiques et discussions sur GPT-5.5

La capacité de raisonnement de ce modèle est incroyable comparée à tout ce que nous avons vu auparavant.

Il a littéralement construit une application SaaS entière en une seule fois sans que j'aie à corriger un seul bug.

À 5 $ par million de tokens, vous devez vraiment être sûr d'avoir besoin de ce niveau d'intelligence.

En le comparant aux modèles ouverts, il y a encore un écart significatif en autonomie agentic.

Les paramètres d'effort de raisonnement sont la vraie nouveauté ici pour les développeurs.

OpenAI a fait fort sur ce coup. C'est cher, mais ça fonctionne réellement pour du travail agentic de haut niveau.

La compréhension visuelle des mises en page d'interface utilisateur est parfaitement précise maintenant.

Il gère mieux son propre état sur plusieurs étapes que GPT-5.4.

Vous pouvez pratiquement lui confier un terminal et le laisser travailler pendant vingt minutes.

La tarification est élevée, mais le temps gagné sur le débogage en vaut la peine.

Le context window d'un million de tokens est un changement majeur pour l'analyse de longs documents.

Si vous construisez des agents autonomes, c'est actuellement le seul modèle qui semble vraiment autonome.

J'ai remarqué un taux d'hallucination élevé sur des faits historiques très spécifiques.

Les gains d'efficacité signifient que vous utilisez moins de tokens pour la même tâche complexe.

C'est un outil spécialisé pour les développeurs davantage qu'un chatbot occasionnel.

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA
Automatisation Web
Flux Intelligents

Conseils Pro pour GPT-5.5

Conseils d'experts pour tirer le meilleur parti de GPT-5.5.

Utilisez le niveau de raisonnement xhigh

Réglez le paramètre reasoning_effort sur 'xhigh' pour les tâches intensives en logique comme les mathématiques et la conception architecturale.

Exploitez le vaste context window

Fournissez une documentation complète et le contexte de la base de code dans le prompt système initial pour tirer pleinement parti de la fenêtre d'1M.

Mettez en œuvre des boucles d'auto-critique

Demandez une révision récursive où le modèle critique sa propre sortie pour atténuer le taux d'hallucination natif.

Vérification agentic

Utilisez le niveau d'effort xhigh pour les tâches agentic afin de vous assurer que le modèle auto-vérifie chaque étape avant de passer à la suivante.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
anthropic

Claude Opus 4.7

Anthropic

Claude Opus 4.7 is Anthropic's flagship model with a 1-million-token context, adaptive reasoning, and 3.3x vision resolution for enterprise-scale agents.

1M context
$5.00/$25.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
moonshot

Kimi k2.6

Moonshot

Kimi k2.6 is Moonshot AI's 1T-parameter MoE model featuring a 256K context window, native video input, and elite performance in autonomous agentic coding.

256K context
$0.95/$4.00/1M

Questions Fréquentes sur GPT-5.5

Trouvez des réponses aux questions courantes sur GPT-5.5