google

Gemini 3.1 Pro

Gemini 3.1 Pro est le flagship multimodal de Google, incluant le reasoning DeepThink, une fenêtre de contexte de 2M et des capacités natives de génération...

MultimodalDeep ReasoningGénération VidéoWorkspace AIGoogle Gemini
google logogoogleGemini 3February 19, 2026
Contexte
2.0Mtokens
Sortie max.
66Ktokens
Prix entrée
$2.50/ 1M
Prix sortie
$15.00/ 1M
Modalité:TextImageAudioVideo
Capacités:VisionOutilsStreamingRaisonnement
Benchmarks
GPQA
94.3%
GPQA: Questions-Réponses Scientifiques Niveau Doctorat. Un benchmark rigoureux avec 448 questions à choix multiples en biologie, physique et chimie créées par des experts du domaine. Les experts en doctorat n'atteignent que 65-74% de précision, tandis que les non-experts obtiennent seulement 34% même avec un accès web illimité (d'où le terme 'résistant à Google'). Gemini 3.1 Pro a obtenu 94.3% sur ce benchmark.
HLE
44.4%
HLE: Raisonnement d'Expertise de Haut Niveau. Teste la capacité d'un modèle à démontrer un raisonnement de niveau expert dans des domaines spécialisés. Évalue la compréhension approfondie de sujets complexes nécessitant des connaissances de niveau professionnel. Gemini 3.1 Pro a obtenu 44.4% sur ce benchmark.
MMLU
80.6%
MMLU: Compréhension Linguistique Multitâche Massive. Un benchmark complet avec 16 000 questions à choix multiples couvrant 57 matières académiques incluant les mathématiques, la philosophie, le droit et la médecine. Teste les connaissances générales et les capacités de raisonnement. Gemini 3.1 Pro a obtenu 80.6% sur ce benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Édition Professionnelle. Une version améliorée du MMLU avec 12 032 questions utilisant un format plus difficile à 10 options. Couvre les mathématiques, la physique, la chimie, le droit, l'ingénierie, l'économie, la santé, la psychologie, les affaires, la biologie, la philosophie et l'informatique. Gemini 3.1 Pro a obtenu 79.2% sur ce benchmark.
SimpleQA
79.6%
SimpleQA: Benchmark de Précision Factuelle. Teste la capacité d'un modèle à fournir des réponses précises et factuelles à des questions directes. Mesure la fiabilité et réduit les hallucinations dans les tâches de récupération de connaissances. Gemini 3.1 Pro a obtenu 79.6% sur ce benchmark.
IFEval
92.4%
IFEval: Évaluation du Suivi d'Instructions. Mesure la capacité d'un modèle à suivre des instructions et contraintes spécifiques. Teste la capacité à respecter les règles de formatage, les limites de longueur et autres exigences explicites. Gemini 3.1 Pro a obtenu 92.4% sur ce benchmark.
AIME 2025
92%
AIME 2025: Examen d'Invitation Américain en Mathématiques. Problèmes mathématiques de niveau compétition issus du prestigieux examen AIME conçu pour les lycéens talentueux. Teste la résolution de problèmes mathématiques avancés nécessitant un raisonnement abstrait, pas simplement de la correspondance de motifs. Gemini 3.1 Pro a obtenu 92% sur ce benchmark.
MATH
92%
MATH: Résolution de Problèmes Mathématiques. Un benchmark mathématique complet testant la résolution de problèmes en algèbre, géométrie, calcul et autres domaines mathématiques. Nécessite un raisonnement en plusieurs étapes et des connaissances mathématiques formelles. Gemini 3.1 Pro a obtenu 92% sur ce benchmark.
GSM8k
98.4%
GSM8k: Mathématiques Niveau Primaire 8K. 8 500 problèmes de mathématiques niveau primaire nécessitant un raisonnement en plusieurs étapes. Teste l'arithmétique de base et la pensée logique à travers des scénarios réels comme les achats ou les calculs de temps. Gemini 3.1 Pro a obtenu 98.4% sur ce benchmark.
MGSM
96.5%
MGSM: Mathématiques Niveau Primaire Multilingue. Le benchmark GSM8k traduit en 10 langues incluant l'espagnol, le français, l'allemand, le russe, le chinois et le japonais. Teste le raisonnement mathématique dans différentes langues. Gemini 3.1 Pro a obtenu 96.5% sur ce benchmark.
MathVista
89.4%
MathVista: Raisonnement Mathématique Visuel. Teste la capacité à résoudre des problèmes mathématiques impliquant des éléments visuels comme les graphiques, les diagrammes de géométrie et les figures scientifiques. Combine la compréhension visuelle avec le raisonnement mathématique. Gemini 3.1 Pro a obtenu 89.4% sur ce benchmark.
SWE-Bench
71%
SWE-Bench: Benchmark d'Ingénierie Logicielle. Les modèles d'IA tentent de résoudre de vrais problèmes GitHub dans des projets Python open-source avec vérification humaine. Teste les compétences pratiques en ingénierie logicielle sur des bases de code en production. Les meilleurs modèles sont passés de 4,4% en 2023 à plus de 70% en 2024. Gemini 3.1 Pro a obtenu 71% sur ce benchmark.
HumanEval
91.2%
HumanEval: Problèmes de Programmation Python. 164 problèmes de programmation écrits à la main où les modèles doivent générer des implémentations de fonctions Python correctes. Chaque solution est vérifiée par des tests unitaires. Les meilleurs modèles atteignent maintenant plus de 90% de précision. Gemini 3.1 Pro a obtenu 91.2% sur ce benchmark.
LiveCodeBench
82%
LiveCodeBench: Benchmark de Code en Direct. Teste les capacités de codage sur des défis de programmation réels continuellement mis à jour. Contrairement aux benchmarks statiques, utilise des problèmes frais pour éviter la contamination des données et mesurer les vraies compétences de codage. Gemini 3.1 Pro a obtenu 82% sur ce benchmark.
MMMU
84.2%
MMMU: Compréhension Multimodale. Benchmark de Compréhension Multimodale Multi-discipline Massive testant les modèles vision-langage sur des problèmes universitaires dans 30 matières nécessitant à la fois la compréhension d'images et des connaissances expertes. Gemini 3.1 Pro a obtenu 84.2% sur ce benchmark.
MMMU Pro
62.5%
MMMU Pro: MMMU Édition Professionnelle. Version améliorée du MMMU avec des questions plus difficiles et une évaluation plus stricte. Teste le raisonnement multimodal avancé aux niveaux professionnel et expert. Gemini 3.1 Pro a obtenu 62.5% sur ce benchmark.
ChartQA
91.8%
ChartQA: Questions-Réponses sur Graphiques. Teste la capacité à comprendre et raisonner sur les informations présentées dans les graphiques. Nécessite l'extraction de données, la comparaison de valeurs et l'exécution de calculs à partir de représentations visuelles de données. Gemini 3.1 Pro a obtenu 91.8% sur ce benchmark.
DocVQA
94.2%
DocVQA: Q&R Visuelle sur Documents. Benchmark de Questions-Réponses Visuelles sur Documents testant la capacité à extraire et raisonner sur les informations des images de documents incluant les formulaires, rapports et textes numérisés. Gemini 3.1 Pro a obtenu 94.2% sur ce benchmark.
Terminal-Bench
58%
Terminal-Bench: Tâches Terminal/CLI. Teste la capacité à effectuer des opérations en ligne de commande, écrire des scripts shell et naviguer dans les environnements terminal. Mesure les compétences pratiques en administration système et flux de travail de développement. Gemini 3.1 Pro a obtenu 58% sur ce benchmark.
ARC-AGI
77.1%
ARC-AGI: Abstraction et Raisonnement. Corpus d'Abstraction et de Raisonnement pour l'AGI - teste l'intelligence fluide à travers des puzzles de reconnaissance de motifs nouveaux. Chaque tâche nécessite de découvrir la règle sous-jacente à partir d'exemples, mesurant la capacité de raisonnement général plutôt que la mémorisation. Gemini 3.1 Pro a obtenu 77.1% sur ce benchmark.

À propos de Gemini 3.1 Pro

Découvrez les capacités, fonctionnalités et façons d'utiliser Gemini 3.1 Pro.

Aperçu du modèle

Gemini 3.1 Pro représente un bond substantiel dans le reasoning au sein de la série Gemini 3, introduisant le moteur DeepThink qui exploite le reinforcement learning pour résoudre des schémas logiques complexes. Il se distingue par sa fenêtre de contexte inédite de 2 048 000 tokens, permettant aux utilisateurs de traiter des dépôts de logiciels entiers ou plusieurs heures de vidéo dans un seul prompt. Le model est nativement multimodal, conçu pour ingérer et raisonner simultanément sur du texte, de l'audio, des images et de la vidéo.

Intelligence et Reasoning

Optimisé pour la prochaine génération de workflows agentic, Gemini 3.1 Pro excelle dans les tâches nécessitant une planification stratégique et des améliorations étape par étape. Il bénéficie d'une intégration profonde avec les outils créatifs de Google, notamment Veo 3.1 natif pour la génération vidéo haute fidélité et Imagen 4 pour la création d'images avancées. En distillant les capacités de reasoning de modèles plus larges dans une architecture hautement efficace, il offre une intelligence de niveau frontier model à un prix compétitif.

Outils Agentic Spécialisés

Bâti sur l'architecture révolutionnaire de Gemini 3, il utilise une vérification sophistiquée par chain-of-thought pour éliminer virtuellement les erreurs logiques dans les tâches de reasoning scientifique et mathématique complexes. Le model représente une avancée significative en capacité zero-shot, particulièrement dans son aptitude à s'auto-corriger lors d'inférences à long terme, ce qui en fait le choix définitif pour l'ingénierie logicielle autonome et la synthèse multi-modale.

Gemini 3.1 Pro

Cas d'utilisation de Gemini 3.1 Pro

Découvrez les différentes façons d'utiliser Gemini 3.1 Pro pour obtenir d'excellents résultats.

Ingénierie logicielle autonome

Naviguer et refactoriser des dépôts de code entiers en utilisant la fenêtre de contexte de 2M pour une compréhension globale du codebase.

Synthèse de recherche multimodale

Ingérer simultanément des heures de cours vidéo, des articles de recherche PDF et des enregistrements audio pour générer des rapports complets.

Planification stratégique d'entreprise

Utiliser le moteur DeepThink pour simuler des scénarios de marché et élaborer des stratégies d'entreprise étape par étape avec auto-correction.

Workflows de production créative

Piloter les moteurs natifs Veo 3.1 et Imagen 4 via des prompts textuels de haut niveau pour générer des vidéos 4K professionnelles et des images haute fidélité.

Analyse de données scientifiques complexes

Résoudre des problèmes scientifiques de niveau doctorat et analyser des jeux de données obscurs avec une grande précision sur les benchmarks HLE et GPQA.

Support client agentic

Créer des assistants IA localisés qui comprennent les nuances culturelles, comme l'étiquette des affaires britannique ou les cadres réglementaires régionaux.

Points forts

Limitations

Reasoning inégalé: Atteint 77,1 % sur ARC-AGI-2, doublant ainsi la capacité de reasoning des générations précédentes.
Latence avec DeepThink: Le mode de haut reasoning peut prendre plusieurs minutes pour générer une réponse pour des tâches complexes.
Contexte massif: La fenêtre de 2M tokens permet un apprentissage en « long-context » natif sur des ensembles de données complets ou des bibliothèques de médias.
Filtres de sécurité agressifs: Les garde-fous destinés au grand public peuvent fréquemment déclencher des refus, même pour des tâches d'écriture créative anodines.
Efficacité des coûts: Offre une intelligence de type frontier model à un coût environ 75 % inférieur à celui de concurrents comme Claude Opus 4.6.
Variabilité des hallucinations: Bien qu'en baisse par rapport aux modèles précédents, il peut encore halluciner des détails spatiaux dans des tâches visuelles complexes.
Multimodalité native: Traite le texte, l'audio, les images et la vidéo en un seul passage sans avoir besoin de sous-modèles auxiliaires.
Fiabilité de l'API: Les versions preview ont rapporté des erreurs de connexion serveur occasionnelles pendant les périodes de forte demande.

Démarrage rapide API

google/gemini-3.1-pro-preview

Voir la documentation
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "Solve for x in 2x^2 + 5x - 3 = 0 using the DeepThink engine.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de Gemini 3.1 Pro

Voyez ce que la communauté pense de Gemini 3.1 Pro

Gemini a parfaitement capturé cette énergie britannique du type 'Je suis terriblement désolé de vous déranger, mais vous nous devez 5 000 £'.
Efficient_Degree9569
reddit
3.1 Pro est le model stupide le plus intelligent que j'aie jamais utilisé. Brillant sur les benchmarks. Inefficace en pratique.
David Lingenfelter, PhD
twitter
C'est comme un personnage principal d'anime qui ne paie pas de mine. Donnez-lui un prompt bien écrit et il se transforme en Saitama.
Meng To
twitter
Gemini 3.1 Pro est le gagnant pour l'analyse de documents à contexte massif.
AIExpert77
hackernews
Le moteur DeepThink est impressionnant pour les énigmes logiques qui ont bloqué GPT-4o.
LogicLeaper
reddit
Enfin un model qui lit réellement tout mon codebase sans oublier le premier fichier.
CoderX
twitter

Vidéos sur Gemini 3.1 Pro

Regardez des tutoriels, critiques et discussions sur Gemini 3.1 Pro

Gemini 3.1 Pro est bien meilleur en 3D et en compréhension spatiale. Tout semble beaucoup plus fluide et précis.

Il possède une connaissance inhérente de la composition musicale qui produit des sons vraiment harmonieux.

La multimodalité ici n'est pas juste un gadget ; c'est le cœur de l'expérience.

Il semble nettement plus réactif en mode standard par rapport à la version 3.0.

J'ai réussi à lui soumettre une vidéo 4K de 2 heures et il a indexé chaque scène parfaitement.

Ce mode thinking high ressemble vraiment à un deep think mini... il a fallu 8 minutes pour résoudre un problème d'Olympiade de Mathématiques.

C'est une mise à jour majeure qui replace le model dans la même zone de compétition qu'Opus 4.6.

L'entraînement par reinforcement learning se voit dans sa façon de gérer les contre-arguments.

Google pratique des prix très agressifs pour regagner des parts de marché auprès des développeurs.

Nous constatons un bond massif des performances zero-shot pour les tâches de coding.

Sur des énigmes qui ne devraient pas figurer dans ses données d'entraînement, la série Gemini 3 surpasse tous les autres modèles.

Cela le place essentiellement dans la marge d'erreur de la moyenne humaine sur les tests de bon sens.

Le changement architectural vers une compréhension vidéo native est ce qui rend la fenêtre de 2M viable.

Il résout les tâches ARC-AGI-2 en faisant réellement du reasoning, pas seulement du pattern matching.

C'est peut-être la première fois que Google a une avance claire en capacité de reasoning pure.

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA
Automatisation Web
Flux Intelligents

Conseils Pro pour Gemini 3.1 Pro

Conseils d'experts pour tirer le meilleur parti de Gemini 3.1 Pro.

Exploitez le mode de thinking « High »

Pour les problèmes mathématiques complexes ou les énigmes logiques, utilisez le réglage de niveau de thinking « High » pour libérer toute la puissance du moteur de reasoning DeepThink.

Utilisez des références visuelles

Gemini 3.1 Pro excelle dans le « vibe coding » et le design lorsqu'on lui fournit des références d'images ou des plans plutôt que de simples descriptions textuelles.

Attention aux garde-fous grand public

Si vous obtenez des réponses qui semblent « lobotomisées » dans l'application grand public, essayez d'utiliser l'API avec des filtres de sécurité ajustés pour des tâches plus créatives ou divergentes.

Gestion du contexte

Pour les interactions longues, redémarrez occasionnellement le fil de discussion ou fournissez un nouveau résumé pour éviter la « dégradation du contexte » où le model finit par confondre les instructions.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Questions Fréquentes sur Gemini 3.1 Pro

Trouvez des réponses aux questions courantes sur Gemini 3.1 Pro