google

Gemini 3.1 Pro

Gemini 3.1 Pro ist Googles exzellentes multimodales Modell mit DeepThink reasoning, einem 2M context window und nativer Veo 3.1 Video-Integration für...

MultimodalDeep ReasoningVideo-GenerierungWorkspace AIGoogle Gemini
google logogoogleGemini19. Februar 2026
Kontext
2.0MToken
Max. Ausgabe
66KToken
Eingabepreis
$2.50/ 1M
Ausgabepreis
$15.00/ 1M
Modalität:TextImageAudioVideo
Fähigkeiten:VisionToolsStreamingLogik
Benchmarks
GPQA
94.3%
GPQA: Wissenschafts-Q&A auf Hochschulniveau. Ein anspruchsvoller Benchmark mit 448 Multiple-Choice-Fragen in Biologie, Physik und Chemie, erstellt von Fachexperten. Doktoranden erreichen nur 65-74% Genauigkeit, während Laien selbst mit unbegrenztem Webzugang nur 34% schaffen (daher 'Google-sicher'). Gemini 3.1 Pro erreichte 94.3% bei diesem Benchmark.
HLE
44.4%
HLE: Expertenwissen-Reasoning. Testet die Fähigkeit eines Modells, Expertenwissen in spezialisierten Bereichen zu demonstrieren. Bewertet tiefes Verständnis komplexer Themen, die professionelles Wissen erfordern. Gemini 3.1 Pro erreichte 44.4% bei diesem Benchmark.
MMLU
90%
MMLU: Massives Multitask-Sprachverständnis. Ein umfassender Benchmark mit 16.000 Multiple-Choice-Fragen zu 57 akademischen Fächern wie Mathematik, Philosophie, Jura und Medizin. Testet breites Wissen und Reasoning-Fähigkeiten. Gemini 3.1 Pro erreichte 90% bei diesem Benchmark.
MMLU Pro
90.1%
MMLU Pro: MMLU Professional Edition. Eine erweiterte Version von MMLU mit 12.032 Fragen im schwereren 10-Optionen-Format. Umfasst Mathematik, Physik, Chemie, Jura, Ingenieurwesen, Wirtschaft, Gesundheit, Psychologie, Business, Biologie, Philosophie und Informatik. Gemini 3.1 Pro erreichte 90.1% bei diesem Benchmark.
SimpleQA
72.1%
SimpleQA: Faktische Genauigkeits-Benchmark. Testet die Fähigkeit eines Modells, akkurate, faktische Antworten auf einfache Fragen zu geben. Misst Zuverlässigkeit und reduziert Halluzinationen bei Wissensabruf. Gemini 3.1 Pro erreichte 72.1% bei diesem Benchmark.
IFEval
91.4%
IFEval: Anweisungsbefolgungs-Evaluation. Misst, wie gut ein Modell spezifische Anweisungen und Einschränkungen befolgt. Testet die Fähigkeit, Formatierungsregeln, Längenbegrenzungen und andere explizite Anforderungen einzuhalten. Gemini 3.1 Pro erreichte 91.4% bei diesem Benchmark.
AIME 2025
96.7%
AIME 2025: Amerikanische Mathematik-Olympiade. Wettbewerbsmathematik-Aufgaben aus der renommierten AIME-Prüfung für talentierte Oberstufenschüler. Testet fortgeschrittenes mathematisches Problemlösen, das abstraktes Denken erfordert. Gemini 3.1 Pro erreichte 96.7% bei diesem Benchmark.
MATH
94.5%
MATH: Mathematisches Problemlösen. Ein umfassender Mathematik-Benchmark für Problemlösung in Algebra, Geometrie, Analysis und anderen mathematischen Bereichen. Erfordert mehrstufiges Reasoning und formales mathematisches Wissen. Gemini 3.1 Pro erreichte 94.5% bei diesem Benchmark.
GSM8k
99.1%
GSM8k: Grundschul-Mathematik 8K. 8.500 Mathematik-Textaufgaben auf Grundschulniveau, die mehrstufiges Reasoning erfordern. Testet grundlegende Arithmetik und logisches Denken durch Alltagsszenarien. Gemini 3.1 Pro erreichte 99.1% bei diesem Benchmark.
MGSM
95.2%
MGSM: Mehrsprachige Grundschul-Mathematik. Der GSM8k-Benchmark übersetzt in 10 Sprachen inkl. Spanisch, Französisch, Deutsch, Russisch, Chinesisch und Japanisch. Testet mathematisches Reasoning in verschiedenen Sprachen. Gemini 3.1 Pro erreichte 95.2% bei diesem Benchmark.
MathVista
76.8%
MathVista: Mathematisches visuelles Reasoning. Testet die Fähigkeit, mathematische Probleme mit visuellen Elementen wie Diagrammen, Graphen, Geometriefiguren und wissenschaftlichen Abbildungen zu lösen. Gemini 3.1 Pro erreichte 76.8% bei diesem Benchmark.
SWE-Bench
80.6%
SWE-Bench: Software-Engineering-Benchmark. KI-Modelle versuchen, echte GitHub-Issues in Open-Source-Python-Projekten zu lösen, mit menschlicher Verifizierung. Testet praktische Software-Engineering-Fähigkeiten. Top-Modelle stiegen von 4,4% (2023) auf über 70% (2024). Gemini 3.1 Pro erreichte 80.6% bei diesem Benchmark.
HumanEval
92.4%
HumanEval: Python-Programmieraufgaben. 164 handgeschriebene Programmieraufgaben, bei denen Modelle korrekte Python-Funktionsimplementierungen generieren müssen. Jede Lösung wird durch Unit-Tests verifiziert. Top-Modelle erreichen heute 90%+. Gemini 3.1 Pro erreichte 92.4% bei diesem Benchmark.
LiveCodeBench
96.2%
LiveCodeBench: Live-Coding-Benchmark. Testet Programmierfähigkeiten mit kontinuierlich aktualisierten, realen Programmieraufgaben. Anders als statische Benchmarks verwendet er frische Aufgaben, um Datenkontamination zu verhindern. Gemini 3.1 Pro erreichte 96.2% bei diesem Benchmark.
MMMU
81%
MMMU: Multimodales Verständnis. Massive Multi-Disziplin Multimodales Verständnis Benchmark, der Vision-Sprach-Modelle bei Hochschulaufgaben in 30 Fächern testet, die sowohl Bildverständnis als auch Expertenwissen erfordern. Gemini 3.1 Pro erreichte 81% bei diesem Benchmark.
MMMU Pro
81%
MMMU Pro: MMMU Professional Edition. Erweiterte Version von MMMU mit anspruchsvolleren Fragen und strengerer Bewertung. Testet fortgeschrittenes multimodales Reasoning auf professionellem und Expertenniveau. Gemini 3.1 Pro erreichte 81% bei diesem Benchmark.
ChartQA
89.5%
ChartQA: Diagramm-Fragebeantwortung. Testet die Fähigkeit, Informationen in Diagrammen und Graphen zu verstehen und zu analysieren. Erfordert Datenextraktion, Wertevergleiche und Berechnungen aus visuellen Darstellungen. Gemini 3.1 Pro erreichte 89.5% bei diesem Benchmark.
DocVQA
94.1%
DocVQA: Dokument-Visuelle Q&A. Dokument Visual Question Answering Benchmark, der die Fähigkeit testet, Informationen aus Dokumentbildern inkl. Formularen, Berichten und gescanntem Text zu extrahieren und zu analysieren. Gemini 3.1 Pro erreichte 94.1% bei diesem Benchmark.
Terminal-Bench
60%
Terminal-Bench: Terminal/CLI-Aufgaben. Testet die Fähigkeit, Kommandozeilen-Operationen auszuführen, Shell-Skripte zu schreiben und in Terminal-Umgebungen zu navigieren. Misst praktische Systemadministrations- und Entwickler-Workflow-Fähigkeiten. Gemini 3.1 Pro erreichte 60% bei diesem Benchmark.
ARC-AGI
77.1%
ARC-AGI: Abstraktion & Reasoning. Abstraction and Reasoning Corpus für AGI - testet fluide Intelligenz durch neuartige Mustererkennungs-Puzzles. Jede Aufgabe erfordert das Entdecken der zugrundeliegenden Regel aus Beispielen und misst allgemeine Reasoning-Fähigkeit statt Auswendiglernen. Gemini 3.1 Pro erreichte 77.1% bei diesem Benchmark.

Über Gemini 3.1 Pro

Erfahren Sie mehr über die Fähigkeiten, Funktionen und Einsatzmöglichkeiten von Gemini 3.1 Pro.

Gemini 3.1 Pro stellt einen Meilenstein in Googles Roadmap für generative AI dar. Veröffentlicht im Februar 2026 als flagship der Gemini 3-Serie, wurde das Modell entwickelt, um die Lücke zwischen vielseitiger multimodaler Unterstützung und reasoning auf PhD-Niveau zu schließen. Das Modell führt die DeepThink-Engine ein, die Halluzinationen bei komplexer Logik und mathematischen Modellierungsaufgaben durch fortschrittliches chain-of-thought-Processing signifikant reduziert. Mit einem gewaltigen context window von 2.048.000 tokens kann Gemini 3.1 Pro stundenlange Videodateien, riesige Codebases oder tausende Seiten Dokumentation erfassen und mit nahezu perfektem Retrieval bearbeiten. Ein wesentliches Differenzierungsmerkmal ist die native Integration mit Veo 3.1, die es ermöglicht, hochwertige Videos direkt aus Text-prompts zu generieren, ohne separate Video-Generierungsmodelle zu benötigen. Optimiert für agentic Workflows verfügt das Modell über einen spezialisierten customtools-Endpunkt für hochzuverlässige Tool-Nutzung im Software Engineering und bei automatisierter Recherche. Es ist für die nahtlose Integration in das Google Workspace-Ökosystem konzipiert und bietet sicheres Grounding in privaten Daten aus Docs, Gmail und Drive für beispiellose Produktivitätssteigerungen.

Gemini 3.1 Pro

Anwendungsfälle für Gemini 3.1 Pro

Entdecken Sie die verschiedenen Möglichkeiten, Gemini 3.1 Pro für großartige Ergebnisse zu nutzen.

Full-Stack Software Engineering

Referenzieren Sie gesamte Anwendungs-Repositories mithilfe des 2M context window, um feature-komplette, fehlerfreie Komponenten zu generieren.

Multimodale Content-Erstellung

Erstellen Sie Skripte, hochauflösende Bilder und Kurzvideo-Sequenzen mit integriertem Veo 3.1 in einem einzigen Workflow.

Intelligente Dokumenten-Sichtung

Nutzen Sie Grounding des Modells in privaten Workspace-Daten, um monatelange E-Mail-Verläufe zusammenzufassen oder Rechtsklauseln aus tausenden Dateien zu extrahieren.

Deep Market Intelligence

Nutzen Sie Deep Research, um stundenlange Webdaten und technische Whitepaper in umfassende Berichte mit Quellenangaben zu synthetisieren.

Komplexes mathematisches Reasoning

Nutzen Sie den DeepThink-Modus für Mathematikaufgaben auf Olympia-Niveau und fortschrittliche wissenschaftliche Modellierung mit Schritt-für-Schritt-Verifizierung.

Interaktive SVG-Generierung

Erstellen Sie anspruchsvolle, physikbasierte Vektorgrafiken und 3D-Simulationen durch direkte Prompt-to-Render-Logik.

Stärken

Einschränkungen

Exzellente Logik-Beherrschung: Erreicht einen bahnbrechenden Score von 77,1 im ARC-AGI 2 benchmark, was auf eine massive Steigerung bei der Erkennung neuartiger Muster hindeutet.
DeepThink-Latenz: Der fortgeschrittene reasoning-Modus 'DeepThink' führt zu deutlich langsameren Antwortzeiten im Vergleich zu Standard-Pro-Modellen.
Gewaltiges 2M Context Window: Verfügt mit 2.048.000 tokens über das größte context window der Branche und ermöglicht nahezu perfektes Retrieval in stundenlangen Videos.
Westlich geprägter kultureller Bias: Community-Berichte deuten auf einen spürbaren Bias beim Umgang mit nicht-westlichen Themen hin, wie etwa spezifischen regionalen Brancheninnovationen.
Nativer Multimodaler Stack: Integriert nahtlos hochauflösende Video-Generierung (Veo 3.1) und Audio-Verarbeitung in einer einzigen, einheitlichen Architektur.
Regionale Funktionsunterschiede: Hochwertige Funktionen wie Deep Research und Workspace-Integrationen sind in bestimmten globalen Regionen nur eingeschränkt verfügbar.
Workspace Grounding: Bietet einzigartige Produktivitätsvorteile durch Grounding von AI-Antworten in privaten Daten aus Google Drive, Docs und Gmail.
Präferenz-Bias bei Eingaben: Fällt gelegentlich auf einfachere Programmiersprachen wie HTML zurück, selbst wenn komplexere Sprachen wie C++ angefordert werden.

API-Schnellstart

google/gemini-3.1-pro-preview

Dokumentation anzeigen
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "Analyze the logic in this codebase...";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

run();

Installieren Sie das SDK und beginnen Sie in wenigen Minuten mit API-Aufrufen.

Was die Leute über Gemini 3.1 Pro sagen

Sehen Sie, was die Community über Gemini 3.1 Pro denkt

Gemini 3.1 Pro weiß in Schritt 5 noch genau, was zuvor empfohlen wurde! Dass der Kontext über riesige Threads hinweg erhalten bleibt, ist der wahre Clou.
2doapp
reddit
Ich habe gestern über 200 Mio. tokens mit Gemini 3.1 Pro verbraucht. Schnell, intelligent und es folgt tatsächlich den Anweisungen. Mein neues Tool der Wahl für Vibe-Coding.
bridgemindai
twitter
Die SVG-Fähigkeiten in Gemini 3.1 sind unerreicht. Ich habe gerade eine funktionierende Uhr und einen Bahnhof mit einem einzigen prompt generiert.
tech_lead_gen
twitter
77,1 beim ARC-AGI 2 ist der Wahnsinn. Wenn diese benchmarks im Alltag halten, was sie versprechen, erleben wir einen gewaltigen Sprung in der allgemeinen Intelligenz.
ai_enthusiast
reddit
Die Wassereffekte in dem generierten Marine-Spiel sind besser als in den meisten AAA-Games von vor 10 Jahren. Wahnsinnig detailliert.
AI_Explorer_2025
youtube
Das context window ist hier das Killer-Feature. Ich habe eine gesamte 1,5 Mio. token codebase reingeworfen und es hat in Sekunden ein Memory Leak gefunden.
dev_guru_2026
hackernews

Videos über Gemini 3.1 Pro

Schauen Sie Tutorials, Rezensionen und Diskussionen über Gemini 3.1 Pro

Schauen Sie sich den Sprung an, den wir im Vergleich zu Gemini 3 Pro sehen.

Aktuell das beste Modell auf dem Markt, wenn man nach dem Intelligenz-Index geht.

Gemini 3.1 Pro hat bei Humanity's Last Exam ohne Tool-Nutzung mit Abstand am besten abgeschnitten.

Die Multimodalität ist hier nicht nur aufgesetzt; sie ist nativ, und das merkt man.

Wir sehen ein nahezu perfektes Retrieval über das gesamte 2-Millionen-token context window.

Der Sprecher verweist auf einen massiven Sprung in der Logik... ARC AGI 2 benchmark-Anstieg von 31,1 auf 77,1.

Dieser Wassereffekt ist mit Abstand der beste, den ich je in einem meiner Modell-Tests gesehen habe.

Das Modell hat separate Spritzeffekte für einzelne Kanonenkugeln implementiert... ein Detailgrad, den ich so noch nicht gesehen habe.

Es folgt nicht nur Anweisungen; es versteht die zugrunde liegende Physik der Szene.

Google setzt mit dem neuen Tool-Use-Endpunkt wirklich voll auf agentic capabilities.

Es ist ein großes Update, das das Modell im Grunde wieder in den gleichen Wettbewerbsbereich wie Opus 4.6 bringt.

Wenn man es auf 'hoch' eingestellt hat... bekommt man definitiv so etwas wie ein Gemini DeepThink Mini.

Das ist etwa die Hälfte dessen, was DeepThink früher für dasselbe Problem benötigt hat.

Die Integration mit Veo 3.1 macht dies zu einer wahrhaft einheitlichen kreativen Workstation.

Die benchmark-Ergebnisse für Coding sind boardweit um fast 15 % gestiegen.

Mehr als nur Prompts

Optimieren Sie Ihren Workflow mit KI-Automatisierung

Automatio kombiniert die Kraft von KI-Agenten, Web-Automatisierung und intelligenten Integrationen, um Ihnen zu helfen, mehr in weniger Zeit zu erreichen.

KI-Agenten
Web-Automatisierung
Intelligente Workflows

Pro-Tipps für Gemini 3.1 Pro

Expertentipps, um das Beste aus Gemini 3.1 Pro herauszuholen.

Nutzen Sie das 4-Teile-Framework

Strukturieren Sie prompts mit Persona, Aufgabe, Kontext und Format, um die Genauigkeit bei der Befolgung von Anweisungen zu maximieren.

Grounding mit @-Tags

Tippen Sie in Workspace @ gefolgt von einem Dateinamen, damit Gemini spezifische Dokumente für eine höhere Genauigkeit analysieren kann.

DeepThink explizit aktivieren

Stellen Sie bei logikintensiven Aufgaben sicher, dass der Thinking-Modus auf 'hoch' eingestellt ist, um das fortschrittliche chain-of-thought-Processing zu nutzen.

Iterieren im AI Studio Canvas

Nutzen Sie den Canvas-Modus, um interaktive Webkomponenten und SVG-Animationen in einer Live-Umgebung zu rendern und zu debuggen.

Erfahrungsberichte

Was Unsere Nutzer Sagen

Schliessen Sie sich Tausenden zufriedener Nutzer an, die ihren Workflow transformiert haben

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Verwandte AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Häufig gestellte Fragen zu Gemini 3.1 Pro

Finden Sie Antworten auf häufige Fragen zu Gemini 3.1 Pro