google

Gemini 3 Pro

Gemini 3 Pro ist Googles flagship multimodal AI mit 1M context window, 'Anti-gravity' agentic reasoning und rekordverdächtiger Performance bei GPQA und ARC-AGI.

google logogoogleGemini 3November 18, 2025
Kontext
1.0MToken
Max. Ausgabe
66KToken
Eingabepreis
$2.00/ 1M
Ausgabepreis
$12.00/ 1M
Modalität:TextImageAudioVideo
Fähigkeiten:VisionToolsStreamingLogik
Benchmarks
GPQA
92%
GPQA: Wissenschafts-Q&A auf Hochschulniveau. Ein anspruchsvoller Benchmark mit 448 Multiple-Choice-Fragen in Biologie, Physik und Chemie, erstellt von Fachexperten. Doktoranden erreichen nur 65-74% Genauigkeit, während Laien selbst mit unbegrenztem Webzugang nur 34% schaffen (daher 'Google-sicher'). Gemini 3 Pro erreichte 92% bei diesem Benchmark.
HLE
46%
HLE: Expertenwissen-Reasoning. Testet die Fähigkeit eines Modells, Expertenwissen in spezialisierten Bereichen zu demonstrieren. Bewertet tiefes Verständnis komplexer Themen, die professionelles Wissen erfordern. Gemini 3 Pro erreichte 46% bei diesem Benchmark.
MMLU
92%
MMLU: Massives Multitask-Sprachverständnis. Ein umfassender Benchmark mit 16.000 Multiple-Choice-Fragen zu 57 akademischen Fächern wie Mathematik, Philosophie, Jura und Medizin. Testet breites Wissen und Reasoning-Fähigkeiten. Gemini 3 Pro erreichte 92% bei diesem Benchmark.
MMLU Pro
90%
MMLU Pro: MMLU Professional Edition. Eine erweiterte Version von MMLU mit 12.032 Fragen im schwereren 10-Optionen-Format. Umfasst Mathematik, Physik, Chemie, Jura, Ingenieurwesen, Wirtschaft, Gesundheit, Psychologie, Business, Biologie, Philosophie und Informatik. Gemini 3 Pro erreichte 90% bei diesem Benchmark.
SimpleQA
72%
SimpleQA: Faktische Genauigkeits-Benchmark. Testet die Fähigkeit eines Modells, akkurate, faktische Antworten auf einfache Fragen zu geben. Misst Zuverlässigkeit und reduziert Halluzinationen bei Wissensabruf. Gemini 3 Pro erreichte 72% bei diesem Benchmark.
IFEval
85%
IFEval: Anweisungsbefolgungs-Evaluation. Misst, wie gut ein Modell spezifische Anweisungen und Einschränkungen befolgt. Testet die Fähigkeit, Formatierungsregeln, Längenbegrenzungen und andere explizite Anforderungen einzuhalten. Gemini 3 Pro erreichte 85% bei diesem Benchmark.
AIME 2025
100%
AIME 2025: Amerikanische Mathematik-Olympiade. Wettbewerbsmathematik-Aufgaben aus der renommierten AIME-Prüfung für talentierte Oberstufenschüler. Testet fortgeschrittenes mathematisches Problemlösen, das abstraktes Denken erfordert. Gemini 3 Pro erreichte 100% bei diesem Benchmark.
MATH
78%
MATH: Mathematisches Problemlösen. Ein umfassender Mathematik-Benchmark für Problemlösung in Algebra, Geometrie, Analysis und anderen mathematischen Bereichen. Erfordert mehrstufiges Reasoning und formales mathematisches Wissen. Gemini 3 Pro erreichte 78% bei diesem Benchmark.
GSM8k
99%
GSM8k: Grundschul-Mathematik 8K. 8.500 Mathematik-Textaufgaben auf Grundschulniveau, die mehrstufiges Reasoning erfordern. Testet grundlegende Arithmetik und logisches Denken durch Alltagsszenarien. Gemini 3 Pro erreichte 99% bei diesem Benchmark.
MGSM
98%
MGSM: Mehrsprachige Grundschul-Mathematik. Der GSM8k-Benchmark übersetzt in 10 Sprachen inkl. Spanisch, Französisch, Deutsch, Russisch, Chinesisch und Japanisch. Testet mathematisches Reasoning in verschiedenen Sprachen. Gemini 3 Pro erreichte 98% bei diesem Benchmark.
MathVista
78%
MathVista: Mathematisches visuelles Reasoning. Testet die Fähigkeit, mathematische Probleme mit visuellen Elementen wie Diagrammen, Graphen, Geometriefiguren und wissenschaftlichen Abbildungen zu lösen. Gemini 3 Pro erreichte 78% bei diesem Benchmark.
SWE-Bench
76%
SWE-Bench: Software-Engineering-Benchmark. KI-Modelle versuchen, echte GitHub-Issues in Open-Source-Python-Projekten zu lösen, mit menschlicher Verifizierung. Testet praktische Software-Engineering-Fähigkeiten. Top-Modelle stiegen von 4,4% (2023) auf über 70% (2024). Gemini 3 Pro erreichte 76% bei diesem Benchmark.
HumanEval
90%
HumanEval: Python-Programmieraufgaben. 164 handgeschriebene Programmieraufgaben, bei denen Modelle korrekte Python-Funktionsimplementierungen generieren müssen. Jede Lösung wird durch Unit-Tests verifiziert. Top-Modelle erreichen heute 90%+. Gemini 3 Pro erreichte 90% bei diesem Benchmark.
LiveCodeBench
81%
LiveCodeBench: Live-Coding-Benchmark. Testet Programmierfähigkeiten mit kontinuierlich aktualisierten, realen Programmieraufgaben. Anders als statische Benchmarks verwendet er frische Aufgaben, um Datenkontamination zu verhindern. Gemini 3 Pro erreichte 81% bei diesem Benchmark.
MMMU
81%
MMMU: Multimodales Verständnis. Massive Multi-Disziplin Multimodales Verständnis Benchmark, der Vision-Sprach-Modelle bei Hochschulaufgaben in 30 Fächern testet, die sowohl Bildverständnis als auch Expertenwissen erfordern. Gemini 3 Pro erreichte 81% bei diesem Benchmark.
MMMU Pro
81%
MMMU Pro: MMMU Professional Edition. Erweiterte Version von MMMU mit anspruchsvolleren Fragen und strengerer Bewertung. Testet fortgeschrittenes multimodales Reasoning auf professionellem und Expertenniveau. Gemini 3 Pro erreichte 81% bei diesem Benchmark.
ChartQA
85%
ChartQA: Diagramm-Fragebeantwortung. Testet die Fähigkeit, Informationen in Diagrammen und Graphen zu verstehen und zu analysieren. Erfordert Datenextraktion, Wertevergleiche und Berechnungen aus visuellen Darstellungen. Gemini 3 Pro erreichte 85% bei diesem Benchmark.
DocVQA
92%
DocVQA: Dokument-Visuelle Q&A. Dokument Visual Question Answering Benchmark, der die Fähigkeit testet, Informationen aus Dokumentbildern inkl. Formularen, Berichten und gescanntem Text zu extrahieren und zu analysieren. Gemini 3 Pro erreichte 92% bei diesem Benchmark.
Terminal-Bench
54%
Terminal-Bench: Terminal/CLI-Aufgaben. Testet die Fähigkeit, Kommandozeilen-Operationen auszuführen, Shell-Skripte zu schreiben und in Terminal-Umgebungen zu navigieren. Misst praktische Systemadministrations- und Entwickler-Workflow-Fähigkeiten. Gemini 3 Pro erreichte 54% bei diesem Benchmark.
ARC-AGI
31%
ARC-AGI: Abstraktion & Reasoning. Abstraction and Reasoning Corpus für AGI - testet fluide Intelligenz durch neuartige Mustererkennungs-Puzzles. Jede Aufgabe erfordert das Entdecken der zugrundeliegenden Regel aus Beispielen und misst allgemeine Reasoning-Fähigkeit statt Auswendiglernen. Gemini 3 Pro erreichte 31% bei diesem Benchmark.
Prompt
Antwort
GPT-5 Mini

Ihre KI-Antwort wird hier erscheinen

Über Gemini 3 Pro

Erfahren Sie mehr über die Fähigkeiten, Funktionen und Einsatzmöglichkeiten von Gemini 3 Pro.

Gemini 3 Pro stellt Googles bedeutendsten Sprung in der künstlichen Intelligenz dar und führt eine 'dynamic thinking'-Architektur ein, die es dem model ermöglicht, seine reasoning Fähigkeiten basierend auf der Komplexität der Aufgabe zu skalieren. Basierend auf Googles maßgeschneiderter TPU-Infrastruktur ist es für hochperformante agentic Workflows und state-of-the-art multimodal Verständnis von Text, Bild, Audio und Video konzipiert.

Als sparse Mixture-of-Experts (MoE) model verschiebt es die AI-Landschaft hin zu aktiven Agents und bietet ein rekordverdächtiges Limit von 64k output tokens sowie ein massives context window, das stundenlange Videos oder ganze Codebases in einem einzigen prompt verarbeiten kann. Sein zentrales Unterscheidungsmerkmal ist 'Anti-gravity', eine vereinheitlichte Plattform, die es dem model ermöglicht, Code auszuführen und in Echtzeit mit Computerumgebungen zu interagieren.

Durch das Schließen der Lücke zwischen reasoning und Interaktion mit der Umgebung entwickelt sich Gemini 3 Pro vom passiven Berater zum autonomen Operator. Es erzielt state-of-the-art Ergebnisse in fast jedem wichtigen reasoning benchmark und setzt damit effektiv den neuen Standard für frontier models in der agentic Ära.

Gemini 3 Pro

Anwendungsfälle für Gemini 3 Pro

Entdecken Sie die verschiedenen Möglichkeiten, Gemini 3 Pro für großartige Ergebnisse zu nutzen.

Autonome Frontend-Entwicklung

Nutzung des 'Anti-gravity'-Loops zur One-Shot-Erstellung komplexer React/Next.js-Interfaces durch Echtzeit-Beobachtung und Behebung visueller Bugs.

Long-Form Video Intelligence

Frame-für-Frame-Analyse von stundenlangen Überwachungsaufnahmen oder Meeting-Aufzeichnungen, um spezifische Ereignisse zu identifizieren oder detaillierte Protokolle zu extrahieren.

Agentic Research Orchestration

Steuerung von 'Gemini Deep Research'-Agents, um tausende technische Paper zu einem einzigen kohärenten Bericht zu synthetisieren.

Komplexe Logik- & Mathematik-Wettbewerbe

Lösung mathematischer Beweise auf IMO-Niveau und AIME-Problemen mit fast 100 % Genauigkeit durch verlängerte reasoning Zeit.

Multimodal Document Parsing

Verarbeitung ganzer Ordner mit Krankenakten oder Finanzberichten, um dokumentübergreifende Muster und Anomalien zu finden.

Echtzeit-Spielstatus-Analyse

Agiert als hochgradiger Stratege in komplexen Spielen wie Pokémon Crystal oder Minecraft durch direktes Verständnis des visuellen Spielzustands.

Stärken

Einschränkungen

Rekordverdächtige Multimodality: Natives Frame-für-Frame-Videoverständnis, das die Konkurrenz im VideoMMMU benchmark schlägt.
Kosten für Context-Skalierung: Ein signifikanter Preissprung (2x) erfolgt, sobald Ihre Session die Marke von 200.000 tokens überschreitet.
Meisterhaftes Fluid Reasoning: Massive 31 % bei ARC-AGI v2, was die Leistung der fluiden Intelligenz früherer frontier models fast verdoppelt.
Aggressive Safety-Filter: Bekannt dafür, harmlose Chemie- oder Medizinanfragen abzulehnen, wenn sie eingeschränkten Themen ähneln.
Enormer Output-Buffer: Ein Limit von 64k output tokens ermöglicht die Generierung ganzer Module oder ganzer Bücher in einem Durchgang.
Halluzinations-Spitzen: Trotz seiner Intelligenz weist es in spezifischen long-horizon reasoning benchmarks eine Halluzinationsrate von 88 % auf.
Agentic Native Core: Speziell für tool-use und autonome Computer-Interaktion über die Anti-gravity-Plattform entwickelt.
Senior-Ego-Syndrom: Erklärt Aufgaben häufig für 'abgeschlossen', während die Logs noch Fehler zeigen, was manuelle Aufsicht bei komplexem Code erfordert.

API-Schnellstart

google/gemini-3-pro-preview

Dokumentation anzeigen
google SDK
import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI({ apiKey: process.env.GOOGLE_API_KEY });
const model = client.getGenerativeModel({ model: "gemini-3-pro-preview" });

async function run() {
  const result = await model.generateContent({
    contents: [{ role: "user", parts: [{ text: "Analyze this codebase for security flaws." }] }],
    generationConfig: { maxOutputTokens: 64000, thinking: true }
  });
  console.log(result.response.text());
}
run();

Installieren Sie das SDK und beginnen Sie in wenigen Minuten mit API-Aufrufen.

Was die Leute über Gemini 3 Pro sagen

Sehen Sie, was die Community über Gemini 3 Pro denkt

"Gemini 3 Pro ist großartig für code review, aber ich nutze ausschließlich 5.2 – der Vorteil von 5.2 Pro in der API ist gewaltig"
zazizazizu
reddit
"Es ist offensichtlich, dass sie Gemini 3.0 trainiert haben, um es neutraler zu machen... es lehnt 'Balance' bei der Wissenschaft ab, behält aber bei der Politik einen neutralen Standpunkt bei"
tarvispickles
reddit
"Gemini 3 Pro führte mit großem Vorsprung und einem Score von 83,64 im SuperCLUE-VLM benchmark"
Dantop Boone
x
"Gemini 3 Pro hat Pokémon Crystal mit 50 % weniger tokens abgeschlossen als 2.5 Pro. Es hat Red besiegt!"
Justin
x
"Es schaut sich das Video buchstäblich Frame für Frame an, anders als jedes andere model... versteht es Frame für Frame"
Matthew Berman
youtube
"Google hat seinen bisher tiefgreifendsten AI research agent veröffentlicht... basierend auf Gemini 3 Pro"
Think AI
x

Videos über Gemini 3 Pro

Schauen Sie Tutorials, Rezensionen und Diskussionen über Gemini 3 Pro

Gemini 3 Pro erreicht 37,5 % [auf HLE]... ein riesiger Sprung über GPT 5.1, und das ist ein Thema, das man immer wieder sieht.

Gemini 3 Pro verdoppelt fast die Leistung von GPT 5.1 bei ARC AGI 2 visual reasoning Rätseln.

Google hat Gemini 3 auf den eigenen hauseigenen TPUs trainiert, nicht auf Nvidia-GPUs. Sie sind vielleicht das einzige Unternehmen, das es sich leisten kann, dies anzubieten.

Wir sehen einen massiven Anstieg der reasoning Dichte dieser models im Vergleich zur vorherigen Generation.

Die multimodal Performance setzt hier wirklich einen neuen Standard für das, was wir von frontier models erwarten.

Es schaut sich das Video buchstäblich Frame für Frame an, anders als jedes andere model... es versteht es Frame für Frame.

Es kann ein komplettes YouTube-Video laden und verstehen... ich nutze das ständig für Kapitelmarkierungen.

Die Fähigkeit, langen Kontext zu verarbeiten, ohne den Fokus zu verlieren, ist der Bereich, in dem Gemini 3 wirklich glänzt.

Ich habe seine Vision an komplexen technischen Diagrammen getestet, und es ist deutlich präziser als GPT.

Googles Integration in AI Studio macht das Testen dieser fortschrittlichen Features sehr unkompliziert.

Der Preis liegt bei 2 $ pro 1M input / 12 $ pro 1M output tokens... es ist token-intensiv und teuer.

Es verhält sich wie ein Senior-Ingenieur, der sagt 'habe ich fertig', aber Überwachung braucht... man muss seine Arbeit verifizieren.

Das context window ist wirklich wahnsinnig, man kann einfach ein komplettes Repository reinkopieren.

Wenn man Agents baut, ist die Zuverlässigkeit beim function calling bei diesem model ein absoluter Gamechanger.

Man muss mit den Safety-Filtern vorsichtig sein, sie können bei bestimmten Themen etwas zu streng eingestellt sein.

Mehr als nur Prompts

Optimieren Sie Ihren Workflow mit KI-Automatisierung

Automatio kombiniert die Kraft von KI-Agenten, Web-Automatisierung und intelligenten Integrationen, um Ihnen zu helfen, mehr in weniger Zeit zu erreichen.

KI-Agenten
Web-Automatisierung
Intelligente Workflows
Demo-Video ansehen

Profi-Tipps

Expertentipps, um das Beste aus diesem Modell herauszuholen.

Dynamic Thinking

Nutzen Sie für einfachere Aufgaben das model im 'Flash'-Modus, um Kosten zu sparen; rufen Sie die Modi 'Deep Think' oder 'Pro' nur für Aufgaben auf, die reasoning auf ARC-AGI-Niveau erfordern.

Context Management

Während das window 1M tokens umfasst, verdoppeln sich die Preise ab 200k tokens. Nutzen Sie selektives context engineering, um Sessions für einen besseren ROI unter diesem Schwellenwert zu halten.

Die 'Senior Engineer'-Strategie

Behandeln Sie das model beim Programmieren wie einen Senior-Entwickler, der Validierung benötigt – fordern Sie es immer auf, 'Logs zu prüfen und Imports zu verifizieren', um die 88 % Halluzinations-Eigenheit in komplexen Umgebungen abzufedern.

Erfahrungsberichte

Was Unsere Nutzer Sagen

Schliessen Sie sich Tausenden zufriedener Nutzer an, die ihren Workflow transformiert haben

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Häufig gestellte Fragen

Finden Sie Antworten auf häufige Fragen zu diesem Modell