google

Gemini 3 Flash

Gemini 3 Flash ist Googles multimodales Hochgeschwindigkeitsmodell mit 1M token context window, erstklassigem 90,4 % GPQA-Reasoning und autonomen...

google logogoogleGemini 32025-12-17
Kontext
1.0MToken
Max. Ausgabe
66KToken
Eingabepreis
$0.50/ 1M
Ausgabepreis
$3.00/ 1M
Modalität:TextImageAudioVideo
Fähigkeiten:VisionToolsStreamingLogik
Benchmarks
GPQA
90.4%
GPQA: Wissenschafts-Q&A auf Hochschulniveau. Ein anspruchsvoller Benchmark mit 448 Multiple-Choice-Fragen in Biologie, Physik und Chemie, erstellt von Fachexperten. Doktoranden erreichen nur 65-74% Genauigkeit, während Laien selbst mit unbegrenztem Webzugang nur 34% schaffen (daher 'Google-sicher'). Gemini 3 Flash erreichte 90.4% bei diesem Benchmark.
HLE
43.5%
HLE: Expertenwissen-Reasoning. Testet die Fähigkeit eines Modells, Expertenwissen in spezialisierten Bereichen zu demonstrieren. Bewertet tiefes Verständnis komplexer Themen, die professionelles Wissen erfordern. Gemini 3 Flash erreichte 43.5% bei diesem Benchmark.
MMLU
91.8%
MMLU: Massives Multitask-Sprachverständnis. Ein umfassender Benchmark mit 16.000 Multiple-Choice-Fragen zu 57 akademischen Fächern wie Mathematik, Philosophie, Jura und Medizin. Testet breites Wissen und Reasoning-Fähigkeiten. Gemini 3 Flash erreichte 91.8% bei diesem Benchmark.
MMLU Pro
72.5%
MMLU Pro: MMLU Professional Edition. Eine erweiterte Version von MMLU mit 12.032 Fragen im schwereren 10-Optionen-Format. Umfasst Mathematik, Physik, Chemie, Jura, Ingenieurwesen, Wirtschaft, Gesundheit, Psychologie, Business, Biologie, Philosophie und Informatik. Gemini 3 Flash erreichte 72.5% bei diesem Benchmark.
SimpleQA
68.7%
SimpleQA: Faktische Genauigkeits-Benchmark. Testet die Fähigkeit eines Modells, akkurate, faktische Antworten auf einfache Fragen zu geben. Misst Zuverlässigkeit und reduziert Halluzinationen bei Wissensabruf. Gemini 3 Flash erreichte 68.7% bei diesem Benchmark.
IFEval
88.2%
IFEval: Anweisungsbefolgungs-Evaluation. Misst, wie gut ein Modell spezifische Anweisungen und Einschränkungen befolgt. Testet die Fähigkeit, Formatierungsregeln, Längenbegrenzungen und andere explizite Anforderungen einzuhalten. Gemini 3 Flash erreichte 88.2% bei diesem Benchmark.
AIME 2025
99.7%
AIME 2025: Amerikanische Mathematik-Olympiade. Wettbewerbsmathematik-Aufgaben aus der renommierten AIME-Prüfung für talentierte Oberstufenschüler. Testet fortgeschrittenes mathematisches Problemlösen, das abstraktes Denken erfordert. Gemini 3 Flash erreichte 99.7% bei diesem Benchmark.
MATH
58%
MATH: Mathematisches Problemlösen. Ein umfassender Mathematik-Benchmark für Problemlösung in Algebra, Geometrie, Analysis und anderen mathematischen Bereichen. Erfordert mehrstufiges Reasoning und formales mathematisches Wissen. Gemini 3 Flash erreichte 58% bei diesem Benchmark.
GSM8k
94%
GSM8k: Grundschul-Mathematik 8K. 8.500 Mathematik-Textaufgaben auf Grundschulniveau, die mehrstufiges Reasoning erfordern. Testet grundlegende Arithmetik und logisches Denken durch Alltagsszenarien. Gemini 3 Flash erreichte 94% bei diesem Benchmark.
MGSM
92.4%
MGSM: Mehrsprachige Grundschul-Mathematik. Der GSM8k-Benchmark übersetzt in 10 Sprachen inkl. Spanisch, Französisch, Deutsch, Russisch, Chinesisch und Japanisch. Testet mathematisches Reasoning in verschiedenen Sprachen. Gemini 3 Flash erreichte 92.4% bei diesem Benchmark.
MathVista
65.4%
MathVista: Mathematisches visuelles Reasoning. Testet die Fähigkeit, mathematische Probleme mit visuellen Elementen wie Diagrammen, Graphen, Geometriefiguren und wissenschaftlichen Abbildungen zu lösen. Gemini 3 Flash erreichte 65.4% bei diesem Benchmark.
SWE-Bench
78%
SWE-Bench: Software-Engineering-Benchmark. KI-Modelle versuchen, echte GitHub-Issues in Open-Source-Python-Projekten zu lösen, mit menschlicher Verifizierung. Testet praktische Software-Engineering-Fähigkeiten. Top-Modelle stiegen von 4,4% (2023) auf über 70% (2024). Gemini 3 Flash erreichte 78% bei diesem Benchmark.
HumanEval
84.1%
HumanEval: Python-Programmieraufgaben. 164 handgeschriebene Programmieraufgaben, bei denen Modelle korrekte Python-Funktionsimplementierungen generieren müssen. Jede Lösung wird durch Unit-Tests verifiziert. Top-Modelle erreichen heute 90%+. Gemini 3 Flash erreichte 84.1% bei diesem Benchmark.
LiveCodeBench
77.2%
LiveCodeBench: Live-Coding-Benchmark. Testet Programmierfähigkeiten mit kontinuierlich aktualisierten, realen Programmieraufgaben. Anders als statische Benchmarks verwendet er frische Aufgaben, um Datenkontamination zu verhindern. Gemini 3 Flash erreichte 77.2% bei diesem Benchmark.
MMMU
81.2%
MMMU: Multimodales Verständnis. Massive Multi-Disziplin Multimodales Verständnis Benchmark, der Vision-Sprach-Modelle bei Hochschulaufgaben in 30 Fächern testet, die sowohl Bildverständnis als auch Expertenwissen erfordern. Gemini 3 Flash erreichte 81.2% bei diesem Benchmark.
MMMU Pro
81.2%
MMMU Pro: MMMU Professional Edition. Erweiterte Version von MMMU mit anspruchsvolleren Fragen und strengerer Bewertung. Testet fortgeschrittenes multimodales Reasoning auf professionellem und Expertenniveau. Gemini 3 Flash erreichte 81.2% bei diesem Benchmark.
ChartQA
86.5%
ChartQA: Diagramm-Fragebeantwortung. Testet die Fähigkeit, Informationen in Diagrammen und Graphen zu verstehen und zu analysieren. Erfordert Datenextraktion, Wertevergleiche und Berechnungen aus visuellen Darstellungen. Gemini 3 Flash erreichte 86.5% bei diesem Benchmark.
DocVQA
93.1%
DocVQA: Dokument-Visuelle Q&A. Dokument Visual Question Answering Benchmark, der die Fähigkeit testet, Informationen aus Dokumentbildern inkl. Formularen, Berichten und gescanntem Text zu extrahieren und zu analysieren. Gemini 3 Flash erreichte 93.1% bei diesem Benchmark.
Terminal-Bench
47.6%
Terminal-Bench: Terminal/CLI-Aufgaben. Testet die Fähigkeit, Kommandozeilen-Operationen auszuführen, Shell-Skripte zu schreiben und in Terminal-Umgebungen zu navigieren. Misst praktische Systemadministrations- und Entwickler-Workflow-Fähigkeiten. Gemini 3 Flash erreichte 47.6% bei diesem Benchmark.
ARC-AGI
33.6%
ARC-AGI: Abstraktion & Reasoning. Abstraction and Reasoning Corpus für AGI - testet fluide Intelligenz durch neuartige Mustererkennungs-Puzzles. Jede Aufgabe erfordert das Entdecken der zugrundeliegenden Regel aus Beispielen und misst allgemeine Reasoning-Fähigkeit statt Auswendiglernen. Gemini 3 Flash erreichte 33.6% bei diesem Benchmark.

Über Gemini 3 Flash

Erfahren Sie mehr über die Fähigkeiten, Funktionen und Einsatzmöglichkeiten von Gemini 3 Flash.

Das Performance-Kraftpaket von Gemini 3

Gemini 3 Flash ist Googles multimodales frontier-class model, das auf extreme Geschwindigkeit und massive Skalierbarkeit optimiert wurde. Es wurde von Google DeepMind entwickelt und fungiert als effizientes Arbeitspferd des Gemini 3-Ökosystems. Es liefert qualitativ hochwertiges Reasoning und native multimodale Verarbeitung von Text, Code, Bildern und Audio. Es wurde speziell für hochvolumige Unternehmens-Workloads entwickelt, bei denen niedrige Latenz und Kosteneffizienz von größter Bedeutung sind.

Beispielloser Kontext und Agency

Das model verfügt über ein massives 1-Million-token context window, das es ermöglicht, ganze Code-Repositories, stundenlange Videos oder Tausende von Dokumentationsseiten in einem einzigen prompt zu verarbeiten. Es ist mehr als nur ein Chatbot; es ist für Agency konzipiert. Durch die Integration mit den Stagehand- und Nano Browser-APIs von Google kann es autonom im Web navigieren, mehrstufige digitale Aufgaben ausführen und wie ein Mensch mit Live-Web-Elementen interagieren.

Erstklassiges wissenschaftliches Reasoning

Obwohl auf Geschwindigkeit optimiert, büßt Gemini 3 Flash keine Intelligenz ein. Durch das spezialisierte Deep Think-Aktivierungsprotokoll kann das model interne chain-of-thought Prozesse auslösen, um Probleme auf PhD-Niveau in Mathematik, Wissenschaft und Logik zu lösen. Diese Dualität ermöglicht es, mit einfachen Systemanweisungen zwischen schneller Datenextraktion und anspruchsvoller Expertenanalyse zu wechseln.

Gemini 3 Flash

Anwendungsfälle für Gemini 3 Flash

Entdecken Sie die verschiedenen Möglichkeiten, Gemini 3 Flash für großartige Ergebnisse zu nutzen.

Autonome Web-Navigation

Führen Sie mehrstufige Web-Aufgaben aus, wie Reisebuchungen oder Wettbewerbsanalysen, mithilfe der Nano Browser API.

Groß angelegtes Code-Refactoring

Analysieren Sie gesamte Software-Repositories unter Nutzung des 1-Million-token-Fensters, um Abhängigkeitslogiken abzubilden.

Multimodale Inhaltsprüfung

Analysieren Sie stundenlanges Videomaterial oder Hunderte von technischen PDFs, um spezifische visuelle Muster und strukturierte Daten zu extrahieren.

Echtzeit-Kundensupport

Betreiben Sie reaktionsschnelle Chatbots, die komplexe multimodale Anfragen mit Antwortzeiten unter einer Sekunde bewältigen.

Synthese wissenschaftlicher Forschung

Analysieren Sie wissenschaftliche Arbeiten und Datensätze auf PhD-Niveau, um unter Verwendung des Deep Think-Protokolls Versuchsdesigns vorzuschlagen.

Interaktive Nachhilfe

Bieten Sie schrittweise Nachhilfe für fortgeschrittene Mathematik mit internen chain-of-thought Erklärungen an.

Stärken

Einschränkungen

Unübertroffenes räumliches Reasoning: Erreicht Spitzenwerte beim visuellen Verständnis und zeichnet sich durch präzise SVG-Generierung sowie Screen-Analyse aus.
Hohe Halluzinationsrate: Gemessen wurde eine Tendenz von 91 %, plausible Antworten zu erfinden, anstatt fehlende spezifische Informationen zuzugeben.
Elite Coding-Effizienz: Erreicht 78 % im SWE-bench Verified benchmark und ist damit schneller und präziser bei Software-Engineering-Aufgaben als viele Pro-Modelle.
Overhead durch Reasoning-tokens: Der Deep Think-Modus erzeugt ein hohes Volumen an Output-tokens, was die Gesamtkosten pro Anfrage erheblich steigern kann.
Massives 1M context window: Die enorme token-Kapazität ermöglicht es dem model, stundenlanges Videomaterial oder ganze Projektverzeichnisse ohne Datenverlust zu verarbeiten.
Lücken bei der Befolgung von Anweisungen: Hat gelegentlich Schwierigkeiten mit negativen Einschränkungen, wie z. B. das Einbeziehen unerwünschter UI-Elemente, obwohl explizit deren Vermeidung gefordert wurde.
Hohe inference Geschwindigkeit: Optimiert für Latenzzeiten unter einer Sekunde, was es zum derzeit schnellsten frontier-class model innerhalb der Gemini-Familie macht.
Instabile API-Erfahrung: Entwickler-Endpoints fallen im Vergleich zur Konkurrenz durch häufige Breaking Changes und inkonsistente Dokumentation auf.

API-Schnellstart

google/gemini-3-flash

Dokumentation anzeigen
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ 
  model: "gemini-3-flash",
  thinkingMode: true 
});

const prompt = "Analysieren Sie das räumliche Layout dieses UI-Screenshots auf Barrierefreiheit.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

Installieren Sie das SDK und beginnen Sie in wenigen Minuten mit API-Aufrufen.

Was die Leute über Gemini 3 Flash sagen

Sehen Sie, was die Community über Gemini 3 Flash denkt

Gemini 3 Flash hat den Pelican SVG-Test vernichtet; die besten Ergebnisse, die ich bisher von irgendeinem model gesehen habe.
Simon Willison
twitter
Der Denkprozess von Gemini 3 ist wild. Es ringt tatsächlich in Echtzeit mit seiner eigenen Identität und seinen Systemvorgaben.
rutan668
reddit
Die Wissensdichte ist unglaublich, aber die Halluzinationsrate macht es gefährlich für unbeaufsichtigte Aufgaben.
anonymous_engineer
hackernews
Endlich ein model, bei dem ich das Compute-Budget kontrollieren kann. Der Standardmodus ist blitzschnell, der Thinking Mode ist brillant.
AI_Insights_Daily
twitter
Flash 3 ist das erste Mal, dass ich das Gefühl hatte, ein 'kleines' model könnte für 90 % meines Programmier-Workflows ein 'Pro'-model ersetzen.
CodeMasterV
reddit
Das räumliche Reasoning ist auf einem anderen Level. Es hat meine unordentliche Whiteboard-Zeichnung beim ersten Versuch perfekt verstanden.
DesignFlow
twitter

Videos über Gemini 3 Flash

Schauen Sie Tutorials, Rezensionen und Diskussionen über Gemini 3 Flash

Es schlägt tatsächlich Gemini 3 Pro beim Programmieren.

MMU Pro ist das Nummer-eins-model von allen.

Es ist im Grunde das frontier-Modell der Intelligenz zu einem Bruchteil der Kosten.

Die Geschwindigkeit, mit der es komplexes Reasoning generiert, ist einfach unerreicht.

Google verschiebt wirklich die Grenzen dessen, was ein 'Flash'-model leisten kann.

Erstellte eine vollständige Vogelschwarm-Simulation mit nur 3.000 tokens, während Gemini 3 Pro noch am Aufbauen war.

Eines der am schlechtesten getesteten Modelle bei Halluzinationen. Es denkt sich einfach etwas aus.

Das context window ist hier der eigentliche Star und verarbeitet ganze Repos problemlos.

Vertrauen Sie ihm nicht bei faktischer Historie oder nischigen technischen Daten ohne RAG.

Es ist das ultimative Tool für die visuelle Analyse von Logs und Dashboards.

Sein Verständnis für räumliches Reasoning ist erstklassig.

In 91 % der Fälle, in denen es etwas nicht weiß, lügt es und erfindet eine Antwort.

Das Verständnis von Bildschirminhalten übertrifft die Werte von 2.5 Flash.

Die Fähigkeit, visuelle UI zu parsen und in Code umzuwandeln, ist fehlerfrei.

Die Preisgestaltung macht es zu einer klaren Wahl für agentic Aufgaben mit hohem Volumen.

Mehr als nur Prompts

Optimieren Sie Ihren Workflow mit KI-Automatisierung

Automatio kombiniert die Kraft von KI-Agenten, Web-Automatisierung und intelligenten Integrationen, um Ihnen zu helfen, mehr in weniger Zeit zu erreichen.

KI-Agenten
Web-Automatisierung
Intelligente Workflows

Pro-Tipps für Gemini 3 Flash

Expertentipps, um das Beste aus Gemini 3 Flash herauszuholen.

Thinking Mode nutzen

Aktivieren Sie den 'thinkingMode' gezielt für logikintensive Aufgaben oder mathematische Probleme, um die Genauigkeit erheblich zu steigern.

Batch Processing zur Kostenersparnis

Nutzen Sie die Batch API für nicht dringende Aufgaben, um einen Rabatt von 50 % auf die standardmäßige Preisgestaltung pro token zu erhalten.

Optimierung via MCP

Verwenden Sie das Model Context Protocol, um Drittanbieter-Tools nahtlos in die agentic Workflows des models zu integrieren.

Kritische Ergebnisse verifizieren

Implementieren Sie Verifizierungsebenen für faktische Abfragen, da das model eine hohe Halluzinationsrate bei unbekannten Daten aufweist.

Erfahrungsberichte

Was Unsere Nutzer Sagen

Schliessen Sie sich Tausenden zufriedener Nutzer an, die ihren Workflow transformiert haben

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Verwandte AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Häufig gestellte Fragen zu Gemini 3 Flash

Finden Sie Antworten auf häufige Fragen zu Gemini 3 Flash