google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite ist das schnellste und kosteneffizienteste Modell von Google. Bietet 1M context, native Multimodalität und 363 tokens/sec Geschwindigkeit...

MultimodalHohe GeschwindigkeitKosteneffizientGoogle Gemini
google logogoogleGemini 3.12026-03-03
Kontext
1.0MToken
Max. Ausgabe
66KToken
Eingabepreis
$0.25/ 1M
Ausgabepreis
$1.50/ 1M
Modalität:TextImageAudioVideo
Fähigkeiten:VisionToolsStreaming
Benchmarks
GPQA
86.9%
GPQA: Wissenschafts-Q&A auf Hochschulniveau. Ein anspruchsvoller Benchmark mit 448 Multiple-Choice-Fragen in Biologie, Physik und Chemie, erstellt von Fachexperten. Doktoranden erreichen nur 65-74% Genauigkeit, während Laien selbst mit unbegrenztem Webzugang nur 34% schaffen (daher 'Google-sicher'). Gemini 3.1 Flash-Lite erreichte 86.9% bei diesem Benchmark.
HLE
16%
HLE: Expertenwissen-Reasoning. Testet die Fähigkeit eines Modells, Expertenwissen in spezialisierten Bereichen zu demonstrieren. Bewertet tiefes Verständnis komplexer Themen, die professionelles Wissen erfordern. Gemini 3.1 Flash-Lite erreichte 16% bei diesem Benchmark.
MMLU
88.9%
MMLU: Massives Multitask-Sprachverständnis. Ein umfassender Benchmark mit 16.000 Multiple-Choice-Fragen zu 57 akademischen Fächern wie Mathematik, Philosophie, Jura und Medizin. Testet breites Wissen und Reasoning-Fähigkeiten. Gemini 3.1 Flash-Lite erreichte 88.9% bei diesem Benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Professional Edition. Eine erweiterte Version von MMLU mit 12.032 Fragen im schwereren 10-Optionen-Format. Umfasst Mathematik, Physik, Chemie, Jura, Ingenieurwesen, Wirtschaft, Gesundheit, Psychologie, Business, Biologie, Philosophie und Informatik. Gemini 3.1 Flash-Lite erreichte 80% bei diesem Benchmark.
SimpleQA
43.3%
SimpleQA: Faktische Genauigkeits-Benchmark. Testet die Fähigkeit eines Modells, akkurate, faktische Antworten auf einfache Fragen zu geben. Misst Zuverlässigkeit und reduziert Halluzinationen bei Wissensabruf. Gemini 3.1 Flash-Lite erreichte 43.3% bei diesem Benchmark.
IFEval
85%
IFEval: Anweisungsbefolgungs-Evaluation. Misst, wie gut ein Modell spezifische Anweisungen und Einschränkungen befolgt. Testet die Fähigkeit, Formatierungsregeln, Längenbegrenzungen und andere explizite Anforderungen einzuhalten. Gemini 3.1 Flash-Lite erreichte 85% bei diesem Benchmark.
AIME 2025
25%
AIME 2025: Amerikanische Mathematik-Olympiade. Wettbewerbsmathematik-Aufgaben aus der renommierten AIME-Prüfung für talentierte Oberstufenschüler. Testet fortgeschrittenes mathematisches Problemlösen, das abstraktes Denken erfordert. Gemini 3.1 Flash-Lite erreichte 25% bei diesem Benchmark.
MATH
78%
MATH: Mathematisches Problemlösen. Ein umfassender Mathematik-Benchmark für Problemlösung in Algebra, Geometrie, Analysis und anderen mathematischen Bereichen. Erfordert mehrstufiges Reasoning und formales mathematisches Wissen. Gemini 3.1 Flash-Lite erreichte 78% bei diesem Benchmark.
GSM8k
95%
GSM8k: Grundschul-Mathematik 8K. 8.500 Mathematik-Textaufgaben auf Grundschulniveau, die mehrstufiges Reasoning erfordern. Testet grundlegende Arithmetik und logisches Denken durch Alltagsszenarien. Gemini 3.1 Flash-Lite erreichte 95% bei diesem Benchmark.
MGSM
92%
MGSM: Mehrsprachige Grundschul-Mathematik. Der GSM8k-Benchmark übersetzt in 10 Sprachen inkl. Spanisch, Französisch, Deutsch, Russisch, Chinesisch und Japanisch. Testet mathematisches Reasoning in verschiedenen Sprachen. Gemini 3.1 Flash-Lite erreichte 92% bei diesem Benchmark.
MathVista
75%
MathVista: Mathematisches visuelles Reasoning. Testet die Fähigkeit, mathematische Probleme mit visuellen Elementen wie Diagrammen, Graphen, Geometriefiguren und wissenschaftlichen Abbildungen zu lösen. Gemini 3.1 Flash-Lite erreichte 75% bei diesem Benchmark.
SWE-Bench
35%
SWE-Bench: Software-Engineering-Benchmark. KI-Modelle versuchen, echte GitHub-Issues in Open-Source-Python-Projekten zu lösen, mit menschlicher Verifizierung. Testet praktische Software-Engineering-Fähigkeiten. Top-Modelle stiegen von 4,4% (2023) auf über 70% (2024). Gemini 3.1 Flash-Lite erreichte 35% bei diesem Benchmark.
HumanEval
88%
HumanEval: Python-Programmieraufgaben. 164 handgeschriebene Programmieraufgaben, bei denen Modelle korrekte Python-Funktionsimplementierungen generieren müssen. Jede Lösung wird durch Unit-Tests verifiziert. Top-Modelle erreichen heute 90%+. Gemini 3.1 Flash-Lite erreichte 88% bei diesem Benchmark.
LiveCodeBench
72%
LiveCodeBench: Live-Coding-Benchmark. Testet Programmierfähigkeiten mit kontinuierlich aktualisierten, realen Programmieraufgaben. Anders als statische Benchmarks verwendet er frische Aufgaben, um Datenkontamination zu verhindern. Gemini 3.1 Flash-Lite erreichte 72% bei diesem Benchmark.
MMMU
76.8%
MMMU: Multimodales Verständnis. Massive Multi-Disziplin Multimodales Verständnis Benchmark, der Vision-Sprach-Modelle bei Hochschulaufgaben in 30 Fächern testet, die sowohl Bildverständnis als auch Expertenwissen erfordern. Gemini 3.1 Flash-Lite erreichte 76.8% bei diesem Benchmark.
MMMU Pro
76.8%
MMMU Pro: MMMU Professional Edition. Erweiterte Version von MMMU mit anspruchsvolleren Fragen und strengerer Bewertung. Testet fortgeschrittenes multimodales Reasoning auf professionellem und Expertenniveau. Gemini 3.1 Flash-Lite erreichte 76.8% bei diesem Benchmark.
ChartQA
91%
ChartQA: Diagramm-Fragebeantwortung. Testet die Fähigkeit, Informationen in Diagrammen und Graphen zu verstehen und zu analysieren. Erfordert Datenextraktion, Wertevergleiche und Berechnungen aus visuellen Darstellungen. Gemini 3.1 Flash-Lite erreichte 91% bei diesem Benchmark.
DocVQA
92%
DocVQA: Dokument-Visuelle Q&A. Dokument Visual Question Answering Benchmark, der die Fähigkeit testet, Informationen aus Dokumentbildern inkl. Formularen, Berichten und gescanntem Text zu extrahieren und zu analysieren. Gemini 3.1 Flash-Lite erreichte 92% bei diesem Benchmark.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI-Aufgaben. Testet die Fähigkeit, Kommandozeilen-Operationen auszuführen, Shell-Skripte zu schreiben und in Terminal-Umgebungen zu navigieren. Misst praktische Systemadministrations- und Entwickler-Workflow-Fähigkeiten. Gemini 3.1 Flash-Lite erreichte 55% bei diesem Benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion & Reasoning. Abstraction and Reasoning Corpus für AGI - testet fluide Intelligenz durch neuartige Mustererkennungs-Puzzles. Jede Aufgabe erfordert das Entdecken der zugrundeliegenden Regel aus Beispielen und misst allgemeine Reasoning-Fähigkeit statt Auswendiglernen. Gemini 3.1 Flash-Lite erreichte 12% bei diesem Benchmark.

Über Gemini 3.1 Flash-Lite

Erfahren Sie mehr über die Fähigkeiten, Funktionen und Einsatzmöglichkeiten von Gemini 3.1 Flash-Lite.

Optimiert für Hochgeschwindigkeits-Intelligenz

Gemini 3.1 Flash-Lite ist Googles Hochleistungs-Modell, das speziell für Entwickler-Workloads mit hohem Volumen entwickelt wurde, bei denen geringe Latenz und Kosteneffizienz im Vordergrund stehen. Erschienen am 3. März 2026, ist es ein optimierter Vertreter der Gemini 3.1-Serie und bietet eine 2,5-mal schnellere Time-to-first-token sowie eine Steigerung der Ausgabegeschwindigkeit um 45 % im Vergleich zu früheren Generationen. Es ist in der Lage, über 360 tokens pro Sekunde zu streamen, was es ideal für Echtzeit-Anwendungen und Datenverarbeitung in massivem Maßstab macht.

Nativ multimodal mit 1M context

Das Modell ist nativ multimodal und unterstützt Texte, Bilder, Audio, Video und PDF-Eingaben innerhalb eines gewaltigen 1-Million-token-context-windows. Dies ermöglicht es Entwicklern, enorme Datensätze wie stundenlange Videos oder riesige juristische Archive zu verarbeiten, ohne komplexe RAG-Pipelines zu benötigen. Seine Vision-Fähigkeiten sind besonders ausgeprägt und glänzen bei visueller Beantwortung von Fragen zu Dokumenten (DocVQA) und Diagrammanalysen.

Granulare Kontrolle für Entwickler

Ein herausragendes Merkmal ist die Einführung von „Thinking Levels“ (Minimal, Low, Medium, High). Dieser Parameter ermöglicht es Entwicklern, die reasoning-Tiefe des Modells je nach Komplexität der Aufgabe feinstufig zu steuern. Diese Flexibilität stellt sicher, dass Nutzer für einfache Aufgaben wie Klassifizierungen nicht zu viel bezahlen, während sie für strukturiertere Ausgaben wie UI-Generierung und Datenextraktion weiterhin Zugriff auf erweiterte Logik haben.

Gemini 3.1 Flash-Lite

Anwendungsfälle für Gemini 3.1 Flash-Lite

Entdecken Sie die verschiedenen Möglichkeiten, Gemini 3.1 Flash-Lite für großartige Ergebnisse zu nutzen.

Echtzeit-Übersetzung in hohem Volumen

Nahtlose Verarbeitung tausender Chat-Nachrichten oder Support-Tickets in über 100 Sprachen mit minimaler Latenz und hoher Kosteneffizienz.

Multimodale Content-Moderation

Nutzung nativer Video- und Bildverarbeitung zur Kennzeichnung unangebrachter Inhalte in Social-Media-Feeds mit hohem Durchsatz oder auf Videoplattformen.

Automatisierte strukturierte Datenextraktion

Extraktion komplexer JSON-Schemata aus massiven PDF-Archiven oder langen juristischen Dokumenten unter Nutzung des 1-Millionen-token-context-windows.

Agiles Front-End-Prototyping

Schnelle Generierung funktionaler React/Tailwind UI-Komponenten und Landing Pages mit über 360 tokens pro Sekunde für iteratives Design.

Agentische Task-Orchestrierung

Unterstützung von „Always-on“-AI-agents, die mehrstufige Planung, Web-Recherche und tool-use durchführen, ohne das token-Budget zu sprengen.

Kundenservice-Bots mit geringer Latenz

Einsatz von Konversationsassistenten, die sofortige Antworten mit anpassbarem reasoning für einfache bis komplexe Anfragen liefern.

Stärken

Einschränkungen

Unübertroffener Durchsatz: Streamt mit 363 tokens pro Sekunde und ist damit 45 % schneller als 2.5 Flash für agentische Echtzeit-Anwendungen.
Begrenztes reasoning: Deutlich geringere Leistung bei abstrakter Logik (12 % ARC-AGI v2) im Vergleich zu Flaggschiff-Modellen, die auf reasoning spezialisiert sind.
Aggressive Preisgestaltung: Mit 0,25 $/M input tokens kostet es etwa 1/8 von Gemini 3.1 Pro bei gleichzeitig hoher allgemeiner Intelligenz.
Schwächen bei Mathematik-Olympiaden: Probleme bei Mathematik auf Elite-Niveau, mit nur 25 % bei AIME 2025 im Vergleich zu über 90 % bei frontier models.
Native multimodale Exzellenz: Herausragende Performance bei Vision (92 % DocVQA) und Video (84,8 % VideoMMMU), ohne separate Encoder zu benötigen.
Faktentreue-Kalibrierung: Höhere Halluzinationsraten bei faktenbasierten Aufgaben (43,3 % SimpleQA) als bei Pro-Modellen oder frontier-Alternativen.
Granulare Rechensteuerung: Das erste Modell, das eine präzise Steuerung der reasoning-Tiefe bietet und so die Optimierung des Preis-Leistungs-Verhältnisses ermöglicht.
Abweichungen bei Anweisungen: Kann bei extrem langen, komplexen mehrstufigen Anweisungen gelegentlich kleinere Formatierungsvorgaben übersehen.

API-Schnellstart

google/gemini-3.1-flash-lite-preview

Dokumentation anzeigen
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

Installieren Sie das SDK und beginnen Sie in wenigen Minuten mit API-Aufrufen.

Was die Leute über Gemini 3.1 Flash-Lite sagen

Sehen Sie, was die Community über Gemini 3.1 Flash-Lite denkt

Flash lite ist wahnsinnig schnell und effektiv für spezifische Workflows wie Zusammenfassungen... das ist ein willkommener Geschwindigkeitsschub.
reddit user
reddit
Gemini 3.1 Flash-Lite ist der lautlose K.-o.-Schlag für Mid-Tier-API-Anbieter... die Kostenkurven summieren sich schnell.
@9chaku
twitter
3.1 Flash-Lite übertrifft 2.5 Flash in den meisten Benchmarks und ist dabei ein kleiner Flitzer!
Tulsee Doshi
twitter
Für Entwickler, die AI-agents in großem Stil betreiben, ist dies das Modell, das ‚Always-on‘ tatsächlich erschwinglich macht. 363 t/s ist wild.
@prince_twets
twitter
Die Preise sind wahnsinnig. 0,25 $ für 1M input macht es günstiger, ganze Repos in den context zu laden, als RAG aufzubauen.
reddit user
reddit
Die Geschwindigkeit bis zum ersten token ist praktisch unmittelbar. Es ist das erste Mal, dass sich ein Modell schneller anfühlt als mein eigenes Tippen.
DevGuru
hackernews

Videos über Gemini 3.1 Flash-Lite

Schauen Sie Tutorials, Rezensionen und Diskussionen über Gemini 3.1 Flash-Lite

Der Preis liegt bei 25 Cent pro 1 Million input tokens und 1,50 $ pro 1 Million output tokens... immer noch sehr wettbewerbsfähig in Anbetracht der Geschwindigkeit.

Ich finde, dass dies ein unterschätztes Modell für Coding ist, das sich auf die Front-End-Entwicklung konzentriert und extrem schnell tokens liefert.

Dies richtet sich wirklich an Entwickler, die Skalierbarkeit ohne die Latenz eines Pro-Modells benötigen.

Die Multimodalität hier ist nicht nur ein Gimmick; sie verarbeitet komplexe PDFs mit Leichtigkeit.

Google verschiebt wirklich die Grenzen dessen, was ein ‚lite‘-Modell im Jahr 2026 tatsächlich leisten kann.

Dieses Mal ist es Gemini 3.1 Flash Light, das eine schnellere und günstigere Version des Flash-Modells sein soll.

Diese Modelle werden benötigt, wenn man sie in Anwendungen mit hohem Durchsatz einsetzen möchte.

Das 1-Million-context-window ist jetzt Standard für Gemini, aber es bei einem so schnellen Modell zu sehen, ist beeindruckend.

Es wird keine Mathematik-Olympiade gewinnen, aber es ist perfekt für Extraktion und Zusammenfassung.

Die API-Latenz ist in meinen ersten Tests deutlich niedriger als bei GPT-4o-mini.

Dieses neue AI-Modell von Google ist 45 % schneller... und es könnte die Art und Weise verändern, wie wir alle mit AI bauen.

Low-thinking-mode für die schnellen, einfachen Dinge. High-thinking-mode für die schwere Arbeit... diese Flexibilität unterscheidet ein Spielzeug von einem echten Werkzeug.

Für SEO-Aufgaben wird dies aufgrund des Preispunktes mein Standardmodell werden.

Die Tatsache, dass es ein Video sehen und den Kontext fast augenblicklich verstehen kann, ist ein Gamechanger für Content-Creator.

Google macht es derzeit sehr schwer, die Nutzung anderer Anbieter für Aufgaben mit hohem Volumen zu rechtfertigen.

Mehr als nur Prompts

Optimieren Sie Ihren Workflow mit KI-Automatisierung

Automatio kombiniert die Kraft von KI-Agenten, Web-Automatisierung und intelligenten Integrationen, um Ihnen zu helfen, mehr in weniger Zeit zu erreichen.

KI-Agenten
Web-Automatisierung
Intelligente Workflows

Pro-Tipps für Gemini 3.1 Flash-Lite

Expertentipps, um das Beste aus Gemini 3.1 Flash-Lite herauszuholen.

Thinking Levels nutzen

Setzen Sie thinking_level für einfache Aufgaben wie Klassifizierung auf „minimal“, um die Geschwindigkeit zu maximieren, nutzen Sie jedoch „high“ für strukturierte Codegenerierung.

Native Videoanalyse

Speisen Sie rohe Videodateien direkt in die API ein, um gleichzeitig schnellere Erkenntnisse über visuelle Ereignisse und Audio-Signale zu erhalten und Transkriptionsschritte zu umgehen.

Context statt RAG

Speisen Sie bei Datensätzen unter 1 Million tokens den gesamten Dokumentsatz direkt in das context window ein, um Abruffehler und Kosten für vector-Datenbanken zu vermeiden.

Optimierung durch Batching

Nutzen Sie die Batching-API für nicht dringende Aufgaben, um die Kosten weiter zu senken, da Flash-Lite speziell für die asynchrone Verarbeitung optimiert ist.

Erfahrungsberichte

Was Unsere Nutzer Sagen

Schliessen Sie sich Tausenden zufriedener Nutzer an, die ihren Workflow transformiert haben

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Verwandte AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Häufig gestellte Fragen zu Gemini 3.1 Flash-Lite

Finden Sie Antworten auf häufige Fragen zu Gemini 3.1 Flash-Lite