google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite is Google's snelste en meest kostenefficiënte model. Voorzien van 1M context, native multimodality en 363 tokens/sec snelheid voor...

MultimodalHoge SnelheidKostenefficiëntGoogle Gemini
google logogoogleGemini 3.13 maart 2026
Context
1.0Mtokens
Max output
66Ktokens
Invoerprijs
$0.25/ 1M
Uitvoerprijs
$1.50/ 1M
Modaliteit:TextImageAudioVideo
Mogelijkheden:VisieToolsStreaming
Benchmarks
GPQA
86.9%
GPQA: Wetenschappelijke vragen op graduate-niveau. Een rigoureuze benchmark met 448 vragen over biologie, fysica en chemie. PhD-experts behalen slechts 65-74% nauwkeurigheid. Gemini 3.1 Flash-Lite scoorde 86.9% op deze benchmark.
HLE
16%
HLE: Expert-niveau redeneren. Test het vermogen van een model om expert-niveau redeneren te demonstreren in gespecialiseerde domeinen. Gemini 3.1 Flash-Lite scoorde 16% op deze benchmark.
MMLU
88.9%
MMLU: Massale multitask taalbegrip. Een uitgebreide benchmark met 16.000 vragen over 57 academische vakken. Gemini 3.1 Flash-Lite scoorde 88.9% op deze benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Professionele editie. Een verbeterde versie van MMLU met 12.032 vragen en een moeilijker 10-optie formaat. Gemini 3.1 Flash-Lite scoorde 80% op deze benchmark.
SimpleQA
43.3%
SimpleQA: Feitelijke nauwkeurigheidsbenchmark. Test het vermogen van een model om accurate, feitelijke antwoorden te geven. Gemini 3.1 Flash-Lite scoorde 43.3% op deze benchmark.
IFEval
85%
IFEval: Instructie-opvolging evaluatie. Meet hoe goed een model specifieke instructies en beperkingen volgt. Gemini 3.1 Flash-Lite scoorde 85% op deze benchmark.
AIME 2025
25%
AIME 2025: Amerikaanse uitnodigingswiskunde-examen. Wiskundeproblemen op wedstrijdniveau van het prestigieuze AIME-examen. Gemini 3.1 Flash-Lite scoorde 25% op deze benchmark.
MATH
78%
MATH: Wiskundig probleemoplossen. Een uitgebreide wiskunde-benchmark die probleemoplossen test in algebra, meetkunde, calculus. Gemini 3.1 Flash-Lite scoorde 78% op deze benchmark.
GSM8k
95%
GSM8k: Basisschool wiskunde 8K. 8.500 wiskundige woordproblemen op basisschoolniveau. Gemini 3.1 Flash-Lite scoorde 95% op deze benchmark.
MGSM
92%
MGSM: Meertalige basisschool wiskunde. De GSM8k-benchmark vertaald naar 10 talen. Gemini 3.1 Flash-Lite scoorde 92% op deze benchmark.
MathVista
75%
MathVista: Wiskundig visueel redeneren. Test het vermogen om wiskundeproblemen met visuele elementen op te lossen. Gemini 3.1 Flash-Lite scoorde 75% op deze benchmark.
SWE-Bench
35%
SWE-Bench: Software engineering benchmark. AI-modellen proberen echte GitHub-issues op te lossen in Python-projecten. Gemini 3.1 Flash-Lite scoorde 35% op deze benchmark.
HumanEval
88%
HumanEval: Python programmeerproblemen. 164 programmeerproblemen waarbij modellen correcte Python-functie-implementaties moeten genereren. Gemini 3.1 Flash-Lite scoorde 88% op deze benchmark.
LiveCodeBench
72%
LiveCodeBench: Live codeerbenchmark. Test codeervaardigheden op continu bijgewerkte, real-world programmeeruitdagingen. Gemini 3.1 Flash-Lite scoorde 72% op deze benchmark.
MMMU
76.8%
MMMU: Multimodaal begrip. Multimodaal begripsbenchmark over 30 universitaire vakken. Gemini 3.1 Flash-Lite scoorde 76.8% op deze benchmark.
MMMU Pro
76.8%
MMMU Pro: MMMU Professionele editie. Verbeterde versie van MMMU met uitdagendere vragen. Gemini 3.1 Flash-Lite scoorde 76.8% op deze benchmark.
ChartQA
91%
ChartQA: Grafiek vraag-antwoord. Test het vermogen om informatie uit grafieken en diagrammen te begrijpen en te analyseren. Gemini 3.1 Flash-Lite scoorde 91% op deze benchmark.
DocVQA
92%
DocVQA: Document visueel vraag-antwoord. Test het vermogen om informatie uit documentafbeeldingen te extraheren. Gemini 3.1 Flash-Lite scoorde 92% op deze benchmark.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI-taken. Test het vermogen om command-line operaties uit te voeren. Gemini 3.1 Flash-Lite scoorde 55% op deze benchmark.
ARC-AGI
12%
ARC-AGI: Abstractie en redeneren. Test fluide intelligentie door nieuwe patroonherkennigspuzzels. Gemini 3.1 Flash-Lite scoorde 12% op deze benchmark.

Over Gemini 3.1 Flash-Lite

Leer over de mogelijkheden van Gemini 3.1 Flash-Lite, functies en hoe het je kan helpen betere resultaten te behalen.

Gemini 3.1 Flash-Lite is ontwikkeld voor AI-applicaties met een hoog volume, waarbij verwerkingssnelheid de belangrijkste technische vereiste is. In tegenstelling tot grotere Pro-modellen, gebruikt Flash-Lite een gestroomlijnde architectuur die prioriteit geeft aan throughput, met snelheden tot 363 tokens per seconde. Het dient als een gespecialiseerde tool voor ontwikkelaars die real-time voice agents, geautomatiseerde content moderatiesystemen en grootschalige data-extractiepijplijnen bouwen die kosteneffectief moeten blijven bij hoge verkeersbelasting.

Ondanks de 'lite'-aanduiding behoudt het model een 1 miljoen token context window. Het kan in één verzoek ruwe audiobestanden, video's van een uur en honderden pagina's aan PDF's verwerken. Door Thinking Levels te introduceren, kunnen gebruikers kiezen tussen vrijwel onmiddellijke antwoorden voor eenvoudige taken en een diepere reasoning-fase voor complexe logica. Dit biedt meerdere prestatieprofielen binnen één API-endpoint om kosten en nauwkeurigheid in balans te houden.

Het model is native multimodal, wat de noodzaak voor externe tools elimineert om audio te transcriberen of afbeeldingen te beschrijven voordat ze worden verwerkt. Deze native mogelijkheid verbetert de prestaties bij visuele taken zoals het beantwoorden van vragen over documenten en het analyseren van grafieken. Ontwikkelaars kunnen de thinking_level parameter gebruiken om de interne reasoning-tijd aan te passen, waardoor de inzet van het model effectief wordt geschaald op basis van de specifieke complexiteit van elk verzoek.

Gemini 3.1 Flash-Lite

Gebruikscases voor Gemini 3.1 Flash-Lite

Ontdek de verschillende manieren waarop je Gemini 3.1 Flash-Lite kunt gebruiken voor geweldige resultaten.

High-Volume Vertaling

Het real-time verwerken van duizenden meertalige chatberichten of supporttickets met sub-seconde latency.

Intelligente Model Routing

Dient als snelle classifier om te bepalen of inkomende vragen moeten worden geëscaleerd naar duurdere modellen.

Multimodal Content Moderation

Het scannen van grote batches door gebruikers gegenereerde afbeeldingen en video's op veiligheid tegen lage kosten.

Real-Time UI Prototyping

Het genereren van functionele React- of Tailwind-componenten op basis van handgetekende wireframes of verbale beschrijvingen.

Long-Document Summarization

Het samenvatten van enorme juridische archieven of technische handleidingen zonder de context te verliezen binnen de 1M token window.

Live Audio Transcriptie

Het omzetten van uren aan vergaderingen of hoorcollegeopnames naar gestructureerde samenvattingen en actiepunten in één keer.

Sterke punten

Beperkingen

Razendsnelle Prestaties: Met 363 tokens per seconde is dit een van de snelste modellen in de industrie voor real-time responsiviteit.
Lage Feitelijke Correctheid: Een SimpleQA-score van 43,3% wijst op een hoog risico op hallucinaties bij algemene kennis zonder grounding.
Geavanceerde Reasoning: Met een score van 86,9% op GPQA Diamond biedt het wetenschappelijke logica op PhD-niveau in een lichtgewicht tier.
Prijsstijging: Het is aanzienlijk duurder dan zijn voorganger, de Gemini 2.5 Flash-Lite.
Dynamische Kostenbeheersing: De Thinking Levels-parameter maakt nauwkeurige controle over de compute-uitgaven per verzoek mogelijk.
Hogere Latency bij High-Thinking: Het gebruik van het hoge denkniveau voegt ongeveer 7 tot 10 seconden pre-computation toe voordat de generatie begint.
Unified Multimodality: Native verwerking van audio, video en PDF's elimineert de noodzaak voor complexe multi-model orchestratie-pipelines.
Safety Refusals: Interne tests tonen een daling van 21,7% in de consistentie van image-to-text veiligheid tijdens red-teaming oefeningen.

API snelstart

google/gemini-3.1-flash-lite-preview

Bekijk documentatie
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Installeer de SDK en begin binnen enkele minuten met API-calls.

Wat mensen zeggen over Gemini 3.1 Flash-Lite

Bekijk wat de community denkt over Gemini 3.1 Flash-Lite

De codeercapaciteit van 3.1 Flash-Lite is verrassend goed voor front-end ontwikkeling; het codeerde een 360-graden viewer perfect.
WorldofAI
youtube
Gemini 3.1 Flash-Lite is het model om altijd actieve, multimodale AI Agents te bouwen. Het leest, verbindt en consolideert alles.
Shubham Saboo
twitter
De prijs is een enorme schok. Een sprong van 3,75x op output tokens gaat pijn doen als je een krap cloudbudget hebt.
Binary Verse AI
youtube
Het verschuift de last van complexiteit van de architectuur van je engineeringteam naar de infrastructuur van Google.
Julian Goldie
youtube
Nog een prijsverlaging voor intelligentie. Hoge snelheid, lage kosten, hoge intelligentie. Een geweldig model voor agentic routing.
ctgtplb
twitter
De 1M context is hier nog steeds de killer feature. Ik kan hele mappen met repositories dumpen en het werkt gewoon met een TTFT van minder dan een seconde.
DevFlow_26
reddit

Video's over Gemini 3.1 Flash-Lite

Bekijk tutorials, reviews en discussies over Gemini 3.1 Flash-Lite

Het lijkt erop dat ze op de een of andere manier een enorme hoeveelheid intelligentie in dit model hebben weten te proppen.

Ik zou het gebruiken voor workloads met een hoge throughput die zeer goed gedefinieerd zijn.

De front-end mogelijkheid van de Flash-Lite is zelfs beter dan de meeste modellen waar ik ooit mee heb gewerkt.

Het creëerde letterlijk een volledig functionele viewer in één keer.

Dit model is ideaal voor degenen die snelheid nodig hebben zonder alle logica op te offeren.

Dit model is wat we een werkpaard noemen... specifiek ontworpen voor taken met een hoge throughput.

Als je dit op een minimaal denkbudget draait, werkt het in feite als een model zonder reasoning en is het extreem snel.

Het deed opmerkelijk goed werk aan de website die we als output hebben.

De verhouding tussen snelheid en kosten is de echte reden waarom je je productie-apps hiernaartoe zou verplaatsen.

Het verwerkt multimodale input native, wat een enorm voordeel is ten opzichte van concurrenten.

Bijna 87% scoren op GPQA Diamond met een model dat als 'lite' bestempeld is, ontwricht ons hele categorisatiesysteem.

Gebruik dit model niet als een feitelijk orakel... je moet de feiten zelf aanleveren.

Met 3.1 Flash-Lite vermijd je het aansturen van drie andere microservices... die eenvoud is echt geld waard.

De 45 procent toename in outputsnelheid voel je direct in de streaming response.

Je krijgt 1M context voor een habbekrats, wat in productie nog steeds als magie voelt.

Meer dan alleen prompts

Supercharge je workflow met AI-automatisering

Automatio combineert de kracht van AI-agents, webautomatisering en slimme integraties om je te helpen meer te bereiken in minder tijd.

AI-agents
Webautomatisering
Slimme workflows

Pro-tips voor Gemini 3.1 Flash-Lite

Experttips om je te helpen het maximale uit Gemini 3.1 Flash-Lite te halen en betere resultaten te behalen.

Stel Thinking Levels in

Gebruik minimaal denken voor classificatie om kosten te verlagen, maar schakel over naar hoog voor complexe codeertaken.

Schakel Grounding in

Gebruik altijd Google Search grounding voor taken die feitelijke kennis vereisen, aangezien de basisnauwkeurigheid lager is.

Upload Raw Files

Vermijd het vooraf verwerken van audio of video naar tekst en upload in plaats daarvan raw files om gebruik te maken van native multimodality.

Gebruik System Instructions

Dwing strikt JSON-schema's af met de system_instruction parameter om output correctie-tokens te minimaliseren.

Testimonials

Wat onze gebruikers zeggen

Sluit je aan bij duizenden tevreden gebruikers die hun workflow hebben getransformeerd

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Gerelateerd AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Veelgestelde vragen over Gemini 3.1 Flash-Lite

Vind antwoorden op veelvoorkomende vragen over Gemini 3.1 Flash-Lite