google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite er Googles hurtigste og mest omkostningseffektive model. Har 1M context, native multimodal funktionalitet og 363 tokens/sek hastighed til...

MultimodalHøj hastighedOmkostningseffektivGoogle Gemini
google logogoogleGemini 3.12026-03-03
Kontekst
1.0Mtokens
Maks output
66Ktokens
Input-pris
$0.25/ 1M
Output-pris
$1.50/ 1M
Modalitet:TextImageAudioVideo
Funktioner:VisionVærktøjerStreaming
Benchmarks
GPQA
86.9%
GPQA: Spørgsmål og svar på kandidatniveau. En streng benchmark med 448 multiple choice-spørgsmål inden for biologi, fysik og kemi skabt af domæneeksperter. PhD-eksperter opnår kun 65-74% nøjagtighed, mens ikke-eksperter scorer kun 34% selv med ubegrænset webadgang (derfor 'Google-proof'). Gemini 3.1 Flash-Lite scorede 86.9% på denne benchmark.
HLE
16%
HLE: Ekspertniveau-ræsonnering. Tester en models evne til at demonstrere ekspertniveau-ræsonnering på tværs af specialiserede domæner. Evaluerer dyb forståelse af komplekse emner, der kræver professionel viden. Gemini 3.1 Flash-Lite scorede 16% på denne benchmark.
MMLU
88.9%
MMLU: Massiv flerfaglig sprogforståelse. En omfattende benchmark med 16.000 multiple choice-spørgsmål på tværs af 57 akademiske fag, herunder matematik, filosofi, jura og medicin. Tester bred viden og ræsonneringsevner. Gemini 3.1 Flash-Lite scorede 88.9% på denne benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Professionel udgave. En forbedret version af MMLU med 12.032 spørgsmål i et sværere format med 10 svarmuligheder. Dækker matematik, fysik, kemi, jura, ingeniørvidenskab, økonomi, sundhed, psykologi, business, biologi, filosofi og datalogi. Gemini 3.1 Flash-Lite scorede 80% på denne benchmark.
SimpleQA
43.3%
SimpleQA: Faktuel nøjagtighedsbenchmark. Tester en models evne til at give nøjagtige, faktuelle svar på ligetil spørgsmål. Måler pålidelighed og reducerer hallucinationer i vidensindhentningstasks. Gemini 3.1 Flash-Lite scorede 43.3% på denne benchmark.
IFEval
85%
IFEval: Instruktionsfølgningsevaluering. Måler, hvor godt en model følger specifikke instruktioner og begrænsninger. Tester evnen til at overholde formateringsregler, længdegrænser og andre eksplicitte krav. Gemini 3.1 Flash-Lite scorede 85% på denne benchmark.
AIME 2025
25%
AIME 2025: American Invitational Math Exam. Konkurrence-niveau matematikopgaver fra den prestigefyldte AIME-eksamen designet til talentfulde gymnasieelever. Tester avanceret matematisk problemløsning, der kræver abstrakt tænkning, ikke kun mønstergenkendelse. Gemini 3.1 Flash-Lite scorede 25% på denne benchmark.
MATH
78%
MATH: Matematisk problemløsning. En omfattende matematikbenchmark, der tester problemløsning inden for algebra, geometri, calculus og andre matematiske domæner. Kræver flertrinssværsonnering og formel matematisk viden. Gemini 3.1 Flash-Lite scorede 78% på denne benchmark.
GSM8k
95%
GSM8k: Folkeskole matematik 8K. 8.500 folkeskole-niveau matematiske tekstopgaver, der kræver flertrinssræsonnering. Tester grundlæggende aritmetik og logisk tænkning gennem virkelige scenarier som shopping eller tidsberegninger. Gemini 3.1 Flash-Lite scorede 95% på denne benchmark.
MGSM
92%
MGSM: Flersproget folkeskolematematik. GSM8k-benchmarken oversat til 10 sprog, herunder spansk, fransk, tysk, russisk, kinesisk og japansk. Tester matematisk ræsonnering på tværs af forskellige sprog. Gemini 3.1 Flash-Lite scorede 92% på denne benchmark.
MathVista
75%
MathVista: Matematisk visuel ræsonnering. Tester evnen til at løse matematikopgaver, der involverer visuelle elementer som diagrammer, grafer, geometriske figurer og videnskabelige illustrationer. Kombinerer visuel forståelse med matematisk ræsonnering. Gemini 3.1 Flash-Lite scorede 75% på denne benchmark.
SWE-Bench
35%
SWE-Bench: Softwareingeniør-benchmark. AI-modeller forsøger at løse rigtige GitHub-issues i open source Python-projekter med menneskelig verifikation. Tester praktiske softwareingeniørfærdigheder på produktionskodebaser. Topmodeller gik fra 4,4% i 2023 til over 70% i 2024. Gemini 3.1 Flash-Lite scorede 35% på denne benchmark.
HumanEval
88%
HumanEval: Python-programmeringsopgaver. 164 håndskrevne programmeringsopgaver, hvor modeller skal generere korrekte Python-funktionsimplementeringer. Hver løsning verificeres mod unit tests. Topmodeller opnår nu 90%+ nøjagtighed. Gemini 3.1 Flash-Lite scorede 88% på denne benchmark.
LiveCodeBench
72%
LiveCodeBench: Live kodningsbenchmark. Tester kodningsevner på løbende opdaterede, virkelige programmeringsudfordringer. I modsætning til statiske benchmarks bruger den friske problemer for at forhindre dataforurening og måle ægte kodningsevner. Gemini 3.1 Flash-Lite scorede 72% på denne benchmark.
MMMU
76.8%
MMMU: Multimodal forståelse. Massiv multi-disciplin multimodal forståelsesbenchmark, der tester vision-sprogmodeller på universitetsniveau-problemer på tværs af 30 fag, der kræver både billedforståelse og ekspertviden. Gemini 3.1 Flash-Lite scorede 76.8% på denne benchmark.
MMMU Pro
76.8%
MMMU Pro: MMMU Professionel udgave. Forbedret version af MMMU med mere udfordrende spørgsmål og strengere evaluering. Tester avanceret multimodal ræsonnering på professionelt og ekspertniveau. Gemini 3.1 Flash-Lite scorede 76.8% på denne benchmark.
ChartQA
91%
ChartQA: Diagram-spørgsmål og svar. Tester evnen til at forstå og ræsonnere om information præsenteret i diagrammer og grafer. Kræver udtrækning af data, sammenligning af værdier og udførelse af beregninger fra visuelle datarepræsentationer. Gemini 3.1 Flash-Lite scorede 91% på denne benchmark.
DocVQA
92%
DocVQA: Dokument visuel Q&A. Document Visual Question Answering benchmark, der tester evnen til at udtrække og ræsonnere om information fra dokumentbilleder, herunder formularer, rapporter og scannet tekst. Gemini 3.1 Flash-Lite scorede 92% på denne benchmark.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI-opgaver. Tester evnen til at udføre kommandolinjeopgaver, skrive shell-scripts og navigere i terminalmiljøer. Måler praktiske systemadministrations- og udviklingsworkflow-færdigheder. Gemini 3.1 Flash-Lite scorede 55% på denne benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion og ræsonnering. Abstraction and Reasoning Corpus for AGI - tester flydende intelligens gennem nye mønstergenkendelsespuslespil. Hver opgave kræver opdagelse af den underliggende regel fra eksempler, der måler generel ræsonneringsevne snarere end memorering. Gemini 3.1 Flash-Lite scorede 12% på denne benchmark.

Om Gemini 3.1 Flash-Lite

Lær om Gemini 3.1 Flash-Lites muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Optimeret til high-speed intelligence

Gemini 3.1 Flash-Lite er Googles højhastigheds-arbejdshest, designet specifikt til højvolumen-workloads hos udviklere, hvor lav latency og omkostningseffektivitet er altafgørende. Den blev udgivet den 3. marts 2026 og fungerer som en optimeret indgang i Gemini 3.1-serien, hvor den leverer 2,5x hurtigere tid-til-første-token og en 45% stigning i output-hastighed sammenlignet med tidligere generationer. Den er i stand til at streame over 360 tokens i sekundet, hvilket gør den ideel til realtidsapplikationer og databehandling i massiv skala.

Nativt multimodal med 1M context

Model'en er født multimodal og understøtter tekst, billeder, lyd, video og PDF-inputs inden for et massivt 1 million-token context window. Dette giver udviklere mulighed for at behandle enorme datasæt, såsom timelange videoer eller massive juridiske arkiver, uden behov for komplekse RAG-pipelines. Dens vision-evner er særligt stærke og udmærker sig ved visuel spørgsmålsbesvarelse i dokumenter og analyse af diagrammer.

Granulær kontrol for udviklere

En iøjnefaldende funktion er introduktionen af 'Thinking Levels' (Minimal, Low, Medium, High). Denne parameter giver udviklere mulighed for granulært at skrue op eller ned for model'ens reasoning-dybde baseret på opgavens kompleksitet. Denne fleksibilitet sikrer, at brugerne ikke betaler for meget for simple opgaver som klassificering, mens de stadig har adgang til forbedret logik til mere strukturerede outputs som UI-generering og dataekstraktion.

Gemini 3.1 Flash-Lite

Anvendelser for Gemini 3.1 Flash-Lite

Opdag de forskellige måder, du kan bruge Gemini 3.1 Flash-Lite til at opnå gode resultater.

Højvolumen realtidsoversættelse

Behandl problemfrit tusindvis af chatbeskeder eller supporthenvendelser på tværs af mere end 100 sprog med minimal latency og høj omkostningseffektivitet.

Multimodal indholdsmoderering

Brug indbygget video- og billedbehandling til at markere upassende indhold i sociale medier eller videoplatforme med høj throughput.

Automatiseret struktureret dataekstraktion

Udtræk komplekse JSON-skemaer fra massive PDF-arkiver eller juridiske dokumenter i lang form ved hjælp af 1M token context window.

Agil front-end prototyping

Generer hurtigt funktionelle React/Tailwind UI-komponenter og landingssider med over 360 tokens i sekundet til iterativt design.

Agentic opgaveorkestrering

Driv 'altid tændte' AI-agenter, der udfører planlægning i flere trin, web-research og værktøjsbrug uden at sprænge token-budgettet.

Customer service bots med lav latency

Implementer samtalebaserede assistenter, der giver øjeblikkelige svar med justerbar reasoning til både simple og komplekse forespørgsler.

Styrker

Begrænsninger

Uovertruffen throughput: Streamer med 363 tokens i sekundet, hvilket gør den 45% hurtigere end 2.5 Flash til agentic realtidsapplikationer.
Loft for reasoning: Betydeligt lavere performance på abstrakt logik (12% ARC-AGI v2) sammenlignet med flagship models, der er specifikke til reasoning.
Aggressiv prissætning: Til $0,25/M input tokens koster den cirka 1/8 af Gemini 3.1 Pro, mens den opretholder en høj generel intelligens.
Mangler i matematiske olympiader: Har udfordringer med matematik på eliteniveau og scorer kun 25% på AIME 2025 sammenlignet med 90%+ for frontier models.
Native multimodal mestring: Enestående performance på vision (92% DocVQA) og video (84,8% VideoMMMU) uden behov for separate encodere.
Kalibrering af faktualitet: Oplever højere rater af hallucinationer i faktuelle opgaver (43,3% SimpleQA) end Pro-tier eller frontier alternativer.
Granulær kontrol over beregning: Den første model, der tilbyder præcis kontrol over reasoning-dybden, hvilket muliggør optimering af forholdet mellem pris og performance.
Instruction Drift: Kan lejlighedsvis overse mindre formateringskrav i ekstremt lange og komplekse instruktioner med mange trin.

API hurtig start

google/gemini-3.1-flash-lite-preview

Se dokumentation
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Gemini 3.1 Flash-Lite

Se hvad fællesskabet mener om Gemini 3.1 Flash-Lite

Flash lite er afsindigt hurtig og effektiv til specifikke workflows som opsummering... dette er et kærkomment hastighedshop.
reddit bruger
reddit
Gemini 3.1 Flash-Lite er det stille nådestød til API-udbydere i mellemlaget... omkostningskurverne akkumuleres hurtigt.
@9chaku
twitter
3.1 Flash-Lite outperformer 2.5 Flash på størstedelen af benchmarks, samtidig med at den er en lille fartdjævel!
Tulsee Doshi
twitter
For udviklere, der kører AI agents i stor skala, er dette den model, der gør 'altid tændt' rentabelt. 363 t/s er vildt.
@prince_twets
twitter
Prissætningen er vanvittig. $0,25 for 1M input gør det billigere bare at smide hele repos ind i context end at bygge RAG.
reddit bruger
reddit
Hastigheden til første token er stort set øjeblikkelig. Det er første gang, en model har føltes hurtigere end min egen skrivning.
DevGuru
hackernews

Videoer om Gemini 3.1 Flash-Lite

Se vejledninger, anmeldelser og diskussioner om Gemini 3.1 Flash-Lite

Prisen lander på 25 cents pr. 1 million input tokens og $1,50 pr. 1 million output tokens... stadig ret konkurrencedygtig hastigheden taget i betragtning.

Jeg synes, denne model er en undervurderet kodnings-model med fokus på front-end-udvikling, og den leverer ekstremt hurtige tokens.

Dette er virkelig målrettet udvikleren, der har brug for skalering uden den latency, man ser hos en Pro model.

Multimodality her er ikke bare et markedsføringstrick; den håndterer komplekse PDF'er med lethed.

Google rykker virkelig grænserne for, hvad en 'lite' model faktisk kan præstere i 2026.

Denne gang er det Gemini 3.1 Flash Lite, som er tænkt som en hurtigere og billigere version af Flash model'en.

Der er brug for disse models, fordi man ønsker at bruge dem i applikationer, hvor der kræves høj throughput.

Det 1 million context window er standard nu for Gemini, men at se det på en model, der er så hurtig, er imponerende.

Den vinder ikke en matematik-olympiade, men den er perfekt til ekstraktion og opsummering.

API-latency er betydeligt lavere end GPT-4o-mini i mine tidlige tests.

Denne nye AI model fra Google er 45% hurtigere... og den kan meget vel ændre, hvordan vi alle bygger med AI.

Low thinking mode til de hurtige, nemme ting. High thinking mode til det tunge arbejde... den fleksibilitet er det, der adskiller et legetøj fra et rigtigt værktøj.

Til SEO-opgaver bliver dette min foretrukne model på grund af prispunktet.

Det faktum at den kan se en video og forstå konteksten næsten øjeblikkeligt er en game changer for indholdsskabere.

Google gør det meget svært at retfærdiggøre brugen af andre udbydere til højvolumen-opgaver lige nu.

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter
Webautomatisering
Smarte arbejdsgange

Pro-tips til Gemini 3.1 Flash-Lite

Eksperttips til at hjælpe dig med at få mest muligt ud af Gemini 3.1 Flash-Lite og opnå bedre resultater.

Udnyt Thinking Levels

Indstil thinking_level til 'minimal' for simple opgaver som klassificering for at maksimere hastigheden, men brug 'high' til struktureret kodegenerering.

Native videoanalyse

Send rå videofiler direkte ind i API'en for hurtigere indsigt i visuelle hændelser og lydspor samtidigt, og spring transskriptionstrin over.

Context frem for RAG

For datasæt under 1M tokens kan du sende hele dokumentsættet direkte ind i context window for at eliminere fejl i hentning og omkostninger til vector-databaser.

Optimer med Batching

Brug batching API til ikke-hastende opgaver for at reducere omkostningerne yderligere, da Flash-Lite er specifikt optimeret til asynkron behandling.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Ofte stillede spørgsmål om Gemini 3.1 Flash-Lite

Find svar på almindelige spørgsmål om Gemini 3.1 Flash-Lite