Hvad koster Gemini 3.1 Flash-Lite?

Det koster $0,25 pr. 1 million input tokens og $1,50 pr. 1 million output tokens.

Findes der et gratis niveau til udviklere?

Ja, den er tilgængelig gratis i preview via Google AI Studio til test og eksperimenter.

Hvad er den maksimale context window?

Modellen understøtter op til 1.048.576 tokens, hvilket giver mulighed for at indlæse cirka 700.000 ord.

Kan jeg processere videofiler med denne model?

Ja, den kan processere videofiler på op til 1 times varighed eller 1,5 GB i størrelse.

Hvad er Thinking Levels?

Denne parameter giver dig mulighed for at kontrollere den interne reasoning-tid, modellen bruger på et problem, før den genererer output.

Hvordan sammenlignes den med Claude 4.5 Haiku?

Gemini 3.1 Flash-Lite er cirka 4 gange billigere på output tokens, samtidig med at den overgår Haiku på GPQA reasoning-benchmark.

Understøtter den function calling?

Ja, den har fuld understøttelse af tool use og function calling til opbygning af autonome agentic workflows.

Hvad er modellens outputhastighed?

Modellen opnår hastigheder på 363 tokens pr. sekund, hvilket gør den ideel til latency-følsomme applikationer.

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite er Googles hurtigste og mest omkostningseffektive model. Har 1M context, native multimodality og 363 tokens/sek. hastighed til skalering.

MultimodalHøj HastighedOmkostningseffektivGoogle Gemini

googleGemini 3.13. marts 2026

Kontekst

1.0Mtokens

Maks output

66Ktokens

Input-pris

$0.25/ 1M

Output-pris

$1.50/ 1M

Modalitet:TextImageAudioVideo

Funktioner:VisionVærktøjerStreaming

Benchmarks

GPQA

86.9%

HLE

16%

MMLU

88.9%

MMLU Pro

80%

SimpleQA

43.3%

IFEval

85%

AIME 2025

25%

MATH

78%

GSM8k

95%

MGSM

92%

MathVista

75%

SWE-Bench

35%

HumanEval

88%

LiveCodeBench

72%

MMMU

76.8%

MMMU Pro

76.8%

ChartQA

91%

DocVQA

92%

Terminal-Bench

55%

ARC-AGI

12%

Se API-dokumentation

Om Gemini 3.1 Flash-Lite

Lær om Gemini 3.1 Flash-Lites muligheder, funktioner og hvordan den kan hjælpe dig med at opnå bedre resultater.

Gemini 3.1 Flash-Lite er bygget til AI-applikationer med høj volumen, hvor processeringshastighed er det primære tekniske krav. I modsætning til større Pro-modeller bruger Flash-Lite en strømlinet arkitektur, der prioriterer throughput og når 363 tokens pr. sekund. Den fungerer som et specialiseret værktøj for udviklere, der bygger realtids-stemmeagenter, automatiserede systemer til moderering af indhold og pipelines til dataudtræk i stor skala, som skal forblive omkostningseffektive under tung trafik.

Trods sin 'lite'-betegnelse bevarer modellen et 1 million token context window. Den kan indlæse rå lydfiler, time-lange videoer og hundredvis af sider med PDF'er i en enkelt forespørgsel. Ved at introducere Thinking Levels giver Google brugerne mulighed for at vælge mellem nærmest øjeblikkelige svar til simple opgaver og en dybere reasoning-fase til kompleks logik. Dette giver flere performance-profiler inden for et enkelt API-endpoint for at balancere omkostninger og præcision.

Modellen er native multimodal, hvilket eliminerer behovet for eksterne værktøjer til at transskribere lyd eller beskrive billeder før processering. Denne native funktion forbedrer performance på visuelle opgaver som spørgsmål-svar i dokumenter og analyse af grafer. Udviklere kan bruge parameteren thinking_level til at justere den interne reasoning-tid og effektivt skalere modellens indsats baseret på den specifikke kompleksitet i hver forespørgsel.

Anvendelser for Gemini 3.1 Flash-Lite

Opdag de forskellige måder, du kan bruge Gemini 3.1 Flash-Lite til at opnå gode resultater.

High-Volume Oversættelse

Processering af tusindvis af flersprogede chatbeskeder eller support-tickets i realtid med sub-sekund latency.

Intelligent Model Routing

Fungerer som en hurtig klassifikator til at afgøre, om indgående forespørgsler skal eskaleres til dyrere modeller.

Multimodal Content Moderation

Scanning af store mængder brugergenererede billeder og videoer for overholdelse af sikkerhedsregler til lave omkostninger.

Realtids UI Prototyping

Generering af funktionelle React- eller Tailwind-komponenter fra håndtegnede wireframes eller mundtlige beskrivelser.

Summarisering af lange dokumenter

Kondensering af massive juridiske arkiver eller tekniske manualer uden at miste kontekst på tværs af 1M token vinduet.

Live lydtransskribering

Konvertering af timers møder eller forelæsningsoptagelser til strukturerede resuméer og action-items i én arbejdsgang.

Styrker

Begrænsninger

Ekstrem performance: Med 363 tokens pr. sekund er det en af de hurtigste modeller i industrien til realtids-respons.

Lav faktuel hukommelse: En SimpleQA-score på 43,3% indikerer en høj risiko for hallucinationer ved generel viden uden grounding.

Avanceret reasoning: Med 86,9% på GPQA Diamond leverer den videnskabelig logik på PhD-niveau i et lightweight-format.

Prisstigning: Den er væsentligt dyrere end den Gemini 2.5 Flash-Lite forgænger, som den erstatter i sortimentet.

Dynamisk omkostningsstyring: Thinking Levels-parameteren giver mulighed for granulær kontrol over compute-forbruget pr. forespørgsel.

Højere latency ved High-Thinking: Brug af high thinking level tilføjer cirka 7 til 10 sekunders pre-computation, før genereringen starter.

Unified Multimodality: Native indlæsning af lyd, video og PDF'er fjerner behovet for komplekse pipelines med flere modeller.

Sikkerhedsrefusal: Interne test viser et fald på 21,7% i konsistens ved billed-til-tekst sikkerhed under red-teaming øvelser.

API hurtig start

google/gemini-3.1-flash-lite-preview

Se dokumentation

google SDK

import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Installér SDK'et og begynd at foretage API-kald på få minutter.

Hvad folk siger om Gemini 3.1 Flash-Lite

Se hvad fællesskabet mener om Gemini 3.1 Flash-Lite

“Kodningskapaciteten i 3.1 Flash-Lite er overraskende god til front-end udvikling; den kodede en 360-graders viewer perfekt.”

— WorldofAI

youtube

“Gemini 3.1 Flash-Lite er modellen til at bygge altid-aktive multimodale AI Agents. Den læser, forbinder og konsoliderer alt.”

— Shubham Saboo

twitter

“Prissætningen er et kæmpe chok. Et spring på 3,75x på output tokens kommer til at kunne mærkes, hvis du er på et stramt cloud-budget.”

— Binary Verse AI

youtube

“Den flytter kompleksitetsbyrden fra ingeniørteamets arkitektur direkte over på Googles infrastruktur.”

— Julian Goldie

youtube

“Endnu et prisfald for intelligens. Høj hastighed, lave omkostninger, høj intelligens. En fantastisk model til agentic routing.”

— ctgtplb

twitter

“1M context er stadig den vigtigste feature her. Jeg kan dumpe hele repo-mapper, og det virker bare med sub-sekund TTFT.”

— DevFlow_26

Videoer om Gemini 3.1 Flash-Lite

Se vejledninger, anmeldelser og diskussioner om Gemini 3.1 Flash-Lite

“Det virker som om, de på en eller anden måde har formået at presse en masse intelligens ind i denne model.”

“Jeg ville bruge den til workloads med høj gennemstrømning, som er meget veldefinerede.”

“Front-end evnerne i Flash-Lite er endda bedre end de fleste modeller, jeg faktisk har arbejdet med.”

“Den skabte bogstaveligt talt en fuldt funktionel fremviser i ét forsøg.”

“Denne model er ideel for dem, der har brug for hastighed uden at ofre al logikken.”

“Denne model er hvad vi vil kalde en arbejdshest... specifikt designet til opgaver med høj gennemstrømning.”

“Hvis du kører den på et minimalt thinking-budget, fungerer den stort set som en non-reasoning model og er ekstremt hurtig.”

“Den gjorde et bemærkelsesværdigt godt stykke arbejde med den hjemmeside, vi har som output.”

“Hastighed-til-omkostnings forholdet er den virkelige grund til, at du ville flytte dine produktions-apps hertil.”

“Den håndterer multimodale inputs natively, hvilket er en kæmpe fordel over konkurrenterne.”

“At ramme næsten 87% på GPQA Diamond med en model mærket som 'lite' forstyrrer hele vores kategoriseringssystem.”

“Brug ikke denne model som et faktuelt orakel... du er nødt til at levere fakta til den.”

“Med 3.1 Flash-Lite undgår du at affyre tre andre mikrotjenester... den enkelhed er penge værd.”

“Stigningen på 45 procent i output-hastighed mærkes øjeblikkeligt i streaming-responsen.”

“Du får 1M context for småpenge, hvilket stadig føles som magi i produktion.”

Mere end bare prompts

Supercharg din arbejdsgang med AI-automatisering

Automatio kombinerer kraften fra AI-agenter, webautomatisering og smarte integrationer for at hjælpe dig med at udrette mere på kortere tid.

AI-agenter

Webautomatisering

Smarte arbejdsgange

Kom i gang gratis

Pro-tips til Gemini 3.1 Flash-Lite

Eksperttips til at hjælpe dig med at få mest muligt ud af Gemini 3.1 Flash-Lite og opnå bedre resultater.

Indstil Thinking Levels

Brug minimal thinking til klassificering for at reducere omkostninger, men skift til high ved komplekse kodningsopgaver.

Aktiver Grounding

Brug altid Google Search grounding til opgaver, der kræver faktuel viden, da den grundlæggende faktuelle præcision er lavere.

Upload råfiler

Undgå at pre-processere lyd eller video til tekst; upload i stedet råfiler for at udnytte native multimodality.

Brug system_instruction

Gennemtving JSON-schemas ved hjælp af system_instruction parameteren for at minimere tokens til output-rettelse.

Anmeldelser

Hvad vores brugere siger

Slut dig til tusindvis af tilfredse brugere, der har transformeret deres arbejdsgang

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relateret AI Models

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context

$1.00/$3.20/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context

$1.75/$14.00/1M

Ofte stillede spørgsmål om Gemini 3.1 Flash-Lite

Find svar på almindelige spørgsmål om Gemini 3.1 Flash-Lite