google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite är Googles snabbaste och mest kostnadseffektiva modell. Inkluderar 1M context, inbyggd multimodality och 363 tokens/sek hastighet för...

MultimodalHög hastighetKostnadseffektivGoogle Gemini
google logogoogleGemini 3.13 mars 2026
Kontext
1.0Mtokens
Max utdata
66Ktokens
Inmatningspris
$0.25/ 1M
Utdatapris
$1.50/ 1M
Modalitet:TextImageAudioVideo
Kapaciteter:VisionVerktygStreaming
Benchmarks
GPQA
86.9%
GPQA: Vetenskapliga fragor pa forskarutbildningsniva. Ett rigorost benchmark med 448 fragor fran biologi, fysik och kemi. PhD-experter uppnar endast 65-74% noggrannhet. Gemini 3.1 Flash-Lite fick 86.9% pa detta benchmark.
HLE
16%
HLE: Expertniva resonemang. Testar modellens formaga att demonstrera expertniva resonemang inom specialiserade omraden. Gemini 3.1 Flash-Lite fick 16% pa detta benchmark.
MMLU
88.9%
MMLU: Massiv multitask sprakforstaelse. Ett omfattande benchmark med 16 000 fragor over 57 akademiska amnen. Gemini 3.1 Flash-Lite fick 88.9% pa detta benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Professionell utgava. En forbattrad version av MMLU med 12 032 fragor och ett svarare 10-alternativsformat. Gemini 3.1 Flash-Lite fick 80% pa detta benchmark.
SimpleQA
43.3%
SimpleQA: Benchmark for faktisk noggrannhet. Testar modellens formaga att ge korrekta, faktabaserade svar. Gemini 3.1 Flash-Lite fick 43.3% pa detta benchmark.
IFEval
85%
IFEval: Utvardering av instruktionsfoljandeformaga. Mater hur val en modell foljer specifika instruktioner och begransningar. Gemini 3.1 Flash-Lite fick 85% pa detta benchmark.
AIME 2025
25%
AIME 2025: American Invitational Mathematics Examination. Matematikproblem pa tavlingsniva fran det prestigefyllda AIME-provet. Gemini 3.1 Flash-Lite fick 25% pa detta benchmark.
MATH
78%
MATH: Matematisk problemlosning. Ett omfattande matematik-benchmark som testar problemlosning i algebra, geometri, kalkyl. Gemini 3.1 Flash-Lite fick 78% pa detta benchmark.
GSM8k
95%
GSM8k: Grundskola matematik 8K. 8 500 matematiska ordproblem pa grundskoleniva. Gemini 3.1 Flash-Lite fick 95% pa detta benchmark.
MGSM
92%
MGSM: Flersprakig grundskola matematik. GSM8k-benchmarket oversatt till 10 sprak. Gemini 3.1 Flash-Lite fick 92% pa detta benchmark.
MathVista
75%
MathVista: Matematiskt visuellt resonemang. Testar formagan att losa matematikproblem med visuella element. Gemini 3.1 Flash-Lite fick 75% pa detta benchmark.
SWE-Bench
35%
SWE-Bench: Benchmark for mjukvaruutveckling. AI-modeller forsoker losa verkliga GitHub-problem i Python-projekt. Gemini 3.1 Flash-Lite fick 35% pa detta benchmark.
HumanEval
88%
HumanEval: Python-programmeringsproblem. 164 programmeringsproblem dar modeller maste generera korrekta Python-funktionsimplementationer. Gemini 3.1 Flash-Lite fick 88% pa detta benchmark.
LiveCodeBench
72%
LiveCodeBench: Live-kodningsbenchmark. Testar kodningsformaga pa kontinuerligt uppdaterade, verkliga programmeringsutmaningar. Gemini 3.1 Flash-Lite fick 72% pa detta benchmark.
MMMU
76.8%
MMMU: Multimodal forstaelse. Multimodalt forstaelsebenchmark fran 30 universitetsanknutna amnen. Gemini 3.1 Flash-Lite fick 76.8% pa detta benchmark.
MMMU Pro
76.8%
MMMU Pro: MMMU Professionell utgava. Forbattrad version av MMMU med mer utmanande fragor. Gemini 3.1 Flash-Lite fick 76.8% pa detta benchmark.
ChartQA
91%
ChartQA: Diagram fragor och svar. Testar formagan att forsta och analysera information fran diagram och grafer. Gemini 3.1 Flash-Lite fick 91% pa detta benchmark.
DocVQA
92%
DocVQA: Visuella dokumentfragor. Testar formagan att extrahera information fran dokumentbilder. Gemini 3.1 Flash-Lite fick 92% pa detta benchmark.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI-uppgifter. Testar formagan att utfora kommandoradsoperationer. Gemini 3.1 Flash-Lite fick 55% pa detta benchmark.
ARC-AGI
12%
ARC-AGI: Abstraktion och resonemang. Testar flytande intelligens genom nya monsterigenkannigspussel. Gemini 3.1 Flash-Lite fick 12% pa detta benchmark.

Om Gemini 3.1 Flash-Lite

Lar dig om Gemini 3.1 Flash-Lites kapacitet, funktioner och hur det kan hjalpa dig uppna battre resultat.

Gemini 3.1 Flash-Lite är konstruerad för AI-applikationer i hög volym där bearbetningshastighet är det primära tekniska kravet. Till skillnad från större Pro-modeller använder Flash-Lite en strömlinjeformad arkitektur som prioriterar genomströmning och når 363 tokens per sekund. Den fungerar som ett specialverktyg för utvecklare som bygger röstagenter i realtid, automatiserade system för innehållsmoderering och storskaliga datapipelines som måste vara kostnadseffektiva under hög belastning.

Trots beteckningen "lite" behåller modellen ett context window på 1 miljon tokens. Den kan bearbeta råa ljudfiler, timslånga videor och hundratals sidor PDF-dokument i en enda förfrågan. Genom att introducera Thinking Levels låter Google användare välja mellan nästan omedelbara svar för enkla uppgifter och en djupare resonemangsfas för komplex logik. Detta ger flera prestandaprofiler inom en enda API-slutpunkt för att balansera kostnad och precision.

Modellen är inbyggt multimodal, vilket eliminerar behovet av externa verktyg för att transkribera ljud eller beskriva bilder före bearbetning. Denna inbyggda kapacitet förbättrar prestandan vid visuella uppgifter som frågor kring dokument och analys av diagram. Utvecklare kan använda parametern thinking_level för att justera den interna resonemangstiden, vilket effektivt skalar modellens ansträngning baserat på den specifika komplexiteten i varje fråga.

Gemini 3.1 Flash-Lite

Anvandningsfall for Gemini 3.1 Flash-Lite

Upptack de olika satten du kan anvanda Gemini 3.1 Flash-Lite for att uppna fantastiska resultat.

Översättning i hög volym

Bearbetning av tusentals flerspråkiga chattmeddelanden eller supportärenden i realtid med sub-sekunds-latency.

Intelligent modellrouting

Fungerar som en snabb klassificerare för att avgöra om inkommande frågor behöver eskaleras till dyrare modeller.

Multimodal innehållsmoderering

Skanning av stora mängder användargenererade bilder och videor för säkerhetsefterlevnad till låg kostnad.

UI-prototypframtagning i realtid

Generering av funktionella React- eller Tailwind-komponenter från handritade skisser eller muntliga beskrivningar.

Summering av långa dokument

Kondensering av enorma juridiska arkiv eller tekniska manualer utan att förlora sammanhanget över 1M token-fönstret.

Direktsänd ljudtranskribering

Omvandling av timmar av mötes- eller föreläsningsinspelningar till strukturerade sammanfattningar och åtgärdspunkter i en enda körning.

Styrkor

Begransningar

Blixtsnabb prestanda: Med 363 tokens per sekund är det en av de snabbaste modellerna i branschen för respons i realtid.
Låg faktisk återkallning: Ett SimpleQA-resultat på 43,3 % indikerar en hög risk för hallucinationer vid allmän kunskap utan grounding.
Avancerad reasoning: Med 86,9 % på GPQA Diamond erbjuder den vetenskaplig logik på doktorandnivå i en lättviktig prisklass.
Prishöjning: Den är betydligt dyrare än föregångaren Gemini 2.5 Flash-Lite som den ersätter i sortimentet.
Dynamisk kostnadskontroll: Parametern Thinking Levels möjliggör granulär kontroll över beräkningskostnader per förfrågan.
Högre latency vid High-Thinking: Att använda high thinking-nivån lägger till ungefär 7 till 10 sekunders förberäkning innan genereringen påbörjas.
Enhetlig multimodality: Inbyggd hantering av ljud, video och PDF-filer eliminerar behovet av komplexa orkestrerings-pipelines med flera modeller.
Säkerhetsrefuseringar: Interna tester visar en minskning på 21,7 % i konsekvens för bild-till-text-säkerhet under red-teaming-övningar.

API snabbstart

google/gemini-3.1-flash-lite-preview

Visa dokumentation
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Skapa ett UI för en väderpanel.");
console.log(result.response.text());

Installera SDK och borja gora API-anrop pa nagra minuter.

Vad folk sager om Gemini 3.1 Flash-Lite

Se vad communityt tycker om Gemini 3.1 Flash-Lite

Kodningskapaciteten hos 3.1 Flash-Lite är förvånansvärt bra för frontend-utveckling; den kodade en 360-graders visningsmodul perfekt.
WorldofAI
youtube
Gemini 3.1 Flash-Lite är modellen för att bygga multimodala AI-agenter som alltid är igång. Den läser, kopplar ihop och konsoliderar allt.
Shubham Saboo
twitter
Prissättningen är en massiv chock. Ett 3,75x hopp på output tokens kommer att svida om du har en stram molnbudget.
Binary Verse AI
youtube
Den flyttar bördan av komplexitet från ditt ingenjörsteams arkitektur direkt över till Googles infrastruktur.
Julian Goldie
youtube
Ännu ett prisfall för intelligens. Hög hastighet, låg kostnad, hög intelligens. En fantastisk modell för agentic routing.
ctgtplb
twitter
1M context är fortfarande den viktigaste funktionen här. Jag kan dumpa hela mappar med repokod och det bara fungerar med sub-sekunds TTFT.
DevFlow_26
reddit

Videor om Gemini 3.1 Flash-Lite

Se handledningar, recensioner och diskussioner om Gemini 3.1 Flash-Lite

Det verkar som att de på något sätt har lyckats klämma in mycket intelligens i den här modellen.

Jag skulle använda den för arbetsflöden med hög genomströmning som är mycket väldefinierade.

Frontend-kapaciteten hos Flash-Lite är ännu bättre än de flesta modeller jag faktiskt har arbetat med.

Den skapade bokstavligen en fullt fungerande visningsmodul i ett svep.

Den här modellen är idealisk för dem som behöver hastighet utan att offra all logik.

Den här modellen är vad vi skulle kalla en arbetshäst... specifikt designad för uppgifter med hög genomströmning.

Om du kör den med minimal thinking-budget fungerar den i princip som en icke-reasoning modell och den är extremt snabb.

Den gjorde ett anmärkningsvärt bra jobb med webbplatsen vi fick som output.

Förhållandet mellan hastighet och kostnad är den verkliga anledningen till att du skulle flytta dina produktionsappar hit.

Den hanterar multimodala input inbyggt, vilket är en enorm fördel jämfört med konkurrenter.

Att nå nästan 87 % på GPQA Diamond med en modell märkt som lite stör hela vårt kategoriseringssystem.

Använd inte den här modellen som ett faktiskt orakel... du måste tillhandahålla fakta till den.

Med 3.1 Flash-Lite slipper du köra tre andra mikrotjänster... den enkelheten är värd riktiga pengar.

Den 45-procentiga ökningen av output-hastigheten känns omedelbart i den streamade responsen.

Du får 1M context för småpengar, vilket fortfarande känns som magi i produktion.

Mer an bara promptar

Superladda ditt arbetsflode med AI-automatisering

Automatio kombinerar kraften av AI-agenter, webbautomatisering och smarta integrationer for att hjalpa dig astadkomma mer pa kortare tid.

AI-agenter
Webbautomatisering
Smarta arbetsfloden

Proffs-tips for Gemini 3.1 Flash-Lite

Experttips for att hjalpa dig fa ut det mesta av Gemini 3.1 Flash-Lite och uppna battre resultat.

Ställ in Thinking Levels

Använd minimal thinking för klassificering för att minska kostnader, men växla till hög för komplexa programmeringsuppgifter.

Aktivera Grounding

Använd alltid Google Search grounding för uppgifter som kräver faktakontroll, eftersom den grundläggande faktiska precisionen är lägre.

Ladda upp råfiler

Undvik att förbearbeta ljud eller video till text; ladda istället upp råfiler för att dra nytta av inbyggd multimodality.

Använd System Instructions

Tvinga strikt fram JSON-scheman med hjälp av parametern system_instruction för att minimera antalet korrigeringstokens i utdatan.

Omdomen

Vad vara anvandare sager

Ga med tusentals nojda anvandare som har transformerat sitt arbetsflode

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relaterat AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Vanliga fragor om Gemini 3.1 Flash-Lite

Hitta svar pa vanliga fragor om Gemini 3.1 Flash-Lite