google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite je Googleov najbrži i najisplativiji model. Sadrži 1M context, izvornu multimodalnost i brzinu od 363 tokens/sec za skaliranje.

MultimodalVisoka brzinaIsplativostGoogle Gemini
google logogoogleGemini 3.12026-03-03
Kontekst
1.0Mtokena
Maks. izlaz
66Ktokena
Ulazna cijena
$0.25/ 1M
Izlazna cijena
$1.50/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreaming
Benchmarks
GPQA
86.9%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Gemini 3.1 Flash-Lite je postigao 86.9% na ovom benchmarku.
HLE
16%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Gemini 3.1 Flash-Lite je postigao 16% na ovom benchmarku.
MMLU
88.9%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Gemini 3.1 Flash-Lite je postigao 88.9% na ovom benchmarku.
MMLU Pro
80%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Gemini 3.1 Flash-Lite je postigao 80% na ovom benchmarku.
SimpleQA
43.3%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Gemini 3.1 Flash-Lite je postigao 43.3% na ovom benchmarku.
IFEval
85%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Gemini 3.1 Flash-Lite je postigao 85% na ovom benchmarku.
AIME 2025
25%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Gemini 3.1 Flash-Lite je postigao 25% na ovom benchmarku.
MATH
78%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Gemini 3.1 Flash-Lite je postigao 78% na ovom benchmarku.
GSM8k
95%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Gemini 3.1 Flash-Lite je postigao 95% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Gemini 3.1 Flash-Lite je postigao 92% na ovom benchmarku.
MathVista
75%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Gemini 3.1 Flash-Lite je postigao 75% na ovom benchmarku.
SWE-Bench
35%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Gemini 3.1 Flash-Lite je postigao 35% na ovom benchmarku.
HumanEval
88%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Gemini 3.1 Flash-Lite je postigao 88% na ovom benchmarku.
LiveCodeBench
72%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Gemini 3.1 Flash-Lite je postigao 72% na ovom benchmarku.
MMMU
76.8%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Gemini 3.1 Flash-Lite je postigao 76.8% na ovom benchmarku.
MMMU Pro
76.8%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Gemini 3.1 Flash-Lite je postigao 76.8% na ovom benchmarku.
ChartQA
91%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Gemini 3.1 Flash-Lite je postigao 91% na ovom benchmarku.
DocVQA
92%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Gemini 3.1 Flash-Lite je postigao 92% na ovom benchmarku.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Gemini 3.1 Flash-Lite je postigao 55% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Gemini 3.1 Flash-Lite je postigao 12% na ovom benchmarku.

O modelu Gemini 3.1 Flash-Lite

Saznajte o mogućnostima, značajkama i načinima korištenja modela Gemini 3.1 Flash-Lite.

Optimiziran za inteligenciju visoke brzine

Gemini 3.1 Flash-Lite je Googleov radni konj visoke brzine, dizajniran posebno za masovna radna opterećenja developera gdje su niska latency i isplativost od ključne važnosti. Objavljen 3. ožujka 2026., služi kao optimizirani unos u seriji Gemini 3.1, pružajući 2,5x brže vrijeme do prvog tokens i 45% povećanje brzine outputa u usporedbi s prethodnim generacijama. Sposoban je streamati više od 360 tokens u sekundi, što ga čini idealnim za aplikacije u stvarnom vremenu i obradu podataka golemog opsega.

Izvorno multimodal s 1M Context

Model je izvorno multimodal, podržavajući unos teksta, slika, audia, videa i PDF-ova unutar masovnog context windowa od 1 milijun tokens. To omogućuje developerima obradu ogromnih skupova podataka, kao što su jednosatni videozapisi ili goleme pravne arhive, bez potrebe za kompleksnim RAG pipelineima. Njegove vision sposobnosti su posebno snažne, ističući se u vizualnom odgovaranju na pitanja o dokumentima i analizi grafikona.

Granularna kontrola za developere

Istaknuta značajka je uvođenje 'Thinking Levels' (Minimal, Low, Medium, High). Ovaj parametar omogućuje developerima granularno podešavanje dubine reasoninga modela ovisno o složenosti zadatka. Ova fleksibilnost osigurava da korisnici ne plaćaju previše za jednostavne zadatke poput klasifikacije, dok i dalje imaju pristup poboljšanoj logici za strukturirane outpute poput generiranja UI-ja i ekstrakcije podataka.

Gemini 3.1 Flash-Lite

Slučajevi korištenja za Gemini 3.1 Flash-Lite

Otkrijte različite načine korištenja modela Gemini 3.1 Flash-Lite za postizanje izvrsnih rezultata.

Masovni prijevod u stvarnom vremenu

Besprijekorno obrađujte tisuće poruka u chatu ili support ticketa na više od 100 jezika uz minimalnu latency i visoku isplativost.

Multimodalna moderacija sadržaja

Koristite izvornu obradu videa i slika za označavanje neprikladnog sadržaja u feedovima društvenih mreža s visokim throughputom ili video platformama.

Automatizirana ekstrakcija strukturiranih podataka

Ekstrahirajte kompleksne JSON sheme iz golemih PDF arhiva ili dugačkih pravnih dokumenata koristeći context window od 1 milijuna tokens.

Agilno front-end prototipiranje

Brzo generirajte funkcionalne React/Tailwind UI komponente i landing stranice brzinom od preko 360 tokens u sekundi za iterativni dizajn.

Agentic orkestracija zadataka

Pokrećite 'uvijek uključene' AI agente koji izvode planiranje u više koraka, istraživanje weba i korištenje alata bez probijanja budžeta za tokens.

Customer service botovi niske latency

Implementirajte konverzacijske asistente koji pružaju trenutne odgovore s podesivim reasoningom za jednostavne naspram kompleksnih upita.

Prednosti

Ograničenja

Neusporediv throughput: Streamanje pri 363 tokens u sekundi, što ga čini 45% bržim od 2.5 Flash za agentic aplikacije u stvarnom vremenu.
Gornja granica reasoninga: Znatno slabije performanse na apstraktnoj logici (12% ARC-AGI v2) u usporedbi s flagship modelima specijaliziranim za reasoning.
Agresivno određivanje cijena: S cijenom od 0,25 $/M input tokens, košta otprilike 1/8 cijene Gemini 3.1 Pro, uz zadržavanje visoke opće inteligencije.
Nedostaci u naprednoj matematici: Bori se s elitnom matematikom, postigavši samo 25% na AIME 2025 u usporedbi s 90%+ kod frontier modela.
Izvorno multimodalno majstorstvo: Izvrsne performanse na vision (92% DocVQA) i video (84,8% VideoMMMU) zadacima bez potrebe za zasebnim enkoderima.
Kalibracija činjenične točnosti: Suočava se s višim stopama halucinacija u zadacima traženja činjenica (43,3% SimpleQA) nego alternative Pro razine ili frontier modeli.
Granularna kontrola resursa: Prvi model koji nudi preciznu kontrolu nad dubinom reasoninga, omogućujući optimizaciju omjera cijene i performansi.
Odstupanje od uputa: Povremeno može propustiti manje zahtjeve za formatiranjem u iznimno dugim, kompleksnim uputama s više koraka.

API brzi početak

google/gemini-3.1-flash-lite-preview

Pogledaj dokumentaciju
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Gemini 3.1 Flash-Lite

Pogledajte što zajednica misli o modelu Gemini 3.1 Flash-Lite

Flash lite je suludo brz i učinkovit za specifične workflowe poput sažimanja... ovo je dobrodošao skok u brzini.
reddit korisnik
reddit
Gemini 3.1 Flash-Lite je tihi ubojica za API pružatelje srednje razine... troškovne krivulje se brzo akumuliraju.
@9chaku
twitter
3.1 Flash-Lite nadmašuje 2.5 Flash u većini benchmarka dok je prava mala jurilica!
Tulsee Doshi
twitter
Za graditelje koji pokreću AI agente u velikom opsegu, ovo je model koji 'uvijek uključeno' čini zapravo priuštivim. 363 t/s je divlje.
@prince_twets
twitter
Cijene su lude. 0,25 $ za 1M inputa čini jeftinijim ubacivanje cijelih repozitorija u context nego izgradnju RAG-a.
reddit korisnik
reddit
Brzina do prvog tokens je praktički trenutačna. Prvi put da se model osjeća bržim od mog vlastitog tipkanja.
DevGuru
hackernews

Videozapisi o modelu Gemini 3.1 Flash-Lite

Gledajte tutorijale, recenzije i diskusije o modelu Gemini 3.1 Flash-Lite

Cijena je 25 centi po milijunu input tokens i 1,50 $ po milijunu output tokens... i dalje vrlo konkurentno s obzirom na brzinu.

Smatram da je ovo podcijenjen model za programiranje s fokusom na front-end razvoj te isporučuje tokens iznimno brzo.

Ovo je uistinu namijenjeno developerima kojima treba skala bez latency koju donosi Pro model.

Multimodalnost ovdje nije samo trik; s lakoćom obrađuje kompleksne PDF-ove.

Google uistinu pomiče granice onoga što 'lite' model zapravo može postići u 2026.

Ovaj put, to je Gemini 3.1 Flash Light, koji bi trebao biti brža i jeftinija verzija Flash modela.

Ovi modeli su potrebni jer ih želite koristiti u aplikacijama gdje vam je potreban visok throughput.

Context window od 1 milijun je sada standard za Gemini, ali vidjeti to na ovako brzom modelu je impresivno.

Neće pobijediti na matematičkoj olimpijadi, ali je savršen za ekstrakciju i sažimanje.

API latency je značajno niža nego kod GPT-4o-mini u mojem ranom testiranju.

Ovaj novi AI model iz Googlea je 45% brži... i mogao bi promijeniti način na koji svatko od nas gradi uz AI.

Low thinking mode za brze, jednostavne stvari. High thinking mode za teške zadatke... ta fleksibilnost je ono što odvaja igračku od pravog alata.

Za SEO zadatke, ovo će biti moj glavni alat zbog cijene.

Činjenica da može vidjeti video i razumjeti kontekst gotovo trenutno mijenja pravila igre za kreatore sadržaja.

Google trenutno uistinu otežava opravdavanje korištenja drugih pružatelja usluga za zadatke visokog volumena.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Gemini 3.1 Flash-Lite

Stručni savjeti za maksimalno iskorištavanje Gemini 3.1 Flash-Lite.

Iskoristite Thinking Levels

Postavite thinking_level na 'minimal' za jednostavne zadatke poput klasifikacije kako biste maksimizirali brzinu, ali koristite 'high' za strukturirano generiranje koda.

Izvorna video analiza

Ubacite sirove video datoteke izravno u API za brži uvid u vizualne događaje i audio signale istovremeno, zaobilazeći korake transkripcije.

Context umjesto RAG-a

Za skupove podataka manje od 1 milijuna tokens, ubacite cijeli set dokumenata u context window kako biste eliminirali pogreške pri dohvaćanju i troškove vector baze podataka.

Optimizacija uz batching

Koristite batching API za zadatke koji nisu hitni kako biste dodatno smanjili troškove, jer je Flash-Lite posebno optimiziran za asinkronu obradu.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Često Postavljana Pitanja o Gemini 3.1 Flash-Lite

Pronađite odgovore na česta pitanja o Gemini 3.1 Flash-Lite