google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite je Googleov najbrži i najisplativiji model. Sadrži 1M kontekst, nativnu multimodalnost i brzinu od 363 tokens/sek za široku primjenu.

MultimodalVelika brzinaIsplativGoogle Gemini
google logogoogleGemini 3.13. ožujka 2026.
Kontekst
1.0Mtokena
Maks. izlaz
66Ktokena
Ulazna cijena
$0.25/ 1M
Izlazna cijena
$1.50/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreaming
Benchmarks
GPQA
86.9%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Gemini 3.1 Flash-Lite je postigao 86.9% na ovom benchmarku.
HLE
16%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Gemini 3.1 Flash-Lite je postigao 16% na ovom benchmarku.
MMLU
88.9%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Gemini 3.1 Flash-Lite je postigao 88.9% na ovom benchmarku.
MMLU Pro
80%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Gemini 3.1 Flash-Lite je postigao 80% na ovom benchmarku.
SimpleQA
43.3%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Gemini 3.1 Flash-Lite je postigao 43.3% na ovom benchmarku.
IFEval
85%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Gemini 3.1 Flash-Lite je postigao 85% na ovom benchmarku.
AIME 2025
25%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Gemini 3.1 Flash-Lite je postigao 25% na ovom benchmarku.
MATH
78%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Gemini 3.1 Flash-Lite je postigao 78% na ovom benchmarku.
GSM8k
95%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Gemini 3.1 Flash-Lite je postigao 95% na ovom benchmarku.
MGSM
92%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Gemini 3.1 Flash-Lite je postigao 92% na ovom benchmarku.
MathVista
75%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Gemini 3.1 Flash-Lite je postigao 75% na ovom benchmarku.
SWE-Bench
35%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Gemini 3.1 Flash-Lite je postigao 35% na ovom benchmarku.
HumanEval
88%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Gemini 3.1 Flash-Lite je postigao 88% na ovom benchmarku.
LiveCodeBench
72%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Gemini 3.1 Flash-Lite je postigao 72% na ovom benchmarku.
MMMU
76.8%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Gemini 3.1 Flash-Lite je postigao 76.8% na ovom benchmarku.
MMMU Pro
76.8%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Gemini 3.1 Flash-Lite je postigao 76.8% na ovom benchmarku.
ChartQA
91%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Gemini 3.1 Flash-Lite je postigao 91% na ovom benchmarku.
DocVQA
92%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Gemini 3.1 Flash-Lite je postigao 92% na ovom benchmarku.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Gemini 3.1 Flash-Lite je postigao 55% na ovom benchmarku.
ARC-AGI
12%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Gemini 3.1 Flash-Lite je postigao 12% na ovom benchmarku.

O modelu Gemini 3.1 Flash-Lite

Saznajte o mogućnostima, značajkama i načinima korištenja modela Gemini 3.1 Flash-Lite.

Gemini 3.1 Flash-Lite je dizajniran za AI aplikacije velikog obujma gdje je brzina obrade primarni tehnički zahtjev. Za razliku od većih Pro modela, Flash-Lite koristi pojednostavljenu arhitekturu koja daje prednost throughputu, dosežući 363 tokens u sekundi. Služi kao specijalizirani alat za programere koji grade glasovne agente u stvarnom vremenu, automatizirane sustave za moderaciju sadržaja i cjevovode za ekstrakciju podataka velikih razmjera koji moraju ostati isplativi pod jakim opterećenjem.

Unatoč oznaci 'lite', model održava context window od 1 milijuna tokena. Može primiti sirove audio datoteke, videozapise od sat vremena i stotine stranica PDF-ova u jednom zahtjevu. Uvođenjem Thinking Levels, Google omogućuje korisnicima odabir između gotovo trenutnih odgovora za jednostavne zadatke i dublje faze reasoninga za složenu logiku. To pruža više profila performansi unutar jedne API krajnje točke za ravnotežu između cijene i točnosti.

Model je nativno multimodalan, što eliminira potrebu za vanjskim alatima za transkripciju audija ili opisivanje slika prije obrade. Ova nativna sposobnost poboljšava performanse na vizualnim zadacima poput odgovaranja na pitanja iz dokumenata i analize grafikona. Programeri mogu koristiti parametar thinking_level za prilagodbu internog vremena reasoninga, učinkovito skalirajući napor modela na temelju specifične složenosti svakog upita.

Gemini 3.1 Flash-Lite

Slučajevi korištenja za Gemini 3.1 Flash-Lite

Otkrijte različite načine korištenja modela Gemini 3.1 Flash-Lite za postizanje izvrsnih rezultata.

Prijevod velikog obujma

Obrada tisuća višejezičnih chat poruka ili upita korisničke podrške u stvarnom vremenu uz sub-sekundni latency.

Inteligentno usmjeravanje modela

Djeluje kao brzi klasifikator za utvrđivanje trebaju li se dolazni upiti eskalirati na skuplje modele.

Multimodalna moderacija sadržaja

Skeniranje velikih serija korisničkih slika i videozapisa radi usklađenosti sa sigurnosnim pravilima uz niske troškove.

Izrada prototipa UI-a u stvarnom vremenu

Generiranje funkcionalnih React ili Tailwind komponenti iz ručno nacrtanih skica ili verbalnih opisa.

Sažimanje dugačkih dokumenata

Sažimanje golemih pravnih arhiva ili tehničkih priručnika bez gubitka konteksta unutar 1M token prozora.

Prijepis audija uživo

Pretvaranje sati snimljenih sastanaka ili predavanja u strukturirane sažetke i zadatke u jednom prolazu.

Prednosti

Ograničenja

Vrhunske performanse: Uz 363 tokens u sekundi, ovo je jedan od najbržih modela u industriji za responzivnost u stvarnom vremenu.
Niska činjenična točnost: SimpleQA rezultat od 43,3% ukazuje na visok rizik od halucinacija za opće znanje bez upotrebe groundinga.
Napredni reasoning: S postignućem od 86,9% na GPQA Diamond benchmarku, pruža znanstvenu logiku na razini doktorata u laganoj kategoriji.
Povećanje cijene: Značajno je skuplji od svog prethodnika, Gemini 2.5 Flash-Lite, kojeg zamjenjuje u ponudi.
Dinamička kontrola troškova: Parametar Thinking Levels omogućuje granularnu kontrolu nad potrošnjom računalnih resursa po pojedinačnom zahtjevu.
Veći latency pri visokom thinkingu: Korištenje visoke razine thinkinga dodaje približno 7 do 10 sekundi predizračuna prije nego što počne generiranje.
Jedinstvena multimodalnost: Nativni unos zvuka, videa i PDF-ova eliminira potrebu za složenim cjevovodima orkestracije više modela.
Sigurnosna odbijanja: Interna testiranja pokazuju pad od 21,7% u dosljednosti sigurnosti slike-u-tekst tijekom red-teaming vježbi.

API brzi početak

google/gemini-3.1-flash-lite-preview

Pogledaj dokumentaciju
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Gemini 3.1 Flash-Lite

Pogledajte što zajednica misli o modelu Gemini 3.1 Flash-Lite

Sposobnost programiranja 3.1 Flash-Lite modela iznenađujuće je dobra za front-end razvoj; savršeno je isprogramirao 360-degree preglednik.
WorldofAI
youtube
Gemini 3.1 Flash-Lite je pravi model za izgradnju uvijek aktivnih multimodalnih AI agenata. Čita, povezuje i konsolidira sve.
Shubham Saboo
twitter
Cijena je ogroman šok. Skok od 3,75x na output tokens će zaboljeti ako imate ograničen cloud budžet.
Binary Verse AI
youtube
Prebacuje teret složenosti s arhitekture vašeg inženjerskog tima izravno na Googleovu infrastrukturu.
Julian Goldie
youtube
Još jedan pad cijene za inteligenciju. Velika brzina, niska cijena, visoka inteligencija. Sjajan model za agentic routing.
ctgtplb
twitter
1M kontekst je i dalje ključna značajka. Mogu ubaciti čitave mape repozitorija i sve radi uz sub-sekundni TTFT.
DevFlow_26
reddit

Videozapisi o modelu Gemini 3.1 Flash-Lite

Gledajte tutorijale, recenzije i diskusije o modelu Gemini 3.1 Flash-Lite

Čini se da su nekako uspjeli ugurati puno inteligencije u ovaj model.

Koristio bih ga za radna opterećenja s visokim throughputom koja su vrlo dobro definirana.

Front-end sposobnosti ovog modela su još bolje od većine modela s kojima sam radio.

Doslovno je kreirao potpuno funkcionalan preglednik iz prve.

Ovaj model je idealan za one koji trebaju brzinu bez žrtvovanja logike.

Ovaj model je ono što bismo nazvali 'radnim konjem'... posebno dizajniran za zadatke visokog throughputa.

Ako ga pokrenete s minimalnim budžetom za thinking, on praktički radi kao non-reasoning model i izuzetno je brz.

Odradio je nevjerojatno dobar posao na web stranici koju smo dobili kao output.

Omjer brzine i cijene je pravi razlog zašto biste prebacili svoje produkcijske aplikacije ovdje.

Nativno obrađuje multimodalne inpute, što je ogromna prednost u odnosu na konkurenciju.

Dosezanje gotovo 87% na GPQA Diamond benchmarku s modelom označenim kao 'lite' remeti cijeli naš sustav kategorizacije.

Ne koristite ovaj model kao činjeničnog proroka... morate mu sami donijeti činjenice.

S 3.1 Flash-Lite izbjegavate pokretanje tri druga mikroservisa... ta jednostavnost vrijedi pravi novac.

Povećanje brzine outputa od 45 posto odmah se osjeti u streaming odgovoru.

Dobivate 1M kontekst za sitniš, što u produkciji i dalje djeluje kao magija.

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Gemini 3.1 Flash-Lite

Stručni savjeti za maksimalno iskorištavanje Gemini 3.1 Flash-Lite.

Postavljanje Thinking Levels

Koristite minimalni thinking za klasifikaciju kako biste smanjili troškove, ali prebacite na visoki (high) za složene zadatke programiranja.

Omogućite Grounding

Uvijek koristite Google Search grounding za zadatke koji zahtijevaju činjenično prisjećanje, budući da je osnovna činjenična točnost niža.

Učitavanje sirovih datoteka

Izbjegavajte pretprocesiranje audio ili video zapisa u tekst; umjesto toga učitajte sirove datoteke kako biste iskoristili nativnu multimodalnost.

Korištenje System Instructions

Strogo primjenjujte JSON sheme pomoću parametra system_instruction kako biste minimizirali tokens za ispravak outputa.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Često Postavljana Pitanja o Gemini 3.1 Flash-Lite

Pronađite odgovore na česta pitanja o Gemini 3.1 Flash-Lite