google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite je najbrži i najisplativiji Google model. Poseduje 1M konteksta, nativnu multimodality podršku i brzinu od 363 tokens/sec.

MultimodalVelika brzinaEkonomičnostGoogle Gemini
google logogoogleGemini 3.13. mart 2026.
Контекст
1.0Mтокена
Макс. излаз
66Kтокена
Улазна цена
$0.25/ 1M
Излазна цена
$1.50/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтриминг
Бенчмаркови
GPQA
86.9%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Gemini 3.1 Flash-Lite је постигао 86.9% на овом бенчмарку.
HLE
16%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Gemini 3.1 Flash-Lite је постигао 16% на овом бенчмарку.
MMLU
88.9%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Gemini 3.1 Flash-Lite је постигао 88.9% на овом бенчмарку.
MMLU Pro
80%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Gemini 3.1 Flash-Lite је постигао 80% на овом бенчмарку.
SimpleQA
43.3%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Gemini 3.1 Flash-Lite је постигао 43.3% на овом бенчмарку.
IFEval
85%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Gemini 3.1 Flash-Lite је постигао 85% на овом бенчмарку.
AIME 2025
25%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Gemini 3.1 Flash-Lite је постигао 25% на овом бенчмарку.
MATH
78%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Gemini 3.1 Flash-Lite је постигао 78% на овом бенчмарку.
GSM8k
95%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Gemini 3.1 Flash-Lite је постигао 95% на овом бенчмарку.
MGSM
92%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Gemini 3.1 Flash-Lite је постигао 92% на овом бенчмарку.
MathVista
75%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Gemini 3.1 Flash-Lite је постигао 75% на овом бенчмарку.
SWE-Bench
35%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Gemini 3.1 Flash-Lite је постигао 35% на овом бенчмарку.
HumanEval
88%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Gemini 3.1 Flash-Lite је постигао 88% на овом бенчмарку.
LiveCodeBench
72%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Gemini 3.1 Flash-Lite је постигао 72% на овом бенчмарку.
MMMU
76.8%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Gemini 3.1 Flash-Lite је постигао 76.8% на овом бенчмарку.
MMMU Pro
76.8%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Gemini 3.1 Flash-Lite је постигао 76.8% на овом бенчмарку.
ChartQA
91%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Gemini 3.1 Flash-Lite је постигао 91% на овом бенчмарку.
DocVQA
92%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Gemini 3.1 Flash-Lite је постигао 92% на овом бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Gemini 3.1 Flash-Lite је постигао 55% на овом бенчмарку.
ARC-AGI
12%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Gemini 3.1 Flash-Lite је постигао 12% на овом бенчмарку.

О моделу Gemini 3.1 Flash-Lite

Сазнајте о могућностима, функцијама и начинима коришћења модела Gemini 3.1 Flash-Lite.

Gemini 3.1 Flash-Lite je dizajniran za AI aplikacije velikog obima gde je brzina obrade primarni tehnički zahtev. Za razliku od većih Pro modela, Flash-Lite koristi optimizovanu arhitekturu koja daje prioritet protoku, dostižući 363 tokens po sekundi. Služi kao specijalizovan alat za developere koji grade glasovne agente u realnom vremenu, automatizovane sisteme za moderaciju sadržaja i cevovode za ekstrakciju podataka velikih razmera koji moraju ostati isplativi pod velikim opterećenjem.

Uprkos oznaci 'lite', model održava prozor konteksta od 1 milion tokena. Može da unese sirove audio datoteke, video zapise u trajanju od sat vremena i stotine stranica PDF dokumenata u jednom zahtevu. Uvođenjem nivoa razmišljanja (Thinking Levels), Google omogućava korisnicima da biraju između trenutnih odgovora za jednostavne zadatke i dublje faze reasoning procesa za složenu logiku. Ovo pruža više profila performansi unutar jednog API endpoint-a radi balansiranja troškova i preciznosti.

Model je nativno multimodalan, što eliminiše potrebu za eksternim alatima za transkripciju zvuka ili opisivanje slika pre obrade. Ova nativna sposobnost poboljšava performanse na vizuelnim zadacima kao što su odgovaranje na pitanja iz dokumenata i analiza grafikona. Developeri mogu koristiti parametar thinking_level da prilagode vreme internog razmišljanja, efikasno skalirajući napor modela na osnovu specifične složenosti svakog upita.

Gemini 3.1 Flash-Lite

Случајеви употребе за Gemini 3.1 Flash-Lite

Откријте различите начине коришћења модела Gemini 3.1 Flash-Lite за постизање одличних резултата.

Prevođenje velikog obima

Obrada hiljada višejezičnih chat poruka ili tiketa za podršku u realnom vremenu uz latency manji od jedne sekunde.

Inteligentno rutiranje modela

Funkcioniše kao brzi klasifikator za određivanje da li dolazni upiti treba da se eskaliraju na skuplje modele.

Multimodalna moderacija sadržaja

Skeniranje velikih serija korisničkih slika i video zapisa radi bezbednosne usaglašenosti uz niske troškove.

Prototipiranje UI-a u realnom vremenu

Generisanje funkcionalnih React ili Tailwind komponenti iz ručno nacrtanih skica ili verbalnih opisa.

Rezimiranje dugih dokumenata

Sažimanje obimnih pravnih arhiva ili tehničkih priručnika bez gubitka konteksta unutar prozora od 1M tokens.

Transkripcija audio zapisa uživo

Pretvaranje sati sastanaka ili snimaka predavanja u strukturirane rezimee i listu zadataka u jednom prolazu.

Предности

Ограничења

Neverovatne performanse: Sa 363 tokens po sekundi, ovo je jedan od najbržih modela u industriji za odziv u realnom vremenu.
Slabo činjenično podsećanje: SimpleQA rezultat od 43,3% ukazuje na visok rizik od halucinacija za opšte znanje bez korišćenja grounding-a.
Napredni reasoning: Postizanjem 86,9% na GPQA Diamond benchmarku, pruža naučnu logiku na doktorskom nivou unutar lagane kategorije.
Povećanje cene: Značajno je skuplji od svog prethodnika, Gemini 2.5 Flash-Lite, kojeg menja u ponudi.
Dinamička kontrola troškova: Parametar Thinking Levels omogućava granularnu kontrolu potrošnje resursa na nivou svakog pojedinačnog zahteva.
Veći latency kod visokog nivoa razmišljanja: Korišćenje visokog nivoa razmišljanja dodaje otprilike 7 do 10 sekundi pre-komputacije pre početka generisanja.
Jedinstvena multimodality: Nativna obrada audio, video i PDF datoteka eliminiše potrebu za složenim cevovodima (pipelines) sa više modela.
Bezbednosna odbijanja: Interni testovi pokazuju pad od 21,7% u konzistentnosti bezbednosnih filtera za konverziju slike u tekst tokom red-teaming vežbi.

АПИ брзи старт

google/gemini-3.1-flash-lite-preview

Погледај документацију
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Kreiraj UI za vremensku prognozu.");
console.log(result.response.text());

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Gemini 3.1 Flash-Lite

Погледајте шта заједница мисли о моделу Gemini 3.1 Flash-Lite

Sposobnost kodiranja modela 3.1 Flash-Lite je iznenađujuće dobra za front-end razvoj; savršeno je iskodirao pregledač od 360 stepeni.
WorldofAI
youtube
Gemini 3.1 Flash-Lite je model za izgradnju 'uvek uključenih' multimodalnih AI agenata. Čita, povezuje i objedinjuje sve.
Shubham Saboo
twitter
Cena je ogroman šok. Skok od 3,75 puta na output tokens će boleti ako ste na ograničenom cloud budžetu.
Binary Verse AI
youtube
Ovo prebacuje teret složenosti sa arhitekture vašeg inženjerskog tima direktno na Google infrastrukturu.
Julian Goldie
youtube
Još jedan pad cene za inteligenciju. Velika brzina, niska cena, visoka inteligencija. Odličan model za agentic rutiranje.
ctgtplb
twitter
Kontekst od 1M je i dalje glavna funkcija ovde. Mogu da ubacim cele repozitorijume i sve jednostavno radi uz TTFT manji od sekunde.
DevFlow_26
reddit

Видео снимци о моделу Gemini 3.1 Flash-Lite

Гледајте туторијале, рецензије и дискусије о моделу Gemini 3.1 Flash-Lite

Čini se da su nekako uspeli da upakuju mnogo inteligencije u ovaj model.

Koristio bih ga za radna opterećenja visokog protoka (throughput) koja su jasno definisana.

Front-end sposobnosti su čak i bolje od većine modela sa kojima sam do sada radio.

Bukvalno je kreirao potpuno funkcionalan pregledač iz prvog pokušaja.

Ovaj model je idealan za one kojima je potrebna brzina bez žrtvovanja logike.

Ovaj model je ono što bismo nazvali 'radnim konjem'... posebno dizajniran za zadatke visokog protoka.

Ako ga pokrenete sa minimalnim budžetom za razmišljanje, on radi praktično kao model bez reasoning sposobnosti i izuzetno je brz.

Uradio je izvanredan posao sa sajtom koji smo dobili kao izlaz.

Odnos brzine i cene je pravi razlog zašto biste prebacili svoje produkcijske aplikacije ovde.

Nativno obrađuje multimodalne unose, što je ogromna prednost u odnosu na konkurenciju.

Dostići skoro 87% na GPQA Diamond sa modelom koji je označen kao 'lite' remeti ceo naš sistem kategorizacije.

Nemojte koristiti ovaj model kao činjeničnu enciklopediju... morate mu vi dostaviti činjenice.

Sa 3.1 Flash-Lite, izbegavate pokretanje tri druga mikroservisa... ta jednostavnost vredi realan novac.

Povećanje brzine izlaza od 45 odsto se odmah oseća u streaming odgovoru.

Dobijate 1M konteksta za siću, što u produkciji i dalje deluje kao magija.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Gemini 3.1 Flash-Lite

Stručni saveti za maksimalno iskorišćenje Gemini 3.1 Flash-Lite.

Podesite Thinking Levels

Koristite minimalan nivo razmišljanja za klasifikaciju kako biste smanjili troškove, a prebacite na visok nivo za složene zadatke programiranja.

Omogućite Grounding

Uvek koristite Google Search grounding za zadatke koji zahtevaju činjenično podsećanje, pošto je osnovna faktografska preciznost niža.

Otpremite sirove datoteke

Izbegavajte pre-procesiranje audio ili video zapisa u tekst i umesto toga otpremite sirove fajlove kako biste iskoristili prednosti nativne multimodality karakteristike.

Koristite System Instructions

Strogo primenjujte JSON šeme koristeći system_instruction parametar kako biste minimizovali tokens potrebne za ispravku izlaza.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Често Постављана Питања о Gemini 3.1 Flash-Lite

Пронађите одговоре на честа питања о Gemini 3.1 Flash-Lite