google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite je Google-ov najbrži i najisplativiji model. Poseduje 1M context, izvornu multimodalnost i 363 tokens/sec brzinu za scale.

MultimodalVelika brzinaTroškovna efikasnostGoogle Gemini
google logogoogleGemini 3.12026-03-03
Контекст
1.0Mтокена
Макс. излаз
66Kтокена
Улазна цена
$0.25/ 1M
Излазна цена
$1.50/ 1M
Модалитет:TextImageAudioVideo
Могућности:ВидАлатиСтриминг
Бенчмаркови
GPQA
86.9%
GPQA: Научна питања на нивоу докторантуре. Ригорозан бенчмарк са 448 питања вишеструког избора из биологије, физике и хемије које су креирали стручњаци. Докторанти постижу само 65-74% тачности, док нестручњаци постижу само 34% чак и са неограниченим приступом интернету (отуда назив 'отпоран на Google'). Gemini 3.1 Flash-Lite је постигао 86.9% на овом бенчмарку.
HLE
16%
HLE: Резоновање високог нивоа експертизе. Тестира способност модела да демонстрира резоновање на нивоу експерта у специјализованим доменима. Процењује дубоко разумевање сложених тема које захтевају знање на професионалном нивоу. Gemini 3.1 Flash-Lite је постигао 16% на овом бенчмарку.
MMLU
88.9%
MMLU: Масовно вишезадатко језичко разумевање. Свеобухватан бенчмарк са 16.000 питања вишеструког избора из 57 академских предмета укључујући математику, филозофију, право и медицину. Тестира широко знање и способности резоновања. Gemini 3.1 Flash-Lite је постигао 88.9% на овом бенчмарку.
MMLU Pro
80%
MMLU Pro: MMLU професионална верзија. Побољшана верзија MMLU са 12.032 питања користећи тежи формат са 10 опција. Покрива математику, физику, хемију, право, инжењерство, економију, здравство, психологију, бизнис, биологију, филозофију и информатику. Gemini 3.1 Flash-Lite је постигао 80% на овом бенчмарку.
SimpleQA
43.3%
SimpleQA: Бенчмарк чињеничне тачности. Тестира способност модела да пружи тачне, чињеничне одговоре на директна питања. Мери поузданост и смањује халуцинације у задацима проналажења знања. Gemini 3.1 Flash-Lite је постигао 43.3% на овом бенчмарку.
IFEval
85%
IFEval: Евалуација праћења инструкција. Мери колико добро модел следи специфичне инструкције и ограничења. Тестира способност придржавања правила форматирања, ограничења дужине и других експлицитних захтева. Gemini 3.1 Flash-Lite је постигао 85% на овом бенчмарку.
AIME 2025
25%
AIME 2025: Амерички позивни математички испит. Математички проблеми такмичарског нивоа са престижног AIME испита дизајнираног за талентоване средњошколце. Тестира напредно математичко решавање проблема које захтева апстрактно резоновање, а не само препознавање образаца. Gemini 3.1 Flash-Lite је постигао 25% на овом бенчмарку.
MATH
78%
MATH: Решавање математичких проблема. Свеобухватан математички бенчмарк који тестира решавање проблема из алгебре, геометрије, рачуна и других математичких домена. Захтева резоновање у више корака и формално математичко знање. Gemini 3.1 Flash-Lite је постигао 78% на овом бенчмарку.
GSM8k
95%
GSM8k: Математика основне школе 8K. 8.500 математичких задатака нивоа основне школе који захтевају резоновање у више корака. Тестира основну аритметику и логичко размишљање кроз сценарије из стварног живота попут куповине или рачунања времена. Gemini 3.1 Flash-Lite је постигао 95% на овом бенчмарку.
MGSM
92%
MGSM: Вишејезична математика основне школе. GSM8k бенчмарк преведен на 10 језика укључујући шпански, француски, немачки, руски, кинески и јапански. Тестира математичко резоновање на различитим језицима. Gemini 3.1 Flash-Lite је постигао 92% на овом бенчмарку.
MathVista
75%
MathVista: Математичко визуелно резоновање. Тестира способност решавања математичких проблема који укључују визуелне елементе попут графикона, геометријских дијаграма и научних фигура. Комбинује визуелно разумевање са математичким резоновањем. Gemini 3.1 Flash-Lite је постигао 75% на овом бенчмарку.
SWE-Bench
35%
SWE-Bench: Бенчмарк софтверског инжењеринга. АИ модели покушавају да реше стварне GitHub проблеме у Python пројектима отвореног кода са људском верификацијом. Тестира практичне вештине софтверског инжењеринга на продукцијским базама кода. Најбољи модели су напредовали са 4,4% у 2023. на преко 70% у 2024. Gemini 3.1 Flash-Lite је постигао 35% на овом бенчмарку.
HumanEval
88%
HumanEval: Python програмерски проблеми. 164 ручно написана програмерска проблема где модели морају да генеришу исправне имплементације Python функција. Свако решење се верификује јединичним тестовима. Најбољи модели сада постижу преко 90% тачности. Gemini 3.1 Flash-Lite је постигао 88% на овом бенчмарку.
LiveCodeBench
72%
LiveCodeBench: Бенчмарк живог кодирања. Тестира способности кодирања на континуирано ажурираним изазовима програмирања из стварног света. За разлику од статичних бенчмаркова, користи свеже проблеме за спречавање контаминације података и мерење правих вештина кодирања. Gemini 3.1 Flash-Lite је постигао 72% на овом бенчмарку.
MMMU
76.8%
MMMU: Мултимодално разумевање. Масиван вишедисциплинарни мултимодални бенчмарк разумевања који тестира моделе вида и језика на проблемима универзитетског нивоа из 30 предмета који захтевају разумевање слика и стручно знање. Gemini 3.1 Flash-Lite је постигао 76.8% на овом бенчмарку.
MMMU Pro
76.8%
MMMU Pro: MMMU професионална верзија. Побољшана верзија MMMU са тежим питањима и строжом евалуацијом. Тестира напредно мултимодално резоновање на професионалном и експертском нивоу. Gemini 3.1 Flash-Lite је постигао 76.8% на овом бенчмарку.
ChartQA
91%
ChartQA: Питања и одговори о графиконима. Тестира способност разумевања и резоновања о информацијама приказаним у графиконима и дијаграмима. Захтева екстракцију података, поређење вредности и извођење рачунања из визуелних приказа података. Gemini 3.1 Flash-Lite је постигао 91% на овом бенчмарку.
DocVQA
92%
DocVQA: Визуелна Q&A о документима. Бенчмарк визуелних питања и одговора о документима који тестира способност екстракције и резоновања о информацијама из слика докумената укључујући обрасце, извештаје и скениран текст. Gemini 3.1 Flash-Lite је постигао 92% на овом бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Terminal/CLI задаци. Тестира способност извођења операција командне линије, писања shell скрипти и навигације у терминалским окружењима. Мери практичне вештине администрације система и развојних токова рада. Gemini 3.1 Flash-Lite је постигао 55% на овом бенчмарку.
ARC-AGI
12%
ARC-AGI: Апстракција и резоновање. Корпус апстракције и резоновања за AGI - тестира флуидну интелигенцију кроз нове загонетке препознавања образаца. Сваки задатак захтева откривање основног правила из примера, мерећи општу способност резоновања уместо меморисања. Gemini 3.1 Flash-Lite је постигао 12% на овом бенчмарку.

О моделу Gemini 3.1 Flash-Lite

Сазнајте о могућностима, функцијама и начинима коришћења модела Gemini 3.1 Flash-Lite.

Optimizovan za inteligenciju velike brzine

Gemini 3.1 Flash-Lite je Google-ov radni konj velike brzine, dizajniran specifično za developere sa velikim obimom posla gde su nizak latency i troškovna efikasnost od presudnog značaja. Pušten u rad 3. marta 2026, služi kao optimizovan model u Gemini 3.1 seriji, pružajući 2,5x brže vreme do prvog token-a i 45% povećanje brzine output-a u poređenju sa prethodnim generacijama. Sposoban je da strimuje preko 360 tokens u sekundi, što ga čini idealnim za real-time aplikacije i obradu podataka u masovnim razmerama.

Izvorno multimodal sa 1M context-om

Model je izvorno multimodal, podržavajući text, slike, audio, video i PDF inpute unutar masivnog context window-a od 1 milion tokens. Ovo omogućava developerima da obrađuju ogromne setove podataka, kao što su video snimci od sat vremena ili masivne pravne arhive, bez potrebe za kompleksnim RAG pipeline-ovima. Njegove vision sposobnosti su posebno jake, briljirajući u vizuelnom odgovaranju na pitanja iz dokumenata i analizi grafikona.

Granularna kontrola za developere

Istaknuta funkcija je uvođenje 'Thinking Levels' (Minimal, Low, Medium, High). Ovaj parametar omogućava developerima da precizno podese dubinu reasoning-a modela na osnovu kompleksnosti zadatka. Ova fleksibilnost osigurava da korisnici ne preplaćuju za jednostavne zadatke poput klasifikacije, dok istovremeno imaju pristup poboljšanoj logici za strukturirane output-e poput generisanja UI-ja i ekstrakcije podataka.

Gemini 3.1 Flash-Lite

Случајеви употребе за Gemini 3.1 Flash-Lite

Откријте различите начине коришћења модела Gemini 3.1 Flash-Lite за постизање одличних резултата.

Real-time prevođenje velikog obima

Besprekorno obrađujte hiljade poruka u chatu ili tiketa korisničke podrške na više od 100 jezika uz minimalni latency i visoku isplativost.

Multimodal moderacija sadržaja

Koristite izvornu obradu videa i slika za označavanje neprikladnog sadržaja u social media feed-ovima ili video platformama velikog protoka.

Automatizovano izvlačenje strukturiranih podataka

Izvucite kompleksne JSON sheme iz masivnih PDF arhiva ili pravnih dokumenata dugog formata koristeći context window od 1M tokens.

Agilno front-end prototipovanje

Brzo generišite funkcionalne React/Tailwind UI komponente i landing stranice brzinom od preko 360 tokens u sekundi za iterativni dizajn.

Agentic orkestracija zadataka

Pokrećite 'always-on' AI agents koji obavljaju planiranje u više koraka, istraživanje weba i korišćenje alata bez probijanja budžeta za tokens.

Korisnički botovi sa niskim latency-em

Implementirajte konverzacijske asistente koji pružaju trenutne odgovore sa podesivim reasoning-om za jednostavne naspram kompleksnih upita.

Предности

Ограничења

Neprevaziđen throughput: Strimuje brzinom od 363 tokens u sekundi, što ga čini 45% bržim od 2.5 Flash-a za real-time agentic aplikacije.
Ograničenja u reasoning-u: Znatno niže performanse u apstraktnoj logici (12% ARC-AGI v2) u poređenju sa flagship modelima specijalizovanim za reasoning.
Agresivno niske cene: Sa cenom od 0,25 $/M input tokens, košta otprilike 1/8 cene Gemini 3.1 Pro modela, dok zadržava visoku opštu inteligenciju.
Nedostaci u matematici: Poteškoće sa matematikom vrhunskog nivoa, sa rezultatom od samo 25% na AIME 2025 u poređenju sa 90%+ kod frontier model-a.
Superiorna izvorna multimodalnost: Izuzetne performanse u vision zadacima (92% DocVQA) i videu (84,8% VideoMMMU) bez potrebe za zasebnim koderima.
Kalibracija činjenične tačnosti: Suočava se sa većom stopom halucinacija u zadacima traženja činjenica (43,3% SimpleQA) nego alternative u Pro klasi ili frontier model-i.
Granularna kontrola resursa: Prvi model koji nudi preciznu kontrolu nad dubinom reasoning-a, omogućavajući optimizaciju odnosa cene i performansi.
Odstupanje od instrukcija: Povremeno može propustiti sitna ograničenja formatiranja u ekstremno dugim i kompleksnim instrukcijama u više koraka.

АПИ брзи старт

google/gemini-3.1-flash-lite-preview

Погледај документацију
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

Инсталирајте SDK и почните са АПИ позивима за неколико минута.

Шта људи кажу о моделу Gemini 3.1 Flash-Lite

Погледајте шта заједница мисли о моделу Gemini 3.1 Flash-Lite

Flash-lite je ludački brz i efikasan za specifične workflow-e poput sumiranja... ovo je dobrodošao skok u brzini.
reddit user
reddit
Gemini 3.1 Flash-Lite je tihi 'presudni udarac' za provajdere API-ja srednjeg ranga... kriva troškova se brzo akumulira.
@9chaku
twitter
3.1 Flash-Lite nadmašuje 2.5 Flash u većini benchmark-ova, a pritom je prava mala 'zver' po brzini!
Tulsee Doshi
twitter
Za bildere koji pokreću AI agents u velikom obimu, ovo je model koji 'always-on' pristup čini zaista pristupačnim. 363 t/s je neverovatno.
@prince_twets
twitter
Cene su sulude. 0,25 $ za 1M input čini jeftinijim ubacivanje čitavih repozitorijuma u context nego pravljenje RAG-a.
reddit user
reddit
Brzina do prvog token-a je praktično trenutna. Prvi put da model deluje brže od mog kucanja.
DevGuru
hackernews

Видео снимци о моделу Gemini 3.1 Flash-Lite

Гледајте туторијале, рецензије и дискусије о моделу Gemini 3.1 Flash-Lite

Cena je 25 centi na 1 milion input tokens i 1,50 $ na 1 milion output tokens... i dalje veoma konkurentno s obzirom na brzinu.

Smatram da je ovaj model potcenjen za kôdiranje, posebno za front-end development, i isporučuje tokens izuzetno brzo.

Ovo je zaista usmereno ka developerima kojima je potreban scale bez latency-a koji ima Pro model.

Multimodalnost ovde nije samo marketinški trik; sa lakoćom obrađuje kompleksne PDF fajlove.

Google zaista pomera granice onoga što jedan 'lite' model može da postigne u 2026. godini.

Ovaj put, to je Gemini 3.1 Flash Lite, koji bi trebalo da bude brža i manje skupa verzija Flash modela.

Ovi modeli su neophodni jer želite da ih koristite u aplikacijama gde vam je potreban visok throughput.

Context window od 1 milion je sada standard za Gemini, ali videti to na ovoliko brzom modelu je impresivno.

Neće pobediti na matematičkoj olimpijadi, ali je savršen za ekstrakciju i sumiranje podataka.

API latency je značajno niži nego kod GPT-4o-mini u mojim ranim testovima.

Ovaj novi AI model iz Google-a je 45% brži... i mogao bi promeniti način na koji svako od nas gradi sa AI-jem.

Low thinking mode za brze, jednostavne stvari. High thinking mode za teške zadatke... ta fleksibilnost je ono što razlikuje igračku od pravog alata.

Za SEO zadatke, ovo će biti moj glavni alat zbog cene.

Činjenica da može da vidi video i razume kontekst gotovo trenutno menja pravila igre za kreatore sadržaja.

Google trenutno zaista otežava opravdavanje korišćenja drugih provajdera za zadatke velikog obima.

Vise od samo promptova

Побољшајте свој радни ток са AI Automatizacijom

Automatio kombinuje moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao da postignete vise za manje vremena.

АИ Агенти
Веб Аутоматизација
Паметни Токови

Pro Saveti za Gemini 3.1 Flash-Lite

Stručni saveti za maksimalno iskorišćenje Gemini 3.1 Flash-Lite.

Iskoristite Thinking Levels

Podesite thinking_level na 'minimal' za jednostavne zadatke poput klasifikacije kako biste maksimalno povećali brzinu, a koristite 'high' za generisanje strukturiranog koda.

Izvorna video analiza

Ubacite sirove video fajlove direktno u API za brži uvid u vizuelne događaje i audio signale istovremeno, zaobilazeći korake transkripcije.

Context umesto RAG-a

Za setove podataka manje od 1M tokens, ubacite čitav set dokumenata u context window kako biste eliminisali greške pri pretrazi i troškove vector DB-a.

Optimizujte uz Batching

Koristite batching API za zadatke koji nisu hitni kako biste dodatno smanjili troškove, jer je Flash-Lite specifično optimizovan za asinhronu obradu.

Сведочанства

Sta Kazu Nasi Korisnici

Pridruzite se hiljadama zadovoljnih korisnika koji su transformisali svoj radni tok

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Често Постављана Питања о Gemini 3.1 Flash-Lite

Пронађите одговоре на честа питања о Gemini 3.1 Flash-Lite