google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite to najszybszy i najbardziej wydajny kosztowo model Google. Posiada 1M kontekstu, natywną multimodality i prędkość 363 tokens/sec.

MultimodalnyWysoka prędkośćEfektywność kosztowaGoogle Gemini
google logogoogleGemini 3.13 marca 2026
Kontekst
1.0Mtokenow
Maks. wyjscie
66Ktokenow
Cena wejscia
$0.25/ 1M
Cena wyjscia
$1.50/ 1M
Modalnosc:TextImageAudioVideo
Mozliwosci:WizjaNarzedziaStreaming
Benchmarki
GPQA
86.9%
GPQA: Pytania naukowe poziomu doktoranckiego. Rygorystyczny benchmark z 448 pytaniami z biologii, fizyki i chemii. Eksperci PhD osiagaja tylko 65-74% dokładnosci. Gemini 3.1 Flash-Lite uzyskal 86.9% w tym benchmarku.
HLE
16%
HLE: Rozumowanie eksperckie wysokiego poziomu. Testuje zdolnosc modelu do demonstrowania rozumowania na poziomie eksperta w specjalistycznych dziedzinach. Gemini 3.1 Flash-Lite uzyskal 16% w tym benchmarku.
MMLU
88.9%
MMLU: Masowe wielozadaniowe rozumienie jezyka. Kompleksowy benchmark z 16 000 pytan z 57 przedmiotow akademickich. Gemini 3.1 Flash-Lite uzyskal 88.9% w tym benchmarku.
MMLU Pro
80%
MMLU Pro: MMLU Edycja Profesjonalna. Ulepszona wersja MMLU z 12 032 pytaniami i trudniejszym formatem 10 opcji. Gemini 3.1 Flash-Lite uzyskal 80% w tym benchmarku.
SimpleQA
43.3%
SimpleQA: Benchmark dokładnosci faktycznej. Testuje zdolnosc modelu do udzielania dokladnych, faktycznych odpowiedzi. Gemini 3.1 Flash-Lite uzyskal 43.3% w tym benchmarku.
IFEval
85%
IFEval: Ocena przestrzegania instrukcji. Mierzy jak dobrze model przestrzega konkretnych instrukcji i ograniczen. Gemini 3.1 Flash-Lite uzyskal 85% w tym benchmarku.
AIME 2025
25%
AIME 2025: Amerykanski Zaproszeniowy Egzamin Matematyczny. Zadania matematyczne poziomu konkursowego z prestizowego egzaminu AIME. Gemini 3.1 Flash-Lite uzyskal 25% w tym benchmarku.
MATH
78%
MATH: Rozwiazywanie problemow matematycznych. Kompleksowy benchmark matematyczny testujacy rozwiazywanie problemow z algebry, geometrii, analizy. Gemini 3.1 Flash-Lite uzyskal 78% w tym benchmarku.
GSM8k
95%
GSM8k: Matematyka szkoly podstawowej 8K. 8 500 zadan matematycznych poziomu szkoly podstawowej. Gemini 3.1 Flash-Lite uzyskal 95% w tym benchmarku.
MGSM
92%
MGSM: Wielojezyczna matematyka szkolna. Benchmark GSM8k przetlumaczony na 10 jezykow. Gemini 3.1 Flash-Lite uzyskal 92% w tym benchmarku.
MathVista
75%
MathVista: Matematyczne rozumowanie wizualne. Testuje zdolnosc rozwiazywania problemow matematycznych z elementami wizualnymi. Gemini 3.1 Flash-Lite uzyskal 75% w tym benchmarku.
SWE-Bench
35%
SWE-Bench: Benchmark inzynierii oprogramowania. Modele AI probuja rozwiazac prawdziwe problemy GitHub w projektach Python. Gemini 3.1 Flash-Lite uzyskal 35% w tym benchmarku.
HumanEval
88%
HumanEval: Zadania programistyczne Python. 164 zadania programistyczne, gdzie modele musza generowac poprawne implementacje funkcji Python. Gemini 3.1 Flash-Lite uzyskal 88% w tym benchmarku.
LiveCodeBench
72%
LiveCodeBench: Benchmark programowania na zywo. Testuje umiejetnosci programowania na ciagle aktualizowanych, rzeczywistych wyzwaniach. Gemini 3.1 Flash-Lite uzyskal 72% w tym benchmarku.
MMMU
76.8%
MMMU: Rozumienie multimodalne. Benchmark rozumienia multimodalnego z 30 przedmiotow uniwersyteckich. Gemini 3.1 Flash-Lite uzyskal 76.8% w tym benchmarku.
MMMU Pro
76.8%
MMMU Pro: MMMU Edycja Profesjonalna. Ulepszona wersja MMMU z trudniejszymi pytaniami. Gemini 3.1 Flash-Lite uzyskal 76.8% w tym benchmarku.
ChartQA
91%
ChartQA: Pytania i odpowiedzi o wykresach. Testuje zdolnosc rozumienia i analizowania informacji z wykresow i diagramow. Gemini 3.1 Flash-Lite uzyskal 91% w tym benchmarku.
DocVQA
92%
DocVQA: Wizualne pytania o dokumentach. Testuje zdolnosc wydobywania informacji z obrazow dokumentow. Gemini 3.1 Flash-Lite uzyskal 92% w tym benchmarku.
Terminal-Bench
55%
Terminal-Bench: Zadania terminal/CLI. Testuje zdolnosc wykonywania operacji wiersza polecen. Gemini 3.1 Flash-Lite uzyskal 55% w tym benchmarku.
ARC-AGI
12%
ARC-AGI: Abstrakcja i rozumowanie. Testuje plynna inteligencje poprzez nowe lamiglowki rozpoznawania wzorow. Gemini 3.1 Flash-Lite uzyskal 12% w tym benchmarku.

O Gemini 3.1 Flash-Lite

Dowiedz sie o mozliwosciach Gemini 3.1 Flash-Lite, funkcjach i jak moze pomoc Ci osiagnac lepsze wyniki.

Gemini 3.1 Flash-Lite został zaprojektowany z myślą o wymagających aplikacjach AI, gdzie szybkość przetwarzania jest głównym wymogiem technicznym. W przeciwieństwie do większych modeli Pro, Flash-Lite wykorzystuje usprawnioną architekturę, która stawia na throughput, osiągając 363 tokeny na sekundę. Służy jako specjalistyczne narzędzie dla deweloperów budujących głosowych agentów w czasie rzeczywistym, zautomatyzowane systemy moderacji treści oraz potoki ekstrakcji danych na dużą skalę, które muszą pozostać opłacalne przy dużym ruchu.

Mimo oznaczenia „lite”, model zachowuje okno kontekstowe 1 miliona tokenów. W jednym zapytaniu potrafi przetworzyć surowe pliki audio, godzinne filmy oraz setki stron PDF. Dzięki wprowadzeniu poziomów Thinking Levels, Google pozwala użytkownikom wybierać między natychmiastową odpowiedzią w prostych zadaniach a głębszą fazą wnioskowania w przypadku skomplikowanej logiki. Zapewnia to wiele profili wydajności w ramach jednego endpointu API, aby zbalansować koszt i dokładność.

Model jest natywnie multimodalny, co eliminuje potrzebę stosowania zewnętrznych narzędzi do transkrypcji audio czy opisywania obrazów przed ich przetworzeniem. Ta natywna zdolność poprawia wyniki w zadaniach wizualnych, takich jak odpowiadanie na pytania dotyczące dokumentów czy analiza wykresów. Deweloperzy mogą używać parametru thinking_level, aby dostosować czas wewnętrznego reasoningu, efektywnie skalując wysiłek modelu w zależności od specyficznej złożoności każdego zapytania.

Gemini 3.1 Flash-Lite

Przypadki uzycia dla Gemini 3.1 Flash-Lite

Odkryj rozne sposoby wykorzystania Gemini 3.1 Flash-Lite do osiagniecia swietnych wynikow.

Wielkoskalowe tłumaczenia

Przetwarzanie tysięcy wielojęzycznych wiadomości czatu lub zgłoszeń serwisowych w czasie rzeczywistym z latency poniżej sekundy.

Inteligentny routing modeli

Działanie jako szybki klasyfikator określający, czy przychodzące zapytania powinny zostać przekierowane do droższych modeli.

Multimodalna moderacja treści

Skanowanie dużych partii obrazów i filmów generowanych przez użytkowników pod kątem bezpieczeństwa przy niskim koszcie.

Prototypowanie UI w czasie rzeczywistym

Generowanie funkcjonalnych komponentów React lub Tailwind na podstawie odręcznych szkiców lub opisów słownych.

Podsumowywanie długich dokumentów

Streszczanie obszernych archiwów prawnych lub instrukcji technicznych bez utraty kontekstu w ramach 1M tokenów.

Transkrypcja audio na żywo

Konwertowanie godzinnych spotkań lub wykładów na ustrukturyzowane podsumowania i listę zadań w jednym przebiegu.

Mocne strony

Ograniczenia

Imponująca wydajność: Dzięki 363 tokens per second jest to jeden z najszybszych modeli w branży pod kątem responsywności w czasie rzeczywistym.
Niska wierność faktograficzna: Wynik SimpleQA na poziomie 43,3% wskazuje na wysokie ryzyko halucynacji w przypadku wiedzy ogólnej bez wsparcia groundingiem.
Zaawansowany reasoning: Osiągając 86,9% w GPQA Diamond, oferuje logikę naukową na poziomie doktoranckim w lekkim wydaniu.
Wzrost ceny: Model jest znacznie droższy niż Gemini 2.5 Flash-Lite, którego zastępuje w ofercie.
Dynamiczna kontrola kosztów: Parametr Thinking Levels pozwala na precyzyjne zarządzanie wydatkami na obliczenia dla każdego zapytania z osobna.
Wyższe latency przy wysokim poziomie reasoningu: Użycie wysokiego poziomu Thinking Levels dodaje około 7–10 sekund obliczeń wstępnych przed rozpoczęciem generowania.
Ujednolicona multimodality: Natywne przetwarzanie audio, wideo i plików PDF eliminuje potrzebę stosowania złożonych potoków z wieloma modelami.
Odmowy ze względów bezpieczeństwa: Testy wewnętrzne wykazują spadek spójności bezpieczeństwa image-to-text o 21,7% podczas ćwiczeń typu red-teaming.

Szybki start API

google/gemini-3.1-flash-lite-preview

Zobacz dokumentacje
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Zainstaluj SDK i zacznij wykonywac wywolania API w kilka minut.

Co mowia ludzie o Gemini 3.1 Flash-Lite

Zobacz, co spolecznosc mysli o Gemini 3.1 Flash-Lite

Zdolności kodowania 3.1 Flash-Lite są zaskakująco dobre w rozwoju front-endu; idealnie zakodował przeglądarkę 360 stopni.
WorldofAI
youtube
Gemini 3.1 Flash-Lite to model do budowania zawsze aktywnych, multimodalnych agentów AI. Czyta, łączy i konsoliduje wszystko.
Shubham Saboo
twitter
Cennik to ogromny szok. Skok o 3,75x na tokenach wyjściowych zaboli, jeśli masz napięty budżet chmurowy.
Binary Verse AI
youtube
Przenosi ciężar złożoności z architektury twojego zespołu inżynierskiego prosto na infrastrukturę Google.
Julian Goldie
youtube
Kolejna obniżka cen za inteligencję. Duża szybkość, niski koszt, wysoka inteligencja. Świetny model do agentic routingu.
ctgtplb
twitter
Kontekst 1M to nadal kluczowa funkcja. Mogę wrzucić całe foldery repozytorium i po prostu to działa z TTFT poniżej sekundy.
DevFlow_26
reddit

Filmy o Gemini 3.1 Flash-Lite

Ogladaj samouczki, recenzje i dyskusje o Gemini 3.1 Flash-Lite

Wydaje się, że jakimś cudem udało im się upchnąć sporo inteligencji w tym modelu.

Użyłbym go do zadań o wysokim throughput, które są dobrze zdefiniowane.

Możliwości front-endowe tego modelu są lepsze niż w większości modeli, z którymi faktycznie pracowałem.

Dosłownie stworzył w pełni funkcjonalną przeglądarkę za jednym razem.

Ten model jest idealny dla tych, którzy potrzebują szybkości bez poświęcania całej logiki.

Ten model to tak zwany „wół roboczy”... zaprojektowany specjalnie do zadań o wysokim throughput.

Jeśli uruchomisz go z minimalnym budżetem na myślenie, działa w zasadzie jako model bez dodatkowego reasoningu i jest ekstremalnie szybki.

Wykonał zadziwiająco dobrą robotę przy stronie internetowej, którą otrzymaliśmy jako wynik.

Stosunek szybkości do kosztu to prawdziwy powód, dla którego przeniósłbyś tutaj swoje aplikacje produkcyjne.

Natywnie obsługuje dane multimodalne, co jest ogromną przewagą nad konkurencją.

Osiągnięcie blisko 87% w GPQA Diamond przez model oznaczony jako „lite” wywraca do góry nogami nasz system kategoryzacji.

Nie używaj tego modelu jako wyroczni faktów... musisz dostarczyć mu fakty samodzielnie.

Z 3.1 Flash-Lite unikasz uruchamiania trzech innych mikroserwisów... ta prostota jest warta realne pieniądze.

45-procentowy wzrost szybkości wyjściowej jest odczuwalny natychmiast w streamowanej odpowiedzi.

Dostajesz 1M kontekstu za grosze, co w produkcji wciąż wydaje się magią.

Wiecej niz tylko prompty

Przyspiesz swoj workflow z automatyzacja AI

Automatio laczy moc agentow AI, automatyzacji web i inteligentnych integracji, aby pomoc Ci osiagnac wiecej w krotszym czasie.

Agenci AI
Automatyzacja web
Inteligentne workflow

Porady Pro dla Gemini 3.1 Flash-Lite

Wskazówki ekspertów, aby w pełni wykorzystać Gemini 3.1 Flash-Lite.

Ustawienie poziomów Thinking Levels

Używaj minimalnego poziomu dla zadań klasyfikacji, aby obniżyć koszty, ale przełączaj na wysoki w przypadku złożonych zadań programistycznych.

Włącz Grounding

Zawsze korzystaj z Google Search grounding dla zadań wymagających przywołania faktów, ponieważ podstawowa dokładność faktograficzna modelu jest niższa.

Przesyłaj surowe pliki

Unikaj wstępnego przetwarzania audio lub wideo na tekst; zamiast tego przesyłaj surowe pliki, aby w pełni wykorzystać natywną multimodality.

Stosuj System Instructions

Wymuszaj rygorystycznie schematy JSON przy użyciu parametru system_instruction, aby zminimalizować liczbę tokenów potrzebnych na poprawki wyjścia.

Opinie

Co mowia nasi uzytkownicy

Dolacz do tysiecy zadowolonych uzytkownikow, ktorzy przeksztalcili swoj workflow

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Powiazane AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Często Zadawane Pytania o Gemini 3.1 Flash-Lite

Znajdź odpowiedzi na częste pytania o Gemini 3.1 Flash-Lite