google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite — найшвидша та найекономічніша модель Google. Має 1М context, нативну multimodality та швидкість 363 tokens/сек для масштабування.

MultimodalВисока швидкістьЕкономічністьGoogle Gemini
google logogoogleGemini 3.13 березня 2026
Контекст
1.0Mтокенів
Макс. вивід
66Kтокенів
Ціна вводу
$0.25/ 1M
Ціна виводу
$1.50/ 1M
Модальність:TextImageAudioVideo
Можливості:ЗірІнструментиПотокова передача
Бенчмарки
GPQA
86.9%
GPQA: Наукові питання рівня аспірантури. Строгий бенчмарк з 448 питаннями з біології, фізики та хімії. Експерти PhD досягають лише 65-74% точності. Gemini 3.1 Flash-Lite набрав 86.9% у цьому бенчмарку.
HLE
16%
HLE: Експертне міркування високого рівня. Тестує здатність моделі демонструвати міркування експертного рівня в спеціалізованих областях. Gemini 3.1 Flash-Lite набрав 16% у цьому бенчмарку.
MMLU
88.9%
MMLU: Масове багатозадачне розуміння мови. Комплексний бенчмарк з 16 000 питань з 57 академічних предметів. Gemini 3.1 Flash-Lite набрав 88.9% у цьому бенчмарку.
MMLU Pro
80%
MMLU Pro: MMLU Професійна версія. Покращена версія MMLU з 12 032 питаннями та складнішим форматом з 10 варіантами відповідей. Gemini 3.1 Flash-Lite набрав 80% у цьому бенчмарку.
SimpleQA
43.3%
SimpleQA: Бенчмарк фактичної точності. Тестує здатність моделі надавати точні, фактичні відповіді. Gemini 3.1 Flash-Lite набрав 43.3% у цьому бенчмарку.
IFEval
85%
IFEval: Оцінка виконання інструкцій. Вимірює, наскільки добре модель виконує конкретні інструкції та обмеження. Gemini 3.1 Flash-Lite набрав 85% у цьому бенчмарку.
AIME 2025
25%
AIME 2025: Американський запрошувальний математичний іспит. Математичні задачі змагального рівня з престижного іспиту AIME. Gemini 3.1 Flash-Lite набрав 25% у цьому бенчмарку.
MATH
78%
MATH: Математичне розв'язування задач. Комплексний математичний бенчмарк, що тестує розв'язування задач з алгебри, геометрії, аналізу. Gemini 3.1 Flash-Lite набрав 78% у цьому бенчмарку.
GSM8k
95%
GSM8k: Математика початкової школи 8K. 8 500 математичних текстових задач рівня початкової школи. Gemini 3.1 Flash-Lite набрав 95% у цьому бенчмарку.
MGSM
92%
MGSM: Багатомовна математика початкової школи. Бенчмарк GSM8k, перекладений 10 мовами. Gemini 3.1 Flash-Lite набрав 92% у цьому бенчмарку.
MathVista
75%
MathVista: Математичне візуальне міркування. Тестує здатність розв'язувати математичні задачі з візуальними елементами. Gemini 3.1 Flash-Lite набрав 75% у цьому бенчмарку.
SWE-Bench
35%
SWE-Bench: Бенчмарк програмної інженерії. AI-моделі намагаються вирішити реальні проблеми GitHub у проектах Python. Gemini 3.1 Flash-Lite набрав 35% у цьому бенчмарку.
HumanEval
88%
HumanEval: Задачі програмування на Python. 164 задачі програмування, де моделі повинні згенерувати правильні реалізації функцій Python. Gemini 3.1 Flash-Lite набрав 88% у цьому бенчмарку.
LiveCodeBench
72%
LiveCodeBench: Живий бенчмарк програмування. Тестує здібності програмування на постійно оновлюваних реальних завданнях. Gemini 3.1 Flash-Lite набрав 72% у цьому бенчмарку.
MMMU
76.8%
MMMU: Мультимодальне розуміння. Бенчмарк мультимодального розуміння з 30 предметів університетського рівня. Gemini 3.1 Flash-Lite набрав 76.8% у цьому бенчмарку.
MMMU Pro
76.8%
MMMU Pro: MMMU Професійна версія. Покращена версія MMMU зі складнішими питаннями. Gemini 3.1 Flash-Lite набрав 76.8% у цьому бенчмарку.
ChartQA
91%
ChartQA: Відповіді на питання за діаграмами. Тестує здатність розуміти та аналізувати інформацію з діаграм і графіків. Gemini 3.1 Flash-Lite набрав 91% у цьому бенчмарку.
DocVQA
92%
DocVQA: Візуальні питання за документами. Тестує здатність витягувати інформацію із зображень документів. Gemini 3.1 Flash-Lite набрав 92% у цьому бенчмарку.
Terminal-Bench
55%
Terminal-Bench: Термінальні/CLI завдання. Тестує здатність виконувати операції командного рядка. Gemini 3.1 Flash-Lite набрав 55% у цьому бенчмарку.
ARC-AGI
12%
ARC-AGI: Абстракція та міркування. Тестує гнучкий інтелект через нові головоломки на розпізнавання патернів. Gemini 3.1 Flash-Lite набрав 12% у цьому бенчмарку.

Про Gemini 3.1 Flash-Lite

Дізнайтеся про можливості Gemini 3.1 Flash-Lite, функції та як це може допомогти вам досягти кращих результатів.

Gemini 3.1 Flash-Lite розроблена для AI-застосунків з високим навантаженням, де швидкість обробки є головною технічною вимогою. На відміну від більших моделей Pro, Flash-Lite використовує оптимізовану архітектуру, що пріоритезує throughput, досягаючи 363 tokens на секунду. Вона слугує спеціалізованим інструментом для розробників, які створюють голосові агенти в реальному часі, автоматизовані системи модерації контенту та масштабні пайплайни вилучення даних, що мають залишатися економічно вигідними при великому трафіку.

Попри маркування «lite», модель підтримує context window обсягом 1 мільйон tokens. Вона може приймати сирі аудіофайли, годинні відео та сотні сторінок PDF в одному запиті. Впровадивши Thinking Levels, Google дозволяє користувачам обирати між майже миттєвими відповідями для простих завдань і глибшою фазою reasoning для складної логіки. Це забезпечує різні профілі продуктивності в межах одного API endpoint для балансування між вартістю та точністю.

Модель є нативно мультимодальною, що виключає потребу в зовнішніх інструментах для транскрибації аудіо чи опису зображень перед обробкою. Ця вбудована можливість покращує роботу з візуальними завданнями, такими як відповіді на запитання за документами та аналіз графіків. Розробники можуть використовувати parameter thinking_level для регулювання внутрішнього часу reasoning, ефективно масштабуючи зусилля моделі залежно від специфічної складності кожного запиту.

Gemini 3.1 Flash-Lite

Випадки використання для Gemini 3.1 Flash-Lite

Відкрийте різні способи використання Gemini 3.1 Flash-Lite для досягнення чудових результатів.

Високооб'ємний переклад

Обробка тисяч багатомовних повідомлень у чатах або тікетів підтримки в реальному часі з sub-second latency.

Інтелектуальна маршрутизація моделей

Використання як швидкого класифікатора для визначення того, чи потрібно передавати запити до дорожчих моделей.

Мультимодальна модерація контенту

Сканування великих пакетів зображень і відео від користувачів на відповідність правилам безпеки з низькими витратами.

Прототипування інтерфейсів у реальному часі

Генерація функціональних React або Tailwind компонентів з намальованих від руки макетів або словесних описів.

Підсумовування довгих документів

Стиснення величезних юридичних архівів або технічних посібників без втрати контексту в межах 1М token вікна.

Транскрибація аудіо в реальному часі

Перетворення годинних записів нарад або лекцій у структуровані резюме та переліки завдань за один прохід.

Сильні сторони

Обмеження

Вражаюча продуктивність: Зі швидкістю 363 tokens на секунду це одна з найшвидших моделей у галузі для миттєвої реакції.
Низька фактологічна точність: Результат SimpleQA 43.3% вказує на високий ризик галюцинацій для загальних знань без використання grounding.
Розширений reasoning: Досягаючи 86.9% у GPQA Diamond, модель забезпечує наукову логіку рівня PhD у полегшеному форматі.
Підвищення ціни: Вона значно дорожча, ніж попередня модель Gemini 2.5 Flash-Lite, яку вона замінює в лінійці.
Динамічний контроль витрат: Parameter Thinking Levels дозволяє детально керувати витратами на обчислення для кожного запиту окремо.
Вища latency при високому рівні мислення: Використання високого рівня мислення додає приблизно 7-10 секунд попередніх обчислень перед початком генерації.
Уніфікована multimodality: Нативне завантаження аудіо, відео та PDF усуває потребу в складних пайплайнах з кількома моделями.
Відмови з питань безпеки: Внутрішнє тестування показує падіння узгодженості безпеки «зображення-в-текст» на 21.7% під час стрес-тестів.

Швидкий старт API

google/gemini-3.1-flash-lite-preview

Переглянути документацію
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Gemini 3.1 Flash-Lite

Подивіться, що думає спільнота про Gemini 3.1 Flash-Lite

Можливості кодування 3.1 Flash-Lite напрочуд гарні для фронтенд-розробки; вона ідеально закодувала переглядач на 360 градусів.
WorldofAI
youtube
Gemini 3.1 Flash-Lite, це модель для створення постійно активних мультимодальних AI Agents. Вона читає, з'єднує та консолідує все.
Shubham Saboo
twitter
Ціна стала шоком. Стрибок у 3.75 раза на вихідних tokens буде болючим, якщо у вас обмежений хмарний бюджет.
Binary Verse AI
youtube
Вона перекладає тягар складності з архітектури вашої інженерної команди на інфраструктуру Google.
Julian Goldie
youtube
Ще одне зниження ціни за інтелект. Висока швидкість, низька вартість, високий інтелект. Чудова модель для agentic маршрутизації.
ctgtplb
twitter
1М контексту залишається головною перевагою. Я можу закинути цілі папки репозиторіїв, і все просто працює з TTFT менш ніж за секунду.
DevFlow_26
reddit

Відео про Gemini 3.1 Flash-Lite

Дивіться навчальні матеріали, огляди та обговорення про Gemini 3.1 Flash-Lite

Здається, вони якимось чином змогли вмістити багато інтелекту в цю модель.

Я б використовував її для завдань з високою пропускною здатністю, які чітко визначені.

Можливості фронтенд-генерації у Flash-Lite навіть кращі, ніж у більшості моделей, з якими я працював.

Вона буквально створила повністю функціональний переглядач за один запит.

Ця модель ідеальна для тих, кому потрібна швидкість без втрати всієї логіки.

Цю модель ми називаємо робочою конячкою... спеціально розробленою для завдань з високою пропускною здатністю.

Якщо запустити її з мінімальним бюджетом на мислення, вона фактично працює як модель без reasoning і надзвичайно швидко.

Вона зробила надзвичайно гарну роботу над вебсайтом, який ми отримали на виході.

Співвідношення швидкості до вартості, це справжня причина, чому варто переносити сюди свої продакшн-застосунки.

Вона обробляє мультимодальні вхідні дані нативно, що є величезною перевагою перед конкурентами.

Показник майже 87% у GPQA Diamond для моделі, позначеної як «lite», руйнує всю нашу систему категоризації.

Не використовуйте цю модель як оракул фактів... ви повинні надавати факти їй.

З 3.1 Flash-Lite ви уникаєте запуску трьох інших мікросервісів... ця простота вартує реальних грошей.

45-відсоткове збільшення швидкості виводу відчувається миттєво під час потокової передачі відповіді.

Ви отримуєте 1М контексту за копійки, що все ще здається магією в продакшні.

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти
Веб-автоматизація
Розумні робочі процеси

Професійні поради для Gemini 3.1 Flash-Lite

Експертні поради, які допоможуть вам отримати максимум від Gemini 3.1 Flash-Lite та досягти кращих результатів.

Налаштування Thinking Levels

Використовуйте мінімальний рівень мислення для класифікації, щоб зменшити витрати, але перемикайтеся на високий для складних завдань з програмування.

Увімкнення Grounding

Завжди використовуйте Google Search grounding для завдань, що потребують фактологічної точності, оскільки базова точність фактів нижча.

Завантаження сирих файлів

Уникайте попередньої обробки аудіо чи відео в текст; замість цього завантажуйте сирі файли, щоб використовувати переваги нативної multimodality.

Використання System Instructions

Суворо дотримуйтесь JSON схем за допомогою parameter system_instruction, щоб мінімізувати кількість tokens для виправлення виводу.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Часті запитання про Gemini 3.1 Flash-Lite

Знайдіть відповіді на поширені запитання про Gemini 3.1 Flash-Lite