Скільки коштує Gemini 3.1 Flash-Lite?

Він коштує $0.25 за 1 мільйон вхідних tokens та $1.50 за 1 мільйон вихідних tokens.

Чи є безкоштовний рівень доступу для розробників?

Так, він доступний безкоштовно у режимі попереднього перегляду через Google AI Studio для тестування та експериментів.

Який максимальний розмір context window?

Модель підтримує до 1 048 576 tokens, що дозволяє обробляти приблизно 700 000 слів.

Чи можу я обробляти відеофайли за допомогою цієї моделі?

Так, він може нативно обробляти відеофайли тривалістю до 1 години або розміром до 1.5 ГБ.

Що таке Thinking Levels?

Цей parameter дозволяє контролювати час внутрішнього reasoning, який модель витрачає на розв'язання задачі перед генерацією відповіді.

Як він порівнюється з Claude 4.5 Haiku?

Gemini 3.1 Flash-Lite приблизно в 4 рази дешевший за вихідні tokens і при цьому перевершує Haiku у benchmark на reasoning GPQA.

Чи підтримує він function calling?

Так, він має повну підтримку використання інструментів та виклику функцій (function calling) для створення автономних agentic робочих процесів.

Яка швидкість генерації моделі?

Модель досягає швидкості 363 tokens на секунду, що робить її ідеальною для застосунків, чутливих до latency.

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite — найшвидша та найекономічніша модель Google. Має 1М context, нативну multimodality та швидкість 363 tokens/сек для масштабування.

MultimodalВисока швидкістьЕкономічністьGoogle Gemini

googleGemini 3.13 березня 2026

Контекст

1.0Mтокенів

Макс. вивід

66Kтокенів

Ціна вводу

$0.25/ 1M

Ціна виводу

$1.50/ 1M

Модальність:TextImageAudioVideo

Можливості:ЗірІнструментиПотокова передача

Бенчмарки

GPQA

86.9%

HLE

16%

MMLU

88.9%

MMLU Pro

80%

SimpleQA

43.3%

IFEval

85%

AIME 2025

25%

MATH

78%

GSM8k

95%

MGSM

92%

MathVista

75%

SWE-Bench

35%

HumanEval

88%

LiveCodeBench

72%

MMMU

76.8%

MMMU Pro

76.8%

ChartQA

91%

DocVQA

92%

Terminal-Bench

55%

ARC-AGI

12%

Переглянути документацію API

Про Gemini 3.1 Flash-Lite

Дізнайтеся про можливості Gemini 3.1 Flash-Lite, функції та як це може допомогти вам досягти кращих результатів.

Gemini 3.1 Flash-Lite розроблена для AI-застосунків з високим навантаженням, де швидкість обробки є головною технічною вимогою. На відміну від більших моделей Pro, Flash-Lite використовує оптимізовану архітектуру, що пріоритезує throughput, досягаючи 363 tokens на секунду. Вона слугує спеціалізованим інструментом для розробників, які створюють голосові агенти в реальному часі, автоматизовані системи модерації контенту та масштабні пайплайни вилучення даних, що мають залишатися економічно вигідними при великому трафіку.

Попри маркування «lite», модель підтримує context window обсягом 1 мільйон tokens. Вона може приймати сирі аудіофайли, годинні відео та сотні сторінок PDF в одному запиті. Впровадивши Thinking Levels, Google дозволяє користувачам обирати між майже миттєвими відповідями для простих завдань і глибшою фазою reasoning для складної логіки. Це забезпечує різні профілі продуктивності в межах одного API endpoint для балансування між вартістю та точністю.

Модель є нативно мультимодальною, що виключає потребу в зовнішніх інструментах для транскрибації аудіо чи опису зображень перед обробкою. Ця вбудована можливість покращує роботу з візуальними завданнями, такими як відповіді на запитання за документами та аналіз графіків. Розробники можуть використовувати parameter thinking_level для регулювання внутрішнього часу reasoning, ефективно масштабуючи зусилля моделі залежно від специфічної складності кожного запиту.

Випадки використання для Gemini 3.1 Flash-Lite

Відкрийте різні способи використання Gemini 3.1 Flash-Lite для досягнення чудових результатів.

Високооб'ємний переклад

Обробка тисяч багатомовних повідомлень у чатах або тікетів підтримки в реальному часі з sub-second latency.

Інтелектуальна маршрутизація моделей

Використання як швидкого класифікатора для визначення того, чи потрібно передавати запити до дорожчих моделей.

Мультимодальна модерація контенту

Сканування великих пакетів зображень і відео від користувачів на відповідність правилам безпеки з низькими витратами.

Прототипування інтерфейсів у реальному часі

Генерація функціональних React або Tailwind компонентів з намальованих від руки макетів або словесних описів.

Підсумовування довгих документів

Стиснення величезних юридичних архівів або технічних посібників без втрати контексту в межах 1М token вікна.

Транскрибація аудіо в реальному часі

Перетворення годинних записів нарад або лекцій у структуровані резюме та переліки завдань за один прохід.

Сильні сторони

Обмеження

Вражаюча продуктивність: Зі швидкістю 363 tokens на секунду це одна з найшвидших моделей у галузі для миттєвої реакції.

Низька фактологічна точність: Результат SimpleQA 43.3% вказує на високий ризик галюцинацій для загальних знань без використання grounding.

Розширений reasoning: Досягаючи 86.9% у GPQA Diamond, модель забезпечує наукову логіку рівня PhD у полегшеному форматі.

Підвищення ціни: Вона значно дорожча, ніж попередня модель Gemini 2.5 Flash-Lite, яку вона замінює в лінійці.

Динамічний контроль витрат: Parameter Thinking Levels дозволяє детально керувати витратами на обчислення для кожного запиту окремо.

Вища latency при високому рівні мислення: Використання високого рівня мислення додає приблизно 7-10 секунд попередніх обчислень перед початком генерації.

Уніфікована multimodality: Нативне завантаження аудіо, відео та PDF усуває потребу в складних пайплайнах з кількома моделями.

Відмови з питань безпеки: Внутрішнє тестування показує падіння узгодженості безпеки «зображення-в-текст» на 21.7% під час стрес-тестів.

Швидкий старт API

google/gemini-3.1-flash-lite-preview

Переглянути документацію

google SDK

import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Встановіть SDK і почніть робити API-виклики за лічені хвилини.

Що кажуть люди про Gemini 3.1 Flash-Lite

Подивіться, що думає спільнота про Gemini 3.1 Flash-Lite

“Можливості кодування 3.1 Flash-Lite напрочуд гарні для фронтенд-розробки; вона ідеально закодувала переглядач на 360 градусів.”

— WorldofAI

youtube

“Gemini 3.1 Flash-Lite, це модель для створення постійно активних мультимодальних AI Agents. Вона читає, з'єднує та консолідує все.”

— Shubham Saboo

twitter

“Ціна стала шоком. Стрибок у 3.75 раза на вихідних tokens буде болючим, якщо у вас обмежений хмарний бюджет.”

— Binary Verse AI

youtube

“Вона перекладає тягар складності з архітектури вашої інженерної команди на інфраструктуру Google.”

— Julian Goldie

youtube

“Ще одне зниження ціни за інтелект. Висока швидкість, низька вартість, високий інтелект. Чудова модель для agentic маршрутизації.”

— ctgtplb

twitter

“1М контексту залишається головною перевагою. Я можу закинути цілі папки репозиторіїв, і все просто працює з TTFT менш ніж за секунду.”

— DevFlow_26

Відео про Gemini 3.1 Flash-Lite

Дивіться навчальні матеріали, огляди та обговорення про Gemini 3.1 Flash-Lite

“Здається, вони якимось чином змогли вмістити багато інтелекту в цю модель.”

“Я б використовував її для завдань з високою пропускною здатністю, які чітко визначені.”

“Можливості фронтенд-генерації у Flash-Lite навіть кращі, ніж у більшості моделей, з якими я працював.”

“Вона буквально створила повністю функціональний переглядач за один запит.”

“Ця модель ідеальна для тих, кому потрібна швидкість без втрати всієї логіки.”

“Цю модель ми називаємо робочою конячкою... спеціально розробленою для завдань з високою пропускною здатністю.”

“Якщо запустити її з мінімальним бюджетом на мислення, вона фактично працює як модель без reasoning і надзвичайно швидко.”

“Вона зробила надзвичайно гарну роботу над вебсайтом, який ми отримали на виході.”

“Співвідношення швидкості до вартості, це справжня причина, чому варто переносити сюди свої продакшн-застосунки.”

“Вона обробляє мультимодальні вхідні дані нативно, що є величезною перевагою перед конкурентами.”

“Показник майже 87% у GPQA Diamond для моделі, позначеної як «lite», руйнує всю нашу систему категоризації.”

“Не використовуйте цю модель як оракул фактів... ви повинні надавати факти їй.”

“З 3.1 Flash-Lite ви уникаєте запуску трьох інших мікросервісів... ця простота вартує реальних грошей.”

“45-відсоткове збільшення швидкості виводу відчувається миттєво під час потокової передачі відповіді.”

“Ви отримуєте 1М контексту за копійки, що все ще здається магією в продакшні.”

Більше ніж просто промпти

Прискорте вашу роботу з AI-автоматизацією

Automatio поєднує силу AI-агентів, веб-автоматизації та розумних інтеграцій, щоб допомогти вам досягти більшого за менший час.

AI-агенти

Веб-автоматизація

Розумні робочі процеси

Почати безкоштовно

Професійні поради для Gemini 3.1 Flash-Lite

Експертні поради, які допоможуть вам отримати максимум від Gemini 3.1 Flash-Lite та досягти кращих результатів.

Налаштування Thinking Levels

Використовуйте мінімальний рівень мислення для класифікації, щоб зменшити витрати, але перемикайтеся на високий для складних завдань з програмування.

Увімкнення Grounding

Завжди використовуйте Google Search grounding для завдань, що потребують фактологічної точності, оскільки базова точність фактів нижча.

Завантаження сирих файлів

Уникайте попередньої обробки аудіо чи відео в текст; замість цього завантажуйте сирі файли, щоб використовувати переваги нативної multimodality.

Використання System Instructions

Суворо дотримуйтесь JSON схем за допомогою parameter system_instruction, щоб мінімізувати кількість tokens для виправлення виводу.

Відгуки

Що кажуть наші користувачі

Приєднуйтесь до тисяч задоволених користувачів, які трансформували свою роботу

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Пов'язані AI Models

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context

$1.00/$3.20/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context

$1.75/$14.00/1M

Часті запитання про Gemini 3.1 Flash-Lite

Знайдіть відповіді на поширені запитання про Gemini 3.1 Flash-Lite