google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite — самая быстрая и экономичная модель Google. Имеет 1M context, нативную мультимодальность и скорость 363 tokens/сек для масштабирования.

MultimodalHigh SpeedCost EfficientGoogle Gemini
google logogoogleGemini 3.13 марта 2026 г.
Контекст
1.0Mтокенов
Макс. вывод
66Kтокенов
Цена ввода
$0.25/ 1M
Цена вывода
$1.50/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передача
Бенчмарки
GPQA
86.9%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Gemini 3.1 Flash-Lite набрал 86.9% в этом бенчмарке.
HLE
16%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Gemini 3.1 Flash-Lite набрал 16% в этом бенчмарке.
MMLU
88.9%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Gemini 3.1 Flash-Lite набрал 88.9% в этом бенчмарке.
MMLU Pro
80%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Gemini 3.1 Flash-Lite набрал 80% в этом бенчмарке.
SimpleQA
43.3%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Gemini 3.1 Flash-Lite набрал 43.3% в этом бенчмарке.
IFEval
85%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Gemini 3.1 Flash-Lite набрал 85% в этом бенчмарке.
AIME 2025
25%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Gemini 3.1 Flash-Lite набрал 25% в этом бенчмарке.
MATH
78%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Gemini 3.1 Flash-Lite набрал 78% в этом бенчмарке.
GSM8k
95%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Gemini 3.1 Flash-Lite набрал 95% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Gemini 3.1 Flash-Lite набрал 92% в этом бенчмарке.
MathVista
75%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Gemini 3.1 Flash-Lite набрал 75% в этом бенчмарке.
SWE-Bench
35%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Gemini 3.1 Flash-Lite набрал 35% в этом бенчмарке.
HumanEval
88%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Gemini 3.1 Flash-Lite набрал 88% в этом бенчмарке.
LiveCodeBench
72%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Gemini 3.1 Flash-Lite набрал 72% в этом бенчмарке.
MMMU
76.8%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Gemini 3.1 Flash-Lite набрал 76.8% в этом бенчмарке.
MMMU Pro
76.8%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Gemini 3.1 Flash-Lite набрал 76.8% в этом бенчмарке.
ChartQA
91%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Gemini 3.1 Flash-Lite набрал 91% в этом бенчмарке.
DocVQA
92%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Gemini 3.1 Flash-Lite набрал 92% в этом бенчмарке.
Terminal-Bench
55%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Gemini 3.1 Flash-Lite набрал 55% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Gemini 3.1 Flash-Lite набрал 12% в этом бенчмарке.

О модели Gemini 3.1 Flash-Lite

Узнайте о возможностях, функциях и способах использования Gemini 3.1 Flash-Lite.

Gemini 3.1 Flash-Lite разработана для ИИ-приложений с большими объемами данных, где скорость обработки является ключевым техническим требованием. В отличие от более крупных моделей Pro, Flash-Lite использует оптимизированную архитектуру, ориентированную на пропускную способность, достигая 363 tokens в секунду. Она служит специализированным инструментом для разработчиков, создающих голосовых агентов реального времени, автоматизированные системы модерации контента и крупномасштабные конвейеры извлечения данных, которые должны сохранять экономическую эффективность при высоких нагрузках.

Несмотря на обозначение «lite», модель сохраняет context window в 1 миллион tokens. Она может принимать исходные аудиофайлы, часовые видео и сотни страниц PDF в одном запросе. Внедряя Thinking Levels, Google позволяет пользователям выбирать между почти мгновенными ответами для простых задач и фазой глубокого reasoning для сложной логики. Это предоставляет несколько профилей производительности в рамках одной точки API для балансировки затрат и точности.

Модель нативно мультимодальна, что исключает необходимость в сторонних инструментах для транскрибации аудио или описания изображений перед обработкой. Эта нативная возможность улучшает производительность в визуальных задачах, таких как ответы на вопросы по документам и анализ графиков. Разработчики могут использовать параметр thinking_level для настройки времени внутреннего мышления, эффективно масштабируя усилия модели в зависимости от сложности каждого запроса.

Gemini 3.1 Flash-Lite

Варианты использования Gemini 3.1 Flash-Lite

Откройте для себя различные способы использования Gemini 3.1 Flash-Lite для достижения отличных результатов.

Масштабируемый перевод

Обработка тысяч многоязычных чатов или тикетов поддержки в реальном времени с sub-second latency.

Интеллектуальная маршрутизация моделей

Использование в качестве быстрого классификатора для определения того, нужно ли перенаправлять входящие запросы к более дорогим моделям.

Мультимодальная модерация контента

Сканирование больших массивов пользовательских изображений и видео на предмет соответствия правилам безопасности с низкими затратами.

Прототипирование UI в реальном времени

Генерация функциональных React или Tailwind компонентов из набросков или словесных описаний.

Саммаризация длинных документов

Сжатие массивных юридических архивов или технических руководств без потери контекста в рамках 1M token window.

Транскрибация аудио в реальном времени

Преобразование многочасовых записей совещаний или лекций в структурированные резюме и списки задач за один проход.

Преимущества

Ограничения

Высочайшая производительность: С показателем 363 tokens в секунду это одна из самых быстрых моделей в индустрии для мгновенного отклика.
Низкая точность фактических данных: Результат SimpleQA 43,3% указывает на высокий риск галлюцинаций при работе с общими знаниями без использования grounding.
Продвинутый reasoning: Показатель 86,9% в GPQA Diamond обеспечивает научную логику уровня PhD в облегченной версии модели.
Увеличение цены: Она значительно дороже предшественницы Gemini 2.5 Flash-Lite, которую заменяет в линейке.
Динамический контроль затрат: Параметр Thinking Levels позволяет гибко управлять расходами на вычисления для каждого запроса.
Повышенная latency при глубоком мышлении: Использование высокого уровня Thinking добавляет примерно 7–10 секунд предварительных вычислений перед началом генерации.
Единая мультимодальность: Нативная обработка аудио, видео и PDF исключает необходимость в сложных конвейерах оркестрации нескольких моделей.
Отказы системы безопасности: Внутреннее тестирование показывает падение консистентности безопасности при преобразовании изображения в текст на 21,7% во время red-teaming упражнений.

Быстрый старт API

google/gemini-3.1-flash-lite-preview

Посмотреть документацию
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Gemini 3.1 Flash-Lite

Посмотрите, что думает сообщество о Gemini 3.1 Flash-Lite

Способности 3.1 Flash-Lite к программированию удивительно хороши для фронтенд-разработки; она идеально написала 360-градусный вьюер.
WorldofAI
youtube
Gemini 3.1 Flash-Lite, это модель для создания мультимодальных AI-агентов, работающих постоянно. Она читает, связывает и объединяет всё.
Shubham Saboo
twitter
Ценообразование, большой шок. Рост в 3,75 раза на выходные tokens будет ощутимым, если у вас ограничен бюджет в облаке.
Binary Verse AI
youtube
Она перекладывает бремя сложности с архитектуры вашей команды инженеров на инфраструктуру Google.
Julian Goldie
youtube
Очередное снижение цены за интеллект. Высокая скорость, низкая стоимость, высокий интеллект. Отличная модель для агентной маршрутизации.
ctgtplb
twitter
1M контекста, всё еще киллер-фича. Я могу загрузить целые папки репозиториев, и всё работает с TTFT менее секунды.
DevFlow_26
reddit

Видео о Gemini 3.1 Flash-Lite

Смотрите обучающие материалы, обзоры и обсуждения о Gemini 3.1 Flash-Lite

Похоже, им удалось втиснуть в эту модель поразительный уровень интеллекта.

Я бы использовал её для задач с высокой пропускной способностью, которые хорошо определены.

Возможности фронтенд-разработки у Flash-Lite даже лучше, чем у большинства моделей, с которыми я работал.

Она буквально создала полностью функциональный вьюер с первой попытки.

Эта модель идеальна для тех, кому нужна скорость без потери логики.

Это «рабочая лошадка», специально разработанная для задач с высокой пропускной способностью.

Если запустить её с минимальным бюджетом мышления, она работает как модель без reasoning и делает это невероятно быстро.

Она проделала отличную работу над сайтом, который мы получили в результате.

Соотношение скорости и стоимости, главная причина для переноса ваших продакшн-приложений сюда.

Она обрабатывает мультимодальные входы нативно, что является огромным преимуществом перед конкурентами.

Показатель почти 87% в GPQA Diamond у модели с маркировкой lite рушит всю нашу систему классификации.

Не используйте эту модель как источник фактов… вы должны сами предоставлять ей факты.

С 3.1 Flash-Lite вы избавляетесь от необходимости запускать три других микросервиса… эта простота стоит реальных денег.

Прирост скорости вывода на 45% ощущается сразу же при стриминговом ответе.

Вы получаете 1M контекста за копейки, что в продакшене до сих пор кажется магией.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Gemini 3.1 Flash-Lite

Экспертные советы для максимальной эффективности Gemini 3.1 Flash-Lite.

Настройка Thinking Levels

Используйте минимальный уровень мышления для классификации, чтобы снизить расходы, но переключайтесь на высокий для сложных задач программирования.

Включение Grounding

Всегда используйте Google Search grounding для задач, требующих точных фактов, так как базовая фактическая точность модели ниже.

Загрузка исходных файлов

Избегайте предварительной обработки аудио или видео в текст; вместо этого загружайте исходные файлы для использования преимуществ нативной мультимодальности.

Использование System Instructions

Строго соблюдайте JSON-схемы, используя параметр system_instruction, чтобы минимизировать количество корректирующих tokens в выводе.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Часто задаваемые вопросы о Gemini 3.1 Flash-Lite

Найдите ответы на частые вопросы о Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite: 1M Context, скорость 363 tokens/сек