google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite — самая быстрая и экономичная модель Google. Context window 1M, нативная multimodal поддержка и скорость 363 tokens/сек для...

MultimodalВысокая скоростьЭкономичностьGoogle Gemini
google logogoogleGemini 3.12026-03-03
Контекст
1.0Mтокенов
Макс. вывод
66Kтокенов
Цена ввода
$0.25/ 1M
Цена вывода
$1.50/ 1M
Модальность:TextImageAudioVideo
Возможности:ЗрениеИнструментыПотоковая передача
Бенчмарки
GPQA
86.9%
GPQA: Научные вопросы уровня докторантуры. Строгий бенчмарк с 448 вопросами с множественным выбором по биологии, физике и химии, созданными экспертами в данных областях. Эксперты с PhD достигают лишь 65-74% точности, в то время как неспециалисты набирают только 34% даже при неограниченном доступе в интернет (отсюда название 'устойчивый к Google'). Gemini 3.1 Flash-Lite набрал 86.9% в этом бенчмарке.
HLE
16%
HLE: Рассуждение высокого уровня экспертизы. Тестирует способность модели демонстрировать рассуждения экспертного уровня в специализированных областях. Оценивает глубокое понимание сложных тем, требующих знаний профессионального уровня. Gemini 3.1 Flash-Lite набрал 16% в этом бенчмарке.
MMLU
88.9%
MMLU: Массовое многозадачное языковое понимание. Комплексный бенчмарк с 16 000 вопросами с множественным выбором по 57 академическим предметам, включая математику, философию, право и медицину. Тестирует широкие знания и способности к рассуждению. Gemini 3.1 Flash-Lite набрал 88.9% в этом бенчмарке.
MMLU Pro
80%
MMLU Pro: MMLU профессиональная версия. Улучшенная версия MMLU с 12 032 вопросами в более сложном формате с 10 вариантами ответа. Охватывает математику, физику, химию, право, инженерию, экономику, здравоохранение, психологию, бизнес, биологию, философию и информатику. Gemini 3.1 Flash-Lite набрал 80% в этом бенчмарке.
SimpleQA
43.3%
SimpleQA: Бенчмарк фактической точности. Тестирует способность модели давать точные, фактические ответы на прямые вопросы. Измеряет надежность и снижает галлюцинации в задачах извлечения знаний. Gemini 3.1 Flash-Lite набрал 43.3% в этом бенчмарке.
IFEval
85%
IFEval: Оценка следования инструкциям. Измеряет, насколько хорошо модель следует конкретным инструкциям и ограничениям. Тестирует способность соблюдать правила форматирования, ограничения длины и другие явные требования. Gemini 3.1 Flash-Lite набрал 85% в этом бенчмарке.
AIME 2025
25%
AIME 2025: Американский пригласительный математический экзамен. Математические задачи соревновательного уровня с престижного экзамена AIME, предназначенного для талантливых старшеклассников. Тестирует продвинутое математическое решение задач, требующее абстрактного мышления, а не просто сопоставления паттернов. Gemini 3.1 Flash-Lite набрал 25% в этом бенчмарке.
MATH
78%
MATH: Решение математических задач. Комплексный математический бенчмарк, тестирующий решение задач по алгебре, геометрии, анализу и другим математическим областям. Требует многошагового рассуждения и формальных математических знаний. Gemini 3.1 Flash-Lite набрал 78% в этом бенчмарке.
GSM8k
95%
GSM8k: Математика начальной школы 8K. 8 500 математических задач уровня начальной школы, требующих многошагового рассуждения. Тестирует базовую арифметику и логическое мышление через жизненные сценарии, такие как покупки или расчет времени. Gemini 3.1 Flash-Lite набрал 95% в этом бенчмарке.
MGSM
92%
MGSM: Многоязычная математика начальной школы. Бенчмарк GSM8k, переведенный на 10 языков, включая испанский, французский, немецкий, русский, китайский и японский. Тестирует математическое рассуждение на разных языках. Gemini 3.1 Flash-Lite набрал 92% в этом бенчмарке.
MathVista
75%
MathVista: Математическое визуальное рассуждение. Тестирует способность решать математические задачи, включающие визуальные элементы, такие как графики, геометрические диаграммы и научные рисунки. Сочетает визуальное понимание с математическим рассуждением. Gemini 3.1 Flash-Lite набрал 75% в этом бенчмарке.
SWE-Bench
35%
SWE-Bench: Бенчмарк программной инженерии. ИИ-модели пытаются решить реальные проблемы GitHub в проектах Python с открытым исходным кодом с человеческой верификацией. Тестирует практические навыки программной инженерии на производственных кодовых базах. Лучшие модели улучшились с 4,4% в 2023 до более 70% в 2024. Gemini 3.1 Flash-Lite набрал 35% в этом бенчмарке.
HumanEval
88%
HumanEval: Задачи программирования на Python. 164 вручную написанные задачи программирования, где модели должны генерировать правильные реализации функций Python. Каждое решение проверяется юнит-тестами. Лучшие модели теперь достигают более 90% точности. Gemini 3.1 Flash-Lite набрал 88% в этом бенчмарке.
LiveCodeBench
72%
LiveCodeBench: Бенчмарк живого кодирования. Тестирует навыки программирования на постоянно обновляемых задачах из реального мира. В отличие от статических бенчмарков, использует свежие задачи для предотвращения загрязнения данных и измерения реальных навыков кодирования. Gemini 3.1 Flash-Lite набрал 72% в этом бенчмарке.
MMMU
76.8%
MMMU: Мультимодальное понимание. Массовый мультидисциплинарный мультимодальный бенчмарк понимания, тестирующий модели зрения и языка на задачах университетского уровня по 30 предметам, требующим понимания изображений и экспертных знаний. Gemini 3.1 Flash-Lite набрал 76.8% в этом бенчмарке.
MMMU Pro
76.8%
MMMU Pro: MMMU профессиональная версия. Улучшенная версия MMMU с более сложными вопросами и строгой оценкой. Тестирует продвинутое мультимодальное рассуждение на профессиональном и экспертном уровнях. Gemini 3.1 Flash-Lite набрал 76.8% в этом бенчмарке.
ChartQA
91%
ChartQA: Вопросы и ответы по диаграммам. Тестирует способность понимать и рассуждать об информации, представленной в диаграммах и графиках. Требует извлечения данных, сравнения значений и выполнения вычислений из визуальных представлений данных. Gemini 3.1 Flash-Lite набрал 91% в этом бенчмарке.
DocVQA
92%
DocVQA: Визуальные Q&A по документам. Бенчмарк визуальных вопросов и ответов по документам, тестирующий способность извлекать и рассуждать об информации из изображений документов, включая формы, отчеты и отсканированный текст. Gemini 3.1 Flash-Lite набрал 92% в этом бенчмарке.
Terminal-Bench
55%
Terminal-Bench: Задачи Terminal/CLI. Тестирует способность выполнять операции командной строки, писать shell-скрипты и работать в терминальных средах. Измеряет практические навыки системного администрирования и рабочих процессов разработки. Gemini 3.1 Flash-Lite набрал 55% в этом бенчмарке.
ARC-AGI
12%
ARC-AGI: Абстракция и рассуждение. Корпус абстракции и рассуждения для AGI - тестирует флюидный интеллект через новые головоломки распознавания паттернов. Каждая задача требует обнаружения базового правила из примеров, измеряя общую способность к рассуждению, а не запоминание. Gemini 3.1 Flash-Lite набрал 12% в этом бенчмарке.

О модели Gemini 3.1 Flash-Lite

Узнайте о возможностях, функциях и способах использования Gemini 3.1 Flash-Lite.

Оптимизация для высокоскоростного интеллекта

Gemini 3.1 Flash-Lite — это высокоскоростная рабочая лошадка от Google, разработанная специально для масштабных рабочих нагрузок разработчиков, где низкая latency и эффективность затрат имеют первостепенное значение. Выпущенная 3 марта 2026 года, она является оптимизированным решением в серии Gemini 3.1, обеспечивая в 2.5 раза более быстрый time-to-first-token и увеличение скорости вывода на 45% по сравнению с предыдущими поколениями. Она способна выдавать поток более 360 tokens в секунду, что делает ее идеальной для приложений реального времени и масштабной обработки данных.

Нативно multimodal с context window 1M

Модель является нативно multimodal, поддерживая ввод текста, изображений, аудио, видео и PDF в рамках огромного context window объемом 1 миллион tokens. Это позволяет разработчикам обрабатывать гигантские наборы данных, такие как часовые видео или объемные юридические архивы, без необходимости создания сложных RAG-систем. Визуальные возможности модели особенно сильны: она отлично справляется с визуальным ответом на вопросы по документам и анализом графиков.

Гранулярный контроль для разработчиков

Отличительной особенностью является введение уровней 'Thinking Levels' (Minimal, Low, Medium, High). Этот параметр позволяет разработчикам точечно настраивать глубину reasoning модели в зависимости от сложности задачи. Такая гибкость гарантирует, что пользователи не будут переплачивать за простые задачи, такие как классификация, сохраняя при этом доступ к расширенной логике для более структурированных результатов, таких как генерация UI и извлечение данных.

Gemini 3.1 Flash-Lite

Варианты использования Gemini 3.1 Flash-Lite

Откройте для себя различные способы использования Gemini 3.1 Flash-Lite для достижения отличных результатов.

Масштабный перевод в реальном времени

Бесшовный перевод тысяч сообщений чатов или тикетов поддержки на более чем 100 языков с минимальной latency и высокой эффективностью затрат.

Multimodal модерация контента

Используйте нативную обработку видео и изображений для выявления неприемлемого контента в высоконагруженных лентах соцсетей или на видеоплатформах.

Автоматическое извлечение структурированных данных

Извлекайте сложные JSON-схемы из огромных архивов PDF или объемных юридических документов, используя context window в 1M tokens.

Гибкое прототипирование фронтенда

Быстрая генерация функциональных React/Tailwind UI-компонентов и лендингов со скоростью более 360 tokens в секунду для итеративного дизайна.

Agentic оркестрация задач

Обеспечьте работу AI agents в режиме 'всегда включен' для многоэтапного планирования, веб-поиска и использования инструментов без выхода за рамки бюджета на tokens.

Боты клиентской службы с низкой latency

Внедряйте разговорных ассистентов, которые мгновенно отвечают на запросы с возможностью настройки reasoning для простых и сложных вопросов.

Преимущества

Ограничения

Непревзойденная throughput: Поток 363 tokens в секунду, что на 45% быстрее, чем 2.5 Flash, для agentic приложений реального времени.
Потолок reasoning: Значительно более низкая производительность в задачах на абстрактную логику (12% ARC-AGI v2) по сравнению с flagship моделями, ориентированными на reasoning.
Агрессивная ценовая политика: При цене $0.25 за 1M input tokens стоимость примерно в 8 раз ниже, чем у Gemini 3.1 Pro, при сохранении высокого уровня общего интеллекта.
Пробелы в олимпиадной математике: Сложности с математикой элитного уровня: результат всего 25% на AIME 2025 по сравнению с 90%+ у frontier models.
Нативное multimodal мастерство: Исключительная производительность в визуальных задачах (92% DocVQA) и видео (84.8% VideoMMMU) без необходимости использования отдельных энкодеров.
Калибровка фактологии: Более высокий уровень галлюцинаций в задачах поиска фактов (43.3% SimpleQA), чем у версий Pro или других frontier alternatives.
Гранулярный контроль вычислений: Первая модель, предлагающая точный контроль над глубиной reasoning, что позволяет оптимизировать соотношение цены и производительности.
Дрейф инструкций: Может иногда упускать мелкие ограничения форматирования в экстремально длинных и сложных многоэтапных инструкциях.

Быстрый старт API

google/gemini-3.1-flash-lite-preview

Посмотреть документацию
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

Установите SDK и начните делать API-запросы за несколько минут.

Что люди говорят о Gemini 3.1 Flash-Lite

Посмотрите, что думает сообщество о Gemini 3.1 Flash-Lite

Flash lite безумно быстрая и эффективная для специфических рабочих процессов, таких как суммаризация... это приятный скачок скорости.
reddit user
reddit
Gemini 3.1 Flash-Lite — это тихий смертельный удар для провайдеров API среднего уровня... кривые затрат суммируются быстро.
@9chaku
twitter
3.1 Flash-Lite превосходит 2.5 Flash в большинстве benchmarks, оставаясь при этом настоящим скороходом!
Tulsee Doshi
twitter
Для разработчиков AI agents в масштабе это модель, которая делает режим 'всегда включен' действительно доступным. 363 t/s — это дико.
@prince_twets
twitter
Цена безумная. $0.25 за 1M input делает более выгодным просто скармливать целые репозитории в context, чем строить RAG.
reddit user
reddit
Speed to first token практически мгновенная. Впервые модель кажется быстрее, чем я печатаю.
DevGuru
hackernews

Видео о Gemini 3.1 Flash-Lite

Смотрите обучающие материалы, обзоры и обсуждения о Gemini 3.1 Flash-Lite

Цена составляет 25 центов за 1 миллион input tokens и $1.50 за 1 миллион output tokens... весьма конкурентоспособно, учитывая скорость.

Я считаю эту модель недооцененной для кодинга, особенно во фронтенд-разработке, она выдает tokens чрезвычайно быстро.

Это решение нацелено на разработчиков, которым нужно масштабирование без latency, присущей Pro модели.

Multimodality здесь — это не просто маркетинговый ход; модель с легкостью справляется со сложными PDF.

Google действительно раздвигает границы того, чего может достичь 'lite' модель в 2026 году.

На этот раз перед нами Gemini 3.1 Flash Light, которая должна быть более быстрой и менее дорогой версией модели Flash.

Такие модели необходимы для приложений, где требуется высокая throughput.

Context window в 1 миллион теперь стандарт для Gemini, но видеть его в такой быстрой модели — впечатляюще.

Она не выиграет математическую олимпиаду, но идеально подходит для экстракции и суммаризации.

В моих ранних тестах latency API значительно ниже, чем у GPT-4o-mini.

Эта новая AI модель от Google на 45% быстрее... и она может изменить то, как каждый из нас строит продукты с AI.

Режим Low thinking для простых вещей. Режим High thinking для тяжелой работы... именно эта гибкость отличает игрушку от реального инструмента.

Для задач SEO эта модель станет моим основным инструментом из-за ее цены.

Тот факт, что она может видеть видео и понимать контекст почти мгновенно, меняет правила игры для создателей контента.

Google делает очень сложным обоснование использования других провайдеров для высокообъемных задач прямо сейчас.

Больше чем просто промпты

Улучшите свой рабочий процесс с ИИ-Автоматизацией

Automatio объединяет мощь ИИ-агентов, веб-автоматизации и умных интеграций, чтобы помочь вам достигать большего за меньшее время.

ИИ Агенты
Веб Автоматизация
Умные Процессы

Советы для Gemini 3.1 Flash-Lite

Экспертные советы для максимальной эффективности Gemini 3.1 Flash-Lite.

Используйте уровни Thinking

Установите thinking_level на 'minimal' для простых задач вроде классификации, чтобы максимизировать скорость, но используйте 'high' для генерации структурированного кода.

Нативный анализ видео

Передавайте необработанные видеофайлы напрямую в API для быстрого анализа визуальных событий и аудиосигналов одновременно, минуя этап транскрибации.

Context вместо RAG

Для наборов данных менее 1M tokens загружайте весь пакет документов в context window, чтобы исключить ошибки извлечения и затраты на векторные БД.

Оптимизация через пакетную обработку

Используйте API для пакетной обработки (batching) несрочных задач, чтобы еще больше снизить расходы, так как Flash-Lite специально оптимизирована для асинхронной обработки.

Отзывы

Что Говорят Наши Пользователи

Присоединяйтесь к тысячам довольных пользователей, которые трансформировали свой рабочий процесс

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Похожие AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Часто задаваемые вопросы о Gemini 3.1 Flash-Lite

Найдите ответы на частые вопросы о Gemini 3.1 Flash-Lite