google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite é o model mais rápido e econômico do Google. Possui context window de 1M, multimodality nativa e velocidade de 363 tokens/seg para escala.

MultimodalAlta VelocidadeCusto-BenefícioGoogle Gemini
google logogoogleGemini 3.12026-03-03
Contexto
1.0Mtokens
Saida Max
66Ktokens
Preco Entrada
$0.25/ 1M
Preco Saida
$1.50/ 1M
Modalidade:TextImageAudioVideo
Capacidades:VisaoFerramentasStreaming
Benchmarks
GPQA
86.9%
GPQA: Q&A de Ciencias Avancadas. Um benchmark rigoroso com 448 questoes de multipla escolha em biologia, fisica e quimica criadas por especialistas. Especialistas com PhD alcancam apenas 65-74% de precisao. Gemini 3.1 Flash-Lite pontuou 86.9% neste benchmark.
HLE
16%
HLE: Raciocinio de Alto Nivel. Testa a capacidade de um modelo de demonstrar raciocinio de nivel especialista em dominios especializados. Gemini 3.1 Flash-Lite pontuou 16% neste benchmark.
MMLU
88.9%
MMLU: Compreensao de Linguagem Multitarefa. Um benchmark abrangente com 16.000 questoes de multipla escolha em 57 disciplinas academicas. Gemini 3.1 Flash-Lite pontuou 88.9% neste benchmark.
MMLU Pro
80%
MMLU Pro: MMLU Edicao Profissional. Uma versao aprimorada do MMLU com 12.032 questoes usando um formato mais dificil de multipla escolha com 10 opcoes. Gemini 3.1 Flash-Lite pontuou 80% neste benchmark.
SimpleQA
43.3%
SimpleQA: Benchmark de Precisao Factual. Testa a capacidade de um modelo de fornecer respostas precisas e factuais a perguntas diretas. Gemini 3.1 Flash-Lite pontuou 43.3% neste benchmark.
IFEval
85%
IFEval: Avaliacao de Seguimento de Instrucoes. Mede quao bem um modelo segue instrucoes e restricoes especificas. Gemini 3.1 Flash-Lite pontuou 85% neste benchmark.
AIME 2025
25%
AIME 2025: Exame de Matematica Invitacional Americano. Problemas de matematica de nivel competitivo do prestigiado exame AIME. Gemini 3.1 Flash-Lite pontuou 25% neste benchmark.
MATH
78%
MATH: Resolucao de Problemas Matematicos. Um benchmark abrangente de matematica testando resolucao de problemas em algebra, geometria, calculo e outros dominios. Gemini 3.1 Flash-Lite pontuou 78% neste benchmark.
GSM8k
95%
GSM8k: Matematica do Ensino Fundamental 8K. 8.500 problemas de matematica de nivel escolar fundamental que requerem raciocinio em multiplas etapas. Gemini 3.1 Flash-Lite pontuou 95% neste benchmark.
MGSM
92%
MGSM: Matematica Escolar Multilingue. O benchmark GSM8k traduzido para 10 idiomas. Gemini 3.1 Flash-Lite pontuou 92% neste benchmark.
MathVista
75%
MathVista: Raciocinio Visual Matematico. Testa a capacidade de resolver problemas de matematica que envolvem elementos visuais como graficos e diagramas. Gemini 3.1 Flash-Lite pontuou 75% neste benchmark.
SWE-Bench
35%
SWE-Bench: Benchmark de Engenharia de Software. Modelos de IA tentam resolver issues reais do GitHub em projetos Python de codigo aberto. Gemini 3.1 Flash-Lite pontuou 35% neste benchmark.
HumanEval
88%
HumanEval: Problemas de Programacao Python. 164 problemas de programacao escritos a mao onde modelos devem gerar implementacoes corretas de funcoes Python. Gemini 3.1 Flash-Lite pontuou 88% neste benchmark.
LiveCodeBench
72%
LiveCodeBench: Benchmark de Codificacao Ao Vivo. Testa habilidades de codificacao em desafios de programacao do mundo real continuamente atualizados. Gemini 3.1 Flash-Lite pontuou 72% neste benchmark.
MMMU
76.8%
MMMU: Compreensao Multimodal. Benchmark de Compreensao Multimodal Multidisciplinar testando modelos de visao-linguagem em problemas de nivel universitario. Gemini 3.1 Flash-Lite pontuou 76.8% neste benchmark.
MMMU Pro
76.8%
MMMU Pro: MMMU Edicao Profissional. Versao aprimorada do MMMU com questoes mais desafiadoras e avaliacao mais rigorosa. Gemini 3.1 Flash-Lite pontuou 76.8% neste benchmark.
ChartQA
91%
ChartQA: Resposta a Perguntas sobre Graficos. Testa a capacidade de entender e raciocinar sobre informacoes apresentadas em graficos. Gemini 3.1 Flash-Lite pontuou 91% neste benchmark.
DocVQA
92%
DocVQA: Q&A Visual de Documentos. Benchmark de Resposta a Perguntas Visuais de Documentos testando a capacidade de extrair informacoes de imagens de documentos. Gemini 3.1 Flash-Lite pontuou 92% neste benchmark.
Terminal-Bench
55%
Terminal-Bench: Tarefas de Terminal/CLI. Testa a capacidade de realizar operacoes de linha de comando e escrever scripts de shell. Gemini 3.1 Flash-Lite pontuou 55% neste benchmark.
ARC-AGI
12%
ARC-AGI: Abstracao e Raciocinio. Corpus de Abstracao e Raciocinio para AGI - testa inteligencia fluida atraves de quebra-cabecas de reconhecimento de padroes. Gemini 3.1 Flash-Lite pontuou 12% neste benchmark.

Sobre Gemini 3.1 Flash-Lite

Aprenda sobre as capacidades do Gemini 3.1 Flash-Lite, recursos e como ele pode ajuda-lo a obter melhores resultados.

Otimizado para Inteligência de Alta Velocidade

O Gemini 3.1 Flash-Lite é o model de alta velocidade do Google, projetado especificamente para workloads de desenvolvedores de alto volume, onde a baixa latency e a eficiência de custos são primordiais. Lançado em 3 de março de 2026, ele serve como uma entrada otimizada na série Gemini 3.1, entregando um tempo para o primeiro token 2.5x mais rápido e um aumento de 45% na velocidade de saída em comparação com as gerações anteriores. Ele é capaz de realizar streaming de mais de 360 tokens por segundo, tornando-o ideal para aplicações em tempo real e processamento de dados em escala massiva.

Multimodality Nativa com Context Window de 1M

O model é nativamente multimodal, suportando inputs de texto, imagem, áudio, vídeo e PDF dentro de uma massiva context window de 1 milhão de tokens. Isso permite que os desenvolvedores processem conjuntos de dados enormes, como vídeos de uma hora ou arquivos jurídicos massivos, sem a necessidade de pipelines complexos de RAG. Suas capacidades de visão são particularmente fortes, destacando-se em visual question answering de documentos e análise de gráficos.

Controle Granular para Desenvolvedores

Um recurso de destaque é a introdução dos 'Thinking Levels' (Minimal, Low, Medium, High). Este parameter permite que os desenvolvedores ajustem de forma granular a reasoning depth do model com base na complexidade da tarefa. Essa flexibilidade garante que os usuários não paguem a mais por tarefas simples como classificação, enquanto ainda têm acesso a uma lógica aprimorada para outputs mais estruturados, como geração de UI e extração de dados.

Gemini 3.1 Flash-Lite

Casos de Uso para Gemini 3.1 Flash-Lite

Descubra as diferentes maneiras de usar Gemini 3.1 Flash-Lite para obter otimos resultados.

Tradução em Tempo Real de Alto Volume

Processe perfeitamente milhares de mensagens de chat ou tickets de suporte em mais de 100 idiomas com latency mínima e alta eficiência de custos.

Moderação de Conteúdo Multimodal

Utilize o processamento nativo de vídeo e imagem para sinalizar conteúdo inadequado em feeds de redes sociais de alto throughput ou plataformas de vídeo.

Extração Automatizada de Dados Estruturados

Extraia esquemas JSON complexos de arquivos PDF massivos ou documentos jurídicos longos usando a context window de 1M de tokens.

Prototipagem Ágil de Front-End

Gere rapidamente componentes de UI funcionais em React/Tailwind e landing pages a mais de 360 tokens por segundo para design iterativo.

Orquestração de Tarefas Agentic

Potencialize agentes de AI 'sempre ativos' que realizam planejamento em várias etapas, pesquisa na web e uso de ferramentas sem estourar o orçamento de tokens.

Bots de Atendimento ao Cliente de Baixa Latency

Implante assistentes conversacionais que fornecem respostas instantâneas com reasoning ajustável para consultas simples vs. complexas.

Pontos Fortes

Limitacoes

Throughput Incomparável: Streaming a 363 tokens por segundo, tornando-o 45% mais rápido que o 2.5 Flash para aplicações agentic em tempo real.
Teto de Reasoning: Desempenho significativamente menor em lógica abstrata (12% ARC-AGI v2) em comparação com models flagship específicos para reasoning.
Preços Agressivos: A $0.25/M de input tokens, custa cerca de 1/8 do custo do Gemini 3.1 Pro, mantendo uma alta inteligência geral.
Lacunas em Olimpíadas de Matemática: Dificuldade com matemática de nível elite, pontuando apenas 25% no AIME 2025 em comparação com 90%+ dos frontier models.
Maestria Multimodal Nativa: Desempenho excepcional em visão (92% DocVQA) e vídeo (84.8% VideoMMMU) sem exigir encoders separados.
Calibração de Factualidade: Enfrenta taxas de alucinação mais altas em tarefas de busca de fatos (43.3% SimpleQA) do que as alternativas Pro ou frontier models.
Controle Granular de Computação: O primeiro model a oferecer controle preciso sobre a reasoning depth, permitindo a otimização da relação custo-performance.
Desvio de Instrução: Ocasionalmente pode ignorar restrições menores de formatação em instruções complexas de várias etapas e extremamente longas.

Inicio Rapido da API

google/gemini-3.1-flash-lite-preview

Ver Documentacao
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extraia as entidades-chave deste documento.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

Instale o SDK e comece a fazer chamadas de API em minutos.

O Que as Pessoas Estao Dizendo Sobre Gemini 3.1 Flash-Lite

Veja o que a comunidade pensa sobre Gemini 3.1 Flash-Lite

O Flash lite é incrivelmente rápido e eficaz para workflows específicos como sumarização... este salto de velocidade é muito bem-vindo.
reddit user
reddit
Gemini 3.1 Flash-Lite é o golpe silencioso para provedores de API de nível médio... as curvas de custo se acumulam rapidamente.
@9chaku
twitter
O 3.1 Flash-Lite supera o 2.5 Flash na maioria dos benchmarks sendo um verdadeiro velocista!
Tulsee Doshi
twitter
Para construtores que rodam agentes de AI em escala, este é o model que torna o 'sempre ativo' realmente acessível. 363 t/s é surreal.
@prince_twets
twitter
O preço é insano. $0.25 por 1M de input torna mais barato alimentar repositórios inteiros na context window do que construir um RAG.
reddit user
reddit
A velocidade para o primeiro token é basicamente instantânea. É a primeira vez que um model parece mais rápido do que minha própria digitação.
DevGuru
hackernews

Videos Sobre Gemini 3.1 Flash-Lite

Assista tutoriais, analises e discussoes sobre Gemini 3.1 Flash-Lite

O preço é de 25 cents por 1 milhão de input tokens e $1.50 por 1 milhão de output tokens... ainda muito competitivo considerando a velocidade.

Estou achando este model subestimado para codificação, focando no desenvolvimento front-end, e ele entrega tokens extremamente rápido.

Isso realmente visa o desenvolvedor que precisa de escala sem a latency de um model Pro.

A multimodality aqui não é apenas um truque; está lidando com PDFs complexos com facilidade.

O Google está realmente forçando os limites do que um model 'lite' pode alcançar em 2026.

Desta vez, é o Gemini 3.1 Flash Light, que deveria ser uma versão mais rápida e menos cara do model Flash.

Estes models são necessários porque você quer usá-los em aplicações onde precisa de alto throughput.

A context window de 1 milhão é padrão agora para o Gemini, mas vê-la em um model tão rápido é impressionante.

Ele não vai vencer uma olimpíada de matemática, mas é perfeito para extração e sumarização.

A latency da API é significativamente menor do que a do GPT-4o-mini em meus testes iniciais.

Este novo model de AI do Google é 45% mais rápido... e pode mudar a forma como cada um de nós constrói com AI.

Modo de low thinking para coisas rápidas e fáceis. Modo de high thinking para o trabalho pesado... essa flexibilidade é o que separa um brinquedo de uma ferramenta real.

Para tarefas de SEO, este será meu driver diário por causa do preço.

O fato de que ele pode ver um vídeo e entender o contexto quase instantaneamente é um divisor de águas para criadores de conteúdo.

O Google está tornando muito difícil justificar o uso de outros provedores para tarefas de alto volume agora.

Mais do que apenas prompts

Potencialize seu fluxo de trabalho com Automacao de IA

Automatio combina o poder de agentes de IA, automacao web e integracoes inteligentes para ajuda-lo a realizar mais em menos tempo.

Agentes de IA
Automacao Web
Fluxos Inteligentes

Dicas Profissionais para Gemini 3.1 Flash-Lite

Dicas de especialistas para ajuda-lo a aproveitar ao maximo Gemini 3.1 Flash-Lite e obter melhores resultados.

Aproveite os Thinking Levels

Defina o thinking_level como 'minimal' para tarefas simples como classificação para maximizar a velocidade, mas use 'high' para geração de código estruturado.

Análise de Vídeo Nativa

Envie arquivos de vídeo brutos diretamente para a API para obter insights mais rápidos sobre eventos visuais e sinais de áudio simultaneamente, ignorando etapas de transcrição.

Context Over RAG

Para conjuntos de dados abaixo de 1M de tokens, envie todo o conjunto de documentos para a context window para eliminar erros de recuperação e custos de banco de dados vector.

Otimize com Batching

Use a API de batching para tarefas não urgentes para reduzir ainda mais os custos, pois o Flash-Lite é especificamente otimizado para processamento assíncrono.

Depoimentos

O Que Nossos Usuarios Dizem

Junte-se a milhares de usuarios satisfeitos que transformaram seu fluxo de trabalho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Relacionados AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Perguntas Frequentes Sobre Gemini 3.1 Flash-Lite

Encontre respostas para perguntas comuns sobre Gemini 3.1 Flash-Lite