google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 是 Google 速度最快、成本效益最高的 model。具备 1M context、原生 multimodal 能力,以及 363 tokens/sec 的超快速度,专为规模化应用而生。

Multimodal高性能高性价比Google Gemini
google logogoogleGemini 3.12026-03-03
上下文
1.0Mtokens
最大输出
66Ktokens
输入价格
$0.25/ 1M
输出价格
$1.50/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输
基准测试
GPQA
86.9%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3.1 Flash-Lite 在此基准测试中得分 86.9%。
HLE
16%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 16%。
MMLU
88.9%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3.1 Flash-Lite 在此基准测试中得分 88.9%。
MMLU Pro
80%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 80%。
SimpleQA
43.3%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 43.3%。
IFEval
85%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 85%。
AIME 2025
25%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 25%。
MATH
78%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3.1 Flash-Lite 在此基准测试中得分 78%。
GSM8k
95%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 95%。
MGSM
92%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3.1 Flash-Lite 在此基准测试中得分 92%。
MathVista
75%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 75%。
SWE-Bench
35%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 35%。
HumanEval
88%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3.1 Flash-Lite 在此基准测试中得分 88%。
LiveCodeBench
72%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 72%。
MMMU
76.8%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3.1 Flash-Lite 在此基准测试中得分 76.8%。
MMMU Pro
76.8%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3.1 Flash-Lite 在此基准测试中得分 76.8%。
ChartQA
91%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 91%。
DocVQA
92%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 92%。
Terminal-Bench
55%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 55%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 12%。

关于 Gemini 3.1 Flash-Lite

了解 Gemini 3.1 Flash-Lite 的功能、特性以及它如何帮助您获得更好的效果。

专为高速智能而优化

Gemini 3.1 Flash-Lite 是 Google 的高速主力 model,专为需要极低 latency 和高成本效益的大规模开发者工作负载而设计。它于 2026 年 3 月 3 日发布,作为 Gemini 3.1 系列中的优化成员,其 time-to-first-token 速度比前代快 2.5 倍,输出速度提升了 45%。它能够以每秒超过 360 tokens 的速度进行 streaming,是实时应用和大规模数据处理的理想选择。

原生 Multimodal 与 100 万 Context

该 model 原生支持 multimodal,可在巨大的 100 万 token context window 内处理文本、图像、音频、视频和 PDF 输入。这使得开发者能够处理海量数据集(如长达一小时的视频或庞大的法律档案),而无需复杂的 RAG 流程。其视觉能力尤为出色,在文档视觉问答和图表分析方面表现优异。

精细的开发者控制

一个显著的特点是引入了 'Thinking Levels'(Minimal、Low、Medium、High)。这一 parameters 允许开发者根据任务复杂度精细地调高或调低 model 的 reasoning 深度。这种灵活性确保了用户在处理分类等简单任务时不会支付多余费用,同时在进行 UI 生成和数据提取等任务时仍能获得增强的逻辑支持。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 的使用案例

发现使用 Gemini 3.1 Flash-Lite 获得出色效果的不同方式。

高吞吐量实时翻译

以极低的 latency 和极高的成本效益,无缝处理跨 100 多种语言的数千条聊天消息或支持工单。

Multimodal 内容审核

利用原生视频和图像处理能力,在高吞吐量的社交媒体流或视频平台中标记违规内容。

自动化结构化数据提取

利用 100 万 tokens 的 context window,从庞大的 PDF 档案或长篇法律文档中提取复杂的 JSON schema。

敏捷前端原型设计

以每秒超过 360 tokens 的速度快速生成功能完备的 React/Tailwind UI 组件和落地页,加速迭代设计。

Agentic 任务编排

为“全天候” AI agents 提供动力,执行多步规划、网络搜索和工具调用,且不会超出 token 预算。

低 Latency 客户服务机器人

部署对话助手,根据查询的简易程度调节 reasoning 深度,提供即时响应。

优势

局限性

无与伦比的 Throughput: Streaming 速度达 363 tokens per second,在实时 agentic 应用中比 2.5 Flash 快 45%。
Reasoning 瓶颈: 在抽象逻辑(12% ARC-AGI v2)方面的表现显著低于专注于 reasoning 的 flagship model。
极具竞争力的定价: 每百万 input tokens 仅需 $0.25,成本约为 Gemini 3.1 Pro 的 1/8,同时保持了极高的通用智能。
奥数级别差距: 在顶尖数学竞赛题目上表现吃力,AIME 2025 得分仅为 25%,而 frontier model 则在 90% 以上。
原生 Multimodal 大师: 在视觉(92% DocVQA)和视频(84.8% VideoMMMU)方面表现卓越,无需单独的编码器。
事实性校准: 在寻求事实的任务中(43.3% SimpleQA),其幻觉率高于 Pro 级别或 frontier model 替代方案。
精细的算力控制: 首个提供 reasoning 深度精准控制的 model,能够优化成本与性能的比例。
指令偏移: 在处理极长且复杂的多次迭代指令时,偶尔会忽略细微的格式限制。

API快速入门

google/gemini-3.1-flash-lite-preview

查看文档
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "从此文档中提取关键实体。";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3.1 Flash-Lite 的评价

看看社区对 Gemini 3.1 Flash-Lite 的看法

Flash lite 速度极快,在总结等特定工作流中非常有效……这速度提升太及时了。
reddit 用户
reddit
Gemini 3.1 Flash-Lite 是对中端 API 提供商的致命一击……成本曲线的优势会迅速累积。
@9chaku
twitter
3.1 Flash-Lite 在大多数 benchmark 测试中都超越了 2.5 Flash,而且简直是个速度小超人!
Tulsee Doshi
twitter
对于大规模运行 AI agents 的开发者来说,这款 model 让“全天候在线”真正变得可负担。363 t/s 的速度太疯狂了。
@prince_twets
twitter
这价格简直疯了。每百万输入 $0.25,直接把整个 repo 塞进 context 比构建 RAG 还要便宜。
reddit 用户
reddit
First token 的响应速度几乎是瞬时的。这是第一次感觉到 model 反应比我打字还要快。
DevGuru
hackernews

关于 Gemini 3.1 Flash-Lite 的视频

观看关于 Gemini 3.1 Flash-Lite 的教程、评测和讨论

定价为每 100 万 input tokens 25 美分,每 100 万 output tokens 1.50 美元……考虑到速度,这非常有竞争力。

我发现这是一个被低估的代码 model,专注于前端开发,它的 tokens 输出速度极快。

这真正针对的是那些需要规模化且无法容忍 Pro model 延迟的开发者。

这里的 multimodality 不仅仅是噱头;它处理复杂 PDF 时游刃有余。

Google 正在真正推高 2026 年“轻量级” model 所能达到的上限。

这一次是 Gemini 3.1 Flash Lite,它被认为是 Flash model 的更快且更便宜的版本。

这些 model 是必不可少的,因为你希望在需要高 throughput 的应用中使用它们。

100 万 context window 现在是 Gemini 的标配,但在如此快速的 model 上看到它令人印象深刻。

它不会赢得奥数比赛,但非常适合提取和总结任务。

在我的早期测试中,API latency 明显低于 GPT-4o-mini。

Google 的这款新 AI model 速度提升了 45%……它可能会改变我们每个人构建 AI 应用的方式。

简单任务用低 thinking 模式,繁重任务用高 thinking 模式……这种灵活性是玩具与真正工具的区别所在。

对于 SEO 任务,考虑到价格因素,这将成为我的主力工具。

它能理解视频内容并几乎瞬间识别 context,这对内容创作者来说是游戏规则的改变者。

Google 让现在很难有理由在处理高吞吐量任务时去选择其他供应商。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Gemini 3.1 Flash-Lite专业提示

专家提示助您充分利用Gemini 3.1 Flash-Lite。

灵活运用 Thinking Levels

对于分类等简单任务,将 thinking_level 设置为 'minimal' 以最大化速度;对于结构化代码生成,请使用 'high'。

原生视频分析

直接将原始视频文件输入 API,即可同时获取视觉事件和音频线索的快速洞察,无需经过转录步骤。

Context 优于 RAG

对于小于 100 万 tokens 的数据集,直接将整个文档集放入 context window,以消除检索错误并节省 vector DB 成本。

利用 Batching 优化

对于非紧急任务使用 Batching API 可进一步降低成本,Flash-Lite 专门针对异步处理进行了优化。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

关于Gemini 3.1 Flash-Lite的常见问题

查找关于Gemini 3.1 Flash-Lite的常见问题答案