google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 是 Google 最快、最具成本效益的 model。具备 1M context window、原生 multimodality 以及每秒 363 tokens 的扩展处理速度。

Multimodal高速高性价比Google Gemini
google logogoogleGemini 3.12026年3月3日
上下文
1.0Mtokens
最大输出
66Ktokens
输入价格
$0.25/ 1M
输出价格
$1.50/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输
基准测试
GPQA
86.9%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3.1 Flash-Lite 在此基准测试中得分 86.9%。
HLE
16%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 16%。
MMLU
88.9%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3.1 Flash-Lite 在此基准测试中得分 88.9%。
MMLU Pro
80%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 80%。
SimpleQA
43.3%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 43.3%。
IFEval
85%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 85%。
AIME 2025
25%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 25%。
MATH
78%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3.1 Flash-Lite 在此基准测试中得分 78%。
GSM8k
95%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 95%。
MGSM
92%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3.1 Flash-Lite 在此基准测试中得分 92%。
MathVista
75%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 75%。
SWE-Bench
35%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3.1 Flash-Lite 在此基准测试中得分 35%。
HumanEval
88%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3.1 Flash-Lite 在此基准测试中得分 88%。
LiveCodeBench
72%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 72%。
MMMU
76.8%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3.1 Flash-Lite 在此基准测试中得分 76.8%。
MMMU Pro
76.8%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3.1 Flash-Lite 在此基准测试中得分 76.8%。
ChartQA
91%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 91%。
DocVQA
92%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 92%。
Terminal-Bench
55%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 55%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3.1 Flash-Lite 在此基准测试中得分 12%。

关于 Gemini 3.1 Flash-Lite

了解 Gemini 3.1 Flash-Lite 的功能、特性以及它如何帮助您获得更好的效果。

Gemini 3.1 Flash-Lite 专为处理速度是首要技术要求的 AI 应用而设计。与体积更大的 Pro model 不同,Flash-Lite 使用了精简的架构,优先保证吞吐量,每秒可处理 363 个 token。它作为一种专业工具,非常适合开发实时语音 agent、自动化内容审核系统以及需要在高流量下保持成本效益的大规模数据提取管道。

尽管被称为 lite 版,但该 model 仍保持了 100 万 token 的 context window。它可以在一次请求中摄入原始音频文件、长达一小时的视频以及数百页的 PDF。通过引入思维层级 (Thinking Levels),Google 允许用户根据任务选择, , 从简单任务的近乎即时响应,到复杂逻辑下的深度推理阶段。这在同一个 API 端点中提供了多种性能方案,以平衡成本与准确性。

该 model 是原生的 multimodal,无需外部工具在处理前进行音频转录或图像描述。这种原生能力提升了视觉任务(如文档问答和图表分析)的性能。开发者可以使用 thinking_level 参数调节内部推理时间,根据每个查询的具体复杂度有效地扩展 model 的计算投入。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 的使用案例

发现使用 Gemini 3.1 Flash-Lite 获得出色效果的不同方式。

高频翻译

以亚秒级 latency 实时处理数千条多语言聊天消息或支持工单。

智能 model 路由

作为快速分类器,确定传入的查询是否需要升级到更昂贵的 model 进行处理。

Multimodal 内容审核

以低成本批量扫描用户生成的图片和视频,确保内容安全合规。

实时 UI 原型设计

根据手绘线框图或口头描述生成功能完备的 React 或 Tailwind 组件。

长文档摘要

在 1M token 的 context window 内压缩海量法律档案或技术手册,且不会丢失上下文信息。

实时音频转录

一次性将数小时的会议或讲座录音转换为结构化的摘要和行动项。

优势

局限性

极致性能: 每秒 363 个 token 的处理速度,使其成为业内实时响应能力最快的 model 之一。
事实记忆能力较低: SimpleQA 得分为 43.3%,表明在没有 Grounding 的情况下,处理一般知识时存在较高的幻觉风险。
高级推理能力: 在 GPQA Diamond 基准测试中达到 86.9%,在轻量级 tier 中提供博士级的科学逻辑能力。
价格上涨: 相比其所取代的上一代 Gemini 2.5 Flash-Lite,价格有显著增长。
动态成本控制: 思维层级 (Thinking Levels) 参数允许按请求精确控制计算资源开支。
高思维模式下 latency 较高: 使用高思维层级会在生成开始前增加约 7 到 10 秒的预计算时间。
统一的 Multimodality: 原生摄入音频、视频和 PDF,无需复杂的跨 model 编排管道。
安全拒绝率: 内部测试显示,在红队测试练习中,图像到文本的安全一致性下降了 21.7%。

API快速入门

google/gemini-3.1-flash-lite-preview

查看文档
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("创建一个天气仪表盘 UI。");
console.log(result.response.text());

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3.1 Flash-Lite 的评价

看看社区对 Gemini 3.1 Flash-Lite 的看法

3.1 Flash-Lite 的编码能力对于前端开发来说令人惊讶;它完美地写出了一个 360 度查看器。
WorldofAI
youtube
Gemini 3.1 Flash-Lite 是构建全天候 multimodal AI Agents 的首选 model。它能读取、连接并整合一切信息。
Shubham Saboo
twitter
定价让人大吃一惊。如果你的云预算紧张,输出 token 费用的 3.75 倍涨幅确实会令人心痛。
Binary Verse AI
youtube
它将工程团队架构中的复杂性负担直接转移到了 Google 的基础设施上。
Julian Goldie
youtube
又一次降价带来的智能化提升。高速度、低成本、高智能。它是 Agentic 路由的绝佳选择。
ctgtplb
twitter
1M context 依然是这里的杀手级功能。我可以丢进去整个仓库文件夹,它凭借亚秒级的 TTFT 直接就能跑。
DevFlow_26
reddit

关于 Gemini 3.1 Flash-Lite 的视频

观看关于 Gemini 3.1 Flash-Lite 的教程、评测和讨论

他们似乎以某种方式在这个 model 中塞入了大量的智能。

我会将它用于定义明确的高吞吐量工作负载。

Flash-Lite 的前端开发能力甚至优于我实际使用过的大多数 model。

它确实一次性生成了一个功能完整的查看器。

对于那些既需要速度又不愿牺牲所有逻辑性能的人来说,这个 model 是理想之选。

这个 model 就是我们所说的‘主力型’ model……专为高吞吐量任务而设计。

如果你以最小的思维预算运行它,它基本就作为一个非推理 model 工作,而且速度极快。

在输出网站代码方面,它做得非常出色。

速度与成本的比率是你将其转向生产环境应用的核心原因。

它原生处理 multimodal 输入,这相对于竞争对手是一个巨大的优势。

在 GPQA Diamond 上达到近 87% 的分数,这打破了我们所有的分类系统,而且它还被贴上了 lite 的标签。

不要把这个 model 当作事实预言机……你必须向它提供事实。

有了 3.1 Flash-Lite,你可以避免启动其他三个微服务……这种简洁性价值不菲。

输出速度提升了 45%,在流式响应中感受非常直接。

你可以用几分钱就获得 1M 的 context,在生产环境中这依然感觉像魔法一样。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Gemini 3.1 Flash-Lite专业提示

专家提示助您充分利用Gemini 3.1 Flash-Lite。

设置思维层级 (Thinking Levels)

对于分类任务使用“最低”思维层级以降低成本,而在处理复杂编程任务时切换为“高”层级。

启用 Grounding

由于基础事实准确性较低,对于需要事实检索的任务,请务必使用 Google 搜索 Grounding。

上传原始文件

避免先将音频或视频预处理为文本,应直接上传原始文件,以利用其原生 multimodal 能力。

使用系统指令 (System Instructions)

使用 system_instruction 参数严格执行 JSON 架构,以最大限度减少输出纠错所消耗的 token。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

关于Gemini 3.1 Flash-Lite的常见问题

查找关于Gemini 3.1 Flash-Lite的常见问题答案