Gemini 3.1 Flash-Lite 的价格是多少？

其定价为每 100 万输入 token 0.25 美元，每 100 万输出 token 1.50 美元。

是否有供开发者使用的免费层级？

是的，它目前通过 Google AI Studio 提供免费预览版，供开发者进行测试和实验。

最大 context window 是多少？

该 model 支持最高 1,048,576 个 token 的 context window，大约可以摄入 70 万个单词。

我可以使用该 model 处理视频文件吗？

是的，它能够原生处理时长最长 1 小时或大小不超过 1.5GB 的视频文件。

什么是思维层级 (Thinking Levels)？

此参数允许你控制 model 在生成输出之前，针对问题进行内部推理所花费的时间。

它与 Claude 4.5 Haiku 相比如何？

Gemini 3.1 Flash-Lite 的输出 token 成本大约便宜 4 倍，且在 GPQA 推理 benchmark 上表现优于 Claude 4.5 Haiku。

它支持函数调用吗？

是的，它全面支持工具使用和函数调用，可用于构建自主的 agentic 工作流。

该 model 的输出速度是多少？

该 model 的输出速度可达每秒 363 个 token，非常适合对 latency 敏感的应用场景。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 是 Google 最快、最具成本效益的 model。具备 1M context window、原生 multimodality 以及每秒 363 tokens 的扩展处理速度。

Multimodal高速高性价比Google Gemini

googleGemini 3.12026年3月3日

上下文

1.0Mtokens

最大输出

66Ktokens

输入价格

$0.25/ 1M

输出价格

$1.50/ 1M

模态:TextImageAudioVideo

能力:视觉工具流式传输

基准测试

GPQA

86.9%

HLE

16%

MMLU

88.9%

MMLU Pro

80%

SimpleQA

43.3%

IFEval

85%

AIME 2025

25%

MATH

78%

GSM8k

95%

MGSM

92%

MathVista

75%

SWE-Bench

35%

HumanEval

88%

LiveCodeBench

72%

MMMU

76.8%

MMMU Pro

76.8%

ChartQA

91%

DocVQA

92%

Terminal-Bench

55%

ARC-AGI

12%

查看API文档

关于 Gemini 3.1 Flash-Lite

了解 Gemini 3.1 Flash-Lite 的功能、特性以及它如何帮助您获得更好的效果。

Gemini 3.1 Flash-Lite 专为处理速度是首要技术要求的 AI 应用而设计。与体积更大的 Pro model 不同，Flash-Lite 使用了精简的架构，优先保证吞吐量，每秒可处理 363 个 token。它作为一种专业工具，非常适合开发实时语音 agent、自动化内容审核系统以及需要在高流量下保持成本效益的大规模数据提取管道。

尽管被称为 lite 版，但该 model 仍保持了 100 万 token 的 context window。它可以在一次请求中摄入原始音频文件、长达一小时的视频以及数百页的 PDF。通过引入思维层级 (Thinking Levels)，Google 允许用户根据任务选择, , 从简单任务的近乎即时响应，到复杂逻辑下的深度推理阶段。这在同一个 API 端点中提供了多种性能方案，以平衡成本与准确性。

该 model 是原生的 multimodal，无需外部工具在处理前进行音频转录或图像描述。这种原生能力提升了视觉任务（如文档问答和图表分析）的性能。开发者可以使用 thinking_level 参数调节内部推理时间，根据每个查询的具体复杂度有效地扩展 model 的计算投入。

Gemini 3.1 Flash-Lite 的使用案例

发现使用 Gemini 3.1 Flash-Lite 获得出色效果的不同方式。

高频翻译

以亚秒级 latency 实时处理数千条多语言聊天消息或支持工单。

智能 model 路由

作为快速分类器，确定传入的查询是否需要升级到更昂贵的 model 进行处理。

Multimodal 内容审核

以低成本批量扫描用户生成的图片和视频，确保内容安全合规。

实时 UI 原型设计

根据手绘线框图或口头描述生成功能完备的 React 或 Tailwind 组件。

长文档摘要

在 1M token 的 context window 内压缩海量法律档案或技术手册，且不会丢失上下文信息。

实时音频转录

一次性将数小时的会议或讲座录音转换为结构化的摘要和行动项。

优势

局限性

极致性能: 每秒 363 个 token 的处理速度，使其成为业内实时响应能力最快的 model 之一。

事实记忆能力较低: SimpleQA 得分为 43.3%，表明在没有 Grounding 的情况下，处理一般知识时存在较高的幻觉风险。

高级推理能力: 在 GPQA Diamond 基准测试中达到 86.9%，在轻量级 tier 中提供博士级的科学逻辑能力。

价格上涨: 相比其所取代的上一代 Gemini 2.5 Flash-Lite，价格有显著增长。

动态成本控制: 思维层级 (Thinking Levels) 参数允许按请求精确控制计算资源开支。

高思维模式下 latency 较高: 使用高思维层级会在生成开始前增加约 7 到 10 秒的预计算时间。

统一的 Multimodality: 原生摄入音频、视频和 PDF，无需复杂的跨 model 编排管道。

安全拒绝率: 内部测试显示，在红队测试练习中，图像到文本的安全一致性下降了 21.7%。

API快速入门

google/gemini-3.1-flash-lite-preview

查看文档

google SDK

import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("创建一个天气仪表盘 UI。");
console.log(result.response.text());

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3.1 Flash-Lite 的评价

看看社区对 Gemini 3.1 Flash-Lite 的看法

“3.1 Flash-Lite 的编码能力对于前端开发来说令人惊讶；它完美地写出了一个 360 度查看器。”

— WorldofAI

youtube

“Gemini 3.1 Flash-Lite 是构建全天候 multimodal AI Agents 的首选 model。它能读取、连接并整合一切信息。”

— Shubham Saboo

twitter

“定价让人大吃一惊。如果你的云预算紧张，输出 token 费用的 3.75 倍涨幅确实会令人心痛。”

— Binary Verse AI

youtube

“它将工程团队架构中的复杂性负担直接转移到了 Google 的基础设施上。”

— Julian Goldie

youtube

“又一次降价带来的智能化提升。高速度、低成本、高智能。它是 Agentic 路由的绝佳选择。”

— ctgtplb

twitter

“1M context 依然是这里的杀手级功能。我可以丢进去整个仓库文件夹，它凭借亚秒级的 TTFT 直接就能跑。”

— DevFlow_26

关于 Gemini 3.1 Flash-Lite 的视频

观看关于 Gemini 3.1 Flash-Lite 的教程、评测和讨论

“他们似乎以某种方式在这个 model 中塞入了大量的智能。”

“我会将它用于定义明确的高吞吐量工作负载。”

“Flash-Lite 的前端开发能力甚至优于我实际使用过的大多数 model。”

“它确实一次性生成了一个功能完整的查看器。”

“对于那些既需要速度又不愿牺牲所有逻辑性能的人来说，这个 model 是理想之选。”

“这个 model 就是我们所说的‘主力型’ model……专为高吞吐量任务而设计。”

“如果你以最小的思维预算运行它，它基本就作为一个非推理 model 工作，而且速度极快。”

“在输出网站代码方面，它做得非常出色。”

“速度与成本的比率是你将其转向生产环境应用的核心原因。”

“它原生处理 multimodal 输入，这相对于竞争对手是一个巨大的优势。”

“在 GPQA Diamond 上达到近 87% 的分数，这打破了我们所有的分类系统，而且它还被贴上了 lite 的标签。”

“不要把这个 model 当作事实预言机……你必须向它提供事实。”

“有了 3.1 Flash-Lite，你可以避免启动其他三个微服务……这种简洁性价值不菲。”

“输出速度提升了 45%，在流式响应中感受非常直接。”

“你可以用几分钱就获得 1M 的 context，在生产环境中这依然感觉像魔法一样。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量，帮助您在更短的时间内完成更多工作。

AI代理

网页自动化

智能工作流

免费开始

Gemini 3.1 Flash-Lite专业提示

专家提示助您充分利用Gemini 3.1 Flash-Lite。

设置思维层级 (Thinking Levels)

对于分类任务使用“最低”思维层级以降低成本，而在处理复杂编程任务时切换为“高”层级。

启用 Grounding

由于基础事实准确性较低，对于需要事实检索的任务，请务必使用 Google 搜索 Grounding。

上传原始文件

避免先将音频或视频预处理为文本，应直接上传原始文件，以利用其原生 multimodal 能力。

使用系统指令 (System Instructions)

使用 system_instruction 参数严格执行 JSON 架构，以最大限度减少输出纠错所消耗的 token。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

关于Gemini 3.1 Flash-Lite的常见问题

查找关于Gemini 3.1 Flash-Lite的常见问题答案

Gemini 3.1 Flash-Lite

关于 Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 的使用案例

高频翻译

智能 model 路由

Multimodal 内容审核

实时 UI 原型设计

长文档摘要

实时音频转录

优势

局限性

API快速入门

人们对 Gemini 3.1 Flash-Lite 的评价

关于 Gemini 3.1 Flash-Lite 的视频

用以下方式提升您的工作流程 AI自动化

Gemini 3.1 Flash-Lite专业提示

设置思维层级 (Thinking Levels)

启用 Grounding

上传原始文件

使用系统指令 (System Instructions)

用户怎么说

相关 AI Models

Claude Opus 4.5

Grok-4

GLM-5.1

Kimi K2.5

Qwen3.6-Max-Preview

GLM-5

GPT-5.1

GPT-5.2

关于Gemini 3.1 Flash-Lite的常见问题

Gemini 3.1 Flash-Lite 的价格是多少？

是否有供开发者使用的免费层级？

最大 context window 是多少？

我可以使用该 model 处理视频文件吗？

什么是思维层级 (Thinking Levels)？

它与 Claude 4.5 Haiku 相比如何？

它支持函数调用吗？

该 model 的输出速度是多少？