google

Gemini 3 Flash

Gemini 3 Flash 是 Google 推出的一款高速 multimodal model,具备 1M token context window、顶尖的 90.4% GPQA 推理能力以及自主浏览器自动化工具。

google logogoogleGemini 3December 17, 2025
上下文
1.0Mtokens
最大输出
66Ktokens
输入价格
$0.50/ 1M
输出价格
$3.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
90.4%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3 Flash 在此基准测试中得分 90.4%。
HLE
43.5%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3 Flash 在此基准测试中得分 43.5%。
MMLU
91.8%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3 Flash 在此基准测试中得分 91.8%。
MMLU Pro
72.5%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3 Flash 在此基准测试中得分 72.5%。
SimpleQA
68.7%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3 Flash 在此基准测试中得分 68.7%。
IFEval
88.2%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3 Flash 在此基准测试中得分 88.2%。
AIME 2025
99.7%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3 Flash 在此基准测试中得分 99.7%。
MATH
58%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3 Flash 在此基准测试中得分 58%。
GSM8k
94%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3 Flash 在此基准测试中得分 94%。
MGSM
92.4%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3 Flash 在此基准测试中得分 92.4%。
MathVista
65.4%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3 Flash 在此基准测试中得分 65.4%。
SWE-Bench
78%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3 Flash 在此基准测试中得分 78%。
HumanEval
84.1%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3 Flash 在此基准测试中得分 84.1%。
LiveCodeBench
77.2%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3 Flash 在此基准测试中得分 77.2%。
MMMU
81.2%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3 Flash 在此基准测试中得分 81.2%。
MMMU Pro
81.2%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3 Flash 在此基准测试中得分 81.2%。
ChartQA
86.5%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3 Flash 在此基准测试中得分 86.5%。
DocVQA
93.1%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3 Flash 在此基准测试中得分 93.1%。
Terminal-Bench
47.6%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3 Flash 在此基准测试中得分 47.6%。
ARC-AGI
33.6%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3 Flash 在此基准测试中得分 33.6%。

关于 Gemini 3 Flash

了解 Gemini 3 Flash 的功能、特性以及它如何帮助您获得更好的效果。

Gemini 3 的性能核心

Gemini 3 Flash 是 Google 的 frontier model,针对极速和大规模可扩展性进行了优化。它由 Google DeepMind 开发,作为 Gemini 3 生态系统中效率优先的主力 model,在文本、代码、图像和音频方面提供高质量的 reasoning 和原生 multimodal 处理。它专门为低 latency 和高性价比至关 cosmological 的高容量企业工作负载而设计。

前所未有的 Context 与 Agency

该 model 拥有海量的 1-million-token context window,使其能够在单个 prompt 中处理整个代码仓库、数小时的视频或数千页的文档。它不仅是一个聊天机器人,更是为 agency 而生;通过与 Google 的 StagehandNano Browser API 集成,它可以像人类一样自主导航网页、执行多步数字任务并与实时网页元素交互。

顶尖的科学推理能力

虽然针对速度进行了优化,但 Gemini 3 Flash 并未牺牲智能。通过专门的 Deep Think 激活协议,该 model 可以触发内部 chain-of-thought 过程,以解决数学、科学和逻辑领域的 PhD-level 问题。这种双重特性使其能够通过简单的系统指令,在快速数据提取和复杂的专家级分析之间无缝切换。

Gemini 3 Flash

Gemini 3 Flash 的使用案例

发现使用 Gemini 3 Flash 获得出色效果的不同方式。

自主浏览器自动化

:通过 Stagehand 和 Nano Browser API 执行多步骤 Web 任务,如线索生成和复杂数据抓取。

高容量数据提取

:利用 1M token context window 处理大规模数据集或长篇文档,实现无缝的信息综合。

实时语音交互

:为具有原生音频对音频能力和低语音转文本 latency 的响应式 AI 助手提供动力。

快速原型开发与编码

:使用集成的 Canvas 模式在开发环境中生成并测试样板代码和 UI 组件。

搜索与信息综合

:通过对各种文本、图像和视频源的快速 multimodal reasoning 来增强 AI Overviews。

Agentic 流程编排

:作为轻量级执行器,为需要快速 tool-calling 的复杂多 agent 数字任务组提供支持。

优势

局限性

极高效率: :运行速度比 Gemini 2.5 Pro 快 3 倍,同时显著降低了高容量企业任务的成本。
默认过度简洁: :默认响应极其简短,对于创意任务可能需要复杂的 prompt 工程或 XML 标签。
海量 Context 容量: :1-million-token 窗口支持在单个 prompt 中处理整个仓库或长视频转录文本。
易受 Context 偏移影响: :如果在长 prompt 中未应用特定的 context 锚定技术,容易出现“迷失在中间”的现象。
顶尖 Reasoning 性能: :在 GPQA Diamond 上达到 PhD-level 的 90.4%,表明在使用 Deep Think 协议时具有极高的科学准确性。
安全评估差距: :在早期版本的红队评估中显示出 97.3% 的越狱成功率,存在潜在的安全风险。
Agentic 精通度: :通过与 Stagehand 框架的深度集成,展现出卓越的自主浏览器操作和 tool-calling 能力。
执行深度尚不及人类: :虽然擅长规划,但在复杂、动态、不可验证的数字环境中进行执行时仍可能遇到困难。

API快速入门

google/gemini-3-flash

查看文档
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-3-flash" });

async function run() {
  const prompt = "Analyze the core logic in this codebase for efficiency.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3 Flash 的评价

看看社区对 Gemini 3 Flash 的看法

"单位成本智能的帕累托前沿实际上通过 Flash 实现了垂直化跨越"
OrdinaryLavishness11
reddit
"Gemini 3 Flash CLI 将您的终端变成了完整的 AI studio"
JamMasterJulian
reddit
"它不仅便宜,而且是顶尖的,在 GPQA Diamond 上获得了 90.4% 的高分"
OrdinaryLavishness11
reddit
"我们实际上正在实现科学自动化的自动化"
alexwg
x/twitter
"在与 Gemini 3 交互时,不要将其受到的限制误认为是其思维能力的局限"
uberzak
reddit
"通过 Stagehand 实现的网页自动化能力是一个游戏规则改变者"
AIBuilder99
hackernews

关于 Gemini 3 Flash 的视频

观看关于 Gemini 3 Flash 的教程、评测和讨论

“这不只是一个插件。它是下一代 Web 本身——一个完全自主阅读、点击、输入、滚动和构建的浏览器。”

“Stagehand 将其转换为视觉坐标并模拟点击。”

“它处理 CAPTCHA 和动态加载的能力比我测试过的任何前代 agent 都要好。”

“从发出指令到第一次点击之间的 latency 低于 800 毫秒。”

“这把每个网站都变成了你 agent 的结构化 API。”

“Google 直接将 Gemini 的大脑带入到了您的终端。”

“这就像在您的终端内部拥有一个 AI 实验室。”

“您现在就可以通过 pip 或 npm install,并开始将日志直接 pipe 给 model。”

“Flash model 是此类任务的完美选择,因为即使处理 50,000 行日志也不会产生高昂费用。”

“它实际上能够安全地编写并执行自己的 bash 脚本。”

“Gemini 3 Flash 证明了速度和规模不一定要以牺牲智能为代价。”

“我用 Gemini 3 Flash 构建了一个完整的文本自动化工具……以前需要 3 小时,现在不到 2 分钟。”

“作为一款 ‘Flash’ model,其 GPQA 分数对于竞争对手来说简直令人生畏。”

“它在 1 million tokens 范围内保持连贯性的能力是其秘密武器。”

“如果你正在构建高容量的 SaaS 应用,这现在是默认之选。”

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流
观看演示视频

Gemini 3 Flash专业提示

专家提示助您充分利用Gemini 3 Flash。

Deep Think 协议:当 model 需要解决复杂的 PhD-level 问题时,使用系统指令 <deep_think_activation: true> 来触发其扩展 reasoning 阶段。

XML 输出规范:为了应对 model 默认过度简洁的问题,请将您的长度和风格要求封装在显式的 <output_verbosity> XML 标签中。

Context 锚定:当利用完整的 1M token context 时,在 prompt 中引用特定的锚点或文件名,以防止信息偏移。

终端集成:利用 Gemini 3 Flash CLI 直接从您的终端环境自动化本地文件处理和 shell 脚本。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

关于Gemini 3 Flash的常见问题

查找关于Gemini 3 Flash的常见问题答案