google

Gemini 3.5 Flash

Gemini 3.5 Flash 是 Google 推出的高性能多模态模型,具有 1M context window,专为亚秒级 agentic 循环和复杂编程任务而优化。

Multimodal AIAgentic Workflows1M ContextHigh-Speed LLM
google logogoogleGemini2026年5月19日
上下文
1.0Mtokens
最大输出
66Ktokens
输入价格
$1.50/ 1M
输出价格
$9.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
74%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3.5 Flash 在此基准测试中得分 74%。
HLE
34%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3.5 Flash 在此基准测试中得分 34%。
MMLU
89%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3.5 Flash 在此基准测试中得分 89%。
MMLU Pro
83%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3.5 Flash 在此基准测试中得分 83%。
SimpleQA
76.7%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3.5 Flash 在此基准测试中得分 76.7%。
IFEval
88%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3.5 Flash 在此基准测试中得分 88%。
AIME 2025
68%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3.5 Flash 在此基准测试中得分 68%。
MATH
88%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3.5 Flash 在此基准测试中得分 88%。
GSM8k
97%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3.5 Flash 在此基准测试中得分 97%。
MGSM
92%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3.5 Flash 在此基准测试中得分 92%。
MathVista
74%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3.5 Flash 在此基准测试中得分 74%。
SWE-Bench
55.1%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3.5 Flash 在此基准测试中得分 55.1%。
HumanEval
92%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3.5 Flash 在此基准测试中得分 92%。
LiveCodeBench
56%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3.5 Flash 在此基准测试中得分 56%。
MMMU
84%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3.5 Flash 在此基准测试中得分 84%。
MMMU Pro
88.3%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3.5 Flash 在此基准测试中得分 88.3%。
ChartQA
89%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3.5 Flash 在此基准测试中得分 89%。
DocVQA
94%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3.5 Flash 在此基准测试中得分 94%。
Terminal-Bench
76.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3.5 Flash 在此基准测试中得分 76.2%。
ARC-AGI
12%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3.5 Flash 在此基准测试中得分 12%。

关于 Gemini 3.5 Flash

了解 Gemini 3.5 Flash 的功能、特性以及它如何帮助您获得更好的效果。

高效 Agentic 性能

Gemini 3.5 Flash 是一款专为速度和复杂 reasoning 设计的多模态模型。它支持 100 万 token 的 context window,使用户能够在单个 prompt 中处理海量数据集,包括长达一小时的视频和整个代码仓库。该架构针对亚秒级 latency 进行了优化,旨在服务于构建交互式 AI agent 和自动化工作流的开发者。

原生多模态与 Reasoning

该模型引入了用于高级 chain-of-thought 逻辑的 Thinking 模式。它原生处理文本、图像、音频、视频和 PDF,无需单独的预处理流水线。Benchmark 显示,它在编程和工具使用任务上超过了之前的 Gemini 3.1 Pro,同时保持了 Flash 级别的效率。

生产环境可扩展性

每百万输入 token 1.50 美元 的成本,它为高容量应用提供了经济高效的选择。它专门针对 function calling 和基于终端的任务进行了调整,在 SWE-bench 和 Terminal-Bench 等 agentic benchmark 中表现出色。这使其成为实时编程助手和数据策划系统的首选。

Gemini 3.5 Flash

Gemini 3.5 Flash 的使用案例

发现使用 Gemini 3.5 Flash 获得出色效果的不同方式。

自动化新闻编辑策划

实时扫描数千个 RSS 源和社交动态,根据特定编辑配置对新闻进行评分和排名。

海量文档分析

处理诸如法律案件记录等庞大档案,在不丢失上下文的情况下提取结构化摘要和可操作的见解。

实时音乐合成

利用对乐理和音频波形的原生理解,生成交互式音频工具和音乐界面。

交互式浏览器 OS 生成

通过自然语言 prompt 创建功能齐全的操作系统模拟和复杂的 UI 仪表板。

快速代码重构

在大型代码库中执行逻辑更新,而无需消耗旗舰模型所需的高额点数。

Agentic 终端自动化

使用终端工具编排开发环境,执行多步骤系统任务和代码迭代。

优势

局限性

海量 1M token context: 支持对长篇数据进行深度分析,包括全长视频和整个软件仓库。
价格上涨: 与之前的 Flash 预览模型相比,token 价格翻了三倍,达到每百万 token 输入 1.50 美元,输出 9 美元。
卓越的综合逻辑: 在生成复杂的交互式音频工具和现代浏览器操作系统模拟方面处于领先水平。
算术不准确: 偶尔在基本数学运算上遇到困难,无法处理专门的 reasoning 模型可以轻松解决的简单 prompt。
亚秒级 latency: 针对极致的 throughput 进行了优化,在生产环境中输出速度高达每秒 1500 tokens。
Context window 退化: 用户报告称,随着 context window 接近 100 万 token 的限制,检索的可靠性可能会略有下降。
Agentic 性能提升: 在现实世界的编程任务和基于终端的 agentic benchmark 中表现优于许多大型旗舰模型。
3D 光照不一致: 在复杂的 3D 模拟中可能会产生过暗或光照不佳的环境,需要通过迭代 prompt 进行修正。

API快速入门

google/gemini-3.5-flash

查看文档
google SDK
import { GoogleGenAI } from "@google/genai";

const client = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = client.getGenerativeModel({ 
  model: "gemini-3.5-flash",
  generationConfig: { maxOutputTokens: 65536 }
});

async function run() {
  const prompt = "使用 Three.js 构建一个完全交互式的 3D 合成波景观。";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

run();

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3.5 Flash 的评价

看看社区对 Gemini 3.5 Flash 的看法

Gemini 3.5 Flash 是智能与速度 Pareto 前沿的明确领导者,在现实世界的 agentic 任务上取得了巨大进步。
Artificial Analysis
twitter
Gemini 3 对于英国商业用途非常出色。它比以美国为中心的模型能更好地捕捉细微的礼貌用语和英国特定的税收假设。
Efficient_Degree9569
reddit
这个模型太棒了,它似乎非常擅长音乐内容。它的速度非常非常快,它生成的音频合成器让我彻底折服。
Bjaman
youtube
Gemini 3.5 Flash 在编程相关任务上绝对超过了之前的 Pro 模型,这对 agentic 开发者来说意义重大。
DevGuru99
reddit
Google 刚刚发布了 Gemini 3.5 Flash。有趣的部分不仅仅是速度快,Google 正将其定位为 agentic 领域的王者。
TestingCatalog
twitter
Gemini 3.5 Flash 是同类产品中非常强大的模型。在许多 benchmark 上都击败了 Gemini 3.1 Pro。
AI_Expert
twitter

关于 Gemini 3.5 Flash 的视频

观看关于 Gemini 3.5 Flash 的教程、评测和讨论

Google 发布了 Gemini 3.5 Flash。从假设上来说,这在性能上是一个巨大的飞跃。

这是我见过的表现最好的模型,没有之一。即使它不一定完美,但该模型似乎非常擅长音乐相关的内容。

我注意到它的速度非常非常快,而且它确实看起来很喜欢音乐。

对于这样一个小型且快速的模型,在这些代码测试中的 reasoning 能力确实令人印象深刻。

它成功地从单个 prompt 创建了一个可运行的 3D 合成环境,且没有出现错误。

Gemini 3.5 Flash 完全震惊了我。它不仅速度快得离谱,而且完成任务的效果甚至优于 Opus。

Gemini 3.5 Flash 在一分钟内完成了这项任务。这真的很疯狂,Gemini 3.5 Flash 的速度简直不可思议。

Gemini 3.5 Flash 的成本仅为 0.36 美元,而 Claude Opus 的成本几乎是它的两倍。

这里的多模态理解能力明显比之前的 Flash 版本更进一步。

你正以极低的分数成本获得接近旗舰级别的智能。

该模型被定位为 Google 迄今为止最强大的 agentic 编程模型,超越了 Gemini 3.1 Pro。

质量提升非常明显。据报道,幻觉率已从 91% 降低到 61%,这非常了不起。

Gemini 3.5 Flash 在性价比、SVG 艺术生成以及 3JS 开发方面表现优异。

它原生处理视频和音频,从而能够更准确地提取时间数据。

新的思考模式帮助开发者确切地审计模型如何规划其工具使用。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Gemini 3.5 Flash专业提示

专家提示助您充分利用Gemini 3.5 Flash。

启用思考模式

在 API 或 Google AI Studio 中切换思考设置,可为工程问题激活高级 chain-of-thought reasoning。

利用原生多模态能力

直接上传原始音频或视频文件进行分析,以保留时间和音调数据,无需使用外部转录文本。

逐字指定约束条件

模型会严格遵循负面约束。对于原始代码输出,使用“无需解释”之类的指令可最大限度地减少 latency。

应用高低策略

将 Flash 用于 UI 起草等高频任务,仅将 Pro 模型用于最终的架构验证。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
anthropic

Claude 4.5 Sonnet

Anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-Omni

alibaba

Qwen3.5-Omni is a natively omnimodal AI by Alibaba Cloud, offering seamless audio-visual reasoning, real-time voice chat, and 256k context for low-latency apps.

256K context
$0.40/$4.80/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context
$1.25/$10.00/1M

关于Gemini 3.5 Flash的常见问题

查找关于Gemini 3.5 Flash的常见问题答案