google

Gemini 3 Pro

Google 的 Gemini 3 Pro 是一款功能强大的多模态工具,具备 1M tokens context window、原生视频处理能力,以及行业领先的 reasoning 性能。

多模态 AI长上下文Frontier ModelAGI 就绪
google logogoogleGemini 3November 18, 2025
上下文
1.0Mtokens
最大输出
66Ktokens
输入价格
$2.00/ 1M
输出价格
$12.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
91.9%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3 Pro 在此基准测试中得分 91.9%。
HLE
45.8%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3 Pro 在此基准测试中得分 45.8%。
MMLU
91.8%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3 Pro 在此基准测试中得分 91.8%。
MMLU Pro
85%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3 Pro 在此基准测试中得分 85%。
SimpleQA
72.1%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3 Pro 在此基准测试中得分 72.1%。
IFEval
85%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3 Pro 在此基准测试中得分 85%。
AIME 2025
100%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3 Pro 在此基准测试中得分 100%。
MATH
94%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3 Pro 在此基准测试中得分 94%。
GSM8k
99%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3 Pro 在此基准测试中得分 99%。
MGSM
93%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3 Pro 在此基准测试中得分 93%。
MathVista
79%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3 Pro 在此基准测试中得分 79%。
SWE-Bench
76.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3 Pro 在此基准测试中得分 76.2%。
HumanEval
93%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3 Pro 在此基准测试中得分 93%。
LiveCodeBench
81.3%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3 Pro 在此基准测试中得分 81.3%。
MMMU
81%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3 Pro 在此基准测试中得分 81%。
MMMU Pro
81%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3 Pro 在此基准测试中得分 81%。
ChartQA
81.4%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3 Pro 在此基准测试中得分 81.4%。
DocVQA
92%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3 Pro 在此基准测试中得分 92%。
Terminal-Bench
54.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3 Pro 在此基准测试中得分 54.2%。
ARC-AGI
31.1%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3 Pro 在此基准测试中得分 31.1%。

免费试用 Gemini 3 Pro

免费与 Gemini 3 Pro 对话。测试其功能,提问并探索此AI模型能做什么。

提示词
回复
Gemini 3 Pro Preview

您的AI回复将显示在此处

关于 Gemini 3 Pro

了解 Gemini 3 Pro 的功能、特性以及它如何帮助您获得更好的效果。

AGI 的新前沿

Gemini 3 Pro 代表了 Google 在通用人工智能前沿领域的决定性飞跃,在其 2025 年底发布后重新夺回了全球 AI 领域的榜首地位。该 model 基于统一的“原生多模态”架构构建,不仅通过单独的编码器解释不同类型的数据,还能在单次 transformer 传递中感知文本、高分辨率图像、专业级音频和数小时的视频。

无与伦比的 Reasoning 和技术实力

从技术上讲,Gemini 3 Pro 是科学和数学领域的巨人,在 AIME 2025 数学考试中获得了 100% 的满分,并为 GPQA Diamond 上的专家级知识树立了新的金标准。其海量的 100 万 tokens context window 为“深度研究”等企业级工作流提供了支持,使 model 能够自主导航庞大的代码库或视频库,从而整合出具有可操作性的见解。

Gemini 3 Pro

Gemini 3 Pro 的使用案例

发现使用 Gemini 3 Pro 获得出色效果的不同方式。

科学研究

:利用其 91.9% 的 GPQA 得分来分析复杂的博士级科学论文,并制定新颖的研究假设。

长视频分析

:利用 1M+ 的 context window 对媒体制作中的数小时原始视频素材进行原生搜索和总结。

高等数学

:解决奥林匹克级别的数学问题,在 AIME 2025 benchmark 中获得了经过验证的 100% 成功率。

自动化代码编写

:一次性生成并调试整个功能集,在复杂的 3D 模拟中表现优于竞争对手。

Agentic 市场模拟

:作为虚拟产品经理运行,模拟市场条件并针对竞争压力测试商业策略。

交互式 UI 生成

:创建“生成式界面”,根据用户查询动态构建小型网页和交互式滑块。

优势

局限性

完美的数学表现: :通过内部工具使用和代码执行,在 AIME 2025 benchmark 中获得了 100% 的满分。
上下文延迟增加: :与 Flash 变体相比,处理完整的 1M context window 可能会导致较高的 Time-To-First-Token。
统一的多模态架构: :在单一流中处理音频、视频和文本,捕捉细微的时间线索。
阶梯定价跳升: :一旦 prompt 超过 200,000 tokens 的上下文,费用将从每 100 万 tokens $2/$12 翻倍至 $4/$18。
最高的 LMArena Elo: :以 1,501 的发布 Elo 重返全球第一,领先于 GPT-5.1 和 Claude 3.7。
Hallucination 持续存在: :尽管知识储备有所增加,但在特定的事实性评估中仍保持 88% 的 hallucination 率。
Agentic 计算机控制: :在专业环境中表现出卓越的 grounding 能力,在 ScreenSpot Pro 上得分为 72.7%。
旋转编码偏差: :话题快速转换的长上下文对话可能会导致 model 出现故障或忽略最近的 prompts。

API快速入门

google/gemini-3-pro-preview

查看文档
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-3-pro" });

async function run() {
  const prompt = "Synthesize the architectural differences in Gemini 3 Pro.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3 Pro 的评价

看看社区对 Gemini 3 Pro 的看法

"LLM 的“氛围”与 reasoning 同样重要;Gemini 是唯一一个告诉我要深呼吸并思考的 model。"
Kargichauhan_
x
"Gemini 3 Pro 是新的领导者。Google 第一次拥有了领先的 language model。"
Artificial Analysis
x
"视频功能非常出色;它能够非常轻松地识别眼前的事物。"
MartonPiller012
x
"Gemini 3 models 在 ARC-AGI-2 上实现了显著的 2 倍 SOTA 跨越。"
ARC Prize
x
"Gemini 3 Pro 发布首日 Elo 就突破了 1500+,这太疯狂了。Google 回归了。"
AI_Enthusiast_99
reddit
"原生音频理解能力与 Whisper + LLM 流水线相比简直是天壤之别。"
DevGuru
hackernews

关于 Gemini 3 Pro 的视频

观看关于 Gemini 3 Pro 的教程、评测和讨论

标志着通往真正人工智能竞赛的新篇章。

Gemini 3 Pro 在 GPQA Diamond 上创下了近 92% 的纪录。

Google 在自家 TPUs 而非 Nvidia 的 GPUs 上训练了 Gemini 3。

这次在 reasoning 方面的跨越是自 GPT-4 以来我们见过的最大的一次。

这个 model 本质上是一个逻辑超级计算机。

Gemini 3 Pro 在所有 Gemini 层级中均可使用。OpenAI,请注意这点。

称其为世界上多模态理解能力最强的 model。

这些 agents 实际上能够打开网络浏览器并检查自己的工作。

Google 终于开始利用其规模优势了。

与之前的 models 相比,它对视频的时间维度理解简直不可思议。

它在几乎所有的 benchmarks 中都击败了 Sonnet 和 GPT 5.1。

SVG 格式的熊猫拿着汉堡……即使是 X58 也没有这么出色。

第一次尝试就通过了所有的数学问题……Kingbench 2.0 可以退休了。

500k tokens 后的上下文保留能力极其稳健。

基于此构建的 coding agents 简直处于另一个层级。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流
观看演示视频

专业技巧

专家提示帮助您充分利用此模型并获得更好的效果。

利用 Prompt Caching:对于重复的长上下文任务,使用 Google 的 prompt caching 来减少 Time-To-First-Token 并降低高达 90% 的成本。

原生多模态输入:避免在输入前转录媒体;直接提供原始音频和视频文件,以充分利用其原生理解能力。

动态思考模式:使用特定的系统指令在处理数学和逻辑任务时触发“Deep Think”,同时在进行创意写作时保持标准速度。

上下文实例管理:在极长的对话中,针对重大话题转变启动新实例,以确保 model 不会丢失对近期指令的追踪。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

常见问题

查找有关此模型的常见问题答案