google

Gemini 3 Pro

Google Gemini 3 Pro 是一款 multimodal 强力模型,具备 100 万 token 的 context window、原生视频处理能力和行业领先的 reasoning 性能。

Multimodal AILong ContextFrontier ModelAGI-Ready
google logogoogleGemini 32025年11月17日
上下文
1.0Mtokens
最大输出
66Ktokens
输入价格
$2.00/ 1M
输出价格
$12.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
91.9%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3 Pro 在此基准测试中得分 91.9%。
HLE
45.8%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3 Pro 在此基准测试中得分 45.8%。
MMLU
91.8%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3 Pro 在此基准测试中得分 91.8%。
MMLU Pro
85%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3 Pro 在此基准测试中得分 85%。
SimpleQA
72.1%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3 Pro 在此基准测试中得分 72.1%。
IFEval
85%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3 Pro 在此基准测试中得分 85%。
AIME 2025
100%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3 Pro 在此基准测试中得分 100%。
MATH
94%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3 Pro 在此基准测试中得分 94%。
GSM8k
99%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3 Pro 在此基准测试中得分 99%。
MGSM
93%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3 Pro 在此基准测试中得分 93%。
MathVista
79%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3 Pro 在此基准测试中得分 79%。
SWE-Bench
76.2%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3 Pro 在此基准测试中得分 76.2%。
HumanEval
93%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3 Pro 在此基准测试中得分 93%。
LiveCodeBench
81.3%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3 Pro 在此基准测试中得分 81.3%。
MMMU
81%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3 Pro 在此基准测试中得分 81%。
MMMU Pro
81%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3 Pro 在此基准测试中得分 81%。
ChartQA
81.4%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3 Pro 在此基准测试中得分 81.4%。
DocVQA
92%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3 Pro 在此基准测试中得分 92%。
Terminal-Bench
54.2%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3 Pro 在此基准测试中得分 54.2%。
ARC-AGI
31.1%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3 Pro 在此基准测试中得分 31.1%。

关于 Gemini 3 Pro

了解 Gemini 3 Pro 的功能、特性以及它如何帮助您获得更好的效果。

原生 Multimodal 架构

Gemini 3 Pro 是 Google 的主要旗舰 model,旨在通过单一 transformer pass 原生处理文本、图像、音频和视频。与以往依赖单独编码器的 model 不同,该架构在不同模态之间保留了细致的数据。它于 2025 年末发布,旨在作为 frontier reasoning model 的高性能替代品,在原始智能和运营效率之间提供了平衡。

Reasoning 与技术表现

从技术上讲,该 model 在定量领域表现卓越,在 AIME 2025 数学考试中达到了 100% 的满分。它集成了一个内部 Deep Think 层,允许系统在生成响应之前对复杂的逻辑结构进行审议。这使其在科学研究、GPQA Diamond 专家级问答以及需要严格逻辑验证的先进竞赛级编程中尤为有效。

企业级上下文实用性

凭借 100 万 token 的 context window,该 model 专为大规模数据合成而构建。它可以摄入整个代码库或数小时的高清视频,从而提取特定的洞察,而不会出现标准 RAG 架构中常见的信息丢失。这种长上下文能力与优化后的 caching 相结合,使企业能够以显著低于竞争旗舰系统的成本运行复杂的自主工作流。

Gemini 3 Pro

Gemini 3 Pro 的使用案例

发现使用 Gemini 3 Pro 获得出色效果的不同方式。

自主代码库工程

将整个 GitHub 仓库导入 100 万 token 的 context window 中,进行全仓库范围的调试和具有架构意识的特性实现。

Multimodal 视频智能

直接分析长达一小时的视频文件,以提取时间维度的洞察、总结复杂场景或识别视听关联。

博士级科学研究

利用领先的 GPQA 分数和解析密集型科学表格的能力,解决物理和化学领域的研究生水平问题。

3D 空间规划

利用 model 独特的 3D reasoning 能力来规划虚拟环境、设计 UI 布局或解决空间谜题。

Zero-Shot 游戏开发

通过先进的 coding 和逻辑合成能力,在单次 prompt 中生成功能性的复古风格游戏或物理引擎。

企业文档合成

同时处理数千页非结构化的财务文档,以识别风险并生成结构化报告。

优势

局限性

精英级 3D Reasoning: 展现出卓越的解决空间谜题和规划 3D 环境的能力,在视觉逻辑方面超越了竞争对手。
过于冗长: 社区 benchmark 经常将该 model 分类为非常冗长,在简单任务上使用的 token 比实际需要的多。
超大上下文实用性: 100 万 token 的 window 允许摄入整个项目或数小时的视频,而不会出现 RAG 系统常见的数据丢失问题。
幻觉差异: 虽然逻辑能力有所提高,但在开放式评估中,与较小的 model 相比,它仍然保持着可衡量的幻觉率。
顶级数学得分: 在 AIME 2025 数学考试中获得了 100% 的满分,使其成为定量和科学分析的首选。
上下文缩放惩罚: 超过 20 万 token 后价格会立即翻倍,这可能导致大规模企业运营出现意料之外的账单。
极具竞争力的定价: 每 100 万输入 token 2.00 美元的定价,以远低于旗舰产品的成本提供了 frontier model 的智能。
地区性功能差距: 一些高级 agentic 和 deep thinking 功能最初仅限于特定地区或英语设置。

API快速入门

google/gemini-3-pro-preview

查看文档
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ 
  model: "gemini-3-pro",
  thinkingConfig: { includeThoughts: true }
});

const prompt = "Explain the architectural implications of this 1M token codebase.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3 Pro 的评价

看看社区对 Gemini 3 Pro 的看法

Gemini 3 Pro 的 1M 上下文对代码库分析来说是游戏规则的改变者。我终于上传了整个项目,它完全没有搞混结构。
dev_guru_2026
reddit
Deep Think 模式在逻辑方面明显优于 GPT-4o。它真的会停下来仔细思考,而不是脱口而出第一个答案。
AIExpertX
twitter
Google 终于通过 3.1 版本追赶上来了。ARC-AGI-2 上的 benchmark 不会说谎;目前这确实是 reasoning 领域的皇冠。
hackernews_reader
hackernews
我喜欢它的速度和 multimodal 特性,但说真的,有时候太啰嗦了。一个简单的 prompt 它能给你写出一份 10 页的报告。
TheTechReviewer
youtube
数学表现才是这里的真正重点。AIME 2025 满分意味着它实际上是在解决高中竞赛数学题。
logic_king
reddit
原生音频处理带来了巨大的差异。它能捕捉到纯文本 model 无法察觉的语气和讽刺意味。
prompt_engineer
twitter

关于 Gemini 3 Pro 的视频

观看关于 Gemini 3 Pro 的教程、评测和讨论

Gemini 3 Pro... 真正开启了通往真正人工智能竞赛的新篇章。

在我自己独立的 benchmark(Simple Bench)中,它碾压了竞争对手。

该 model 展现出一种我们在之前版本中从未见过的内部审议形式。

它无需预处理就能理解长视频内容的能力,是其最被低估的特性。

我认为几乎没有任何 benchmark 是普通人类的表现能优于 Gemini 3 Pro 的了。

Gemini 3 Pro Deepthink... 可以说是目前公开可用的最聪明的 LLM。

它利用先进的并行 reasoning 同时探索多个假设。

在 100 万 token 的窗口内,其一致性比 1.5 Pro 高得多。

你可以在思维链中看到它在纠正自己的逻辑谬误。

它是少数几个真正能正确展示飞机坠落动画的模型之一。

从 Gemini 2.5 到 Gemini 3 Pro 的能力飞跃是 GPT-4 以来最显著的一次。

考虑到其 reasoning 容量,这个价格简直疯狂。

当 Karpathy 启用 Google Search 工具后,该 model 经历了它所称的‘时间冲击’。

它处理 TypeScript 类型的能力比我今年测试过的任何其他 model 都好。

Gemini 3 成功生成了一个可识别的游戏控制器……而 GPT 5.1 产生的形状几乎无法辨认。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Gemini 3 Pro专业提示

专家提示助您充分利用Gemini 3 Pro。

利用 Reasoning 开关

使用 Deep Think 配置来平衡速度和准确性,并将 High 设置留给竞赛级编程任务。

利用 Context Caching 提升投资回报率

对于长期项目使用 context caching,当查询相同 100 万 token 的数据集时,可将成本降低高达 90%。

提供完整的代码库上下文

在 coding 时,上传整个文件结构而不是片段,以确保 model 能够保持架构的一致性。

时间戳提示 (Temporal Prompting)

在分析视频时,在 prompt 中引用具体的时间戳,以帮助 model 将注意力集中在关键视觉事件上。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

关于Gemini 3 Pro的常见问题

查找关于Gemini 3 Pro的常见问题答案