google

Gemini 3.1 Pro

Gemini 3.1 Pro 是 Google 的旗舰级 multimodal AI,具有 DeepThink reasoning、2M context window 以及原生的 Veo 3.1 视频生成能力。

Multimodal深度 Reasoning视频生成Workspace AIGoogle Gemini
google logogoogleGemini 3February 19, 2026
上下文
2.0Mtokens
最大输出
66Ktokens
输入价格
$2.50/ 1M
输出价格
$15.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
94.3%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3.1 Pro 在此基准测试中得分 94.3%。
HLE
44.4%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3.1 Pro 在此基准测试中得分 44.4%。
MMLU
80.6%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3.1 Pro 在此基准测试中得分 80.6%。
MMLU Pro
79.2%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3.1 Pro 在此基准测试中得分 79.2%。
SimpleQA
79.6%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3.1 Pro 在此基准测试中得分 79.6%。
IFEval
92.4%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3.1 Pro 在此基准测试中得分 92.4%。
AIME 2025
92%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3.1 Pro 在此基准测试中得分 92%。
MATH
92%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3.1 Pro 在此基准测试中得分 92%。
GSM8k
98.4%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3.1 Pro 在此基准测试中得分 98.4%。
MGSM
96.5%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3.1 Pro 在此基准测试中得分 96.5%。
MathVista
89.4%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3.1 Pro 在此基准测试中得分 89.4%。
SWE-Bench
71%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3.1 Pro 在此基准测试中得分 71%。
HumanEval
91.2%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3.1 Pro 在此基准测试中得分 91.2%。
LiveCodeBench
82%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3.1 Pro 在此基准测试中得分 82%。
MMMU
84.2%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3.1 Pro 在此基准测试中得分 84.2%。
MMMU Pro
62.5%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3.1 Pro 在此基准测试中得分 62.5%。
ChartQA
91.8%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3.1 Pro 在此基准测试中得分 91.8%。
DocVQA
94.2%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3.1 Pro 在此基准测试中得分 94.2%。
Terminal-Bench
58%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3.1 Pro 在此基准测试中得分 58%。
ARC-AGI
77.1%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3.1 Pro 在此基准测试中得分 77.1%。

关于 Gemini 3.1 Pro

了解 Gemini 3.1 Pro 的功能、特性以及它如何帮助您获得更好的效果。

模型概览

Gemini 3.1 Pro 代表了 Gemini 3 系列在核心 reasoning 方面的实质性飞跃,引入了利用强化学习解决复杂逻辑模式的 DeepThink 引擎。其显著特征是前所未有的 2,048,000 token context window,允许用户在单个 prompt 中处理整个软件仓库或数小时的视频。该 model 是原生 multimodal 的,旨在同时摄取文本、音频、图像和视频并进行 reasoning。

智能与推理

Gemini 3.1 Pro 为下一代 agentic 工作流进行了优化,在需要战略规划和逐步改进的任务中表现出色。它与 Google 的创意工具深度集成,包括用于高保真视频生成的原生 Veo 3.1 和用于高级图像创作的 Imagen 4。通过将大型 model 的 reasoning 能力提炼到高效的架构中,它以极具竞争力的价格提供了 frontier model 级别的智能。

专业 Agentic 工具

基于革命性的 Gemini 3 架构,它利用复杂的 chain-of-thought 验证,在复杂的科学和数学 reasoning 任务中几乎消除了逻辑错误。该 model 在 zero-shot 能力方面代表了重大跨越,特别是在长周期 inference 过程中的自我修正能力,使其成为自主软件工程和 multimodal 综合的终极选择。

Gemini 3.1 Pro

Gemini 3.1 Pro 的使用案例

发现使用 Gemini 3.1 Pro 获得出色效果的不同方式。

自主软件工程

利用 2M context window 实现对全局代码库的理解,从而导航和重构整个代码仓库。

Multimodal 研究综合

同时摄取数小时的视频讲座、PDF 研究论文和音频录音,以生成综合报告。

战略业务规划

利用 DeepThink 引擎模拟市场场景,并开发具有自我修正能力的逐步企业策略。

创意生产工作流

通过高层文本 prompt 指导原生的 Veo 3.1 和 Imagen 4 引擎,生成专业的 4K 视频和高保真图像。

复杂科学数据分析

解决博士级别的科学问题,并在 HLE 和 GPQA benchmark 上以高准确率分析晦涩的数据集。

Agentic 客户支持

构建能够理解文化细微差别(如英国商务礼仪或地区监管框架)的本地化 AI 助手。

优势

局限性

无与伦比的 reasoning 能力: 在 ARC-AGI-2 上达到 77.1%,使前几代产品的 reasoning 能力翻了一番以上。
DeepThink 的 latency 问题: 对于复杂任务,高 reasoning 模式可能需要几分钟才能生成响应。
海量 context: 2M token 窗口允许在整个数据集或媒体库中进行原生的“长 context”学习。
激进的安全过滤器: 面向消费者的护栏经常会触发拒绝,即使是对于温和的创意写作任务也是如此。
成本效益: 提供 frontier model 级别的智能,而成本比 Claude Opus 4.6 等竞争对手低约 75%。
Hallucination 波动: 虽然比之前的 model 低,但在复杂的视觉任务中仍可能对空间细节产生 hallucination。
原生 Multimodality: 在单次处理中即可处理文本、音频、图像和视频,无需辅助子模型。
API 稳定性: 早期预览版在需求高峰期曾出现过偶发性的服务器连接错误。

API快速入门

google/gemini-3.1-pro-preview

查看文档
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "Solve for x in 2x^2 + 5x - 3 = 0 using the DeepThink engine.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3.1 Pro 的评价

看看社区对 Gemini 3.1 Pro 的看法

Gemini 完美捕捉到了那种英国式的‘非常抱歉打扰你,但你欠我们 5,000 英镑’的神韵。
Efficient_Degree9569
reddit
3.1 Pro 是我用过最聪明的‘笨’ model。在 benchmark 上表现惊人,但在实际应用中却表现欠佳。
David Lingenfelter, PhD
twitter
它就像一个不起眼的动漫主角。扔给它一个写得好的 prompt,它就会像一拳超人里的埼玉一样爆发出惊人的实力。
Meng To
twitter
Gemini 3.1 Pro 是海量 context 文档分析的赢家。
AIExpert77
hackernews
对于那些难倒 GPT-4o 的逻辑谜题,DeepThink 引擎确实很有两把刷子。
LogicLeaper
reddit
终于有一个 model 能真正读完我的整个代码库,而不会忘掉第一个文件了。
CoderX
twitter

关于 Gemini 3.1 Pro 的视频

观看关于 Gemini 3.1 Pro 的教程、评测和讨论

Gemini 3.1 Pro 在 3D 和空间理解方面表现得更好。一切看起来都更加平滑、更加准确。

它内置了一些固有的音乐创作知识,听起来非常和谐。

这里的 multimodality 不仅仅是个噱头,它是整个体验的核心。

与 3.0 版本相比,标准模式下的运行速度明显更加轻快。

我尝试给它喂了一个 2 小时的 4K 视频,它完美地索引了每一个场景。

这个高思维模式真的很像 deep think mini... 它花了 8 分钟解出了一道奥数题。

这是一个重大更新,让该 model 重新回到了与 Opus 4.6 相同的竞争领域。

强化学习训练在它处理反驳论点的方式中得到了体现。

Google 的定价非常激进,旨在夺回开发者市场份额。

我们看到编程任务的 zero-shot 性能有了巨大飞跃。

在那些不应该出现在训练数据中的谜题上,Gemini 3 系列的表现优于所有其他 model。

它基本上让 model 在常识测试中达到了人类平均基准的误差范围之内。

向原生视频理解的架构转变是 2M 窗口变得可行的原因。

它通过真正的 reasoning 而非简单的模式匹配来解决 ARC-AGI-2 任务。

这可能是 Google 第一次在原始 reasoning 能力上拥有明显的领先优势。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Gemini 3.1 Pro专业提示

专家提示助您充分利用Gemini 3.1 Pro。

利用“高”思维模式

对于复杂的数学或逻辑难题,请使用“高”思维等级设置,以触发 DeepThink reasoning 引擎的全部能力。

使用视觉参考

当提供图像参考或蓝图而非仅仅是文本描述时,Gemini 3.1 Pro 在“氛围编程 (vibe coding)”和设计方面表现出色。

注意消费者端的安全护栏

如果你在消费者应用中遇到“被阉割”的回复,请尝试使用 API 并调整安全过滤器,以执行更具创意或发散性的任务。

Context 管理

对于长对话,请偶尔重新启动线程或提供新的摘要,以防止出现 model 混淆指令的“context rot”现象。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

关于Gemini 3.1 Pro的常见问题

查找关于Gemini 3.1 Pro的常见问题答案