google

Gemini 3.1 Pro

Gemini 3.1 Pro 是 Google 的顶级 multimodal model,具有 DeepThink reasoning、2M context window 以及用于高级任务的原生 Veo 3.1 视频集成。

MultimodalDeep Reasoning视频生成Workspace AIGoogle Gemini
google logogoogleGeminiFebruary 19, 2026
上下文
2.0Mtokens
最大输出
66Ktokens
输入价格
$2.50/ 1M
输出价格
$15.00/ 1M
模态:TextImageAudioVideo
能力:视觉工具流式传输推理
基准测试
GPQA
94.3%
GPQA: 研究生级科学问答. 由领域专家创建的448道多选题的严格基准测试,涵盖生物学、物理学和化学。博士专家仅达到65-74%的准确率。 Gemini 3.1 Pro 在此基准测试中得分 94.3%。
HLE
44.4%
HLE: 高级专业推理. 测试模型在专业领域展示专家级推理能力的能力。 Gemini 3.1 Pro 在此基准测试中得分 44.4%。
MMLU
90%
MMLU: 大规模多任务语言理解. 涵盖57个学科的16,000道多选题的综合基准测试。 Gemini 3.1 Pro 在此基准测试中得分 90%。
MMLU Pro
90.1%
MMLU Pro: MMLU专业版. MMLU的增强版本,包含12,032道使用更难的10选项多选格式的问题。 Gemini 3.1 Pro 在此基准测试中得分 90.1%。
SimpleQA
72.1%
SimpleQA: 事实准确性基准. 测试模型对直接问题提供准确、事实性回答的能力。 Gemini 3.1 Pro 在此基准测试中得分 72.1%。
IFEval
91.4%
IFEval: 指令遵循评估. 衡量模型遵循特定指令和约束的能力。 Gemini 3.1 Pro 在此基准测试中得分 91.4%。
AIME 2025
96.7%
AIME 2025: 美国数学邀请赛. 来自著名AIME考试的竞赛级数学问题。 Gemini 3.1 Pro 在此基准测试中得分 96.7%。
MATH
94.5%
MATH: 数学问题解决. 涵盖代数、几何、微积分等领域的综合数学基准测试。 Gemini 3.1 Pro 在此基准测试中得分 94.5%。
GSM8k
99.1%
GSM8k: 小学数学8K. 8,500道需要多步推理的小学水平数学应用题。 Gemini 3.1 Pro 在此基准测试中得分 99.1%。
MGSM
95.2%
MGSM: 多语言小学数学. GSM8k基准测试翻译成10种语言版本。 Gemini 3.1 Pro 在此基准测试中得分 95.2%。
MathVista
76.8%
MathVista: 数学视觉推理. 测试解决涉及图表、图形等视觉元素的数学问题的能力。 Gemini 3.1 Pro 在此基准测试中得分 76.8%。
SWE-Bench
80.6%
SWE-Bench: 软件工程基准. AI模型尝试解决开源Python项目中的真实GitHub问题。 Gemini 3.1 Pro 在此基准测试中得分 80.6%。
HumanEval
92.4%
HumanEval: Python编程问题. 164道手写编程问题,模型必须生成正确的Python函数实现。 Gemini 3.1 Pro 在此基准测试中得分 92.4%。
LiveCodeBench
96.2%
LiveCodeBench: 实时编程基准. 在持续更新的真实世界编程挑战中测试编程能力。 Gemini 3.1 Pro 在此基准测试中得分 96.2%。
MMMU
81%
MMMU: 多模态理解. 大规模多学科多模态理解基准测试,测试视觉语言模型在大学水平问题上的表现。 Gemini 3.1 Pro 在此基准测试中得分 81%。
MMMU Pro
81%
MMMU Pro: MMMU专业版. MMMU的增强版本,问题更具挑战性,评估更严格。 Gemini 3.1 Pro 在此基准测试中得分 81%。
ChartQA
89.5%
ChartQA: 图表问答. 测试理解和推理图表信息的能力。 Gemini 3.1 Pro 在此基准测试中得分 89.5%。
DocVQA
94.1%
DocVQA: 文档视觉问答. 测试从文档图像中提取信息的能力。 Gemini 3.1 Pro 在此基准测试中得分 94.1%。
Terminal-Bench
60%
Terminal-Bench: 终端/CLI任务. 测试执行命令行操作和编写shell脚本的能力。 Gemini 3.1 Pro 在此基准测试中得分 60%。
ARC-AGI
77.1%
ARC-AGI: 抽象与推理. AGI抽象和推理语料库 - 通过新颖的模式识别谜题测试流体智力。 Gemini 3.1 Pro 在此基准测试中得分 77.1%。

关于 Gemini 3.1 Pro

了解 Gemini 3.1 Pro 的功能、特性以及它如何帮助您获得更好的效果。

Gemini 3.1 Pro 代表了 Google 生成式 AI 路线图的里程碑式转变,于 2026 年 2 月作为 Gemini 3 系列的 flagship 发布。该 model 旨在弥合通用 multimodal 助手与专家级 reasoning 之间的差距,引入了 DeepThink 引擎,通过先进的 chain-of-thought 处理显著减少了复杂逻辑和数学建模任务中的幻觉。

Gemini 3.1 Pro 拥有海量的 2,048,000 tokens context window,能够以近乎完美的检索能力处理长达一小时的视频文件、庞大的代码库或数千页的文档。其关键优势在于与 Veo 3.1 的原生集成,使其能够直接从文本 prompt 生成高保真视频,而无需单独的视频生成 model。

该 model 针对 agentic 工作流进行了优化,具有专门的 customtools endpoint,可在软件工程和自动化研究中实现高可靠性的工具使用。它旨在与 Google Workspace 生态系统无缝协作,在私有的 Docs、Gmail 和 Drive 数据中提供安全的高质量 grounding,从而实现前所未有的生产力提升。

Gemini 3.1 Pro

Gemini 3.1 Pro 的使用案例

发现使用 Gemini 3.1 Pro 获得出色效果的不同方式。

全栈软件工程

利用 2M context window 参考整个应用仓库,生成功能完整、无 bug 的组件。

Multimodal 内容创作

利用集成的 Veo 3.1 在一个工作流中生成脚本、高清图像和短视频序列。

智能文档分选

将 model 在私有 Workspace 数据中进行 grounding,以总结数月的邮件往来或从数千个文件中提取法律条款。

深度市场情报

利用 Deep Research 合成数小时的网页数据和技术白皮书,生成带有引用来源的全面报告。

复杂数学 Reasoning

利用 DeepThink 模式解决奥数级数学问题,并通过逐步验证进行高级科学建模。

交互式 SVG 生成

通过直接的 prompt-to-render 逻辑创建复杂的、基于物理的矢量图形和 3D 模拟。

优势

局限性

顶级逻辑掌握能力: 在 ARC-AGI 2 benchmark 中获得了突破性的 77.1 分,表明其在新模式识别方面有巨大提升。
DeepThink Latency: 与标准 Pro model 相比,先进的 reasoning 模式“DeepThink”会导致响应时间明显变慢。
海量 2M Context Window: 拥有行业内最大的 context window,达到 2,048,000 tokens,可在长达一小时的视频中实现近乎完美的检索。
西方文化偏见: 社区报告显示,在处理非西方话题(如特定地区的行业创新)时存在明显的偏见。
原生 Multimodal 栈: 在单一统一架构中无缝集成了高保真视频生成 (Veo 3.1) 和音频处理。
地区功能差异: Deep Research 和 Workspace 集成等高价值功能在全球特定地区的可用性有限。
Workspace Grounding: 通过在私有 Google Drive、Docs 和 Gmail 数据中进行 grounding,提供独特的生产力优势。
输入偏好偏差: 即使在请求使用 C++ 等复杂语言时,偶尔也会默认使用 HTML 等更简单的编程语言。

API快速入门

google/gemini-3.1-pro-preview

查看文档
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "Analyze the logic in this codebase...";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

run();

安装SDK并在几分钟内开始进行API调用。

人们对 Gemini 3.1 Pro 的评价

看看社区对 Gemini 3.1 Pro 的看法

Gemini 3.1 Pro 在第 5 步中居然准确知道前面推荐了什么!这种跨越海量线程的上下文承接能力才是真正的赢家。
2doapp
reddit
我昨天在 Gemini 3.1 Pro 上消耗了超过 2 亿个 tokens。快速、智能,而且真的听话。这是我进行氛围编程 (vibe coding) 的新首选。
bridgemindai
twitter
Gemini 3.1 的 SVG 能力无与伦比。我刚才用一个 prompt 就生成了一个能工作的时钟和火车站。
tech_lead_gen
twitter
ARC-AGI 2 达到 77.1 分简直不可思议。如果这些 benchmark 在日常使用中也能站得住脚,那我们将看到通用智能的一次重大飞跃。
ai_enthusiast
reddit
它生成的那个海战游戏里的水面效果比 10 年前的大多数 AAA 游戏都要好。颗粒度细节简直疯了。
AI_Explorer_2025
youtube
Context window 是这里的杀手级功能。我丢进去一个 150 万 tokens 的完整代码库,它在几秒钟内就找到了内存泄漏。
dev_guru_2026
hackernews

关于 Gemini 3.1 Pro 的视频

观看关于 Gemini 3.1 Pro 的教程、评测和讨论

看看我们看到的相比 Gemini 3 Pro 的提升。

就智能指数而言,这是目前你可以使用的最好的 model。

在不使用工具的情况下,Gemini 3.1 Pro 在 Humanity's Last Exam 中取得了迄今为止最高的得分。

这里的 multimodality 不仅仅是插件;它是原生的,而且效果显著。

我们在整个 200 万 token window 中看到了近乎完美的检索能力。

演讲者指出了逻辑上的巨大飞跃……ARC AGI 2 benchmark 从 31.1 跳升到 77.1。

这种水面效果是我在所有 model 测试中见过的最棒的水面效果。

该 model 为每个单独的炮弹实现了独立的水花效果……这种颗粒度细节是我以前从未见过的。

它不只是在遵循指令;它理解场景背后的物理原理。

Google 确实在通过新的工具使用 endpoint 强化其 agentic 能力。

这是一次重大更新,基本上让该 model 回到了与 Opus 4.6 相同的竞争水平。

如果你将其设置为“高”……你肯定会获得类似 Gemini DeepThink mini 的体验。

解决同样的问题,耗时大约只有以前 DeepThink 的一半。

与 Veo 3.1 的集成使这成为了一个真正统一的创意工作站。

代码相关的 benchmark 分数全面提升了近 15%。

不仅仅是提示词

用以下方式提升您的工作流程 AI自动化

Automatio结合AI代理、网页自动化和智能集成的力量,帮助您在更短的时间内完成更多工作。

AI代理
网页自动化
智能工作流

Gemini 3.1 Pro专业提示

专家提示助您充分利用Gemini 3.1 Pro。

使用“四步框架”

通过 Persona(角色)、Task(任务)、Context(上下文)和 Format(格式)来构建 prompt,以最大限度地提高指令遵循的准确性。

使用 @ 标签进行 Grounding

在 Workspace 中,输入 @ 符号后跟文件名,即可让 Gemini 分析特定文档以获得更准确的回答。

显式启用 DeepThink

对于逻辑密集型任务,确保将思考模式设置为“高”,以利用先进的 chain-of-thought 处理。

在 AI Studio Canvas 中迭代

使用 Canvas 模式在实时环境中渲染和调试交互式 Web 组件和 SVG 动画。

用户评价

用户怎么说

加入数千名已改变工作流程的满意用户

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

相关 AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

关于Gemini 3.1 Pro的常见问题

查找关于Gemini 3.1 Pro的常见问题答案