google

Gemini 3.1 Pro

Gemini 3.1 Proは、DeepThink reasoningエンジン、1M以上のcontext window、業界トップクラスのARC-AGIロジックスコアを備えたGoogleのeliteなmultimodalモデルです。

MultimodalDeep ReasoningVideo GenerationWorkspace AIGoogle Gemini
google logogoogleGeminiFebruary 19, 2026
コンテキスト
2.0Mトークン
最大出力
66Kトークン
入力価格
$2.50/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
94.3%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Gemini 3.1 Proはこのベンチマークで94.3%を記録しました。
HLE
44.4%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Gemini 3.1 Proはこのベンチマークで44.4%を記録しました。
MMLU
80.6%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Gemini 3.1 Proはこのベンチマークで80.6%を記録しました。
MMLU Pro
79.2%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Gemini 3.1 Proはこのベンチマークで79.2%を記録しました。
SimpleQA
79.6%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Gemini 3.1 Proはこのベンチマークで79.6%を記録しました。
IFEval
92.4%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Gemini 3.1 Proはこのベンチマークで92.4%を記録しました。
AIME 2025
92%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Gemini 3.1 Proはこのベンチマークで92%を記録しました。
MATH
92%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Gemini 3.1 Proはこのベンチマークで92%を記録しました。
GSM8k
98.4%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Gemini 3.1 Proはこのベンチマークで98.4%を記録しました。
MGSM
96.5%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Gemini 3.1 Proはこのベンチマークで96.5%を記録しました。
MathVista
89.4%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Gemini 3.1 Proはこのベンチマークで89.4%を記録しました。
SWE-Bench
71%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Gemini 3.1 Proはこのベンチマークで71%を記録しました。
HumanEval
91.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Gemini 3.1 Proはこのベンチマークで91.2%を記録しました。
LiveCodeBench
82%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Gemini 3.1 Proはこのベンチマークで82%を記録しました。
MMMU
84.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Gemini 3.1 Proはこのベンチマークで84.2%を記録しました。
MMMU Pro
62.5%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Gemini 3.1 Proはこのベンチマークで62.5%を記録しました。
ChartQA
91.8%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Gemini 3.1 Proはこのベンチマークで91.8%を記録しました。
DocVQA
94.2%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Gemini 3.1 Proはこのベンチマークで94.2%を記録しました。
Terminal-Bench
58%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Gemini 3.1 Proはこのベンチマークで58%を記録しました。
ARC-AGI
77.1%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Gemini 3.1 Proはこのベンチマークで77.1%を記録しました。

Gemini 3.1 Proについて

Gemini 3.1 Proの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Gemini 3.1 Proは、高度なmultimodal処理エンジンをネイティブに組み合わせたSparse Mixture-of-Experts (MoE)フレームワークの成熟した実装です。アーキテクチャの際立った特徴は、モデルが出力tokenを確定させる前に内部で熟考することを可能にするDeepThink System 2層の民主化です。このモデルは、Low、Medium、Highというユニークな3段階のthinkingシステムを導入しており、開発者がlatency、コスト、reasoning深度のトレードオフを明示的に制御できるようにしています。

100万tokenのcontext windowを持つGemini 3.1 Proは、金融、データ分析、リポジトリ全体のコード移行などの複雑なワークフローに最適化されています。新しい論理パターンを解決する創発的な能力を示しており、ARC-AGI-2 benchmarkで前例のない77.1%を記録しました。これにより、低latencyなmultimodalインタラクションと、agenticなタスクのための高度な認知パフォーマンスの両方を必要とする開発者にとって、好ましい選択肢となっています。

Gemini 3.1 Pro

Gemini 3.1 Proのユースケース

Gemini 3.1 Proを使って素晴らしい結果を得るさまざまな方法を発見してください。

リポジトリ全体のコード分析

1M context windowを活用し、リファクタリングや依存関係マッピングのためにソフトウェアリポジトリ全体を取り込みます。

自律的なエージェント委員会

内部サブエージェントが実行前にソリューションを議論・検証する、ステップバイステップのagenticワークフローを駆動します。

科学研究の統合

数千もの研究論文や複雑なデータセットを分析し、構造化された知見や事実に基づく洞察を抽出します。

Multimodalコンテンツ制作

テキスト、画像、音声を同時に処理し、複雑な教材やインタラクティブなメディアを生成します。

ターミナルベースの自動化

高度なreasoningモードを介して、複雑なbashコマンドの実行やファイルシステムの操作を高精度で行います。

企業データ監査

非構造化された財務データや法的文書を解析し、ほぼ完璧な事実の再現性をもってコンプライアンスの不備を特定します。

強み

制限

ARC-AGI-2 Reasoningのリーダー: ARC-AGI-2で77.1%を記録し、以前のflagship modelのreasoning能力を2倍以上に高めました。
大規模Contextの価格ペナルティ: プロンプトが200,000 tokenの閾値を超えると入力・出力価格が倍になり、大規模なバッチジョブに影響します。
1M token context window: 大規模な複数ファイルのコードベースや長編ビデオを、state-of-the-artの再現性と低latencyで処理します。
過剰な冗長性: benchmarkでは、単純なタスクに対して必要な量よりも大幅に多くのtokenを生成するなど、モデルが過度に冗長になる可能性があることが示されています。
競争力のある価格戦略: 100万tokenあたり2ドル/12ドルという価格設定により、AnthropicやOpenAIの同等モデルよりも大幅に手頃な価格になっています。
ニュアンスのあるトーンの課題: コミュニティからのフィードバックでは、会話のトーンがClaude 3.5シリーズと比較して自然さやニュアンスに欠ける場合があるとの指摘があります。
粒度の細かいCompute Tier: 内部のreasoning深度とコストを開発者が正確に制御できるようにする、3段階のthinkingシステムを備えています。
不整合なReasoning Tier: reasoningの品質はTier間で大きく異なり、最適な設定を見つけるために手動での実験が必要になることがよくあります。

APIクイックスタート

google/gemini-3.1-pro-preview

ドキュメントを見る
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { tier: "high" }
});

const prompt = "Analyze this entire codebase for security vulnerabilities.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

SDKをインストールして、数分でAPIコールを開始しましょう。

Gemini 3.1 Proについてのユーザーの声

Gemini 3.1 Proについてコミュニティがどう思っているか見てください

Gemini 3.1 Pro's 77.1% score represents the most disruptive market shift; it more than doubles the previous high on ARC-AGI.
enoumen
reddit
The coding benchmarks don't lie. This model found a bug in my repo that 3.5 and GPT-4o missed completely.
SiliconValleyCoder
hackernews
The gemini 3.1 shitstorm is really interesting. It crushed benchmarks but real users are saying the tone and vibe are inconsistent.
cryptopunk7213
twitter
The DeepThink engine can lead to significant delays, sometimes over 90 seconds, when processing tasks requiring deep logic.
TechReviewer2026
youtube
Context caching is the killer feature here. I'm running an entire documentation bot for pennies compared to GPT-4o.
CloudArchitect
reddit
Gemini failed to discuss Python at all in a complex planning task... some logic was just not present in its final plan.
Temporary-Mix8022
reddit

Gemini 3.1 Proについての動画

Gemini 3.1 Proについてのチュートリアル、レビュー、ディスカッションを見る

Gemini 3.1 Pro generates the most detailed version of this pagoda so far

Gemini has by far the widest window of a million tokens

The multimodal fidelity in audio processing is noticeably better than 3.0

Token throughput remains stable even as the context window fills up

Long-term recall is basically perfect across the entire million tokens

On puzzles that shouldn't be in its training data, the Gemini 3 series outperforms all other models

3.1 Pro could indeed reduce the runtime of a fine-tuning script from 300 seconds to 47 seconds

DeepThink logic steps are clearly visible in the trace, showing real deliberation

We are reaching benchmark saturation where only ARC-AGI really matters for progress

The AGI trajectory is accelerating based on these abstract reasoning jumps

I do think that like 3.1 it genuinely feels like a step up, even if it's just very slight

It does seem to outperform Gemini 3.0 Pro when we test the exact same prompts side by side

Coding accuracy on complex Python refactors is the highest I have seen

API reliability has improved significantly over the last month of testing

Real-world performance finally matches the hype of the benchmark scores

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Gemini 3.1 Proのプロのヒント

Gemini 3.1 Proを最大限に活用し、より良い結果を得るための専門家のヒント。

Reasoning Tierの選択

複雑な数学や論理にはHigh thinkingモードを使用し、標準的なフォーマット作成にはLowを使用してコストを削減しましょう。

Context Caching

静的なドキュメントに対してcontext cachingを実装することで、入力コストを100万tokenあたり最大90%削減できます。

構造化されたArtifacts

agenticな実行中に、人間が監督しやすいように構造化されたタスクリストを生成するモデルの能力を活用しましょう。

Multimodal Prompting

ビデオと音声の入力を組み合わせることで、テキストのみの説明ではなく、現実世界のシナリオの完全なコンテキストをモデルに与えましょう。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Gemini 3.1 Proについてのよくある質問

Gemini 3.1 Proに関するよくある質問への回答を見つけてください