google

Gemini 3.1 Pro

Gemini 3.1 Proは、DeepThink reasoning、2Mのcontext window、およびネイティブなVeo 3.1ビデオ生成機能を備えた、Googleのフラッグシップmultimodal AIです。

マルチモーダル高度なReasoningビデオ生成Workspace AIGoogle Gemini
google logogoogleGemini 32026年2月19日
コンテキスト
2.0Mトークン
最大出力
66Kトークン
入力価格
$2.50/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
94.3%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Gemini 3.1 Proはこのベンチマークで94.3%を記録しました。
HLE
44.4%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Gemini 3.1 Proはこのベンチマークで44.4%を記録しました。
MMLU
80.6%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Gemini 3.1 Proはこのベンチマークで80.6%を記録しました。
MMLU Pro
79.2%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Gemini 3.1 Proはこのベンチマークで79.2%を記録しました。
SimpleQA
79.6%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Gemini 3.1 Proはこのベンチマークで79.6%を記録しました。
IFEval
92.4%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Gemini 3.1 Proはこのベンチマークで92.4%を記録しました。
AIME 2025
92%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Gemini 3.1 Proはこのベンチマークで92%を記録しました。
MATH
92%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Gemini 3.1 Proはこのベンチマークで92%を記録しました。
GSM8k
98.4%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Gemini 3.1 Proはこのベンチマークで98.4%を記録しました。
MGSM
96.5%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Gemini 3.1 Proはこのベンチマークで96.5%を記録しました。
MathVista
89.4%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Gemini 3.1 Proはこのベンチマークで89.4%を記録しました。
SWE-Bench
71%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Gemini 3.1 Proはこのベンチマークで71%を記録しました。
HumanEval
91.2%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Gemini 3.1 Proはこのベンチマークで91.2%を記録しました。
LiveCodeBench
82%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Gemini 3.1 Proはこのベンチマークで82%を記録しました。
MMMU
84.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Gemini 3.1 Proはこのベンチマークで84.2%を記録しました。
MMMU Pro
62.5%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Gemini 3.1 Proはこのベンチマークで62.5%を記録しました。
ChartQA
91.8%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Gemini 3.1 Proはこのベンチマークで91.8%を記録しました。
DocVQA
94.2%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Gemini 3.1 Proはこのベンチマークで94.2%を記録しました。
Terminal-Bench
58%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Gemini 3.1 Proはこのベンチマークで58%を記録しました。
ARC-AGI
77.1%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Gemini 3.1 Proはこのベンチマークで77.1%を記録しました。

Gemini 3.1 Proについて

Gemini 3.1 Proの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

モデル概要

Gemini 3.1 Proは、Gemini 3シリーズにおける核心的なreasoning性能の大幅な飛躍を象徴するモデルであり、強化学習を活用して複雑な論理パターンを解決するDeepThinkエンジンを導入しています。最大の特徴は前例のない2,048,000 tokenのcontext windowであり、ユーザーはソフトウェアリポジトリ全体や数時間のビデオを一度のpromptで処理することが可能です。このモデルはネイティブにmultimodalであり、テキスト、音声、画像、ビデオを同時に取り込み、それらを横断してreasoningを行うように設計されています。

知能とReasoning

次世代のagenticなワークフローに最適化されたGemini 3.1 Proは、戦略的計画や段階的な改善を必要とするタスクで卓越した能力を発揮します。高精細なビデオ生成を行うネイティブのVeo 3.1や、高度な画像生成を行うImagen 4など、Googleのクリエイティブツールと深く統合されています。大規模モデルのreasoning能力を非常に効率的なアーキテクチャに蒸留することで、競争力のある価格でfrontier modelレベルの知能を提供します。

特化されたAgenticツール

画期的なGemini 3アーキテクチャに基づいて構築されており、高度なchain-of-thought検証を利用して、複雑な科学的・数学的reasoningタスクにおける論理的エラーを実質的に排除します。このモデルは、特に長期的なinference中の自己修正能力においてzero-shot能力の著しい向上を実現しており、自律型ソフトウェアエンジニアリングやマルチモーダルな統合分析のための決定的な選択肢となります。

Gemini 3.1 Pro

Gemini 3.1 Proのユースケース

Gemini 3.1 Proを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ソフトウェアエンジニアリング

2Mのcontext windowを活用してコードベース全体を把握し、リポジトリ全体のナビゲーションやリファクタリングを行います。

マルチモーダルな研究統合

数時間のビデオ講義、PDFの研究論文、音声録音を同時に取り込み、包括的なレポートを生成します。

戦略的ビジネスプランニング

DeepThinkエンジンを利用して市場シナリオをシミュレートし、自己修正を行いながら段階的な企業戦略を策定します。

クリエイティブ制作ワークフロー

高度なテキストpromptを通じてネイティブのVeo 3.1およびImagen 4エンジンを操作し、プロフェッショナルな4Kビデオや高精細な画像を生成します。

複雑な科学データ分析

HLEやGPQAなどのbenchmarkで高い精度を発揮し、博士課程レベルの科学問題の解決や難解なデータセットの分析を行います。

Agenticなカスタマーサポート

英国のビジネスエチケットや地域の規制枠組みなど、文化的なニュアンスを理解するローカライズされたAIアシスタントを構築します。

強み

制限

比類なきReasoning能力: ARC-AGI-2で77.1%を達成し、前世代のreasoning能力を2倍以上に向上させました。
DeepThinkにおける遅延: 高度なreasoningモードでは、複雑なタスクの回答生成に数分かかることがあります。
膨大なコンテキスト: 2Mのtoken windowにより、データセット全体やメディアライブラリ全体にわたるネイティブな「long-context」学習が可能です。
強力な安全フィルター: 一般ユーザー向けのガードレールにより、無害なクリエイティブライティングのタスクでも拒否反応が頻発することがあります。
コスト効率: Claude Opus 4.6のような競合他社よりも約75%低いコストで、frontier modelレベルの知能を提供します。
ハルシネーションのばらつき: 以前のモデルよりは改善されていますが、複雑な視覚的タスクにおいて空間的な詳細をハルシネーションすることがあります。
ネイティブなマルチモーダル性能: 補助的なサブモデルを必要とせず、テキスト、音声、画像、ビデオをシングルパスで処理します。
APIの信頼性: 初期のプレビュー版では、需要がピークに達する時間帯にサーバー接続エラーが時折報告されています。

APIクイックスタート

google/gemini-3.1-pro-preview

ドキュメントを見る
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ 
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { includeThoughts: true }
});

async function run() {
  const prompt = "DeepThinkエンジンを使用して、2x^2 + 5x - 3 = 0 の x を解いてください。";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

SDKをインストールして、数分でAPIコールを開始しましょう。

Gemini 3.1 Proについてのユーザーの声

Gemini 3.1 Proについてコミュニティがどう思っているか見てください

Geminiは、英国風の「お忙しいところ大変申し訳ございませんが、5,000ポンドの未払いがございます」という独特の雰囲気を完璧に捉えていました。
Efficient_Degree9569
reddit
3.1 Proは、私がこれまで使った中で最も「賢くて不器用な」モデルです。benchmarkは素晴らしいですが、実戦では課題があります。
David Lingenfelter, PhD
twitter
控えめなアニメの主人公のようです。よく書かれたpromptを投げれば、サイタマのように圧倒的な力を発揮します。
Meng To
twitter
膨大なコンテキストの文書分析において、Gemini 3.1 Proは勝者です。
AIExpert77
hackernews
DeepThinkエンジンは、GPT-4oを悩ませた論理パズルに対して本物の力を発揮します。
LogicLeaper
reddit
最初のファイルを忘れることなく、コードベース全体を実際に読み取ってくれるモデルがついに登場しました。
CoderX
twitter

Gemini 3.1 Proについての動画

Gemini 3.1 Proについてのチュートリアル、レビュー、ディスカッションを見る

Gemini 3.1 Proは3Dと空間の理解が大幅に向上しています。すべてがよりスムーズで正確に見えます。

非常に調和のとれた、本来備わっている作曲の知識が組み込まれています。

ここでのmultimodalityは単なるギミックではなく、体験の核心です。

3.0バージョンと比較して、標準モードではかなりキビキビ動く感じがします。

2時間の4Kビデオを読み込ませましたが、すべてのシーンを完璧にインデックス化できました。

このHigh Thinkingモードは本当にDeepThink miniのようです... 数学オリンピックの問題を解くのに8分かかりました。

これはモデルをOpus 4.6と同じ競争領域に戻す大きなアップデートです。

反論への対処の仕方に、強化学習のトレーニングの成果が現れています。

Googleは開発者のシェアを取り戻すために、非常に攻撃的な価格設定を行っています。

コーディングタスクにおけるzero-shot性能が大幅に向上しているのがわかります。

学習データに含まれていないはずのパズルにおいて、Gemini 3シリーズは他のすべてのモデルを凌駕しています。

常識テストにおいて、人間の平均的なベースラインとの誤差の範囲内まで到達しています。

ネイティブなビデオ理解へのアーキテクチャの移行こそが、2Mのウィンドウを実用的なものにしています。

単なるパターンマッチングではなく、実際にreasoningすることによってARC-AGI-2のタスクを解決しています。

Googleが純粋なreasoning能力において明確なリードを奪ったのは、これが初めてかもしれません。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Gemini 3.1 Proのプロのヒント

Gemini 3.1 Proを最大限に活用し、より良い結果を得るための専門家のヒント。

「High」Thinkingモードの活用

複雑な数学や論理パズルでは、「High」の思考レベル設定を使用することで、DeepThink reasoningエンジンの真価を最大限に引き出すことができます。

視覚的なリファレンスの利用

Gemini 3.1 Proは、テキストによる説明だけでなく画像のリファレンスや設計図を提供することで、「バイブスコーディング」やデザインにおいて卓越した能力を発揮します。

コンシューマー向けのガードレールに注意

一般向けアプリで「活力を削がれた」ような回答が返ってくる場合は、APIを使用して安全フィルターを調整することで、よりクリエイティブまたは発散的なタスクに対応させることができます。

コンテキスト管理

長いやり取りでは、modelが指示を混同する「context rot(コンテキストの劣化)」を防ぐために、時々スレッドを再起動するか、最新の要約を提供してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M

Gemini 3.1 Proについてのよくある質問

Gemini 3.1 Proに関するよくある質問への回答を見つけてください