google

Gemini 3 Flash

Gemini 3 Flashは、100万tokenのcontext window、90.4%という極めて高いGPQA reasoning性能、および自律型ブラウザ自動化ツールを備えた、Googleの高速multimodalモデルです。

google logogoogleGemini 32025年12月17日
コンテキスト
1.0Mトークン
最大出力
66Kトークン
入力価格
$0.50/ 1M
出力価格
$3.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
90.4%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Gemini 3 Flashはこのベンチマークで90.4%を記録しました。
HLE
43.5%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Gemini 3 Flashはこのベンチマークで43.5%を記録しました。
MMLU
91.8%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Gemini 3 Flashはこのベンチマークで91.8%を記録しました。
MMLU Pro
72.5%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Gemini 3 Flashはこのベンチマークで72.5%を記録しました。
SimpleQA
68.7%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Gemini 3 Flashはこのベンチマークで68.7%を記録しました。
IFEval
88.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Gemini 3 Flashはこのベンチマークで88.2%を記録しました。
AIME 2025
99.7%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Gemini 3 Flashはこのベンチマークで99.7%を記録しました。
MATH
58%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Gemini 3 Flashはこのベンチマークで58%を記録しました。
GSM8k
94%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Gemini 3 Flashはこのベンチマークで94%を記録しました。
MGSM
92.4%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Gemini 3 Flashはこのベンチマークで92.4%を記録しました。
MathVista
65.4%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Gemini 3 Flashはこのベンチマークで65.4%を記録しました。
SWE-Bench
78%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Gemini 3 Flashはこのベンチマークで78%を記録しました。
HumanEval
84.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Gemini 3 Flashはこのベンチマークで84.1%を記録しました。
LiveCodeBench
77.2%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Gemini 3 Flashはこのベンチマークで77.2%を記録しました。
MMMU
81.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Gemini 3 Flashはこのベンチマークで81.2%を記録しました。
MMMU Pro
81.2%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Gemini 3 Flashはこのベンチマークで81.2%を記録しました。
ChartQA
86.5%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Gemini 3 Flashはこのベンチマークで86.5%を記録しました。
DocVQA
93.1%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Gemini 3 Flashはこのベンチマークで93.1%を記録しました。
Terminal-Bench
47.6%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Gemini 3 Flashはこのベンチマークで47.6%を記録しました。
ARC-AGI
33.6%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Gemini 3 Flashはこのベンチマークで33.6%を記録しました。

Gemini 3 Flashについて

Gemini 3 Flashの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Gemini 3のパフォーマンス・パワーハウス

Gemini 3 Flashは、極限のスピードと大規模なスケーラビリティに最適化された、Googleのfrontier modelクラスのmultimodalモデルです。Google DeepMindによって開発されたこのモデルは、Gemini 3エコシステムの効率性重視の主力として、テキスト、コード、画像、音声を横断する高品質なreasoningとネイティブなmultimodal処理を提供します。特に、低latencyとコスト効率が最優先される大規模なエンタープライズ・ワークロード向けに設計されています。

前例のないコンテキストとエージェント機能

このモデルは、巨大な100万tokenのcontext windowを備えており、コードリポジトリ全体、数時間の動画、あるいは数千ページのドキュメントを1つのpromptで処理することが可能です。単なるチャットボットにとどまらず、エージェントとしての利用を想定して設計されており、GoogleのStagehandおよびNano Browser APIと統合することで、ウェブを自律的にナビゲートし、マルチステップのデジタルタスクを実行し、人間と同じようにライブのウェブ要素と対話することができます。

エリート級の科学的Reasoning

速度に最適化されている一方で、Gemini 3 Flashは知能に妥協していません。専用のDeep Thinkアクティベーション・プロトコルを通じて、モデルは内部的なchain-of-thoughtプロセスをトリガーし、数学、科学、論理における博士レベルの課題を解決できます。この二面性により、単純なシステム指示だけで、迅速なデータ抽出と洗練された専門家レベルの分析を切り替えることが可能です。

Gemini 3 Flash

Gemini 3 Flashのユースケース

Gemini 3 Flashを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ブラウザ自動化

StagehandおよびNano Browser APIを介した、リード獲得や複雑なデータスクレイピングなどのマルチステップなウェブタスクの実行。

大規模データ抽出

100万tokenのcontext windowを活用し、膨大なデータセットや長文ドキュメントをシームレスに合成・処理。

リアルタイム音声対話

ネイティブな音声対音声機能と低い音声認識latencyにより、応答性の高いAIアシスタントを構築。

迅速なプロトタイピングとコーディング

統合されたCanvasモードを使用して、開発環境でのボイラープレートコードやUIコンポーネントの生成とテスト。

検索と情報の集約

テキスト、画像、動画などの多様なソースにわたる迅速なmultimodal reasoningにより、AIによる概要生成を強化。

Agenticなワークフローのオーケストレーション

迅速なtool-callingを必要とする複雑なマルチエージェント型タスクにおける、軽量な実行エンジンとしての活用。

強み

制限

極めて高い効率性: Gemini 2.5 Proよりも3倍高速に動作し、大量のエンタープライズタスクにおいて大幅なコスト削減を実現。
デフォルトでの過度な簡潔さ: デフォルトでは非常に短い回答を返す傾向があり、クリエイティブなタスクには詳細なprompt engineeringやXMLタグが必要になる場合がある。
巨大なコンテキスト容量: 100万tokenのウィンドウにより、リポジトリ全体や長時間の動画文字起こしを一度のpromptで処理可能。
コンテキスト・ドリフトへの感受性: 長いpromptにおいて、特定のコンテキスト・アンカリング技術を適用しない場合、「lost in the middle(中だるみ)」現象の影響を受けやすい。
エリート級のReasoning性能: Deep Thinkプロトコル使用時にGPQA Diamondで博士レベルの90.4%を達成し、高い科学的精度を実証。
安全性評価のギャップ: 開発初期バージョンのレッドチーム評価において97.3%のjailbreak成功率が示されており、潜在的なセキュリティリスクがある。
Agenticな卓越性: Stagehandフレームワークとの深い統合により、自律的なブラウザ操作やtool-callingを実行する優れた能力。
人間には及ばない実行深度: 計画能力は高いものの、複雑で動的、かつ検証不可能なデジタル環境での実行において苦戦することがある。

APIクイックスタート

google/gemini-3-flash

ドキュメントを見る
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-3-flash" });

async function run() {
  const prompt = "Analyze the core logic in this codebase for efficiency.";
  const result = await model.generateContent(prompt);
  const response = await result.response;
  console.log(response.text());
}

run();

SDKをインストールして、数分でAPIコールを開始しましょう。

Gemini 3 Flashについてのユーザーの声

Gemini 3 Flashについてコミュニティがどう思っているか見てください

"「Flashによって、コストあたりの知能というパレートのフロンティアは実質的に垂直化した。」"
OrdinaryLavishness11
reddit
"「Gemini 3 Flash CLIは、ターミナルをフル機能のAIスタジオに変えてくれる。」"
JamMasterJulian
reddit
"「ただ安いだけではない。GPQA Diamondで90.4%を叩き出すエリートだ。」"
OrdinaryLavishness11
reddit
"「我々は事実上、科学の自動化を自動化しようとしている。」"
alexwg
x/twitter
"「Gemini 3と対話する際、その制約(口輪)を知能そのものと混同してはならない。」"
uberzak
reddit
"「Stagehandを通じたウェブ自動化機能は、まさにゲームチェンジャーだ。」"
AIBuilder99
hackernews

Gemini 3 Flashについての動画

Gemini 3 Flashについてのチュートリアル、レビュー、ディスカッションを見る

「これは単なるプラグインではありません。ウェブそのものの次世代の姿です。自ら読み、クリックし、入力し、スクロールし、構築するブラウザなのです。」

「Stagehandがそれを視覚的な座標に変換し、クリックをシミュレートします。」

「これまでテストしたどのエージェントよりも、CAPTCHAや動的な読み込みをうまく処理できます。」

「コマンドから最初のクリックまでのlatencyは800ミリ秒未満です。」

「これにより、あらゆるウェブサイトがエージェントのための構造化されたAPIに変わります。」

「GoogleはGeminiの知能をターミナルに直接持ち込みました。」

「ターミナルの内部にAIラボがあるようなものです。」

「今すぐpipやnpmでインストールして、ログをモデルに直接流し込み始めることができます。」

「5万行のログを読み込ませても破産することはないので、Flashモデルはこの用途に最適です。」

「実際に独自のbashスクリプトを安全に記述し、実行する能力を備えています。」

「Gemini 3 Flashは、スピードとスケールが知能を犠牲にする必要がないことを証明しています。」

「Gemini 3 Flashを使って完全なコンテンツ自動化ツールを構築しました。以前は3時間かかっていたものが、今は2分未満です。」

「『Flash』モデルがGPQAで出したスコアは、競合他社にとって正直恐ろしいものです。」

「100万tokenにわたって一貫性を維持できる能力こそが、その秘密兵器です。」

「大量のトラフィックを扱うSaaSアプリを構築しているなら、これが現在のデフォルトの選択肢です。」

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

Gemini 3 Flashのプロのヒント

Gemini 3 Flashを最大限に活用し、より良い結果を得るための専門家のヒント。

Deep Thinkプロトコル

モデルが博士レベルの複雑な課題を解決する必要がある場合、システム指示に <deep_think_activation: true> を含めて、拡張されたreasoningフェーズをトリガーしてください。

XML出力指定

モデルのデフォルトの過度な簡潔さを抑えるために、長さやスタイルの要件を明示的な <output_verbosity> XMLタグで囲んでください。

コンテキスト・アンカリング

100万tokenのフルコンテキストを利用する際は、情報の乖離を防ぐため、prompt内で特定のアンカーポイントやファイル名を引用してください。

ターミナル統合

Gemini 3 Flash CLIを活用して、ローカルファイルの処理やシェルスクリプトの実行をターミナル環境から直接自動化してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M

Gemini 3 Flashについてのよくある質問

Gemini 3 Flashに関するよくある質問への回答を見つけてください