google

Gemini 3 Flash

Gemini 3 Flashは、1M tokenのcontext window、90.4%のエリートレベルのGPQA reasoning、そして自律的なブラウザ自動化ツールを備えたGoogleの高速マルチモーダルモデルです。

google logogoogleGemini 32025-12-17
コンテキスト
1.0Mトークン
最大出力
66Kトークン
入力価格
$0.50/ 1M
出力価格
$3.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
90.4%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Gemini 3 Flashはこのベンチマークで90.4%を記録しました。
HLE
43.5%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Gemini 3 Flashはこのベンチマークで43.5%を記録しました。
MMLU
91.8%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Gemini 3 Flashはこのベンチマークで91.8%を記録しました。
MMLU Pro
72.5%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Gemini 3 Flashはこのベンチマークで72.5%を記録しました。
SimpleQA
68.7%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Gemini 3 Flashはこのベンチマークで68.7%を記録しました。
IFEval
88.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Gemini 3 Flashはこのベンチマークで88.2%を記録しました。
AIME 2025
99.7%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Gemini 3 Flashはこのベンチマークで99.7%を記録しました。
MATH
58%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Gemini 3 Flashはこのベンチマークで58%を記録しました。
GSM8k
94%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Gemini 3 Flashはこのベンチマークで94%を記録しました。
MGSM
92.4%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Gemini 3 Flashはこのベンチマークで92.4%を記録しました。
MathVista
65.4%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Gemini 3 Flashはこのベンチマークで65.4%を記録しました。
SWE-Bench
78%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Gemini 3 Flashはこのベンチマークで78%を記録しました。
HumanEval
84.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Gemini 3 Flashはこのベンチマークで84.1%を記録しました。
LiveCodeBench
77.2%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Gemini 3 Flashはこのベンチマークで77.2%を記録しました。
MMMU
81.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Gemini 3 Flashはこのベンチマークで81.2%を記録しました。
MMMU Pro
81.2%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Gemini 3 Flashはこのベンチマークで81.2%を記録しました。
ChartQA
86.5%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Gemini 3 Flashはこのベンチマークで86.5%を記録しました。
DocVQA
93.1%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Gemini 3 Flashはこのベンチマークで93.1%を記録しました。
Terminal-Bench
47.6%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Gemini 3 Flashはこのベンチマークで47.6%を記録しました。
ARC-AGI
33.6%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Gemini 3 Flashはこのベンチマークで33.6%を記録しました。

Gemini 3 Flashについて

Gemini 3 Flashの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Gemini 3のパフォーマンスの原動力

Gemini 3 Flashは、極めて高速かつ大規模なスケーラビリティに最適化されたGoogleのfrontier-classマルチモーダルモデルです。Google DeepMindによって開発されたこのモデルは、Gemini 3エコシステムにおいて効率性を最優先した主力モデルであり、テキスト、コード、画像、音声にわたる高品質なreasoningとネイティブなマルチモーダル処理を提供します。低latencyと費用対効果が最重要視される大規模なエンタープライズワークロードに向けて特別に設計されています。

前例のないcontextとagent機能

このモデルは100万tokenのcontext windowを特徴としており、1つのプロンプトでリポジトリ全体、数時間の動画、数千ページのドキュメントを処理できます。単なるチャットボットではなく、エージェントとしての動作に最適化されています。GoogleのStagehandおよびNano Browser APIと統合されており、自律的にWebをブラウジングし、複数ステップのデジタルタスクを実行し、人間のようにライブWeb要素と対話することが可能です。

エリートレベルの科学的reasoning

スピード重視でありながら、Gemini 3 Flashは知能を犠牲にしていません。専用のDeep Thinkアクティベーションプロトコルを通じて、数学、科学、論理学の博士レベルの問題を解決するための内部的なchain-of-thoughtプロセスをトリガーできます。この二面性により、単純なシステム指示だけで、迅速なデータ抽出から専門家レベルの高度な分析まで切り替えることが可能です。

Gemini 3 Flash

Gemini 3 Flashのユースケース

Gemini 3 Flashを使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なWebブラウジング

Nano Browser APIを使用して、旅行の予約や競合調査といった複数ステップのWebタスクを実行します。

大規模なコードのリファクタリング

100万tokenのcontext windowを使用してソフトウェアリポジトリ全体を読み込み、依存関係の論理を分析します。

マルチモーダルなコンテンツ監査

数時間の動画や数百の技術PDFを分析し、特定の視覚パターンや構造化データを抽出します。

リアルタイムカスタマーサポート

複雑なマルチモーダルクエリをサブ秒の応答時間で処理する、レスポンシブなチャットボットを構築します。

科学的研究の統合

Deep Thinkプロトコルを使用して、博士レベルの論文やデータセットを分析し、実験計画を提案します。

対話型個別指導

内部のchain-of-thoughtによる説明を用い、高度な数学のステップバイステップ指導を提供します。

強み

制限

比類なき空間reasoning: 視覚理解においてトップクラスの成果を出し、正確なSVG生成や画面解析に優れています。
高いハルシネーション率: 特定の情報がないことを認める代わりに、もっともらしい回答を捏造する傾向が91%測定されています。
エリートレベルのコーディング効率: SWE-bench Verifiedで78%のスコアを記録し、多くのProモデルよりも高速かつ高精度なソフトウェアエンジニアリングを実現します。
reasoning tokenのオーバーヘッド: Deep Thinkモードは大量の出力tokenを生成するため、リクエストあたりの合計コストが大幅に増加する可能性があります。
巨大な1M context window: 巨大なtoken容量により、データ損失なしで数時間の動画やプロジェクトディレクトリ全体を処理可能です。
指示への追従における課題: 避けるように明示されたUI要素を含めてしまうなど、否定的な制約への対応に苦労する場合があります。
高速なinference: サブ秒のlatencyに最適化されており、Geminiファミリーの中で現在最も高速なfrontier-classモデルです。
不安定なAPIエクスペリエンス: 開発者向けエンドポイントは、競合と比較して頻繁な破壊的変更やドキュメントの不整合が指摘されています。

APIクイックスタート

google/gemini-3-flash

ドキュメントを見る
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ 
  model: "gemini-3-flash",
  thinkingMode: true 
});

const prompt = "このUIスクリーンショットのアクセシビリティについて、空間レイアウトを分析してください。";
const result = await model.generateContent(prompt);
console.log(result.response.text());

SDKをインストールして、数分でAPIコールを開始しましょう。

Gemini 3 Flashについてのユーザーの声

Gemini 3 Flashについてコミュニティがどう思っているか見てください

Gemini 3 FlashはPelican SVGテストを圧倒した。今までどのモデルでも見たことがない最高の結果だ。
Simon Willison
twitter
Gemini 3の思考プロセスは驚異的だ。リアルタイムで自身のアイデンティティやシステムの制約と格闘している。
rutan668
reddit
知識の密度は信じられないほどだが、ハルシネーション率の高さは放置タスクには危険だ。
anonymous_engineer
hackernews
ついに、計算予算をコントロールできるモデルが登場した。標準モードは非常に高速で、thinking modeは素晴らしい。
AI_Insights_Daily
twitter
「小規模」モデルがコーディングワークフローの90%において、「pro」モデルを実際に置き換えられると感じたのはFlash 3が初めてだ。
CodeMasterV
reddit
空間reasoningは別の次元にある。私が適当に書いたホワイトボードの絵を完璧に理解した。
DesignFlow
twitter

Gemini 3 Flashについての動画

Gemini 3 Flashについてのチュートリアル、レビュー、ディスカッションを見る

コーディングにおいては実際にGemini 3 Proを凌駕している。

MMU Proは現在、すべての中でナンバーワンのモデルだ。

実質的に、コストの数分の一でfrontierレベルの知能を提供している。

複雑なreasoningを生成するスピードは比類ない。

Googleは「flash」モデルができることの限界を押し広げている。

Gemini 3 Proがまだビルドしている間に、たった3,000 tokensで鳥の群れのシミュレーションを完全に作成した。

ハルシネーションに関しては、テストした中で最悪のモデルの一つ。平気で嘘をつく。

context windowこそが真の主役であり、リポジトリ全体を簡単に扱える。

RAGなしで、歴史的な事実やニッチな技術データについて信頼してはいけない。

ログやダッシュボードの視覚分析には究極のツールだ。

空間reasoningの理解度はクラス最高だ。

91%の確率で、答えを知らないと嘘をついて答えをでっち上げる。

画面理解能力は、2.5 Flashのスコアを粉砕している。

視覚的なUIを解析してコードに変換する能力は非の打ち所がない。

価格設定のおかげで、大量のagentタスクをこなすのにこれ以上の選択肢はない。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Gemini 3 Flashのプロのヒント

Gemini 3 Flashを最大限に活用し、より良い結果を得るための専門家のヒント。

thinkingModeの活用

論理的なタスクや数学の問題には「thinkingMode」を有効にすることで、精度が大幅に向上します。

コスト削減のためのバッチ処理

急ぎではないタスクにはBatch APIを使用することで、標準のtoken料金から50%の割引が適用されます。

MCPによる最適化

Model Context Protocolを使用して、サードパーティのツールをモデルのagenticなワークフローにシームレスに統合してください。

重要な出力のファクトチェック

不明なデータに対して高いハルシネーション率を示す可能性があるため、事実確認のための検証レイヤーを実装してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Gemini 3 Flashについてのよくある質問

Gemini 3 Flashに関するよくある質問への回答を見つけてください