google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Liteは、Googleの最も高速でコスト効率に優れたmodelです。100万context、ネイティブmultimodal対応、大規模利用を支える秒間363 tokensの速度が特徴です。

マルチモーダル高速コスト効率Google Gemini
google logogoogleGemini 3.12026-03-03
コンテキスト
1.0Mトークン
最大出力
66Kトークン
入力価格
$0.25/ 1M
出力価格
$1.50/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング
ベンチマーク
GPQA
86.9%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Gemini 3.1 Flash-Liteはこのベンチマークで86.9%を記録しました。
HLE
16%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで16%を記録しました。
MMLU
88.9%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで88.9%を記録しました。
MMLU Pro
80%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Gemini 3.1 Flash-Liteはこのベンチマークで80%を記録しました。
SimpleQA
43.3%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで43.3%を記録しました。
IFEval
85%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Gemini 3.1 Flash-Liteはこのベンチマークで85%を記録しました。
AIME 2025
25%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Gemini 3.1 Flash-Liteはこのベンチマークで25%を記録しました。
MATH
78%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで78%を記録しました。
GSM8k
95%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Gemini 3.1 Flash-Liteはこのベンチマークで95%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Gemini 3.1 Flash-Liteはこのベンチマークで92%を記録しました。
MathVista
75%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで75%を記録しました。
SWE-Bench
35%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Gemini 3.1 Flash-Liteはこのベンチマークで35%を記録しました。
HumanEval
88%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Gemini 3.1 Flash-Liteはこのベンチマークで88%を記録しました。
LiveCodeBench
72%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで72%を記録しました。
MMMU
76.8%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで76.8%を記録しました。
MMMU Pro
76.8%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Gemini 3.1 Flash-Liteはこのベンチマークで76.8%を記録しました。
ChartQA
91%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで91%を記録しました。
DocVQA
92%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで92%を記録しました。
Terminal-Bench
55%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで55%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで12%を記録しました。

Gemini 3.1 Flash-Liteについて

Gemini 3.1 Flash-Liteの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

高速な知能のために最適化

Gemini 3.1 Flash-Liteは、低latencyとコスト効率が最優先される大規模な開発者ワークロード向けに特別に設計された、Googleの高速ワークホースmodelです。2026年3月3日にリリースされたこのmodelは、Gemini 3.1シリーズの最適化されたエントリーモデルとして、以前の世代と比較して最初のtoken生成までの時間を2.5倍短縮し、出力速度を45%向上させました。秒間360 tokens以上のストリーミングが可能で、リアルタイムアプリケーションや大規模データ処理に理想的です。

100万コンテキスト対応のネイティブ・マルチモーダル

このmodelはネイティブでmultimodalに対応しており、テキスト、画像、音声、video、PDFの入力を、膨大な100万tokenのcontext window内で処理できます。これにより、開発者は複雑なRAGパイプラインを構築することなく、1時間の動画や膨大な法律アーカイブなどの巨大なデータセットを処理できます。特にビジョン機能が強力で、文書の視覚的質問回答やチャート分析に優れています。

きめ細かな開発者制御

特筆すべき機能は、「Thinking Levels」(Minimal、Low、Medium、High)の導入です。このparametersにより、開発者はタスクの複雑さに応じて、modelのreasoningの深さをきめ細かく調整できます。この柔軟性により、UI生成やデータ抽出のような構造化された出力には高度な論理を利用しつつ、分類のような単純なタスクで過剰なコストを支払う必要がなくなります。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Liteのユースケース

Gemini 3.1 Flash-Liteを使って素晴らしい結果を得るさまざまな方法を発見してください。

大規模リアルタイム翻訳

100以上の言語に対応し、数千のチャットメッセージやサポートチケットを、最小限のlatencyと高いコスト効率でシームレスに処理します。

マルチモーダル・コンテンツモデレーション

ネイティブのvideoおよび画像処理機能を活用し、高スループットのソーシャルメディアフィードや動画プラットフォームにおける不適切なコンテンツを検知します。

構造化データの自動抽出

100万tokenのcontext windowを活用して、膨大なPDFアーカイブや長い法的文書から複雑なJSONスキーマを抽出します。

アジャイルなフロントエンド・プロトタイピング

秒間360 tokens以上のスピードで、機能的なReact/Tailwind UIコンポーネントやランディングページを迅速に生成し、反復的なデザインを支援します。

エージェントによるタスクオーケストレーション

token予算を大幅に消費することなく、多段階のプランニング、ウェブ調査、ツール利用を実行する「常時稼働型」のAI agentを支えます。

低レイテンシのカスタマーサービスボット

単純な問い合わせから複雑な質問まで、reasoningの深さを調整しながら即座に回答を返す対話型アシスタントをデプロイします。

強み

制限

圧倒的なスループット: 秒間363 tokensでストリーミングされ、リアルタイムのagenticなアプリケーションにおいて2.5 Flashよりも45%高速です。
推論能力の限界: フラッグシップのreasoning特化型modelと比較すると、抽象的な論理(ARC-AGI v2で12%)のパフォーマンスは大幅に低くなります。
攻めの価格設定: 100万入力tokenあたり0.25ドルという価格は、高い汎用的な知能を維持しながらも、Gemini 3.1 Proの約8分の1のコストです。
数学オリンピックレベルの課題: エリートレベルの数学に苦戦しており、frontier modelが90%以上を記録する中、AIME 2025では25%にとどまっています。
ネイティブなマルチモーダル性能: 独立したエンコーダーを必要とせず、ビジョン(DocVQAで92%)および動画(VideoMMMUで84.8%)において卓越したパフォーマンスを発揮します。
事実性の精度: 事実確認タスク(SimpleQAで43.3%)において、Pro層や他のfrontier modelよりもハルシネーション率が高くなる傾向があります。
きめ細かな計算制御: reasoningの深さを正確に制御できる初めてのmodelであり、コスト対性能の比率を最適化することが可能です。
指示への追従漏れ: 非常に長く複雑な多段階の指示において、稀に細かなフォーマット制約を見落とすことがあります。

APIクイックスタート

google/gemini-3.1-flash-lite-preview

ドキュメントを見る
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

SDKをインストールして、数分でAPIコールを開始しましょう。

Gemini 3.1 Flash-Liteについてのユーザーの声

Gemini 3.1 Flash-Liteについてコミュニティがどう思っているか見てください

Flash Liteはめちゃくちゃ速くて、要約のような特定のワークフローには効果的です。この速度の向上は嬉しいですね。
reddit user
reddit
Gemini 3.1 Flash-Liteは、中堅APIプロバイダーに対する「静かなる決定打」です。コストの優位性が急速に積み重なっていきます。
@9chaku
twitter
3.1 Flash-Liteは、驚異的なスピードを保ちつつ、大多数のbenchmarkで2.5 Flashを上回っています!
Tulsee Doshi
twitter
大規模にAI agentを運用する開発者にとって、これは「常時稼働」を現実的なコストにするmodelです。秒間363 tokensは凄まじい。
@prince_twets
twitter
価格設定が異常です。100万入力あたり0.25ドルなら、RAGを構築するよりもリポジトリ全体をcontextに放り込む方が安上がりです。
reddit user
reddit
最初のtokenまでの速度はほぼ一瞬です。自分のタイピングよりもmodelの方が速いと感じたのは初めてです。
DevGuru
hackernews

Gemini 3.1 Flash-Liteについての動画

Gemini 3.1 Flash-Liteについてのチュートリアル、レビュー、ディスカッションを見る

価格は100万入力tokenあたり25セント、100万出力tokenあたり1.50ドル... スピードを考えれば非常に競争力があります。

このmodelは、フロントエンド開発に焦点を当てた過小評価されているコーディングmodelであり、極めて高速にtokensを提供してくれます。

これは、Proモデルほどのlatencyを必要とせず、スケールを求める開発者を真にターゲットにしています。

ここでのmultimodalityは単なる見せかけではありません。複雑なPDFをいとも簡単に処理しています。

Googleは、2026年において「lite」モデルが実際に達成できる限界を押し広げています。

今回はGemini 3.1 Flash-Liteです。これはFlashモデルをより高速かつ安価にしたバージョンとされています。

これらのモデルが必要とされるのは、高いthroughputが求められるアプリケーションで使用したいからです。

100万のcontext windowはGeminiの標準となりましたが、これほど高速なmodelで実現されているのは印象的です。

数学オリンピックで優勝することはないでしょうが、抽出や要約には最適です。

私の初期テストでは、APIのlatencyはGPT-4o-miniよりも大幅に低かったです。

Googleのこの新しいAIモデルは45%高速化されており、私たちのAI構築のあり方を根本から変えるかもしれません。

簡単なタスクにはLow thinkingモードを、重い処理にはHigh thinkingモードを。この柔軟性が、玩具と真のツールの違いです。

SEOタスクにおいて、この価格設定なら間違いなくメインで使うことになるでしょう。

動画を見てほぼ瞬時に文脈を理解できるという事実は、コンテンツクリエイターにとってゲームチェンジャーです。

Googleは、現在の大規模タスクにおいて他のプロバイダーを利用する理由をなくそうとしています。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Gemini 3.1 Flash-Liteのプロのヒント

Gemini 3.1 Flash-Liteを最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Levelsの活用

分類のような単純なタスクではthinking_levelを「minimal」に設定して速度を最大化し、構造化されたコード生成には「high」を使用してください。

ネイティブ動画解析

動画ファイルを直接APIに投入することで、文字起こしのステップを介さずに、視覚的なイベントと音声の手がかりを同時に素早く分析できます。

RAGよりもコンテキストを優先

100万token未満のデータセットであれば、ドキュメントセット全体をcontext windowに直接投入することで、検索エラーやvector DBのコストを排除できます。

バッチ処理による最適化

緊急性のないタスクにはbatching APIを使用して、さらにコストを削減しましょう。Flash-Liteは特に非同期処理に最適化されています。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

Gemini 3.1 Flash-Liteについてのよくある質問

Gemini 3.1 Flash-Liteに関するよくある質問への回答を見つけてください