google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Liteは、Googleの最も高速で費用対効果の高いモデルです。1M context、ネイティブマルチモーダル対応、毎秒363 tokensの速度を実現。

MultimodalHigh SpeedCost EfficientGoogle Gemini
google logogoogleGemini 3.12026年3月3日
コンテキスト
1.0Mトークン
最大出力
66Kトークン
入力価格
$0.25/ 1M
出力価格
$1.50/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング
ベンチマーク
GPQA
86.9%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Gemini 3.1 Flash-Liteはこのベンチマークで86.9%を記録しました。
HLE
16%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで16%を記録しました。
MMLU
88.9%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで88.9%を記録しました。
MMLU Pro
80%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Gemini 3.1 Flash-Liteはこのベンチマークで80%を記録しました。
SimpleQA
43.3%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで43.3%を記録しました。
IFEval
85%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Gemini 3.1 Flash-Liteはこのベンチマークで85%を記録しました。
AIME 2025
25%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Gemini 3.1 Flash-Liteはこのベンチマークで25%を記録しました。
MATH
78%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで78%を記録しました。
GSM8k
95%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Gemini 3.1 Flash-Liteはこのベンチマークで95%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Gemini 3.1 Flash-Liteはこのベンチマークで92%を記録しました。
MathVista
75%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで75%を記録しました。
SWE-Bench
35%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Gemini 3.1 Flash-Liteはこのベンチマークで35%を記録しました。
HumanEval
88%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Gemini 3.1 Flash-Liteはこのベンチマークで88%を記録しました。
LiveCodeBench
72%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで72%を記録しました。
MMMU
76.8%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで76.8%を記録しました。
MMMU Pro
76.8%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Gemini 3.1 Flash-Liteはこのベンチマークで76.8%を記録しました。
ChartQA
91%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで91%を記録しました。
DocVQA
92%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Gemini 3.1 Flash-Liteはこのベンチマークで92%を記録しました。
Terminal-Bench
55%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで55%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Gemini 3.1 Flash-Liteはこのベンチマークで12%を記録しました。

Gemini 3.1 Flash-Liteについて

Gemini 3.1 Flash-Liteの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

Gemini 3.1 Flash-Liteは、処理速度が最優先事項となる大量のAIアプリケーション向けに設計されています。より大きなProモデルとは異なり、Flash-Liteはスループットを優先した合理的なアーキテクチャを採用しており、毎秒363 tokensに達します。リアルタイムの音声エージェント、自動化されたコンテンツモデレーションシステム、そして高トラフィック下でも費用対効果を維持しなければならない大規模データ抽出パイプラインを構築する開発者にとって、特化したツールとなります。

Liteという名称ですが、このモデルは100万tokenのcontext windowを維持しています。一度のリクエストで生のオーディオファイル、1時間分のビデオ、数百ページにわたるPDFを取り込むことができます。Googleは「Thinking Levels」を導入することで、単純なタスクにはほぼ瞬時の応答を、複雑な論理にはより深い推論フェーズを選択できるようにしました。これにより、一つのAPIエンドポイント内でコストと精度のバランスを取るための多様なパフォーマンスプロファイルが提供されます。

このモデルはネイティブにマルチモーダルであるため、処理の前にオーディオを文字起こししたり画像を記述したりするための外部ツールは不要です。このネイティブ機能により、ドキュメントの質問回答やチャート分析といった視覚的タスクにおけるパフォーマンスが向上します。開発者はthinking_levelパラメーターを使用して内部推論時間を調整し、各クエリの複雑さに合わせてモデルのリソース使用量を効率的にスケールできます。

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Liteのユースケース

Gemini 3.1 Flash-Liteを使って素晴らしい結果を得るさまざまな方法を発見してください。

大量の翻訳処理

数千件の多言語チャットやサポートチケットを、1秒以下のlatencyでリアルタイムに処理します。

インテリジェントなモデルルーティング

高速な分類器として機能し、受信したクエリをより高価なモデルへ転送すべきかどうかを判断します。

Multimodalコンテンツモデレーション

大量のユーザー生成画像や動画を、低コストで安全コンプライアンスに照らし合わせてスキャンします。

リアルタイムUIプロトタイピング

手描きのワイヤーフレームや口頭での説明から、機能的なReactやTailwindコンポーネントを生成します。

長文ドキュメントの要約

1M tokenのcontext windowを活かし、膨大な法務アーカイブや技術マニュアルの文脈を失わずに要約します。

ライブ音声の文字起こし

数時間の会議や講義の録音を、一度のパスで構造化された要約やアクションアイテムに変換します。

強み

制限

驚異的なパフォーマンス: 毎秒363 tokensという速度は、リアルタイム応答において業界最速レベルのモデルの一つです。
低い事実記憶精度: SimpleQAスコアが43.3%であるため、groundingなしでの一般的な知識に関してはハルシネーション(幻覚)のリスクが高まります。
高度なreasoning: GPQA Diamondで86.9%を記録し、軽量モデルながら博士レベルの科学的論理推論を提供します。
価格の上昇: 以前のGemini 2.5 Flash-Liteと比較して、価格が大幅に上昇しています。
動的なコスト管理: Thinking Levelsパラメーターにより、リクエストごとにコンピューティングコストを細かく制御可能です。
高レベルなThinking使用時のlatency: 高いthinkingレベルを設定すると、生成が始まる前に約7〜10秒のプリコンピューティング時間が追加されます。
統合されたmultimodal機能: オーディオ、ビデオ、PDFをネイティブに取り込めるため、複雑なマルチモデル連携パイプラインが不要になります。
安全性による拒絶: 内部テストにおいて、レッドチーミング演習中に画像からテキストへの安全性の一貫性が21.7%低下することが示されています。

APIクイックスタート

google/gemini-3.1-flash-lite-preview

ドキュメントを見る
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

SDKをインストールして、数分でAPIコールを開始しましょう。

Gemini 3.1 Flash-Liteについてのユーザーの声

Gemini 3.1 Flash-Liteについてコミュニティがどう思っているか見てください

3.1 Flash-Liteのコーディング能力はフロントエンド開発において驚くほど優秀で、360度ビューアーを完璧に作成しました。
WorldofAI
youtube
Gemini 3.1 Flash-Liteは、常時稼働のマルチモーダルAIエージェントを構築するためのモデルです。すべてを読み取り、接続し、統合します。
Shubham Saboo
twitter
価格設定には大きな衝撃を受けました。クラウド予算が厳しい場合、出力tokenの3.75倍の跳ね上がりは痛手です。
Binary Verse AI
youtube
エンジニアリングチームのアーキテクチャにかかる複雑さの負担を、Googleのインフラへと直接転換してくれます。
Julian Goldie
youtube
またもや知能のための値下げです。高速、低コスト、高知能。エージェントのルーティングに最適なモデルです。
ctgtplb
twitter
1M contextがやはり最大の強みです。レポジトリフォルダ丸ごと放り込んでも、秒単位のTTFTで期待通りに動作します。
DevFlow_26
reddit

Gemini 3.1 Flash-Liteについての動画

Gemini 3.1 Flash-Liteについてのチュートリアル、レビュー、ディスカッションを見る

どういうわけか、このモデルにはかなりの知能が詰め込まれているようです。

明確に定義された大量の処理を行うワークロードに最適でしょう。

Flash-Liteのフロントエンド構築能力は、私がこれまで扱ったほとんどのモデルよりも優れています。

文字通り、完全に機能するビューアーを一撃で作成しました。

論理を犠牲にせずに速度を求めるユーザーにとって理想的なモデルです。

このモデルは、大量のスループットを必要とするタスクのために特別に設計された、まさに主力モデルといえます。

Thinkingの予算を最小限に抑えれば、基本的に非推論モデルとして機能し、非常に高速です。

出力されたウェブサイトの質は非常に高いものでした。

速度とコストの比率こそが、本番環境のアプリをここに移行する本当の理由です。

マルチモーダル入力をネイティブに扱う点は、競合他社に対する大きなアドバンテージです。

Liteと銘打たれたモデルがGPQA Diamondで87%近くを記録するのは、我々の分類システムを破壊するものです。

このモデルを事実のオラクルとして使ってはいけません…事実を自ら提供する必要があります。

3.1 Flash-Liteなら、他の3つのマイクロサービスを動かす必要がなくなります。そのシンプルさには価値があります。

出力速度の45%向上は、ストリーミングレスポンスにおいてすぐに体感できます。

わずかなコストで1M contextが手に入るのは、本番環境では依然として魔法のように感じられます。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Gemini 3.1 Flash-Liteのプロのヒント

Gemini 3.1 Flash-Liteを最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Levelsの設定

分類タスクでは最小限のthinkingレベルを使用してコストを削減し、複雑なコーディングタスクでは高レベルに切り替えてください。

Groundingの有効化

事実に基づいた正確性が求められるタスクでは、モデル自体の事実認識精度が低いため、必ずGoogle Searchのgroundingを使用してください。

生のファイルでアップロード

オーディオやビデオを事前にテキストへ変換(プリプロセッシング)せず、生のファイルをアップロードしてネイティブなmultimodal機能を活用してください。

System Instructionsの活用

system_instructionパラメーターを使用してJSONスキーマを厳格に指定し、出力の修正にかかるtokenを最小限に抑えてください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Gemini 3.1 Flash-Liteについてのよくある質問

Gemini 3.1 Flash-Liteに関するよくある質問への回答を見つけてください