google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite là model nhanh nhất và tiết kiệm chi phí nhất của Google. Với 1M context, tính năng multimodal nguyên bản và tốc độ 363 tokens/giây ở quy...

MultimodalTốc độ caoHiệu quả chi phíGoogle Gemini
google logogoogleGemini 3.13 tháng 3, 2026
Ngu canh
1.0Mtoken
Dau ra toi da
66Ktoken
Gia dau vao
$0.25/ 1M
Gia dau ra
$1.50/ 1M
Phuong thuc:TextImageAudioVideo
Kha nang:Thi giacCong cuTruyen truc tiep
Diem chuan
GPQA
86.9%
GPQA: Cau hoi khoa hoc cap sau dai hoc. Benchmark nghiem ngat voi 448 cau hoi ve sinh hoc, vat ly va hoa hoc. Chuyen gia PhD chi dat 65-74% do chinh xac. Gemini 3.1 Flash-Lite dat 86.9% trong benchmark nay.
HLE
16%
HLE: Suy luan cap chuyen gia. Kiem tra kha nang mo hinh the hien suy luan cap chuyen gia trong cac linh vuc chuyen mon. Gemini 3.1 Flash-Lite dat 16% trong benchmark nay.
MMLU
88.9%
MMLU: Hieu ngon ngu da nhiem voc lon. Benchmark toan dien voi 16.000 cau hoi tren 57 mon hoc. Gemini 3.1 Flash-Lite dat 88.9% trong benchmark nay.
MMLU Pro
80%
MMLU Pro: MMLU Phien ban chuyen nghiep. Phien ban nang cap cua MMLU voi 12.032 cau hoi va dinh dang 10 lua chon kho hon. Gemini 3.1 Flash-Lite dat 80% trong benchmark nay.
SimpleQA
43.3%
SimpleQA: Benchmark do chinh xac thuc te. Kiem tra kha nang mo hinh cung cap cau tra loi chinh xac, thuc te. Gemini 3.1 Flash-Lite dat 43.3% trong benchmark nay.
IFEval
85%
IFEval: Danh gia tuan theo huong dan. Do luong mo hinh tuan theo huong dan va rang buoc cu the tot nhu the nao. Gemini 3.1 Flash-Lite dat 85% trong benchmark nay.
AIME 2025
25%
AIME 2025: Ky thi toan hoc moi My. Bai toan toan hoc cap do thi dau tu ky thi AIME uy tin. Gemini 3.1 Flash-Lite dat 25% trong benchmark nay.
MATH
78%
MATH: Giai quyet van de toan hoc. Benchmark toan hoc toan dien kiem tra giai quyet van de trong dai so, hinh hoc, giai tich. Gemini 3.1 Flash-Lite dat 78% trong benchmark nay.
GSM8k
95%
GSM8k: Toan tieu hoc 8K. 8.500 bai toan dang van ban cap tieu hoc. Gemini 3.1 Flash-Lite dat 95% trong benchmark nay.
MGSM
92%
MGSM: Toan tieu hoc da ngon ngu. Benchmark GSM8k duoc dich sang 10 ngon ngu. Gemini 3.1 Flash-Lite dat 92% trong benchmark nay.
MathVista
75%
MathVista: Suy luan thi giac toan hoc. Kiem tra kha nang giai quyet bai toan toan hoc voi cac yeu to thi giac. Gemini 3.1 Flash-Lite dat 75% trong benchmark nay.
SWE-Bench
35%
SWE-Bench: Benchmark ky thuat phan mem. Cac mo hinh AI co gang giai quyet van de GitHub thuc trong cac du an Python. Gemini 3.1 Flash-Lite dat 35% trong benchmark nay.
HumanEval
88%
HumanEval: Bai tap lap trinh Python. 164 bai tap lap trinh yeu cau mo hinh tao ra cac trien khai ham Python dung. Gemini 3.1 Flash-Lite dat 88% trong benchmark nay.
LiveCodeBench
72%
LiveCodeBench: Benchmark lap trinh truc tiep. Kiem tra kha nang lap trinh tren cac thach thuc lap trinh thuc te cap nhat lien tuc. Gemini 3.1 Flash-Lite dat 72% trong benchmark nay.
MMMU
76.8%
MMMU: Hieu da phuong thuc. Benchmark hieu da phuong thuc tren 30 mon hoc dai hoc. Gemini 3.1 Flash-Lite dat 76.8% trong benchmark nay.
MMMU Pro
76.8%
MMMU Pro: MMMU Phien ban chuyen nghiep. Phien ban nang cap cua MMMU voi cac cau hoi kho hon. Gemini 3.1 Flash-Lite dat 76.8% trong benchmark nay.
ChartQA
91%
ChartQA: Hoi dap bieu do. Kiem tra kha nang hieu va phan tich thong tin tu bieu do va do thi. Gemini 3.1 Flash-Lite dat 91% trong benchmark nay.
DocVQA
92%
DocVQA: Hoi dap thi giac tai lieu. Kiem tra kha nang trich xuat thong tin tu hinh anh tai lieu. Gemini 3.1 Flash-Lite dat 92% trong benchmark nay.
Terminal-Bench
55%
Terminal-Bench: Tac vu terminal/CLI. Kiem tra kha nang thuc hien cac thao tac dong lenh. Gemini 3.1 Flash-Lite dat 55% trong benchmark nay.
ARC-AGI
12%
ARC-AGI: Truu tuong va suy luan. Kiem tra tri thong minh linh hoat thong qua cac cau do nhan dang mau moi. Gemini 3.1 Flash-Lite dat 12% trong benchmark nay.

Ve Gemini 3.1 Flash-Lite

Tim hieu ve kha nang cua Gemini 3.1 Flash-Lite, tinh nang va cach no co the giup ban dat ket qua tot hon.

Gemini 3.1 Flash-Lite được thiết kế cho các ứng dụng AI khối lượng lớn, nơi tốc độ xử lý là yêu cầu kỹ thuật hàng đầu. Không giống như các model Pro lớn hơn, Flash-Lite sử dụng kiến trúc tinh gọn ưu tiên thông lượng, đạt 363 tokens mỗi giây. Nó đóng vai trò là công cụ chuyên dụng cho các nhà phát triển xây dựng các voice agent thời gian thực, hệ thống kiểm duyệt nội dung tự động và các pipeline trích xuất dữ liệu quy mô lớn cần duy trì hiệu quả chi phí dưới lưu lượng truy cập cao.

Bất chấp cái tên lite, model vẫn duy trì context window 1 triệu token. Nó có thể nạp các tệp âm thanh gốc, video dài một giờ và hàng trăm trang PDF trong một yêu cầu duy nhất. Bằng cách giới thiệu Thinking Levels, Google cho phép người dùng lựa chọn giữa các phản hồi gần như tức thì cho các tác vụ đơn giản và giai đoạn reasoning sâu hơn cho logic phức tạp. Điều này cung cấp nhiều hồ sơ hiệu suất trong một API endpoint duy nhất để cân bằng giữa chi phí và độ chính xác.

Model này có tính chất multimodal nguyên bản, loại bỏ nhu cầu về các công cụ bên ngoài để chuyển âm thanh thành văn bản hoặc mô tả hình ảnh trước khi xử lý. Khả năng nguyên bản này cải thiện hiệu suất trên các tác vụ thị giác như hỏi đáp tài liệu và phân tích biểu đồ. Các nhà phát triển có thể sử dụng tham số thinking_level để điều chỉnh thời gian reasoning nội bộ, mở rộng nỗ lực của model một cách hiệu quả dựa trên độ phức tạp cụ thể của từng truy vấn.

Gemini 3.1 Flash-Lite

Truong hop su dung cho Gemini 3.1 Flash-Lite

Kham pha cac cach khac nhau ban co the su dung Gemini 3.1 Flash-Lite de dat ket qua tuyet voi.

Dịch thuật khối lượng lớn

Xử lý hàng ngàn tin nhắn chat đa ngôn ngữ hoặc yêu cầu hỗ trợ theo thời gian thực với độ trễ dưới một giây.

Điều hướng model thông minh

Đóng vai trò như một bộ phân loại nhanh để xác định liệu các truy vấn đến có cần chuyển tiếp sang các model đắt tiền hơn hay không.

Kiểm duyệt nội dung multimodal

Quét các loạt ảnh và video lớn do người dùng tạo để đảm bảo tuân thủ an toàn với chi phí thấp.

Tạo nguyên mẫu UI thời gian thực

Tạo các thành phần React hoặc Tailwind chức năng từ các bản vẽ tay wireframe hoặc mô tả bằng lời nói.

Tóm tắt tài liệu dài

Cô đọng các kho lưu trữ pháp lý đồ sộ hoặc hướng dẫn kỹ thuật mà không làm mất context trong phạm vi 1M token.

Chuyển đổi văn bản âm thanh trực tiếp

Chuyển đổi hàng giờ họp hoặc ghi âm bài giảng thành các bản tóm tắt và danh sách hành động có cấu trúc trong một lần xử lý.

Diem manh

Han che

Hiệu suất vượt trội: Với 363 tokens mỗi giây, đây là một trong những model nhanh nhất trong ngành về khả năng phản hồi thời gian thực.
Khả năng truy xuất thực tế thấp: Điểm số SimpleQA 43,3% cho thấy rủi ro cao về ảo giác đối với các kiến thức chung nếu không có grounding.
Reasoning nâng cao: Đạt 86,9% trên GPQA Diamond, nó cung cấp khả năng tư duy khoa học cấp độ Tiến sĩ trong một phân khúc nhẹ.
Tăng giá: Nó đắt hơn đáng kể so với model tiền nhiệm Gemini 2.5 Flash-Lite mà nó thay thế trong danh mục sản phẩm.
Kiểm soát chi phí linh hoạt: Tham số Thinking Levels cho phép kiểm soát chi phí tính toán một cách chi tiết trên cơ sở từng yêu cầu.
Độ trễ cao hơn ở chế độ High-Thinking: Sử dụng mức thinking cao làm tăng thêm khoảng 7 đến 10 giây tính toán trước khi bắt đầu tạo output.
Multimodal thống nhất: Việc nạp nguyên bản âm thanh, video và PDF loại bỏ nhu cầu về các đường ống điều phối đa model phức tạp.
Từ chối do vấn đề an toàn: Các thử nghiệm nội bộ cho thấy sự sụt giảm 21,7% tính nhất quán về an toàn trong việc chuyển đổi ảnh sang văn bản trong các bài tập red-teaming.

Bat dau nhanh API

google/gemini-3.1-flash-lite-preview

Xem tai lieu
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

Cai dat SDK va bat dau thuc hien cac cuoc goi API trong vai phut.

Moi nguoi dang noi gi ve Gemini 3.1 Flash-Lite

Xem cong dong nghi gi ve Gemini 3.1 Flash-Lite

Khả năng lập trình của 3.1 Flash-Lite cực kỳ tốt cho phát triển front-end; nó đã code một trình xem 360 độ một cách hoàn hảo.
WorldofAI
youtube
Gemini 3.1 Flash-Lite là model để xây dựng các AI Agent multimodal hoạt động liên tục. Nó đọc, kết nối và tổng hợp mọi thứ.
Shubham Saboo
twitter
Giá cả là một cú sốc lớn. Mức tăng 3,75 lần trên output tokens sẽ gây đau ví nếu bạn có ngân sách đám mây eo hẹp.
Binary Verse AI
youtube
Nó chuyển gánh nặng về độ phức tạp từ kiến trúc của đội ngũ kỹ thuật sang cơ sở hạ tầng của Google.
Julian Goldie
youtube
Lại thêm một đợt giảm giá cho trí tuệ. Tốc độ cao, chi phí thấp, trí tuệ cao. Một model tuyệt vời cho điều hướng agentic.
ctgtplb
twitter
1M context vẫn là tính năng sát thủ ở đây. Tôi có thể dump toàn bộ các thư mục repo và nó chỉ hoạt động với TTFT dưới một giây.
DevFlow_26
reddit

Video ve Gemini 3.1 Flash-Lite

Xem huong dan, danh gia va thao luan ve Gemini 3.1 Flash-Lite

Dường như họ đã tìm ra cách để nhồi nhét rất nhiều trí tuệ vào model này.

Tôi sẽ sử dụng nó cho các khối lượng công việc thông lượng cao, vốn đã được xác định rất rõ ràng.

Khả năng front-end của Flash-Lite thậm chí còn tốt hơn hầu hết các model mà tôi từng làm việc cùng.

Nó thực sự đã tạo ra một trình xem đầy đủ chức năng chỉ trong một lần thực hiện.

Model này lý tưởng cho những ai cần tốc độ mà không muốn hy sinh hoàn toàn khả năng tư duy.

Đây là thứ mà chúng tôi gọi là model làm việc năng suất... được thiết kế đặc biệt cho các tác vụ thông lượng cao.

Nếu bạn chạy nó với ngân sách thinking tối thiểu, nó về cơ bản hoạt động như một model không cần reasoning và nó cực kỳ nhanh.

Nó đã làm một công việc cực kỳ tốt với trang web mà chúng tôi có dưới dạng output.

Tỷ lệ tốc độ trên chi phí là lý do thực sự khiến bạn chuyển các ứng dụng production của mình sang đây.

Nó xử lý các input multimodal nguyên bản, đây là một lợi thế lớn so với các đối thủ cạnh tranh.

Đạt gần 87% trên GPQA Diamond với một model gắn nhãn lite làm đảo lộn hoàn toàn hệ thống phân loại của chúng tôi.

Đừng sử dụng model này như một nguồn thông tin thực tế... bạn phải cung cấp thông tin cho nó.

Với 3.1 Flash-Lite, bạn tránh được việc phải khởi chạy ba microservice khác... sự đơn giản đó xứng đáng với tiền bạc thực sự.

Mức tăng 45% tốc độ output được cảm nhận ngay lập tức trong phản hồi streaming.

Bạn nhận được 1M context với giá rất rẻ, điều vẫn cảm thấy như phép thuật trong môi trường production.

Hon ca prompt

Tang cuong quy trinh lam viec cua ban voi Tu dong hoa AI

Automatio ket hop suc manh cua cac AI agent, tu dong hoa web va tich hop thong minh de giup ban lam duoc nhieu hon trong thoi gian ngan hon.

AI Agent
Tu dong hoa web
Quy trinh thong minh

Meo chuyen nghiep cho Gemini 3.1 Flash-Lite

Meo chuyen gia giup ban tan dung toi da Gemini 3.1 Flash-Lite va dat ket qua tot hon.

Thiết lập Thinking Levels

Sử dụng mức thinking tối thiểu cho các tác vụ phân loại để giảm chi phí, nhưng chuyển sang mức cao cho các tác vụ lập trình phức tạp.

Bật Grounding

Luôn sử dụng Google Search grounding cho các tác vụ yêu cầu truy xuất dữ liệu thực tế vì độ chính xác thực tế cơ bản của model thấp hơn.

Tải lên tệp gốc

Tránh tiền xử lý âm thanh hoặc video thành văn bản, thay vào đó hãy tải lên các tệp gốc để tận dụng tính năng multimodal nguyên bản.

Sử dụng System Instructions

Thực thi nghiêm ngặt các JSON schema bằng cách sử dụng tham số system_instruction để giảm thiểu các token sửa lỗi output.

Danh gia

Nguoi dung cua chung toi noi gi

Tham gia cung hang nghin nguoi dung hai long da thay doi quy trinh lam viec cua ho

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Lien quan AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Cau hoi thuong gap ve Gemini 3.1 Flash-Lite

Tim cau tra loi cho cac cau hoi thuong gap ve Gemini 3.1 Flash-Lite