Gemini 3.1 Flash-Lite มีค่าใช้จ่ายเท่าไร?

มีราคาอยู่ที่ $0.25 ต่อ 1 ล้าน input tokens และ $1.50 ต่อ 1 ล้าน output tokens

มีระดับการใช้งานฟรีสำหรับนักพัฒนาหรือไม่?

ใช่ มีให้ใช้งานฟรีในรูปแบบพรีวิวผ่าน Google AI Studio สำหรับการทดสอบและทดลองใช้งาน

ค่าสูงสุดของ context window คือเท่าไร?

โมเดลรองรับ context window สูงสุดถึง 1,048,576 tokens ซึ่งช่วยให้สามารถประมวลผลข้อมูลได้ประมาณ 700,000 คำ

ฉันสามารถประมวลผลไฟล์วิดีโอกับโมเดลนี้ได้ไหม?

ใช่ โมเดลสามารถประมวลผลไฟล์วิดีโอที่มีความยาวสูงสุด 1 ชั่วโมง หรือมีขนาดไม่เกิน 1.5GB ได้โดยตรง

Thinking Levels คืออะไร?

พารามิเตอร์นี้ช่วยให้คุณควบคุมเวลาในการใช้ reasoning ภายในที่โมเดลใช้ในการแก้ปัญหา ก่อนที่จะสร้างผลลัพธ์ออกมา

เมื่อเทียบกับ Claude 4.5 Haiku แล้วเป็นอย่างไรบ้าง?

Gemini 3.1 Flash-Lite มีราคา output tokens ที่ถูกกว่าประมาณ 4 เท่า ในขณะที่ให้ประสิทธิภาพในการทำ reasoning เหนือกว่า Haiku บน benchmark ของ GPQA

รองรับการทำ function calling หรือไม่?

ใช่ โมเดลรองรับการใช้งาน tool use และ function calling อย่างเต็มรูปแบบสำหรับการสร้างเวิร์กโฟลว์ของ agentic ที่ทำงานโดยอัตโนมัติ

ความเร็วในการสร้างผลลัพธ์ของโมเดลเป็นอย่างไร?

โมเดลทำความเร็วได้ถึง 363 tokens ต่อวินาที ซึ่งเหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการความเร็วสูง (latency-sensitive)

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite คือโมเดลที่เร็วและประหยัดต้นทุนที่สุดของ Google มาพร้อม 1M context, multimodality และความเร็ว 363 tokens/sec สำหรับการใช้งานในระดับสเกล

MultimodalHigh SpeedCost EfficientGoogle Gemini

googleGemini 3.13 มีนาคม 2026

บริบท

1.0Mโทเคน

เอาต์พุตสูงสุด

66Kโทเคน

ราคาอินพุต

$0.25/ 1M

ราคาเอาต์พุต

$1.50/ 1M

โหมด:TextImageAudioVideo

ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่ง

เกณฑ์มาตรฐาน

GPQA

86.9%

HLE

16%

MMLU

88.9%

MMLU Pro

80%

SimpleQA

43.3%

IFEval

85%

AIME 2025

25%

MATH

78%

GSM8k

95%

MGSM

92%

MathVista

75%

SWE-Bench

35%

HumanEval

88%

LiveCodeBench

72%

MMMU

76.8%

MMMU Pro

76.8%

ChartQA

91%

DocVQA

92%

Terminal-Bench

55%

ARC-AGI

12%

ดูเอกสาร API

เกี่ยวกับ Gemini 3.1 Flash-Lite

เรียนรู้เกี่ยวกับความสามารถของ Gemini 3.1 Flash-Lite คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

Gemini 3.1 Flash-Lite ถูกออกแบบมาสำหรับแอปพลิเคชัน AI ที่มีปริมาณงานสูงซึ่งความเร็วในการประมวลผลเป็นความต้องการทางเทคนิคอันดับแรก ไม่เหมือนกับโมเดล Pro ขนาดใหญ่ Flash-Lite ใช้สถาปัตยกรรมที่ปรับให้เหมาะสมซึ่งเน้นไปที่ throughput สูงสุด โดยทำความเร็วได้ถึง 363 tokens ต่อวินาที ทำหน้าที่เป็นเครื่องมือเฉพาะทางสำหรับนักพัฒนาที่สร้าง voice agents แบบเรียลไทม์ ระบบการกลั่นกรองเนื้อหาอัตโนมัติ และไปป์ไลน์การดึงข้อมูลขนาดใหญ่ที่ต้องประหยัดต้นทุนภายใต้ปริมาณการใช้งานที่หนักหน่วง

แม้จะมีชื่อรุ่นว่า Lite แต่โมเดลนี้ยังคงรักษา context window ขนาด 1 ล้าน token ไว้ สามารถนำเข้าไฟล์เสียงดิบ วิดีโอความยาวหนึ่งชั่วโมง และไฟล์ PDF หลายร้อยหน้าได้ในการสั่งงานครั้งเดียว ด้วยการแนะนำ Thinking Levels ทำให้ Google อนุญาตให้ผู้ใช้เลือกระหว่างการตอบสนองที่รวดเร็วแทบจะทันทีสำหรับงานง่ายๆ ไปจนถึงขั้นตอนการใช้เหตุผลที่ลึกซึ้งยิ่งขึ้นสำหรับตรรกะที่ซับซ้อน ซึ่งช่วยให้มีโปรไฟล์ประสิทธิภาพที่หลากหลายภายใน API endpoint เดียวเพื่อสร้างสมดุลระหว่างต้นทุนและความแม่นยำ

โมเดลนี้เป็น multimodal โดยธรรมชาติ ซึ่งช่วยลดความจำเป็นในการใช้เครื่องมือภายนอกเพื่อถอดความเสียงหรืออธิบายรูปภาพก่อนประมวลผล ความสามารถนี้ช่วยเพิ่มประสิทธิภาพในการทำงานด้านภาพ เช่น การตอบคำถามจากเอกสารและการวิเคราะห์แผนภูมิ นักพัฒนาสามารถใช้พารามิเตอร์ thinking_level เพื่อปรับเวลาในการใช้เหตุผลภายใน ซึ่งเท่ากับการขยายความพยายามของโมเดลตามความซับซ้อนเฉพาะของแต่ละคำสั่ง

กรณีการใช้งานสำหรับ Gemini 3.1 Flash-Lite

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Gemini 3.1 Flash-Lite เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

การแปลภาษาปริมาณมหาศาล

ประมวลผลข้อความแชทหลายภาษาหรือตั๋วสนับสนุน (support tickets) หลายพันรายการในแบบเรียลไทม์ด้วย latency ระดับเสี้ยววินาที

การทำ Intelligent Model Routing

ทำหน้าที่เป็นตัวจำแนกประเภทที่รวดเร็วเพื่อตัดสินใจว่าคำถามที่เข้ามาจำเป็นต้องส่งต่อไปยังโมเดลที่มีราคาสูงกว่าหรือไม่

การกลั่นกรองเนื้อหา Multimodal

ตรวจสอบรูปภาพและวิดีโอที่ผู้ใช้สร้างขึ้นจำนวนมาก เพื่อความปลอดภัยในราคาประหยัด

การทำ Prototype UI แบบเรียลไทม์

สร้างส่วนประกอบ React หรือ Tailwind ที่ใช้งานได้จริงจาก wireframe ที่วาดด้วยมือหรือคำอธิบายแบบปากเปล่า

การสรุปเอกสารขนาดยาว

ย่อคลังเอกสารทางกฎหมายหรือคู่มือเทคนิคขนาดใหญ่โดยไม่สูญเสียบริบทภายใน context window ขนาด 1M token

การถอดความเสียงแบบเรียลไทม์

เปลี่ยนไฟล์บันทึกการประชุมหรือคำบรรยายที่ยาวนานหลายชั่วโมงให้เป็นสรุปที่มีโครงสร้างและรายการสิ่งที่ต้องทำในครั้งเดียว

จุดแข็ง

ข้อจำกัด

ประสิทธิภาพที่รวดเร็วทันใจ: ด้วยความเร็ว 363 tokens ต่อวินาที ทำให้เป็นหนึ่งในโมเดลที่เร็วที่สุดในอุตสาหกรรมสำหรับการตอบสนองแบบเรียลไทม์

การดึงข้อมูลความจริงต่ำ: คะแนน SimpleQA ที่ 43.3% บ่งชี้ถึงความเสี่ยงสูงในการเกิดอาการหลอน (hallucinations) สำหรับความรู้ทั่วไปหากไม่มีการทำ grounding

การทำ Reasoning ขั้นสูง: ทำคะแนนได้ 86.9% บน GPQA Diamond ซึ่งให้ตรรกะทางวิทยาศาสตร์ในระดับปริญญาเอกในโมเดลรุ่นน้ำหนักเบา

ราคาที่เพิ่มขึ้น: มีราคาแพงกว่ารุ่นก่อนหน้าอย่าง Gemini 2.5 Flash-Lite ที่มาแทนที่ในไลน์อัปอย่างเห็นได้ชัด

การควบคุมต้นทุนแบบไดนามิก: พารามิเตอร์ Thinking Levels ช่วยให้คุณควบคุมค่าใช้จ่ายในการประมวลผลได้อย่างละเอียดในแต่ละคำสั่ง

Latency สูงขึ้นเมื่อใช้ระดับ High-Thinking: การใช้ระดับ High Thinking จะเพิ่มเวลาในการคำนวณก่อนเริ่มสร้างเนื้อหาประมาณ 7 ถึง 10 วินาที

Multimodality แบบครบวงจร: การรับข้อมูลเสียง วิดีโอ และ PDF เข้าสู่โมเดลโดยตรงช่วยลดความจำเป็นในการสร้างไปป์ไลน์การจัดการโมเดลหลายตัวที่ซับซ้อน

การปฏิเสธการทำงานตามนโยบายความปลอดภัย: การทดสอบภายในแสดงให้เห็นว่าความคงเส้นคงวาในการตรวจสอบความปลอดภัยของ image-to-text ลดลง 21.7% ในระหว่างการทดสอบ red-teaming

เริ่มต้นด่วน API

google/gemini-3.1-flash-lite-preview

ดูเอกสาร

google SDK

import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Gemini 3.1 Flash-Lite

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Gemini 3.1 Flash-Lite

“ความสามารถในการเขียนโค้ดของ 3.1 Flash-Lite นั้นดีอย่างน่าประหลาดใจสำหรับการพัฒนา front-end มันเขียนตัวแสดงผลแบบ 360 องศาออกมาได้อย่างสมบูรณ์แบบ”

— WorldofAI

youtube

“Gemini 3.1 Flash-Lite คือโมเดลสำหรับสร้าง AI Agents แบบ Multimodal ที่ทำงานตลอดเวลา มันสามารถอ่าน เชื่อมโยง และสรุปทุกอย่างได้ในตัวเดียว”

— Shubham Saboo

twitter

“ราคาถือเป็นเรื่องช็อกพอสมควร การกระโดดขึ้น 3.75 เท่าของ output tokens จะเป็นปัญหาถ้าคุณมีงบประมาณบนคลาวด์ที่จำกัด”

— Binary Verse AI

youtube

“มันช่วยย้ายภาระด้านความซับซ้อนจากสถาปัตยกรรมของทีมวิศวกรรมไปไว้บนโครงสร้างพื้นฐานของ Google แทน”

— Julian Goldie

youtube

“ราคาที่ลดลงอีกสำหรับความฉลาดระดับนี้ ความเร็วสูง ต้นทุนต่ำ ความฉลาดสูง เป็นโมเดลที่ดีมากสำหรับการทำ Agentic Routing”

— ctgtplb

twitter

“1M context ยังคงเป็นฟีเจอร์เด็ดที่สุด ผมสามารถใส่โฟลเดอร์ซอร์สโค้ดทั้งโครงการเข้าไป และมันก็ทำงานได้ดีด้วย TTFT ระดับเสี้ยววินาที”

— DevFlow_26

วิดีโอเกี่ยวกับ Gemini 3.1 Flash-Lite

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Gemini 3.1 Flash-Lite

“ดูเหมือนว่าพวกเขาจะสามารถอัดแน่นความฉลาดไว้ในโมเดลนี้ได้อย่างน่าทึ่ง”

“ผมจะใช้มันสำหรับเวิร์กโหลดที่มีปริมาณงานสูงซึ่งถูกกำหนดไว้อย่างชัดเจน”

“ความสามารถด้าน Front-end ของ Flash-Lite นั้นดีกว่าโมเดลส่วนใหญ่ที่ผมเคยใช้งานมาจริงๆ”

“มันสร้างตัวแสดงผลที่ใช้งานได้เต็มรูปแบบได้ในครั้งเดียวจริงๆ”

“โมเดลนี้เหมาะสำหรับผู้ที่ต้องการความเร็วโดยไม่สูญเสียตรรกะการทำงานไป”

“โมเดลนี้คือสิ่งที่เราเรียกว่าโมเดลที่เป็นม้างาน... ซึ่งออกแบบมาเพื่อรองรับงานที่มีปริมาณสูงโดยเฉพาะ”

“ถ้าคุณรันด้วยงบประมาณการคิดที่ต่ำที่สุด มันจะทำงานเหมือนโมเดลที่ไม่มีการ reasoning และทำงานได้เร็วมาก”

“มันทำผลงานออกมาได้ดีอย่างเหลือเชื่อสำหรับเว็บไซต์ที่เราได้เป็นผลลัพธ์”

“อัตราส่วนความเร็วต่อต้นทุนคือเหตุผลที่แท้จริงที่คุณควรย้ายแอปพลิเคชันระดับ production ของคุณมาที่นี่”

“มันจัดการข้อมูล multimodal ได้โดยตรงซึ่งเป็นข้อได้เปรียบมหาศาลเมื่อเทียบกับคู่แข่ง”

“การทำคะแนนได้เกือบ 87% บน GPQA Diamond ด้วยโมเดลที่แปะป้ายว่า Lite ถือเป็นการสั่นสะเทือนระบบการจัดหมวดหมู่ของเราทั้งหมด”

“อย่าใช้โมเดลนี้เป็นแหล่งข้อมูลข้อเท็จจริง... คุณต้องเป็นผู้จัดหาข้อเท็จจริงให้มัน”

“ด้วย 3.1 Flash-Lite คุณสามารถหลีกเลี่ยงการใช้ microservices อื่นๆ อีกสามตัว... ความเรียบง่ายนั้นคุ้มค่าเงินจริงๆ”

“ความเร็วในการสร้างผลลัพธ์ที่เพิ่มขึ้น 45 เปอร์เซ็นต์นั้นเห็นได้ชัดทันทีในการตอบสนองแบบสตรีมมิ่ง”

“คุณได้รับ 1M context ในราคาถูกมาก ซึ่งยังคงให้ความรู้สึกเหมือนเวทมนตร์ในการทำ production”

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents

การอัตโนมัติเว็บ

เวิร์กโฟลว์อัจฉริยะ

เริ่มต้นฟรี

เคล็ดลับมือโปรสำหรับ Gemini 3.1 Flash-Lite

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Gemini 3.1 Flash-Lite และได้ผลลัพธ์ที่ดีขึ้น

การตั้งค่า Thinking Levels

ใช้ระดับการคิดต่ำสุด (minimal) สำหรับงานจัดหมวดหมู่เพื่อลดต้นทุน แต่ให้เปลี่ยนเป็นระดับสูงสำหรับงานเขียนโค้ดที่ซับซ้อน

เปิดใช้งาน Grounding

ควรใช้งาน Google Search grounding เสมอสำหรับงานที่ต้องการความถูกต้องของข้อมูลเชิงเท็จจริง เนื่องจากความแม่นยำในตัวโมเดลเองอาจต่ำกว่า

อัปโหลดไฟล์ดิบ

หลีกเลี่ยงการแปลงไฟล์เสียงหรือวิดีโอเป็นข้อความก่อนล่วงหน้า แต่ให้เลือกอัปโหลดไฟล์ดิบเพื่อใช้ประโยชน์จากความสามารถ multimodality โดยตรง

ใช้ System Instructions

บังคับใช้ JSON schemas อย่างเคร่งครัดผ่านพารามิเตอร์ system_instruction เพื่อลดจำนวน token ที่ต้องใช้ในการแก้ไขผลลัพธ์

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context

$1.00/$3.20/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context

$1.75/$14.00/1M

คำถามที่พบบ่อยเกี่ยวกับ Gemini 3.1 Flash-Lite

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Gemini 3.1 Flash-Lite