google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite คือโมเดลที่เร็วและประหยัดต้นทุนที่สุดของ Google มาพร้อม 1M context, multimodality และความเร็ว 363 tokens/sec สำหรับการใช้งานในระดับสเกล

MultimodalHigh SpeedCost EfficientGoogle Gemini
google logogoogleGemini 3.13 มีนาคม 2026
บริบท
1.0Mโทเคน
เอาต์พุตสูงสุด
66Kโทเคน
ราคาอินพุต
$0.25/ 1M
ราคาเอาต์พุต
$1.50/ 1M
โหมด:TextImageAudioVideo
ความสามารถ:การมองเห็นเครื่องมือสตรีมมิ่ง
เกณฑ์มาตรฐาน
GPQA
86.9%
GPQA: คำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา. เกณฑ์มาตรฐานที่เข้มงวดพร้อม 448 คำถามจากชีววิทยา ฟิสิกส์ และเคมี ผู้เชี่ยวชาญ PhD ทำได้เพียง 65-74% Gemini 3.1 Flash-Lite ได้คะแนน 86.9% ในเกณฑ์มาตรฐานนี้
HLE
16%
HLE: การใช้เหตุผลระดับผู้เชี่ยวชาญ. ทดสอบความสามารถของโมเดลในการแสดงการใช้เหตุผลระดับผู้เชี่ยวชาญในสาขาเฉพาะทาง Gemini 3.1 Flash-Lite ได้คะแนน 16% ในเกณฑ์มาตรฐานนี้
MMLU
88.9%
MMLU: ความเข้าใจภาษาแบบมัลติทาสก์ขนาดใหญ่. เกณฑ์มาตรฐานที่ครอบคลุมพร้อม 16,000 คำถามใน 57 วิชา Gemini 3.1 Flash-Lite ได้คะแนน 88.9% ในเกณฑ์มาตรฐานนี้
MMLU Pro
80%
MMLU Pro: MMLU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMLU พร้อม 12,032 คำถามและรูปแบบ 10 ตัวเลือกที่ยากขึ้น Gemini 3.1 Flash-Lite ได้คะแนน 80% ในเกณฑ์มาตรฐานนี้
SimpleQA
43.3%
SimpleQA: เกณฑ์มาตรฐานความถูกต้องของข้อเท็จจริง. ทดสอบความสามารถของโมเดลในการให้คำตอบที่ถูกต้องและเป็นข้อเท็จจริง Gemini 3.1 Flash-Lite ได้คะแนน 43.3% ในเกณฑ์มาตรฐานนี้
IFEval
85%
IFEval: การประเมินการปฏิบัติตามคำสั่ง. วัดว่าโมเดลปฏิบัติตามคำสั่งและข้อจำกัดเฉพาะได้ดีเพียงใด Gemini 3.1 Flash-Lite ได้คะแนน 85% ในเกณฑ์มาตรฐานนี้
AIME 2025
25%
AIME 2025: การสอบคณิตศาสตร์เชิญชวนอเมริกัน. โจทย์คณิตศาสตร์ระดับการแข่งขันจากการสอบ AIME ที่มีชื่อเสียง Gemini 3.1 Flash-Lite ได้คะแนน 25% ในเกณฑ์มาตรฐานนี้
MATH
78%
MATH: การแก้ปัญหาคณิตศาสตร์. เกณฑ์มาตรฐานคณิตศาสตร์ที่ครอบคลุมทดสอบการแก้ปัญหาในพีชคณิต เรขาคณิต แคลคูลัส Gemini 3.1 Flash-Lite ได้คะแนน 78% ในเกณฑ์มาตรฐานนี้
GSM8k
95%
GSM8k: คณิตศาสตร์ประถม 8K. 8,500 โจทย์คณิตศาสตร์ระดับประถมศึกษา Gemini 3.1 Flash-Lite ได้คะแนน 95% ในเกณฑ์มาตรฐานนี้
MGSM
92%
MGSM: คณิตศาสตร์ประถมหลายภาษา. เกณฑ์มาตรฐาน GSM8k แปลเป็น 10 ภาษา Gemini 3.1 Flash-Lite ได้คะแนน 92% ในเกณฑ์มาตรฐานนี้
MathVista
75%
MathVista: การใช้เหตุผลเชิงภาพคณิตศาสตร์. ทดสอบความสามารถในการแก้ปัญหาคณิตศาสตร์ที่มีองค์ประกอบภาพ Gemini 3.1 Flash-Lite ได้คะแนน 75% ในเกณฑ์มาตรฐานนี้
SWE-Bench
35%
SWE-Bench: เกณฑ์มาตรฐานวิศวกรรมซอฟต์แวร์. โมเดล AI พยายามแก้ปัญหา GitHub จริงในโครงการ Python Gemini 3.1 Flash-Lite ได้คะแนน 35% ในเกณฑ์มาตรฐานนี้
HumanEval
88%
HumanEval: โจทย์เขียนโปรแกรม Python. 164 โจทย์เขียนโปรแกรมที่โมเดลต้องสร้างการใช้งานฟังก์ชัน Python ที่ถูกต้อง Gemini 3.1 Flash-Lite ได้คะแนน 88% ในเกณฑ์มาตรฐานนี้
LiveCodeBench
72%
LiveCodeBench: เกณฑ์มาตรฐานเขียนโค้ดสด. ทดสอบความสามารถในการเขียนโค้ดบนความท้าทายการเขียนโปรแกรมจริงที่อัปเดตอย่างต่อเนื่อง Gemini 3.1 Flash-Lite ได้คะแนน 72% ในเกณฑ์มาตรฐานนี้
MMMU
76.8%
MMMU: ความเข้าใจหลายโหมด. เกณฑ์มาตรฐานความเข้าใจหลายโหมดจาก 30 วิชามหาวิทยาลัย Gemini 3.1 Flash-Lite ได้คะแนน 76.8% ในเกณฑ์มาตรฐานนี้
MMMU Pro
76.8%
MMMU Pro: MMMU รุ่นมืออาชีพ. เวอร์ชันที่ปรับปรุงของ MMMU พร้อมคำถามที่ท้าทายมากขึ้น Gemini 3.1 Flash-Lite ได้คะแนน 76.8% ในเกณฑ์มาตรฐานนี้
ChartQA
91%
ChartQA: คำถามและคำตอบกราฟ. ทดสอบความสามารถในการเข้าใจและวิเคราะห์ข้อมูลจากกราฟและแผนภูมิ Gemini 3.1 Flash-Lite ได้คะแนน 91% ในเกณฑ์มาตรฐานนี้
DocVQA
92%
DocVQA: คำถามเชิงภาพเอกสาร. ทดสอบความสามารถในการสกัดข้อมูลจากภาพเอกสาร Gemini 3.1 Flash-Lite ได้คะแนน 92% ในเกณฑ์มาตรฐานนี้
Terminal-Bench
55%
Terminal-Bench: งาน Terminal/CLI. ทดสอบความสามารถในการดำเนินการ command-line Gemini 3.1 Flash-Lite ได้คะแนน 55% ในเกณฑ์มาตรฐานนี้
ARC-AGI
12%
ARC-AGI: การนามธรรมและการใช้เหตุผล. ทดสอบความฉลาดที่ยืดหยุ่นผ่านปริศนาการจดจำรูปแบบใหม่ Gemini 3.1 Flash-Lite ได้คะแนน 12% ในเกณฑ์มาตรฐานนี้

เกี่ยวกับ Gemini 3.1 Flash-Lite

เรียนรู้เกี่ยวกับความสามารถของ Gemini 3.1 Flash-Lite คุณสมบัติ และวิธีที่จะช่วยให้คุณได้ผลลัพธ์ที่ดีขึ้น

Gemini 3.1 Flash-Lite ถูกออกแบบมาสำหรับแอปพลิเคชัน AI ที่มีปริมาณงานสูงซึ่งความเร็วในการประมวลผลเป็นความต้องการทางเทคนิคอันดับแรก ไม่เหมือนกับโมเดล Pro ขนาดใหญ่ Flash-Lite ใช้สถาปัตยกรรมที่ปรับให้เหมาะสมซึ่งเน้นไปที่ throughput สูงสุด โดยทำความเร็วได้ถึง 363 tokens ต่อวินาที ทำหน้าที่เป็นเครื่องมือเฉพาะทางสำหรับนักพัฒนาที่สร้าง voice agents แบบเรียลไทม์ ระบบการกลั่นกรองเนื้อหาอัตโนมัติ และไปป์ไลน์การดึงข้อมูลขนาดใหญ่ที่ต้องประหยัดต้นทุนภายใต้ปริมาณการใช้งานที่หนักหน่วง

แม้จะมีชื่อรุ่นว่า Lite แต่โมเดลนี้ยังคงรักษา context window ขนาด 1 ล้าน token ไว้ สามารถนำเข้าไฟล์เสียงดิบ วิดีโอความยาวหนึ่งชั่วโมง และไฟล์ PDF หลายร้อยหน้าได้ในการสั่งงานครั้งเดียว ด้วยการแนะนำ Thinking Levels ทำให้ Google อนุญาตให้ผู้ใช้เลือกระหว่างการตอบสนองที่รวดเร็วแทบจะทันทีสำหรับงานง่ายๆ ไปจนถึงขั้นตอนการใช้เหตุผลที่ลึกซึ้งยิ่งขึ้นสำหรับตรรกะที่ซับซ้อน ซึ่งช่วยให้มีโปรไฟล์ประสิทธิภาพที่หลากหลายภายใน API endpoint เดียวเพื่อสร้างสมดุลระหว่างต้นทุนและความแม่นยำ

โมเดลนี้เป็น multimodal โดยธรรมชาติ ซึ่งช่วยลดความจำเป็นในการใช้เครื่องมือภายนอกเพื่อถอดความเสียงหรืออธิบายรูปภาพก่อนประมวลผล ความสามารถนี้ช่วยเพิ่มประสิทธิภาพในการทำงานด้านภาพ เช่น การตอบคำถามจากเอกสารและการวิเคราะห์แผนภูมิ นักพัฒนาสามารถใช้พารามิเตอร์ thinking_level เพื่อปรับเวลาในการใช้เหตุผลภายใน ซึ่งเท่ากับการขยายความพยายามของโมเดลตามความซับซ้อนเฉพาะของแต่ละคำสั่ง

Gemini 3.1 Flash-Lite

กรณีการใช้งานสำหรับ Gemini 3.1 Flash-Lite

ค้นพบวิธีต่างๆ ที่คุณสามารถใช้ Gemini 3.1 Flash-Lite เพื่อได้ผลลัพธ์ที่ยอดเยี่ยม

การแปลภาษาปริมาณมหาศาล

ประมวลผลข้อความแชทหลายภาษาหรือตั๋วสนับสนุน (support tickets) หลายพันรายการในแบบเรียลไทม์ด้วย latency ระดับเสี้ยววินาที

การทำ Intelligent Model Routing

ทำหน้าที่เป็นตัวจำแนกประเภทที่รวดเร็วเพื่อตัดสินใจว่าคำถามที่เข้ามาจำเป็นต้องส่งต่อไปยังโมเดลที่มีราคาสูงกว่าหรือไม่

การกลั่นกรองเนื้อหา Multimodal

ตรวจสอบรูปภาพและวิดีโอที่ผู้ใช้สร้างขึ้นจำนวนมาก เพื่อความปลอดภัยในราคาประหยัด

การทำ Prototype UI แบบเรียลไทม์

สร้างส่วนประกอบ React หรือ Tailwind ที่ใช้งานได้จริงจาก wireframe ที่วาดด้วยมือหรือคำอธิบายแบบปากเปล่า

การสรุปเอกสารขนาดยาว

ย่อคลังเอกสารทางกฎหมายหรือคู่มือเทคนิคขนาดใหญ่โดยไม่สูญเสียบริบทภายใน context window ขนาด 1M token

การถอดความเสียงแบบเรียลไทม์

เปลี่ยนไฟล์บันทึกการประชุมหรือคำบรรยายที่ยาวนานหลายชั่วโมงให้เป็นสรุปที่มีโครงสร้างและรายการสิ่งที่ต้องทำในครั้งเดียว

จุดแข็ง

ข้อจำกัด

ประสิทธิภาพที่รวดเร็วทันใจ: ด้วยความเร็ว 363 tokens ต่อวินาที ทำให้เป็นหนึ่งในโมเดลที่เร็วที่สุดในอุตสาหกรรมสำหรับการตอบสนองแบบเรียลไทม์
การดึงข้อมูลความจริงต่ำ: คะแนน SimpleQA ที่ 43.3% บ่งชี้ถึงความเสี่ยงสูงในการเกิดอาการหลอน (hallucinations) สำหรับความรู้ทั่วไปหากไม่มีการทำ grounding
การทำ Reasoning ขั้นสูง: ทำคะแนนได้ 86.9% บน GPQA Diamond ซึ่งให้ตรรกะทางวิทยาศาสตร์ในระดับปริญญาเอกในโมเดลรุ่นน้ำหนักเบา
ราคาที่เพิ่มขึ้น: มีราคาแพงกว่ารุ่นก่อนหน้าอย่าง Gemini 2.5 Flash-Lite ที่มาแทนที่ในไลน์อัปอย่างเห็นได้ชัด
การควบคุมต้นทุนแบบไดนามิก: พารามิเตอร์ Thinking Levels ช่วยให้คุณควบคุมค่าใช้จ่ายในการประมวลผลได้อย่างละเอียดในแต่ละคำสั่ง
Latency สูงขึ้นเมื่อใช้ระดับ High-Thinking: การใช้ระดับ High Thinking จะเพิ่มเวลาในการคำนวณก่อนเริ่มสร้างเนื้อหาประมาณ 7 ถึง 10 วินาที
Multimodality แบบครบวงจร: การรับข้อมูลเสียง วิดีโอ และ PDF เข้าสู่โมเดลโดยตรงช่วยลดความจำเป็นในการสร้างไปป์ไลน์การจัดการโมเดลหลายตัวที่ซับซ้อน
การปฏิเสธการทำงานตามนโยบายความปลอดภัย: การทดสอบภายในแสดงให้เห็นว่าความคงเส้นคงวาในการตรวจสอบความปลอดภัยของ image-to-text ลดลง 21.7% ในระหว่างการทดสอบ red-teaming

เริ่มต้นด่วน API

google/gemini-3.1-flash-lite-preview

ดูเอกสาร
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

ติดตั้ง SDK และเริ่มเรียก API ภายในไม่กี่นาที

ผู้คนพูดอะไรเกี่ยวกับ Gemini 3.1 Flash-Lite

ดูว่าชุมชนคิดอย่างไรเกี่ยวกับ Gemini 3.1 Flash-Lite

ความสามารถในการเขียนโค้ดของ 3.1 Flash-Lite นั้นดีอย่างน่าประหลาดใจสำหรับการพัฒนา front-end มันเขียนตัวแสดงผลแบบ 360 องศาออกมาได้อย่างสมบูรณ์แบบ
WorldofAI
youtube
Gemini 3.1 Flash-Lite คือโมเดลสำหรับสร้าง AI Agents แบบ Multimodal ที่ทำงานตลอดเวลา มันสามารถอ่าน เชื่อมโยง และสรุปทุกอย่างได้ในตัวเดียว
Shubham Saboo
twitter
ราคาถือเป็นเรื่องช็อกพอสมควร การกระโดดขึ้น 3.75 เท่าของ output tokens จะเป็นปัญหาถ้าคุณมีงบประมาณบนคลาวด์ที่จำกัด
Binary Verse AI
youtube
มันช่วยย้ายภาระด้านความซับซ้อนจากสถาปัตยกรรมของทีมวิศวกรรมไปไว้บนโครงสร้างพื้นฐานของ Google แทน
Julian Goldie
youtube
ราคาที่ลดลงอีกสำหรับความฉลาดระดับนี้ ความเร็วสูง ต้นทุนต่ำ ความฉลาดสูง เป็นโมเดลที่ดีมากสำหรับการทำ Agentic Routing
ctgtplb
twitter
1M context ยังคงเป็นฟีเจอร์เด็ดที่สุด ผมสามารถใส่โฟลเดอร์ซอร์สโค้ดทั้งโครงการเข้าไป และมันก็ทำงานได้ดีด้วย TTFT ระดับเสี้ยววินาที
DevFlow_26
reddit

วิดีโอเกี่ยวกับ Gemini 3.1 Flash-Lite

ดูบทเรียน รีวิว และการสนทนาเกี่ยวกับ Gemini 3.1 Flash-Lite

ดูเหมือนว่าพวกเขาจะสามารถอัดแน่นความฉลาดไว้ในโมเดลนี้ได้อย่างน่าทึ่ง

ผมจะใช้มันสำหรับเวิร์กโหลดที่มีปริมาณงานสูงซึ่งถูกกำหนดไว้อย่างชัดเจน

ความสามารถด้าน Front-end ของ Flash-Lite นั้นดีกว่าโมเดลส่วนใหญ่ที่ผมเคยใช้งานมาจริงๆ

มันสร้างตัวแสดงผลที่ใช้งานได้เต็มรูปแบบได้ในครั้งเดียวจริงๆ

โมเดลนี้เหมาะสำหรับผู้ที่ต้องการความเร็วโดยไม่สูญเสียตรรกะการทำงานไป

โมเดลนี้คือสิ่งที่เราเรียกว่าโมเดลที่เป็นม้างาน... ซึ่งออกแบบมาเพื่อรองรับงานที่มีปริมาณสูงโดยเฉพาะ

ถ้าคุณรันด้วยงบประมาณการคิดที่ต่ำที่สุด มันจะทำงานเหมือนโมเดลที่ไม่มีการ reasoning และทำงานได้เร็วมาก

มันทำผลงานออกมาได้ดีอย่างเหลือเชื่อสำหรับเว็บไซต์ที่เราได้เป็นผลลัพธ์

อัตราส่วนความเร็วต่อต้นทุนคือเหตุผลที่แท้จริงที่คุณควรย้ายแอปพลิเคชันระดับ production ของคุณมาที่นี่

มันจัดการข้อมูล multimodal ได้โดยตรงซึ่งเป็นข้อได้เปรียบมหาศาลเมื่อเทียบกับคู่แข่ง

การทำคะแนนได้เกือบ 87% บน GPQA Diamond ด้วยโมเดลที่แปะป้ายว่า Lite ถือเป็นการสั่นสะเทือนระบบการจัดหมวดหมู่ของเราทั้งหมด

อย่าใช้โมเดลนี้เป็นแหล่งข้อมูลข้อเท็จจริง... คุณต้องเป็นผู้จัดหาข้อเท็จจริงให้มัน

ด้วย 3.1 Flash-Lite คุณสามารถหลีกเลี่ยงการใช้ microservices อื่นๆ อีกสามตัว... ความเรียบง่ายนั้นคุ้มค่าเงินจริงๆ

ความเร็วในการสร้างผลลัพธ์ที่เพิ่มขึ้น 45 เปอร์เซ็นต์นั้นเห็นได้ชัดทันทีในการตอบสนองแบบสตรีมมิ่ง

คุณได้รับ 1M context ในราคาถูกมาก ซึ่งยังคงให้ความรู้สึกเหมือนเวทมนตร์ในการทำ production

มากกว่าแค่พรอมต์

เพิ่มพลังให้เวิร์กโฟลว์ของคุณด้วย ระบบอัตโนมัติ AI

Automatio รวมพลังของ AI agents การอัตโนมัติเว็บ และการผสานรวมอัจฉริยะเพื่อช่วยให้คุณทำงานได้มากขึ้นในเวลาน้อยลง

AI Agents
การอัตโนมัติเว็บ
เวิร์กโฟลว์อัจฉริยะ

เคล็ดลับมือโปรสำหรับ Gemini 3.1 Flash-Lite

เคล็ดลับจากผู้เชี่ยวชาญเพื่อช่วยให้คุณใช้ประโยชน์สูงสุดจาก Gemini 3.1 Flash-Lite และได้ผลลัพธ์ที่ดีขึ้น

การตั้งค่า Thinking Levels

ใช้ระดับการคิดต่ำสุด (minimal) สำหรับงานจัดหมวดหมู่เพื่อลดต้นทุน แต่ให้เปลี่ยนเป็นระดับสูงสำหรับงานเขียนโค้ดที่ซับซ้อน

เปิดใช้งาน Grounding

ควรใช้งาน Google Search grounding เสมอสำหรับงานที่ต้องการความถูกต้องของข้อมูลเชิงเท็จจริง เนื่องจากความแม่นยำในตัวโมเดลเองอาจต่ำกว่า

อัปโหลดไฟล์ดิบ

หลีกเลี่ยงการแปลงไฟล์เสียงหรือวิดีโอเป็นข้อความก่อนล่วงหน้า แต่ให้เลือกอัปโหลดไฟล์ดิบเพื่อใช้ประโยชน์จากความสามารถ multimodality โดยตรง

ใช้ System Instructions

บังคับใช้ JSON schemas อย่างเคร่งครัดผ่านพารามิเตอร์ system_instruction เพื่อลดจำนวน token ที่ต้องใช้ในการแก้ไขผลลัพธ์

คำรับรอง

ผู้ใช้ของเราพูดอย่างไร

เข้าร่วมกับผู้ใช้ที่พึงพอใจนับพันที่ได้เปลี่ยนแปลงเวิร์กโฟลว์ของพวกเขา

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

ที่เกี่ยวข้อง AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

คำถามที่พบบ่อยเกี่ยวกับ Gemini 3.1 Flash-Lite

ค้นหาคำตอบสำหรับคำถามทั่วไปเกี่ยวกับ Gemini 3.1 Flash-Lite