google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite سریع‌ترین و مقرون‌به‌صرفه‌ترین model شرکت Google است. دارای context window یک میلیونی، قابلیت multimodal نیتیو و سرعت 363 tokens/sec برای...

MultimodalHigh SpeedCost EfficientGoogle Gemini
google logogoogleGemini 3.12026-03-03
پنجره زمینه
1.0Mتوکن
حداکثر خروجی
66Kتوکن
قیمت ورودی
$0.25/ 1M
قیمت خروجی
$1.50/ 1M
حالت:TextImageAudioVideo
قابلیت‌ها:بیناییابزارهااستریمینگ
معیارها
GPQA
86.9%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Gemini 3.1 Flash-Lite امتیاز 86.9% در این معیار کسب کرد.
HLE
16%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 16% در این معیار کسب کرد.
MMLU
88.9%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Gemini 3.1 Flash-Lite امتیاز 88.9% در این معیار کسب کرد.
MMLU Pro
80%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Gemini 3.1 Flash-Lite امتیاز 80% در این معیار کسب کرد.
SimpleQA
43.3%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 43.3% در این معیار کسب کرد.
IFEval
85%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Gemini 3.1 Flash-Lite امتیاز 85% در این معیار کسب کرد.
AIME 2025
25%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Gemini 3.1 Flash-Lite امتیاز 25% در این معیار کسب کرد.
MATH
78%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 78% در این معیار کسب کرد.
GSM8k
95%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Gemini 3.1 Flash-Lite امتیاز 95% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Gemini 3.1 Flash-Lite امتیاز 92% در این معیار کسب کرد.
MathVista
75%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 75% در این معیار کسب کرد.
SWE-Bench
35%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Gemini 3.1 Flash-Lite امتیاز 35% در این معیار کسب کرد.
HumanEval
88%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Gemini 3.1 Flash-Lite امتیاز 88% در این معیار کسب کرد.
LiveCodeBench
72%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 72% در این معیار کسب کرد.
MMMU
76.8%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Gemini 3.1 Flash-Lite امتیاز 76.8% در این معیار کسب کرد.
MMMU Pro
76.8%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Gemini 3.1 Flash-Lite امتیاز 76.8% در این معیار کسب کرد.
ChartQA
91%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 91% در این معیار کسب کرد.
DocVQA
92%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 92% در این معیار کسب کرد.
Terminal-Bench
55%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 55% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 12% در این معیار کسب کرد.

درباره Gemini 3.1 Flash-Lite

درباره قابلیت‌های Gemini 3.1 Flash-Lite، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

بهینه‌سازی شده برای هوشمندی با سرعت بالا

Gemini 3.1 Flash-Lite مدل قدرتمند و پرسرعت Google است که به طور اختصاصی برای حجم کاری بالای توسعه‌دهندگان، جایی که latency پایین و بهره‌وری هزینه در اولویت است، طراحی شده است. این مدل که در 3 مارس 2026 عرضه شد، به عنوان یک گزینه بهینه‌سازی شده در سری Gemini 3.1 عمل می‌کند و زمان رسیدن به اولین token را 2.5 برابر سریع‌تر کرده و سرعت خروجی را نسبت به نسل‌های قبلی 45٪ افزایش داده است. این مدل قادر است بیش از 360 tokens را در ثانیه استریم کند که آن را برای اپلیکیشن‌های آنی و پردازش داده در مقیاس وسیع ایده‌آل می‌سازد.

Multimodal نیتیو با Context یک میلیونی

این model به صورت نیتیو multimodal است و از ورودی‌های متن، تصویر، صدا، ویدئو و PDF در یک context window عظیم یک میلیون tokens پشتیبانی می‌کند. این ویژگی به توسعه‌دهندگان اجازه می‌دهد مجموعه‌داده‌های عظیم مانند ویدئوهای یک ساعته یا آرشیوهای حقوقی بزرگ را بدون نیاز به pipeline‌های پیچیده RAG پردازش کنند. قابلیت‌های vision آن به ویژه در پاسخگویی بصری به سوالات اسناد و تحلیل نمودارها بسیار قدرتمند است.

کنترل دقیق برای توسعه‌دهندگان

یک ویژگی برجسته، معرفی 'Thinking Levels' (در سطوح Minimal، Low، Medium، High) است. این پارامتر به توسعه‌دهندگان اجازه می‌دهد تا عمق reasoning مدل را بر اساس پیچیدگی کار به صورت دقیق کم یا زیاد کنند. این انعطاف‌پذیری تضمین می‌کند که کاربران برای کارهای ساده‌ای مثل دسته‌بندی هزینه اضافی پرداخت نکنند، در حالی که همچنان برای خروجی‌های ساختاریافته‌تر مانند تولید UI و استخراج داده به منطق پیشرفته دسترسی داشته باشند.

Gemini 3.1 Flash-Lite

موارد استفاده برای Gemini 3.1 Flash-Lite

روش‌های مختلف استفاده از Gemini 3.1 Flash-Lite برای دستیابی به نتایج عالی را کشف کنید.

ترجمه آنی با حجم بالا

پردازش بی‌وقفه هزاران پیام چت یا تیکت‌های پشتیبانی در بیش از 100 زبان با حداقل latency و بهره‌وری هزینه بالا.

مدیریت محتوای Multimodal

استفاده از پردازش نیتیو ویدئو و تصویر برای شناسایی محتوای نامناسب در فیدهای شبکه‌های اجتماعی با throughput بالا.

استخراج خودکار داده‌های ساختاریافته

استخراج اسکیماهای پیچیده JSON از آرشیوهای عظیم PDF یا اسناد حقوقی طولانی با استفاده از context window یک میلیونی.

نمونه‌سازی سریع فرانت‌اند

تولید سریع کامپوننت‌های UI در React/Tailwind و صفحات فرود با سرعت بیش از 360 tokens در ثانیه برای طراحی تکرارپذیر.

هماهنگ‌سازی وظایف Agentic

تامین قدرت agentهای هوش مصنوعی 'همیشه روشن' که برنامه‌ریزی چندمرحله‌ای، تحقیق وب و استفاده از ابزار را بدون فراتر رفتن از بودجه token انجام می‌دهند.

بات‌های خدمات مشتری با Latency پایین

استقرار دستیارهای گفتگو که پاسخ‌های آنی را با قابلیت تنظیم reasoning برای پرسش‌های ساده در مقابل پیچیده ارائه می‌دهند.

نقاط قوت

محدودیت‌ها

Throughput بی‌رقیب: استریم با سرعت 363 tokens در ثانیه که آن را 45٪ سریع‌تر از 2.5 Flash برای برنامه‌های agentic آنی می‌کند.
سقف Reasoning: عملکرد به مراتب پایین‌تر در منطق انتزاعی (12% در ARC-AGI v2) در مقایسه با model‌های flagship که مخصوص reasoning هستند.
قیمت‌گذاری تهاجمی: با قیمت 0.25 دلار به ازای هر میلیون input tokens، هزینه آن تقریباً 1/8 مدل Gemini 3.1 Pro است در حالی که هوش عمومی بالایی را حفظ کرده است.
شکاف در المپیاد ریاضی: در ریاضیات سطح بالا با چالش روبروست و در AIME 2025 تنها 25٪ امتیاز کسب کرده است، در حالی که frontier modelها امتیاز بالای 90٪ دارند.
تسلط بر Multimodal نیتیو: عملکرد استثنایی در vision (92% در DocVQA) و ویدئو (84.8% در VideoMMMU) بدون نیاز به انکودرهای جداگانه.
دقت در واقعیت‌سنجی: در کارهای مبتنی بر واقعیت، نرخ توهم (hallucination) بالاتری نسبت به نسخه‌های Pro یا جایگزین‌های frontier دارد (43.3% در SimpleQA).
کنترل دقیق روی پردازش: اولین model که کنترل دقیقی روی عمق reasoning ارائه می‌دهد و امکان بهینه‌سازی نسبت هزینه به عملکرد را فراهم می‌کند.
انحراف از دستورالعمل: گاهی اوقات ممکن است محدودیت‌های جزئی فرمت‌بندی را در دستورالعمل‌های بسیار طولانی و پیچیده چندمرحله‌ای نادیده بگیرد.

شروع سریع API

google/gemini-3.1-flash-lite-preview

مشاهده مستندات
google SDK
import { GoogleGenAI } from '@google/genai';

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ 
  model: 'gemini-3.1-flash-lite-preview',
  thinkingConfig: { thinking_level: 'low' }
});

async function generate() {
  const prompt = "Extract key entities from this document.";
  const result = await model.generateContent(prompt);
  console.log(result.response.text());
}

generate();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Gemini 3.1 Flash-Lite چه می‌گویند

ببینید جامعه درباره Gemini 3.1 Flash-Lite چه فکر می‌کند

Flash lite فوق‌العاده سریع و برای گردش‌های کاری خاص مثل خلاصه‌سازی موثر است... این یک جهش سرعت خوشایند است.
reddit user
reddit
Gemini 3.1 Flash-Lite یک ضربه نهایی بی‌صدا برای ارائه‌دهندگان API میان‌رده است... منحنی هزینه‌ها به سرعت روی هم انباشته می‌شوند.
@9chaku
twitter
3.1 Flash-Lite در اکثر benchmarkها از 2.5 Flash بهتر عمل می‌کند و در عین حال بسیار پرسرعت است!
Tulsee Doshi
twitter
برای سازندگانی که AI agents را در مقیاس بالا اجرا می‌کنند، این مدلی است که حالت 'همیشه روشن' را واقعاً مقرون‌به‌صرفه می‌کند. سرعت 363 t/s وحشتناک است.
@prince_twets
twitter
قیمت‌گذاری خیره‌کننده است. 0.25 دلار برای 1M ورودی باعث می‌شود تغذیه کل مخازن کد در context ارزان‌تر از ساخت سیستم RAG تمام شود.
reddit user
reddit
سرعت رسیدن به اولین token تقریباً آنی است. این اولین باری است که یک model حس می‌شود از تایپ کردن خودم سریع‌تر است.
DevGuru
hackernews

ویدیوهای درباره Gemini 3.1 Flash-Lite

آموزش‌ها، بررسی‌ها و بحث‌های درباره Gemini 3.1 Flash-Lite را تماشا کنید

قیمت‌گذاری 25 سنت به ازای هر یک میلیون input tokens و 1.50 دلار برای هر یک میلیون output tokens است... با توجه به سرعت، بسیار رقابتی است.

من این مدل را یک model برنامه‌نویسی دست‌کم گرفته شده یافتم که روی توسعه فرانت‌اند تمرکز دارد و tokens را فوق‌العاده سریع ارائه می‌دهد.

این دقیقاً توسعه‌دهندگانی را هدف قرار داده که به مقیاس بالا بدون latency مدل‌های Pro نیاز دارند.

قابلیت multimodality در اینجا فقط یک ترفند تبلیغاتی نیست؛ این مدل PDFهای پیچیده را به راحتی مدیریت می‌کند.

Google واقعاً مرزهای آنچه یک model 'lite' می‌تواند در سال 2026 به دست آورد را جابجا کرده است.

این بار با Gemini 3.1 Flash Light روبرو هستیم که قرار است نسخه‌ای سریع‌تر و ارزان‌تر از مدل Flash باشد.

این modelها برای اپلیکیشن‌هایی که به throughput بالا نیاز دارند، ضروری هستند.

context window یک میلیونی اکنون برای Gemini استاندارد شده است، اما دیدن آن روی مدلی با این سرعت تحسین‌برانگیز است.

قرار نیست در المپیاد ریاضی برنده شود، اما برای استخراج و خلاصه‌سازی عالی است.

در تست‌های اولیه من، API latency به طور قابل توجهی کمتر از GPT-4o-mini است.

این AI model جدید گوگل 45٪ سریع‌تر است... و ممکن است نحوه ساخت ما با هوش مصنوعی را تغییر دهد.

حالت Low thinking برای کارهای سریع و ساده، و High thinking برای کارهای سنگین... این انعطاف‌پذیری است که یک ابزار واقعی را از اسباب‌بازی متمایز می‌کند.

برای کارهای SEO، این مدل به دلیل قیمت مناسب، انتخاب روزانه من خواهد بود.

اینکه می‌تواند یک ویدئو را ببیند و context آن را تقریباً آنی درک کند، برای تولیدکنندگان محتوا یک تغییردهنده بازی است.

در حال حاضر Google توجیه استفاده از سایر ارائه‌دهندگان برای وظایف با حجم بالا را بسیار سخت کرده است.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Gemini 3.1 Flash-Lite

نکات تخصصی برای کمک به شما در استفاده حداکثری از Gemini 3.1 Flash-Lite و دستیابی به نتایج بهتر.

بهره‌گیری از Thinking Levels

برای کارهای ساده مانند دسته‌بندی، thinking_level را روی 'minimal' تنظیم کنید تا سرعت به حداکثر برسد، اما برای تولید کد ساختاریافته از 'high' استفاده کنید.

تحلیل نیتیو ویدئو

فایل‌های ویدئویی خام را مستقیماً به API بدهید تا بدون نیاز به مراحل تبدیل به متن، بینش‌های سریع‌تری از رویدادهای بصری و نشانه‌های صوتی به طور همزمان دریافت کنید.

اولویت Context بر RAG

برای مجموعه‌داده‌های زیر 1 میلیون tokens، کل مجموعه اسناد را وارد context window کنید تا خطاهای بازیابی و هزینه‌های vector DB حذف شود.

بهینه‌سازی با Batching

از API بچینگ برای کارهای غیرفوری استفاده کنید تا هزینه‌ها بیشتر کاهش یابد، چرا که Flash-Lite به طور خاص برای پردازش نامتقارن بهینه شده است.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
anthropic

Claude 3.7 Sonnet

Anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M

سوالات متداول درباره Gemini 3.1 Flash-Lite

پاسخ سوالات رایج درباره Gemini 3.1 Flash-Lite را بیابید