google

Gemini 3.1 Flash-Lite

جمنای 3.1 فلش-لایت سریع‌ترین و مقرون‌به‌صرفه‌ترین مدل گوگل است. دارای 1 میلیون توکن context window، قابلیت چندوجهی بومی و سرعت 363 توکن در ثانیه برای...

Multimodalسرعت بالامقرون‌به‌صرفهگوگل جمنای
google logogoogleGemini 3.1۳ مارس ۲۰۲۶
پنجره زمینه
1.0Mتوکن
حداکثر خروجی
66Kتوکن
قیمت ورودی
$0.25/ 1M
قیمت خروجی
$1.50/ 1M
حالت:TextImageAudioVideo
قابلیت‌ها:بیناییابزارهااستریمینگ
معیارها
GPQA
86.9%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Gemini 3.1 Flash-Lite امتیاز 86.9% در این معیار کسب کرد.
HLE
16%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 16% در این معیار کسب کرد.
MMLU
88.9%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Gemini 3.1 Flash-Lite امتیاز 88.9% در این معیار کسب کرد.
MMLU Pro
80%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Gemini 3.1 Flash-Lite امتیاز 80% در این معیار کسب کرد.
SimpleQA
43.3%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 43.3% در این معیار کسب کرد.
IFEval
85%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Gemini 3.1 Flash-Lite امتیاز 85% در این معیار کسب کرد.
AIME 2025
25%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Gemini 3.1 Flash-Lite امتیاز 25% در این معیار کسب کرد.
MATH
78%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 78% در این معیار کسب کرد.
GSM8k
95%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Gemini 3.1 Flash-Lite امتیاز 95% در این معیار کسب کرد.
MGSM
92%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Gemini 3.1 Flash-Lite امتیاز 92% در این معیار کسب کرد.
MathVista
75%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 75% در این معیار کسب کرد.
SWE-Bench
35%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Gemini 3.1 Flash-Lite امتیاز 35% در این معیار کسب کرد.
HumanEval
88%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Gemini 3.1 Flash-Lite امتیاز 88% در این معیار کسب کرد.
LiveCodeBench
72%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 72% در این معیار کسب کرد.
MMMU
76.8%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Gemini 3.1 Flash-Lite امتیاز 76.8% در این معیار کسب کرد.
MMMU Pro
76.8%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Gemini 3.1 Flash-Lite امتیاز 76.8% در این معیار کسب کرد.
ChartQA
91%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 91% در این معیار کسب کرد.
DocVQA
92%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 92% در این معیار کسب کرد.
Terminal-Bench
55%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 55% در این معیار کسب کرد.
ARC-AGI
12%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Gemini 3.1 Flash-Lite امتیاز 12% در این معیار کسب کرد.

درباره Gemini 3.1 Flash-Lite

درباره قابلیت‌های Gemini 3.1 Flash-Lite، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Gemini 3.1 Flash-Lite برای برنامه‌های کاربردی هوش مصنوعی با حجم بالا که در آن سرعت پردازش نیاز فنی اصلی است، مهندسی شده است. برخلاف مدل‌های Pro بزرگتر، Flash-Lite از معماری ساده‌سازی شده‌ای استفاده می‌کند که توان عملیاتی را در اولویت قرار داده و به ۳۶۳ توکن در ثانیه می‌رسد. این مدل به عنوان یک ابزار تخصصی برای توسعه‌دهندگانی عمل می‌کند که عامل‌های صوتی بلادرنگ، سیستم‌های خودکار مدیریت محتوا و خط‌لوله‌های استخراج داده در مقیاس بزرگ می‌سازند که باید تحت ترافیک سنگین مقرون‌به‌صرفه باقی بمانند.

با وجود نام Lite، این مدل همچنان context window یک میلیون توکنی خود را حفظ کرده است. این مدل می‌تواند فایل‌های صوتی خام، ویدیوهای یک‌ساعته و صدها صفحه PDF را در یک درخواست پردازش کند. با معرفی سطوح تفکر، گوگل به کاربران اجازه می‌دهد بین پاسخ‌های تقریباً آنی برای کارهای ساده و یک مرحله استدلال عمیق‌تر برای منطق‌های پیچیده، انتخاب کنند. این امر پروفایل‌های عملکردی متعددی را در یک endpoint واحد API ارائه می‌دهد تا هزینه و دقت را متعادل کند.

این مدل به صورت بومی چندوجهی است که نیاز به ابزارهای خارجی برای رونویسی صدا یا توصیف تصاویر قبل از پردازش را از بین می‌برد. این قابلیت بومی عملکرد را در کارهای بصری مانند پرسش و پاسخ از اسناد و تحلیل نمودار بهبود می‌بخشد. توسعه‌دهندگان می‌توانند از پارامتر thinking_level برای تنظیم زمان استدلال داخلی استفاده کنند و به طور موثر تلاش مدل را بر اساس پیچیدگی خاص هر پرسش تنظیم کنند.

Gemini 3.1 Flash-Lite

موارد استفاده برای Gemini 3.1 Flash-Lite

روش‌های مختلف استفاده از Gemini 3.1 Flash-Lite برای دستیابی به نتایج عالی را کشف کنید.

ترجمه با حجم بالا

پردازش هزاران پیام چت چندزبانه یا تیکت پشتیبانی به صورت بلادرنگ با latency کمتر از یک ثانیه.

مسیریابی هوشمند مدل

عمل به عنوان یک طبقه‌بندی‌کننده سریع برای تعیین اینکه آیا پرسش‌های ورودی نیاز به ارجاع به مدل‌های گران‌تر دارند یا خیر.

مدیریت محتوای چندوجهی (Multimodal)

اسکن دسته‌های بزرگ تصاویر و ویدیوهای تولید شده توسط کاربران برای رعایت استانداردهای ایمنی با هزینه کم.

نمونه‌سازی رابط کاربری بلادرنگ

تولید کامپوننت‌های کاربردی React یا Tailwind از روی وایرفریم‌های ترسیم‌شده با دست یا توضیحات کلامی.

خلاصه‌سازی اسناد طولانی

فشرده‌سازی آرشیوهای حقوقی یا دفترچه‌های راهنمای فنی حجیم بدون از دست دادن context در بازه ۱ میلیون توکنی.

رونویسی صوتی زنده

تبدیل ساعت‌ها ضبط جلسات یا سخنرانی‌ها به خلاصه‌های ساختاریافته و موارد عملیاتی در یک مرحله.

نقاط قوت

محدودیت‌ها

عملکرد فوق‌سریع: با سرعت ۳۶۳ توکن در ثانیه، این یکی از سریع‌ترین مدل‌ها در صنعت برای پاسخگویی بلادرنگ است.
فراخوانی حقایق پایین: امتیاز ۴۳.۳٪ در SimpleQA نشان‌دهنده ریسک بالای توهم (hallucinations) در دانش عمومی بدون استفاده از Grounding است.
استدلال پیشرفته: با دستیابی به ۸۶.۹٪ در GPQA Diamond، این مدل منطق علمی در سطح دکتری را در یک کلاس سبک ارائه می‌دهد.
افزایش قیمت: این مدل نسبت به مدل قبلی یعنی Gemini 2.5 Flash-Lite که جایگزین آن شده، به طور قابل توجهی گران‌تر است.
کنترل هزینه پویا: پارامتر Thinking Levels امکان کنترل دقیق هزینه‌های پردازشی را به صورت هر درخواست فراهم می‌کند.
Latency بالاتر در سطوح تفکر بالا: استفاده از سطح تفکر بالا حدود ۷ تا ۱۰ ثانیه پیش‌پردازش قبل از شروع تولید خروجی اضافه می‌کند.
چندوجهی (Multimodal) یکپارچه: ورودی بومی صدا، ویدیو و فایل‌های PDF نیاز به خط‌لوله‌های پیچیده ارکستراسی چندمدل را از بین می‌برد.
امتناع‌های ایمنی: تست‌های داخلی کاهش ۲۱.۷ درصدی در ثبات ایمنی تصویر به متن را طی تمرینات red-teaming نشان می‌دهند.

شروع سریع API

google/gemini-3.1-flash-lite-preview

مشاهده مستندات
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Gemini 3.1 Flash-Lite چه می‌گویند

ببینید جامعه درباره Gemini 3.1 Flash-Lite چه فکر می‌کند

توانایی کدنویسی 3.1 Flash-Lite برای توسعه فرانت‌اند به‌طور شگفت‌انگیزی خوب است؛ یک نمایشگر ۳۶۰ درجه را بی‌نقص کدنویسی کرد.
WorldofAI
youtube
Gemini 3.1 Flash-Lite مدلی برای ساخت عامل‌های هوش مصنوعی چندوجهی (Multimodal AI Agents) همیشه روشن است. می‌خواند، متصل می‌کند و همه چیز را تثبیت می‌کند.
Shubham Saboo
twitter
قیمت‌گذاری یک شوک بزرگ است. اگر بودجه ابری محدودی دارید، جهش ۳.۷۵ برابری در توکن‌های خروجی آزاردهنده خواهد بود.
Binary Verse AI
youtube
این مدل بار پیچیدگی را از روی معماری تیم مهندسی شما برداشته و مستقیماً بر روی زیرساخت گوگل منتقل می‌کند.
Julian Goldie
youtube
یک کاهش قیمت دیگر برای هوش. سرعت بالا، هزینه کم، هوش بالا. مدلی عالی برای مسیریابی عامل‌محور (agentic routing).
ctgtplb
twitter
۱ میلیون توکن context هنوز ویژگی اصلی و جذاب اینجاست. من می‌توانم کل پوشه‌های مخزن (repo) را به آن بدهم و فقط با TTFT زیر ثانیه کار می‌کند.
DevFlow_26
reddit

ویدیوهای درباره Gemini 3.1 Flash-Lite

آموزش‌ها، بررسی‌ها و بحث‌های درباره Gemini 3.1 Flash-Lite را تماشا کنید

به نظر می‌رسد آن‌ها توانسته‌اند مقدار زیادی هوش را به نوعی در این مدل بگنجانند.

من از آن برای بارهای کاری با توان عملیاتی (throughput) بالا که به خوبی تعریف شده‌اند استفاده می‌کنم.

توانایی فرانت‌اند این مدل حتی از اکثر مدل‌هایی که با آن‌ها کار کرده‌ام بهتر است.

این مدل در یک تلاش، یک نمایشگر کاملاً کاربردی ایجاد کرد.

این مدل برای کسانی که بدون از دست دادن تمام منطق، به سرعت نیاز دارند، ایده‌آل است.

این مدل چیزی است که ما آن را مدل کاری یا workhorse می‌نامیم... که مخصوص کارهای با توان عملیاتی بالا طراحی شده است.

اگر آن را با بودجه تفکر حداقلی اجرا کنید، اساساً به عنوان یک مدل بدون استدلال عمل می‌کند و بسیار سریع است.

وب‌سایتی که به عنوان خروجی به ما داد، عملکرد فوق‌العاده‌ای داشت.

نسبت سرعت به هزینه دلیل اصلی مهاجرت برنامه‌های تولیدی (production) شما به اینجا است.

این مدل ورودی‌های چندوجهی (multimodal) را به صورت بومی مدیریت می‌کند که یک مزیت بزرگ نسبت به رقبا است.

رسیدن به نزدیک ۸۷٪ در GPQA Diamond با مدلی که به عنوان lite برچسب‌گذاری شده، کل سیستم دسته‌بندی ما را مختل می‌کند.

از این مدل به عنوان مرجع فاکتوال استفاده نکنید... شما باید حقایق را به آن بدهید.

با 3.1 Flash-Lite، شما از اجرای سه میکروسرویس دیگر جلوگیری می‌کنید... آن سادگی ارزش واقعی پول را دارد.

افزایش ۴۵ درصدی در سرعت خروجی فوراً در پاسخ‌های استریم احساس می‌شود.

شما ۱ میلیون توکن context را با هزینه ناچیز دریافت می‌کنید که هنوز در محیط تولید مثل جادو به نظر می‌رسد.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Gemini 3.1 Flash-Lite

نکات تخصصی برای کمک به شما در استفاده حداکثری از Gemini 3.1 Flash-Lite و دستیابی به نتایج بهتر.

تنظیم سطوح تفکر (Thinking Levels)

برای طبقه‌بندی، از سطح تفکر حداقلی استفاده کنید تا هزینه‌ها کاهش یابد، اما برای کارهای پیچیده کدنویسی از تنظیمات بالا استفاده کنید.

فعال‌سازی Grounding

برای کارهایی که نیاز به فراخوانی حقایق دارند، همیشه از Google Search grounding استفاده کنید، زیرا دقت فاکتوال پایه مدل پایین‌تر است.

آپلود فایل‌های خام

از پیش‌پردازش فایل‌های صوتی یا ویدیویی به متن خودداری کنید و به جای آن، فایل‌های خام را برای بهره‌گیری از قابلیت multimodality بومی آپلود کنید.

استفاده از دستورالعمل‌های سیستمی (System Instructions)

برای به حداقل رساندن توکن‌های اصلاح خروجی، طرح‌های JSON را با استفاده از پارامتر system_instruction به شدت اعمال کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

سوالات متداول درباره Gemini 3.1 Flash-Lite

پاسخ سوالات رایج درباره Gemini 3.1 Flash-Lite را بیابید

جمنای 3.1 فلش-لایت: 1 میلیون توکن context window، سرعت 363 توکن در ثانیه