هزینه استفاده از Gemini 3.1 Flash-Lite چقدر است؟

هزینه این مدل به ازای هر ۱ میلیون توکن ورودی ۰.۲۵ دلار و به ازای هر ۱ میلیون توکن خروجی ۱.۵۰ دلار است.

آیا سطح رایگان برای توسعهدهندگان وجود دارد؟

بله، این مدل برای تست و آزمایش در Google AI Studio به صورت رایگان در دسترس است.

حداکثر context window چقدر است؟

این مدل از حداکثر ۱,۰۴۸,۵۷۶ توکن پشتیبانی میکند که امکان پردازش حدود ۷۰۰ هزار کلمه را فراهم میسازد.

آیا میتوانم فایلهای ویدیویی را با این مدل پردازش کنم؟

بله، این مدل میتواند به صورت بومی فایلهای ویدیویی تا ۱ ساعت یا ۱.۵ گیگابایت حجم را پردازش کند.

سطوح تفکر (Thinking Levels) چیست؟

این پارامتر به شما امکان میدهد زمان استدلال داخلی که مدل صرف حل یک مسئله قبل از تولید خروجی میکند را کنترل کنید.

این مدل در مقایسه با Claude 4.5 Haiku چگونه است؟

مدل Gemini 3.1 Flash-Lite در توکنهای خروجی حدود ۴ برابر ارزانتر است و در benchmarkهای استدلال GPQA عملکرد بهتری نسبت به Claude 4.5 Haiku دارد.

آیا این مدل از function calling پشتیبانی میکند؟

بله، این مدل از قابلیت tool use و function calling برای ساخت جریانهای کاری agentic خودمختار به طور کامل پشتیبانی میکند.

سرعت خروجی مدل چقدر است؟

این مدل به سرعت ۳۶۳ توکن در ثانیه میرسد که آن را برای برنامههای حساس به latency ایدهآل میکند.

Gemini 3.1 Flash-Lite

جمنای 3.1 فلش-لایت سریع‌ترین و مقرون‌به‌صرفه‌ترین مدل گوگل است. دارای 1 میلیون توکن context window، قابلیت چندوجهی بومی و سرعت 363 توکن در ثانیه برای...

Multimodalسرعت بالامقرون‌به‌صرفهگوگل جمنای

googleGemini 3.1۳ مارس ۲۰۲۶

پنجره زمینه

1.0Mتوکن

حداکثر خروجی

66Kتوکن

قیمت ورودی

$0.25/ 1M

قیمت خروجی

$1.50/ 1M

حالت:TextImageAudioVideo

قابلیت‌ها:بیناییابزارهااستریمینگ

معیارها

GPQA

86.9%

HLE

16%

MMLU

88.9%

MMLU Pro

80%

SimpleQA

43.3%

IFEval

85%

AIME 2025

25%

MATH

78%

GSM8k

95%

MGSM

92%

MathVista

75%

SWE-Bench

35%

HumanEval

88%

LiveCodeBench

72%

MMMU

76.8%

MMMU Pro

76.8%

ChartQA

91%

DocVQA

92%

Terminal-Bench

55%

ARC-AGI

12%

مشاهده مستندات API

درباره Gemini 3.1 Flash-Lite

درباره قابلیت‌های Gemini 3.1 Flash-Lite، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

Gemini 3.1 Flash-Lite برای برنامه‌های کاربردی هوش مصنوعی با حجم بالا که در آن سرعت پردازش نیاز فنی اصلی است، مهندسی شده است. برخلاف مدل‌های Pro بزرگتر، Flash-Lite از معماری ساده‌سازی شده‌ای استفاده می‌کند که توان عملیاتی را در اولویت قرار داده و به ۳۶۳ توکن در ثانیه می‌رسد. این مدل به عنوان یک ابزار تخصصی برای توسعه‌دهندگانی عمل می‌کند که عامل‌های صوتی بلادرنگ، سیستم‌های خودکار مدیریت محتوا و خط‌لوله‌های استخراج داده در مقیاس بزرگ می‌سازند که باید تحت ترافیک سنگین مقرون‌به‌صرفه باقی بمانند.

با وجود نام Lite، این مدل همچنان context window یک میلیون توکنی خود را حفظ کرده است. این مدل می‌تواند فایل‌های صوتی خام، ویدیوهای یک‌ساعته و صدها صفحه PDF را در یک درخواست پردازش کند. با معرفی سطوح تفکر، گوگل به کاربران اجازه می‌دهد بین پاسخ‌های تقریباً آنی برای کارهای ساده و یک مرحله استدلال عمیق‌تر برای منطق‌های پیچیده، انتخاب کنند. این امر پروفایل‌های عملکردی متعددی را در یک endpoint واحد API ارائه می‌دهد تا هزینه و دقت را متعادل کند.

این مدل به صورت بومی چندوجهی است که نیاز به ابزارهای خارجی برای رونویسی صدا یا توصیف تصاویر قبل از پردازش را از بین می‌برد. این قابلیت بومی عملکرد را در کارهای بصری مانند پرسش و پاسخ از اسناد و تحلیل نمودار بهبود می‌بخشد. توسعه‌دهندگان می‌توانند از پارامتر thinking_level برای تنظیم زمان استدلال داخلی استفاده کنند و به طور موثر تلاش مدل را بر اساس پیچیدگی خاص هر پرسش تنظیم کنند.

موارد استفاده برای Gemini 3.1 Flash-Lite

روش‌های مختلف استفاده از Gemini 3.1 Flash-Lite برای دستیابی به نتایج عالی را کشف کنید.

ترجمه با حجم بالا

پردازش هزاران پیام چت چندزبانه یا تیکت پشتیبانی به صورت بلادرنگ با latency کمتر از یک ثانیه.

مسیریابی هوشمند مدل

عمل به عنوان یک طبقه‌بندی‌کننده سریع برای تعیین اینکه آیا پرسش‌های ورودی نیاز به ارجاع به مدل‌های گران‌تر دارند یا خیر.

مدیریت محتوای چندوجهی (Multimodal)

اسکن دسته‌های بزرگ تصاویر و ویدیوهای تولید شده توسط کاربران برای رعایت استانداردهای ایمنی با هزینه کم.

نمونه‌سازی رابط کاربری بلادرنگ

تولید کامپوننت‌های کاربردی React یا Tailwind از روی وایرفریم‌های ترسیم‌شده با دست یا توضیحات کلامی.

خلاصه‌سازی اسناد طولانی

فشرده‌سازی آرشیوهای حقوقی یا دفترچه‌های راهنمای فنی حجیم بدون از دست دادن context در بازه ۱ میلیون توکنی.

رونویسی صوتی زنده

تبدیل ساعت‌ها ضبط جلسات یا سخنرانی‌ها به خلاصه‌های ساختاریافته و موارد عملیاتی در یک مرحله.

نقاط قوت

محدودیت‌ها

عملکرد فوق‌سریع: با سرعت ۳۶۳ توکن در ثانیه، این یکی از سریع‌ترین مدل‌ها در صنعت برای پاسخگویی بلادرنگ است.

فراخوانی حقایق پایین: امتیاز ۴۳.۳٪ در SimpleQA نشان‌دهنده ریسک بالای توهم (hallucinations) در دانش عمومی بدون استفاده از Grounding است.

استدلال پیشرفته: با دستیابی به ۸۶.۹٪ در GPQA Diamond، این مدل منطق علمی در سطح دکتری را در یک کلاس سبک ارائه می‌دهد.

افزایش قیمت: این مدل نسبت به مدل قبلی یعنی Gemini 2.5 Flash-Lite که جایگزین آن شده، به طور قابل توجهی گران‌تر است.

کنترل هزینه پویا: پارامتر Thinking Levels امکان کنترل دقیق هزینه‌های پردازشی را به صورت هر درخواست فراهم می‌کند.

Latency بالاتر در سطوح تفکر بالا: استفاده از سطح تفکر بالا حدود ۷ تا ۱۰ ثانیه پیش‌پردازش قبل از شروع تولید خروجی اضافه می‌کند.

چندوجهی (Multimodal) یکپارچه: ورودی بومی صدا، ویدیو و فایل‌های PDF نیاز به خط‌لوله‌های پیچیده ارکستراسی چندمدل را از بین می‌برد.

امتناع‌های ایمنی: تست‌های داخلی کاهش ۲۱.۷ درصدی در ثبات ایمنی تصویر به متن را طی تمرینات red-teaming نشان می‌دهند.

شروع سریع API

google/gemini-3.1-flash-lite-preview

مشاهده مستندات

google SDK

import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("Create a weather dashboard UI.");
console.log(result.response.text());

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Gemini 3.1 Flash-Lite چه می‌گویند

ببینید جامعه درباره Gemini 3.1 Flash-Lite چه فکر می‌کند

“توانایی کدنویسی 3.1 Flash-Lite برای توسعه فرانت‌اند به‌طور شگفت‌انگیزی خوب است؛ یک نمایشگر ۳۶۰ درجه را بی‌نقص کدنویسی کرد.”

— WorldofAI

youtube

“Gemini 3.1 Flash-Lite مدلی برای ساخت عامل‌های هوش مصنوعی چندوجهی (Multimodal AI Agents) همیشه روشن است. می‌خواند، متصل می‌کند و همه چیز را تثبیت می‌کند.”

— Shubham Saboo

twitter

“قیمت‌گذاری یک شوک بزرگ است. اگر بودجه ابری محدودی دارید، جهش ۳.۷۵ برابری در توکن‌های خروجی آزاردهنده خواهد بود.”

— Binary Verse AI

youtube

“این مدل بار پیچیدگی را از روی معماری تیم مهندسی شما برداشته و مستقیماً بر روی زیرساخت گوگل منتقل می‌کند.”

— Julian Goldie

youtube

“یک کاهش قیمت دیگر برای هوش. سرعت بالا، هزینه کم، هوش بالا. مدلی عالی برای مسیریابی عامل‌محور (agentic routing).”

— ctgtplb

twitter

“۱ میلیون توکن context هنوز ویژگی اصلی و جذاب اینجاست. من می‌توانم کل پوشه‌های مخزن (repo) را به آن بدهم و فقط با TTFT زیر ثانیه کار می‌کند.”

— DevFlow_26

ویدیوهای درباره Gemini 3.1 Flash-Lite

آموزش‌ها، بررسی‌ها و بحث‌های درباره Gemini 3.1 Flash-Lite را تماشا کنید

“به نظر می‌رسد آن‌ها توانسته‌اند مقدار زیادی هوش را به نوعی در این مدل بگنجانند.”

“من از آن برای بارهای کاری با توان عملیاتی (throughput) بالا که به خوبی تعریف شده‌اند استفاده می‌کنم.”

“توانایی فرانت‌اند این مدل حتی از اکثر مدل‌هایی که با آن‌ها کار کرده‌ام بهتر است.”

“این مدل در یک تلاش، یک نمایشگر کاملاً کاربردی ایجاد کرد.”

“این مدل برای کسانی که بدون از دست دادن تمام منطق، به سرعت نیاز دارند، ایده‌آل است.”

“این مدل چیزی است که ما آن را مدل کاری یا workhorse می‌نامیم... که مخصوص کارهای با توان عملیاتی بالا طراحی شده است.”

“اگر آن را با بودجه تفکر حداقلی اجرا کنید، اساساً به عنوان یک مدل بدون استدلال عمل می‌کند و بسیار سریع است.”

“وب‌سایتی که به عنوان خروجی به ما داد، عملکرد فوق‌العاده‌ای داشت.”

“نسبت سرعت به هزینه دلیل اصلی مهاجرت برنامه‌های تولیدی (production) شما به اینجا است.”

“این مدل ورودی‌های چندوجهی (multimodal) را به صورت بومی مدیریت می‌کند که یک مزیت بزرگ نسبت به رقبا است.”

“رسیدن به نزدیک ۸۷٪ در GPQA Diamond با مدلی که به عنوان lite برچسب‌گذاری شده، کل سیستم دسته‌بندی ما را مختل می‌کند.”

“از این مدل به عنوان مرجع فاکتوال استفاده نکنید... شما باید حقایق را به آن بدهید.”

“با 3.1 Flash-Lite، شما از اجرای سه میکروسرویس دیگر جلوگیری می‌کنید... آن سادگی ارزش واقعی پول را دارد.”

“افزایش ۴۵ درصدی در سرعت خروجی فوراً در پاسخ‌های استریم احساس می‌شود.”

“شما ۱ میلیون توکن context را با هزینه ناچیز دریافت می‌کنید که هنوز در محیط تولید مثل جادو به نظر می‌رسد.”

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI

اتوماسیون وب

گردش‌کارهای هوشمند

شروع رایگان

نکات حرفه‌ای برای Gemini 3.1 Flash-Lite

نکات تخصصی برای کمک به شما در استفاده حداکثری از Gemini 3.1 Flash-Lite و دستیابی به نتایج بهتر.

تنظیم سطوح تفکر (Thinking Levels)

برای طبقه‌بندی، از سطح تفکر حداقلی استفاده کنید تا هزینه‌ها کاهش یابد، اما برای کارهای پیچیده کدنویسی از تنظیمات بالا استفاده کنید.

فعال‌سازی Grounding

برای کارهایی که نیاز به فراخوانی حقایق دارند، همیشه از Google Search grounding استفاده کنید، زیرا دقت فاکتوال پایه مدل پایین‌تر است.

آپلود فایل‌های خام

از پیش‌پردازش فایل‌های صوتی یا ویدیویی به متن خودداری کنید و به جای آن، فایل‌های خام را برای بهره‌گیری از قابلیت multimodality بومی آپلود کنید.

استفاده از دستورالعمل‌های سیستمی (System Instructions)

برای به حداقل رساندن توکن‌های اصلاح خروجی، طرح‌های JSON را با استفاده از پارامتر system_instruction به شدت اعمال کنید.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Mohammed Ibrahim

CEO, qannas.pro

Ben Bressington

CTO, AiChatSolutions

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context

$5.00/$25.00/1M

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context

$3.00/$15.00/1M

GLM-5.1

Zhipu (GLM)

GLM-5.1 is Zhipu AI's flagship reasoning model, featuring a 202K context window and an autonomous 8-hour execution loop for complex agentic engineering.

203K context

$1.40/$4.40/1M

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context

$0.60/$3.00/1M

Qwen3.6-Max-Preview

alibaba

Qwen3.6-Max-Preview is Alibaba's flagship MoE model featuring 1M context, a native thinking mode, and SOTA scores in agentic coding and reasoning.

1M context

$1.25/$10.00/1M

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context

$1.00/$3.20/1M

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context

$1.25/$10.00/1M

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context

$1.75/$14.00/1M

سوالات متداول درباره Gemini 3.1 Flash-Lite

پاسخ سوالات رایج درباره Gemini 3.1 Flash-Lite را بیابید

Gemini 3.1 Flash-Lite

درباره Gemini 3.1 Flash-Lite

موارد استفاده برای Gemini 3.1 Flash-Lite

ترجمه با حجم بالا

مسیریابی هوشمند مدل

مدیریت محتوای چندوجهی (Multimodal)

نمونه‌سازی رابط کاربری بلادرنگ

خلاصه‌سازی اسناد طولانی

رونویسی صوتی زنده

نقاط قوت

محدودیت‌ها

شروع سریع API

مردم درباره Gemini 3.1 Flash-Lite چه می‌گویند

ویدیوهای درباره Gemini 3.1 Flash-Lite

گردش کار خود را با اتوماسیون AI

نکات حرفه‌ای برای Gemini 3.1 Flash-Lite

تنظیم سطوح تفکر (Thinking Levels)

فعال‌سازی Grounding

آپلود فایل‌های خام

استفاده از دستورالعمل‌های سیستمی (System Instructions)

کاربران ما چه می‌گویند

مرتبط AI Models

Claude Opus 4.5

Grok-4

GLM-5.1

Kimi K2.5

Qwen3.6-Max-Preview

GLM-5

GPT-5.1

GPT-5.2

سوالات متداول درباره Gemini 3.1 Flash-Lite

هزینه استفاده از Gemini 3.1 Flash-Lite چقدر است؟

آیا سطح رایگان برای توسعه‌دهندگان وجود دارد؟

حداکثر context window چقدر است؟

آیا می‌توانم فایل‌های ویدیویی را با این مدل پردازش کنم؟

سطوح تفکر (Thinking Levels) چیست؟

این مدل در مقایسه با Claude 4.5 Haiku چگونه است؟

آیا این مدل از function calling پشتیبانی می‌کند؟

سرعت خروجی مدل چقدر است؟