google

Gemini 3 Pro

مدل Gemini 3 Pro گوگل، یک قدرت‌نمای multimodal است که از context window یک میلیون توکنی، پردازش ویدیویی native و عملکرد reasoning پیشرو در صنعت بهره می‌برد.

هوش مصنوعی MultimodalContext طولانیمدل Frontierآماده برای AGI
google logogoogleGemini 317 نوامبر 2025
پنجره زمینه
1.0Mتوکن
حداکثر خروجی
66Kتوکن
قیمت ورودی
$2.00/ 1M
قیمت خروجی
$12.00/ 1M
حالت:TextImageAudioVideo
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
91.9%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. Gemini 3 Pro امتیاز 91.9% در این معیار کسب کرد.
HLE
45.8%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. Gemini 3 Pro امتیاز 45.8% در این معیار کسب کرد.
MMLU
91.8%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. Gemini 3 Pro امتیاز 91.8% در این معیار کسب کرد.
MMLU Pro
85%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. Gemini 3 Pro امتیاز 85% در این معیار کسب کرد.
SimpleQA
72.1%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. Gemini 3 Pro امتیاز 72.1% در این معیار کسب کرد.
IFEval
85%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. Gemini 3 Pro امتیاز 85% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. Gemini 3 Pro امتیاز 100% در این معیار کسب کرد.
MATH
94%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. Gemini 3 Pro امتیاز 94% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. Gemini 3 Pro امتیاز 99% در این معیار کسب کرد.
MGSM
93%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. Gemini 3 Pro امتیاز 93% در این معیار کسب کرد.
MathVista
79%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. Gemini 3 Pro امتیاز 79% در این معیار کسب کرد.
SWE-Bench
76.2%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. Gemini 3 Pro امتیاز 76.2% در این معیار کسب کرد.
HumanEval
93%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. Gemini 3 Pro امتیاز 93% در این معیار کسب کرد.
LiveCodeBench
81.3%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. Gemini 3 Pro امتیاز 81.3% در این معیار کسب کرد.
MMMU
81%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. Gemini 3 Pro امتیاز 81% در این معیار کسب کرد.
MMMU Pro
81%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. Gemini 3 Pro امتیاز 81% در این معیار کسب کرد.
ChartQA
81.4%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. Gemini 3 Pro امتیاز 81.4% در این معیار کسب کرد.
DocVQA
92%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. Gemini 3 Pro امتیاز 92% در این معیار کسب کرد.
Terminal-Bench
54.2%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. Gemini 3 Pro امتیاز 54.2% در این معیار کسب کرد.
ARC-AGI
31.1%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. Gemini 3 Pro امتیاز 31.1% در این معیار کسب کرد.

درباره Gemini 3 Pro

درباره قابلیت‌های Gemini 3 Pro، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

معماری Multimodal Native

Gemini 3 Pro مدل flagship اصلی گوگل است که برای پردازش متن، تصویر، صوت و ویدیو به‌صورت native در یک pass ترنسفورمر طراحی شده است. برخلاف مدل‌های قبلی که بر انکودرهای جداگانه تکیه می‌کردند، این معماری داده‌های ظریف را در تمامی مودالیته‌ها حفظ می‌کند. این مدل در اواخر سال 2025 منتشر شد تا به‌عنوان جایگزینی با عملکرد بالا برای مدل‌های reasoning پیشرو عمل کند و تعادلی بین هوش خام و کارایی عملیاتی برقرار نماید.

Reasoning و عملکرد فنی

از نظر فنی، این مدل در حوزه‌های کمی عالی عمل می‌کند و توانسته امتیاز کامل 100% در آزمون ریاضی AIME 2025 را کسب کند. این مدل شامل یک لایه Deep Think درونی است که به سیستم اجازه می‌دهد قبل از تولید پاسخ، بر ساختارهای منطقی پیچیده تأمل کند. این ویژگی آن را به‌ویژه برای تحقیقات علمی، پرسش‌وپاسخ‌های تخصصی در GPQA Diamond و برنامه‌نویسی رقابتی پیشرفته که در آن تأیید منطق حیاتی است، مؤثر می‌سازد.

کارایی Context در سطح سازمانی

با یک context window عظیم یک میلیون توکنی، این مدل برای سنتز داده‌ها در مقیاس بزرگ ساخته شده است. این مدل می‌تواند کل codebaseها یا ساعت‌ها ویدیوی با کیفیت بالا را وارد کند تا بینش‌های خاصی را بدون از دست دادن اطلاعات که در معماری‌های استاندارد RAG رایج است، استخراج نماید. این قابلیت context طولانی، در کنار caching بهینه، به سازمان‌ها اجازه می‌دهد تا گردش‌های کاری خودکار پیچیده را با هزینه‌ای به‌مراتب کمتر از سیستم‌های flagship رقیب اجرا کنند.

Gemini 3 Pro

موارد استفاده برای Gemini 3 Pro

روش‌های مختلف استفاده از Gemini 3 Pro برای دستیابی به نتایج عالی را کشف کنید.

مهندسی خودکار Codebase

کل مخازن گیت‌هاب را به داخل context window یک میلیون توکنی وارد کنید تا دیباگ کل مخزن و پیاده‌سازی ویژگی‌ها با آگاهی کامل از معماری انجام شود.

هوش بصری Multimodal ویدیو

فایل‌های ویدیویی یک‌ساعته را به‌صورت native تحلیل کنید تا بینش‌های زمانی استخراج شوند، صحنه‌های پیچیده خلاصه شوند یا ارتباطات بصری-صوتی شناسایی گردند.

تحقیقات علمی در سطح دکتری

با استفاده از امتیازات پیشرو GPQA و توانایی تجزیه جداول علمی پیچیده، مسائل فیزیک و شیمی در سطح تحصیلات تکمیلی را حل کنید.

برنامه‌ریزی فضایی سه‌بعدی

از قابلیت‌های بی‌نظیر reasoning سه‌بعدی model برای برنامه‌ریزی محیط‌های مجازی، طراحی لایه‌بندی UI یا حل پازل‌های فضایی استفاده کنید.

توسعه بازی با تکنیک Zero-Shot

با بهره‌گیری از کدنویسی پیشرفته و ترکیب منطقی، بازی‌های سبک رترو یا موتورهای فیزیکی کاربردی را تنها با یک prompt تولید کنید.

سنتز اسناد سازمانی

هزاران صفحه اسناد مالی غیرساختاریافته را به‌طور هم‌زمان پردازش کنید تا ریسک‌ها شناسایی شده و گزارش‌های ساختاریافته تولید شوند.

نقاط قوت

محدودیت‌ها

Reasoning سه‌بعدی نخبه: توانایی برتر در حل پازل‌های فضایی و برنامه‌ریزی محیط‌های سه‌بعدی را نشان می‌دهد و در منطق بصری از رقبا پیشی می‌گیرد.
مشکل پرگویی (Verbosity): benchmarkهای جامعه کاربری اغلب این model را بسیار پرگو توصیف می‌کنند که برای کارهای ساده، توکن‌های بیشتری از حد نیاز مصرف می‌کند.
کارایی عظیم Context: context window یک میلیون توکنی اجازه می‌دهد پروژه‌های کامل یا ساعت‌ها ویدیو بدون از دست رفتن داده‌ها (مشکل رایج در سیستم‌های RAG) پردازش شوند.
تغییرات نرخ توهم: اگرچه منطق بهبود یافته است، اما در ارزیابی‌های باز نسبت به مدل‌های کوچک‌تر، همچنان نرخ توهم قابل‌اندازه‌گیری دارد.
امتیازات ریاضی سطح بالا: کسب امتیاز کامل 100% در آزمون ریاضی AIME 2025، آن را به انتخابی برتر برای تحلیل‌های کمی و علمی تبدیل کرده است.
جریمه مقیاس‌پذیری Context: قیمت پس از 200,000 توکن بلافاصله دو برابر می‌شود که می‌تواند منجر به صورت‌حساب‌های غیرمنتظره برای عملیات‌های بزرگ سازمانی شود.
قیمت‌گذاری رقابتی: با قیمت 2 دلار به ازای هر 1 میلیون token ورودی، هوش frontier را با هزینه‌ای به‌مراتب کمتر از جایگزین‌های flagship ارائه می‌دهد.
شکاف‌های ویژگی منطقه‌ای: برخی از ویژگی‌های پیشرفته agentic و deep thinking در ابتدا محدود به مناطق خاص یا تنظیمات زبان انگلیسی هستند.

شروع سریع API

google/gemini-3-pro-preview

مشاهده مستندات
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({ 
  model: "gemini-3-pro",
  thinkingConfig: { includeThoughts: true }
});

const prompt = "پیامدهای معماری این codebase یک میلیون توکنی را توضیح بده.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره Gemini 3 Pro چه می‌گویند

ببینید جامعه درباره Gemini 3 Pro چه فکر می‌کند

Context یک میلیونی Gemini 3 Pro برای تحلیل codebase یک تغییر بازی است. بالاخره کل پروژه‌ام را آپلود کردم و ساختار آن را توهم نزد.
dev_guru_2026
reddit
حالت Deep Think در منطق به‌مراتب بهتر از GPT-4o است. واقعاً مکث می‌کند تا تأمل کند به‌جای اینکه فقط اولین پاسخ را بیرون بریزد.
AIExpertX
twitter
گوگل بالاخره با انتشار نسخه 3.1 عقب‌ماندگی را جبران کرد. benchmarkهای ARC-AGI-2 دروغ نمی‌گویند؛ این فعلاً تاج reasoning است.
hackernews_reader
hackernews
عاشق سرعت و قابلیت‌های multimodal هستم، اما مرد، گاهی اوقات بیش از حد پرگو می‌شود. برای یک prompt ساده یک گزارش 10 صفحه‌ای تحویل می‌دهد.
TheTechReviewer
youtube
عملکرد ریاضی داستان اصلی اینجاست. 100% در AIME 2025 عملاً به معنای حل مسائل ریاضی رقابتی دبیرستان است.
logic_king
reddit
پردازش صوتی native تفاوت بزرگی ایجاد می‌کند. لحن و کنایه‌هایی را درک می‌کند که مدل‌های فقط متنی از دست می‌دهند.
prompt_engineer
twitter

ویدیوهای درباره Gemini 3 Pro

آموزش‌ها، بررسی‌ها و بحث‌های درباره Gemini 3 Pro را تماشا کنید

Gemini 3 Pro... حقیقتاً فصل جدیدی در مسابقه به سمت هوش مصنوعی واقعی رقم می‌زند.

در benchmark مستقل شخصی خودم، Simple Bench، رقبایش را درهم کوبید.

این model شکلی از تأمل درونی را نشان می‌دهد که در تکرارهای قبلی ندیده بودیم.

توانایی آن در درک محتوای ویدیویی طولانی بدون پیش‌پردازش، دست‌کم‌گرفته‌شده‌ترین ویژگی آن است.

فکر می‌کنم عملاً هیچ benchmarkای باقی نمانده که یک انسان متوسط بتواند در آن بهتر از Gemini 3 Pro عمل کند.

Gemini 3 Pro Deepthink... مسلماً باهوش‌ترین LLM موجود است که حداقل به صورت عمومی در دسترس است.

از reasoning موازی پیشرفته برای بررسی چندین فرضیه به‌طور هم‌زمان استفاده می‌کند.

ثبات در کل context window یک میلیونی به‌طور قابل‌توجهی بالاتر از 1.5 Pro است.

می‌توانید ببینید که در مسیر فکر کردن، خطاهای منطقی خودش را تصحیح می‌کند.

این یکی از تنها مدل‌هایی است که واقعاً به‌درستی انیمیشن سقوط هواپیما از آسمان را نشان می‌دهد.

جهش در قابلیت‌ها از Gemini 2.5 به Gemini 3 Pro، مهم‌ترین جهشی است که از زمان GPT-4 دیده شده.

قیمت‌گذاری برای آنچه از نظر ظرفیت reasoning دریافت می‌کنید، واقعاً دیوانه‌وار است.

زمانی که Karpathy ابزار Google Search را فعال کرد، model دچار چیزی شد که آن را شوک زمانی نامید.

انواع TypeScript را بهتر از هر model دیگری که امسال تست کرده‌ام، مدیریت می‌کند.

Gemini 3 با موفقیت یک کنترلر بازی قابل‌تشخیص تولید کرد... در حالی که GPT 5.1 یک شکل به‌سختی قابل‌تشخیص تولید کرد.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای Gemini 3 Pro

نکات تخصصی برای کمک به شما در استفاده حداکثری از Gemini 3 Pro و دستیابی به نتایج بهتر.

استفاده از قابلیت‌های Reasoning

از تنظیمات Deep Think برای ایجاد تعادل بین سرعت و دقت استفاده کنید و حالت High را برای برنامه‌نویسی رقابتی رزرو کنید.

استفاده از Context Caching برای بازگشت سرمایه

در پروژه‌های طولانی‌مدت از context caching استفاده کنید تا هنگام پرس‌وجو از همان دیتاست 1M token، هزینه‌ها را تا 90 درصد کاهش دهید.

ارائه Context کامل مخزن کد

هنگام کدنویسی، به‌جای قطعه‌کدها، کل ساختار فایل‌ها را آپلود کنید تا model بتواند انسجام معماری پروژه را حفظ کند.

استفاده از Prompting زمانی

هنگام تحلیل ویدیو، در prompt خود به timestampهای خاص اشاره کنید تا به model کمک کنید تمرکز خود را بر رویدادهای بصری کلیدی بگذارد.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

سوالات متداول درباره Gemini 3 Pro

پاسخ سوالات رایج درباره Gemini 3 Pro را بیابید