openai

GPT-5.2

GPT-5.2 مدل flagship شرکت OpenAI برای وظایف حرفه‌ای است که دارای context window ۴۰۰ هزار توکنی، کدنویسی پیشرفته و قابلیت‌های عمیق reasoning چندمرحله‌ای است.

openai logoopenaiGPT-5۱۱ دسامبر ۲۰۲۵
پنجره زمینه
400Kتوکن
حداکثر خروجی
100Kتوکن
قیمت ورودی
$1.75/ 1M
قیمت خروجی
$14.00/ 1M
حالت:TextImage
قابلیت‌ها:بیناییابزارهااستریمینگاستدلال
معیارها
GPQA
93%
GPQA: سوالات علمی سطح تحصیلات تکمیلی. معیار دقیق با 448 سوال از زیست‌شناسی، فیزیک و شیمی. کارشناسان دکترا فقط 65-74% دقت دارند. GPT-5.2 امتیاز 93% در این معیار کسب کرد.
HLE
45%
HLE: استدلال سطح کارشناسی. توانایی مدل در نشان دادن استدلال سطح کارشناسی در حوزه‌های تخصصی را آزمایش می‌کند. GPT-5.2 امتیاز 45% در این معیار کسب کرد.
MMLU
88%
MMLU: درک زبان چندوظیفه‌ای گسترده. معیار جامع با 16000 سوال در 57 موضوع دانشگاهی. GPT-5.2 امتیاز 88% در این معیار کسب کرد.
MMLU Pro
83%
MMLU Pro: نسخه حرفه‌ای MMLU. نسخه بهبود یافته MMLU با 12032 سوال و فرمت 10 گزینه‌ای سخت‌تر. GPT-5.2 امتیاز 83% در این معیار کسب کرد.
SimpleQA
58%
SimpleQA: معیار دقت واقعی. توانایی مدل در ارائه پاسخ‌های دقیق و واقعی را آزمایش می‌کند. GPT-5.2 امتیاز 58% در این معیار کسب کرد.
IFEval
95%
IFEval: ارزیابی پیروی از دستورالعمل. اندازه‌گیری می‌کند مدل چقدر خوب از دستورالعمل‌ها و محدودیت‌های خاص پیروی می‌کند. GPT-5.2 امتیاز 95% در این معیار کسب کرد.
AIME 2025
100%
AIME 2025: امتحان ریاضی دعوتی آمریکا. مسائل ریاضی سطح مسابقه از امتحان معتبر AIME. GPT-5.2 امتیاز 100% در این معیار کسب کرد.
MATH
98%
MATH: حل مسئله ریاضی. معیار جامع ریاضی که حل مسئله در جبر، هندسه، حساب دیفرانسیل را آزمایش می‌کند. GPT-5.2 امتیاز 98% در این معیار کسب کرد.
GSM8k
99%
GSM8k: ریاضی دبستان 8K. 8500 مسئله ریاضی کلامی سطح دبستان. GPT-5.2 امتیاز 99% در این معیار کسب کرد.
MGSM
98%
MGSM: ریاضی دبستان چندزبانه. معیار GSM8k ترجمه شده به 10 زبان. GPT-5.2 امتیاز 98% در این معیار کسب کرد.
MathVista
78%
MathVista: استدلال بصری ریاضی. توانایی حل مسائل ریاضی با عناصر بصری را آزمایش می‌کند. GPT-5.2 امتیاز 78% در این معیار کسب کرد.
SWE-Bench
80%
SWE-Bench: معیار مهندسی نرم‌افزار. مدل‌های AI سعی می‌کنند مسائل واقعی GitHub را در پروژه‌های Python حل کنند. GPT-5.2 امتیاز 80% در این معیار کسب کرد.
HumanEval
95%
HumanEval: مسائل برنامه‌نویسی Python. 164 مسئله برنامه‌نویسی که مدل‌ها باید پیاده‌سازی صحیح توابع Python تولید کنند. GPT-5.2 امتیاز 95% در این معیار کسب کرد.
LiveCodeBench
80%
LiveCodeBench: معیار کدنویسی زنده. توانایی‌های کدنویسی را در چالش‌های برنامه‌نویسی واقعی به‌روز شده آزمایش می‌کند. GPT-5.2 امتیاز 80% در این معیار کسب کرد.
MMMU
75%
MMMU: درک چندحالته. معیار درک چندحالته در 30 موضوع دانشگاهی. GPT-5.2 امتیاز 75% در این معیار کسب کرد.
MMMU Pro
65%
MMMU Pro: نسخه حرفه‌ای MMMU. نسخه بهبود یافته MMMU با سوالات چالش‌برانگیزتر. GPT-5.2 امتیاز 65% در این معیار کسب کرد.
ChartQA
93%
ChartQA: پرسش و پاسخ نمودار. توانایی درک و تحلیل اطلاعات از نمودارها را آزمایش می‌کند. GPT-5.2 امتیاز 93% در این معیار کسب کرد.
DocVQA
95%
DocVQA: پرسش و پاسخ بصری سند. توانایی استخراج اطلاعات از تصاویر سند را آزمایش می‌کند. GPT-5.2 امتیاز 95% در این معیار کسب کرد.
Terminal-Bench
60%
Terminal-Bench: وظایف ترمینال/CLI. توانایی انجام عملیات خط فرمان را آزمایش می‌کند. GPT-5.2 امتیاز 60% در این معیار کسب کرد.
ARC-AGI
52.9%
ARC-AGI: انتزاع و استدلال. هوش سیال را از طریق پازل‌های تشخیص الگوی جدید آزمایش می‌کند. GPT-5.2 امتیاز 52.9% در این معیار کسب کرد.

درباره GPT-5.2

درباره قابلیت‌های GPT-5.2، ویژگی‌ها و نحوه کمک به شما در دستیابی به نتایج بهتر بیاموزید.

GPT-5.2 مدل flagship شرکت OpenAI است که برای کارهای حرفه‌ای دانش‌بنیان و مهندسی خودمختار طراحی شده است. این مدل که در ۱۱ دسامبر ۲۰۲۵ عرضه شد، تحولی قابل‌توجه از سری‌های GPT-4 و GPT-o1 محسوب می‌شود که با ادغام یک حالت Thinking اختصاصی با کنترل‌های تلاش (متوسط، بالا، خیلی بالا) همراه است. این ویژگی به model اجازه می‌دهد تا قبل از تولید پاسخ، مکث کرده و منطق چندمرحله‌ای را بررسی کند.

با یک context window عظیم ۴۰۰ هزار توکنی و بازیابی تقریباً ۱۰۰ درصدی، این مدل برای بازبینی کد در سطح ارشد، refactoring‌های پیچیده و تحقیقات علمی مهندسی شده است. معماری این model به‌گونه‌ای ساخته شده که از جریان‌های کاری agentic پشتیبانی کند و دارای ابزارهای native برای فراخوانی (tool-calling) و بینایی multimodal است که می‌تواند به‌طور همزمان نمودارهای فنی پیچیده و مخازن کد را پردازش کند.

در حالی که این مدل در دقت منطقی و benchmark‌های مهندسی با کسب امتیاز ۱۰۰٪ در AIME 2025 می‌درخشد، اما در مقایسه با رقبایی مانند Claude لحن رسمی‌تر و شبیه به ماشین اتخاذ می‌کند. قیمت فعلی آن ۱.۷۵ دلار به ازای هر میلیون input tokens و ۱۴.۰۰ دلار به ازای هر میلیون output tokens است که آن را به جایگزینی مقرون‌به‌صرفه برای وظایف deep reasoning تبدیل می‌کند که قبلاً نیازمند نظارت انسانی با توان محاسباتی بالا بود.

GPT-5.2

موارد استفاده برای GPT-5.2

روش‌های مختلف استفاده از GPT-5.2 برای دستیابی به نتایج عالی را کشف کنید.

Refactor‌‌های پیچیده مهندسی

انجام Refactor‌‌های عمیق روی codebase‌های حساس به عملکرد، همراه با حفظ دقیق ثبات نوع‌ها و انسجام معماری.

وظایف خودمختار در ترمینال

اجرای جریان‌های کاری CLI چندمرحله‌ای و مدیریت مستقر‌سازی‌های پیچیده ابری با عملکرد بالا در محیط‌های Terminal-Bench.

سنتز دانش در سطح دکترا

تحلیل همزمان صدها منبع فنی و مقالات دانشگاهی برای ایجاد گزارش‌های تحقیقاتی جامع در مورد موضوعات علمی تخصصی.

رفع باگ‌های همروندی (Concurrency)

شناسایی و رفع race condition‌های ظریف یا نشتی حافظه که نیازمند inference منطقی سطح بالا روی بخش‌های طولانی کد هستند.

پردازش مکانیکی کد

مدیریت مهاجرت‌های کد در مقیاس بزرگ و تکراری در کل مخازن، بدون تنبلی رایج در LLM‌های عمومی.

بازبینی فنی ارشد

ایفای نقش به عنوان یک مهندس ارشد مجازی برای بررسی طرح‌های معماری و شناسایی حالات خاص (edge cases) در منطق سیستم‌های عملیاتی.

نقاط قوت

محدودیت‌ها

دقت مهندسی برتر: کسب امتیاز ۷۷.۳٪ در Terminal-Bench 2.0 و پیشی گرفتن از رقبا در وظایف پیچیده رابط خط فرمان.
تاخیر (Latency) بالای پاسخ‌دهی: سربار قابل‌توجه reasoning به این معنی است که model به‌طور محسوسی از نسخه‌های قبلی کندتر است که منجر به زمان انتظار طولانی می‌شود.
Reasoning ریاضی سطح بالا: کسب امتیاز ۱۰۰٪ در benchmark AIME 2025 که نشان‌دهنده ظرفیت حل مسائل ریاضی در سطح مسابقات بدون ابزارهای خارجی است.
لحن مصنوعی رابط کاربری: کاربران آن را به دلیل لحن متکبرانه و بیش از حد ساختاریافته که نسبت به سری Claude کمتر طبیعی به نظر می‌رسد، نقد کرده‌اند.
نرخ توهم پایین: تست‌های جامعه کاربری و benchmark‌های داخلی نشان‌دهنده کاهش ۳۰ درصدی در جعل واقعیت نسبت به نسل‌های flagship قبلی است.
فرآیند تفکر مبهم: برخلاف برخی از مدل‌های با reasoning شفاف، GPT-5.2 اغلب زنجیره فکر (chain-of-thought) داخلی خود را پنهان می‌کند و تنها پاسخ نهایی تایید شده را ارائه می‌دهد.
پایداری طولانی در انجام وظایف: توانایی حفظ جلسات کاری خودمختار و فعال برای بیش از دو ساعت، که آن را برای کارهای توسعه در مقیاس بزرگ ایده‌آل می‌سازد.
هزینه بالای Reasoning: قیمت ۱۴.۰۰ دلاری خروجی می‌تواند در طول وظایف طولانی reasoning که حجم بالایی از thinking tokens مصرف می‌شود، به‌سرعت افزایش یابد.

شروع سریع API

openai/gpt-5.2

مشاهده مستندات
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function solveCodeProblem() {
  const response = await openai.chat.completions.create({
    model: 'gpt-5.2',
    messages: [{ role: 'user', content: 'Debug this race condition in my Rust service.' }],
    reasoning_effort: 'high',
    temperature: 0,
  });
  console.log(response.choices[0].message.content);
}

solveCodeProblem();

SDK را نصب کنید و در عرض چند دقیقه شروع به فراخوانی API کنید.

مردم درباره GPT-5.2 چه می‌گویند

ببینید جامعه درباره GPT-5.2 چه فکر می‌کند

GPT 5.2 در Codex بهبود بسیار بزرگی است؛ تمایل بیشتری برای انجام کارهای مکانیکی دارد که معمولاً مدل‌ها را تنبل می‌کند.
ArchMeta1868
reddit
افزایش تامل و زمان صرف شده برای بررسی صحت خروجی شایسته تقدیر است... قابلیت اطمینان بسیار بهبود یافته است.
Thomas Randall
techopedia
مدلی که تحقیقات عمیق را قدرت می‌بخشد، رویکردی شبیه به انسان را با جستجوی موثر اطلاعات تخصصی در صورت نیاز به نمایش گذاشت.
OpenAI Official
twitter
تمرکز OpenAI بر «مراقبت از کاربر» ساختاریافته، در مقایسه با بحث‌های طبیعی در Claude، شبیه به نقاب شرکتی برای یک هسته سرد احساس می‌شود.
Anonymous Developer
hackernews
بالاخره مدلی که در نیمه راه یک refactor ۵۰۰ خطی تنبل نمی‌شود.
CodeWizard
reddit
پارامتر reasoning effort واقعاً MVP (ارزشمندترین بخش) برای مسائل منطقی پیچیده است.
AIBuilder
twitter

ویدیوهای درباره GPT-5.2

آموزش‌ها، بررسی‌ها و بحث‌های درباره GPT-5.2 را تماشا کنید

این واقعاً دیوانه‌کننده است. این یک‌بار اجرا را ببینید.

من از طراحی GPT 5.2 خیلی تحت تاثیر قرار نگرفتم... عملکردش از Gemini 3 خیلی بدتر بود.

دقت بازیابی context در کل محدوده ۴۰۰ هزار توکنی تقریباً بی‌نقص است.

بیشتر شبیه به یک موتور reasoning است تا یک chatbot.

تاخیر تنها نقطه ضعف واقعی برای برخی از برنامه‌های real-time است.

GPT 5.2 اکنون می‌تواند صفحات گسترده و اسلاید‌های کاملاً فرمت‌شده را مستقیماً داخل ChatGPT ایجاد کند.

انگار model بالاخره بزرگ شد و شروع کرد به جدی گرفتن کارش.

تنظیمات reasoning بالا را فقط برای وظایف سنگین منطقی استفاده کنید.

توهم‌ها نسبت به سری 4o به‌طور قابل‌توجهی کاهش یافته‌اند.

جریان‌های کاری agentic بالاخره بدون نیاز به مراقبت مداوم، قابل استفاده هستند.

GPT 5.2 در واقع ۴۰٪ گران‌تر از 5.1 است، اما هنوز به‌طور قابل‌توجهی ارزان‌تر از Opus است.

GPT 5.2 حدود ۱۱ دقیقه و ۲۰ ثانیه [برای ساخت برنامه] زمان برد. یعنی دو برابر زمان [نسبت به Opus].

کیفیت خروجی زمانی که به حالت thinking اجازه اجرا می‌دهید، بسیار بالاتر است.

آن توانست refactor چند فایلی را بدون از دست دادن تعریف نوع‌ها انجام دهد.

اگر به سرعت خام نیاز دارید، این مدل مناسب شما نیست.

بیشتر از فقط پرامپت

گردش کار خود را با اتوماسیون AI

Automatio قدرت عامل‌های AI، اتوماسیون وب و ادغام‌های هوشمند را ترکیب می‌کند تا به شما کمک کند در زمان کمتر بیشتر انجام دهید.

عامل‌های AI
اتوماسیون وب
گردش‌کارهای هوشمند

نکات حرفه‌ای برای GPT-5.2

نکات تخصصی برای کمک به شما در استفاده حداکثری از GPT-5.2 و دستیابی به نتایج بهتر.

استفاده از Thinking Effort

از پارامتر reasoning_effort (medium، high، xhigh) استفاده کنید تا زمان تامل model را با پیچیدگی وظیفه مورد نظر هماهنگ کنید.

فعال‌سازی Codex برای پایداری

هنگام کار روی مخازن بزرگ کد، از محیط اختصاصی Codex برای حفظ جلسات پردازش فعال تا ۱۵۰ دقیقه استفاده کنید.

تغذیه تدریجی Context

مستندات پیش‌زمینه غنی را در system prompts ارائه دهید، چرا که model زمانی بهترین عملکرد را دارد که درباره context مورد نیاز آن سوال شود.

تکرار روی نیازمندی‌ها

به‌طور صریح به model دستور دهید تا بررسی‌های تاییدیه را در برابر codebase فعلی انجام دهد تا از صحت نیازمندی‌ها اطمینان حاصل شود.

نظرات

کاربران ما چه می‌گویند

به هزاران کاربر راضی که گردش کار خود را متحول کرده‌اند بپیوندید

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

مرتبط AI Models

openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

سوالات متداول درباره GPT-5.2

پاسخ سوالات رایج درباره GPT-5.2 را بیابید