openai

GPT-5.2 Pro

GPT-5.2 Pro는 OpenAI의 2025년 flagship reasoning 모델로, 수학, 코딩 및 전문 지식 작업 분야에서 SOTA 성능을 발휘하는 Extended Thinking 기능을 갖추고 있습니다.

openai logoopenaiGPT-52025-12-11
컨텍스트
400K토큰
최대 출력
128K토큰
입력 가격
$21.00/ 1M
출력 가격
$168.00/ 1M
모달리티:TextImage
기능:비전도구스트리밍추론
벤치마크
GPQA
93.2%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. GPT-5.2 Pro이 이 벤치마크에서 93.2%점을 기록했습니다.
HLE
36.6%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 36.6%점을 기록했습니다.
MMLU
89.6%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. GPT-5.2 Pro이 이 벤치마크에서 89.6%점을 기록했습니다.
MMLU Pro
82%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. GPT-5.2 Pro이 이 벤치마크에서 82%점을 기록했습니다.
SimpleQA
52%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 52%점을 기록했습니다.
IFEval
93.5%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. GPT-5.2 Pro이 이 벤치마크에서 93.5%점을 기록했습니다.
AIME 2025
100%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. GPT-5.2 Pro이 이 벤치마크에서 100%점을 기록했습니다.
MATH
97%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. GPT-5.2 Pro이 이 벤치마크에서 97%점을 기록했습니다.
GSM8k
99.2%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. GPT-5.2 Pro이 이 벤치마크에서 99.2%점을 기록했습니다.
MGSM
96%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. GPT-5.2 Pro이 이 벤치마크에서 96%점을 기록했습니다.
MathVista
76.5%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 76.5%점을 기록했습니다.
SWE-Bench
80%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. GPT-5.2 Pro이 이 벤치마크에서 80%점을 기록했습니다.
HumanEval
94.5%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. GPT-5.2 Pro이 이 벤치마크에서 94.5%점을 기록했습니다.
LiveCodeBench
78%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 78%점을 기록했습니다.
MMMU
79.5%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. GPT-5.2 Pro이 이 벤치마크에서 79.5%점을 기록했습니다.
MMMU Pro
79.5%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. GPT-5.2 Pro이 이 벤치마크에서 79.5%점을 기록했습니다.
ChartQA
91.2%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 91.2%점을 기록했습니다.
DocVQA
94.8%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. GPT-5.2 Pro이 이 벤치마크에서 94.8%점을 기록했습니다.
Terminal-Bench
55.6%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 55.6%점을 기록했습니다.
ARC-AGI
54.2%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. GPT-5.2 Pro이 이 벤치마크에서 54.2%점을 기록했습니다.

GPT-5.2 Pro 소개

GPT-5.2 Pro의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

추론 지능의 새로운 기준

GPT-5.2 Pro는 OpenAI의 reasoning 중심 모델 중 고성능 컴퓨팅 티어를 대표합니다. 이 모델은 박사급 과학 연구 및 복잡한 논리적 inference를 필요로 하는 기업 워크플로우를 위해 특별히 설계되었습니다. 일반적인 LLM과 달리, 사용자가 모델의 thinking effort를 조정할 수 있는 정교한 inference-time 컴퓨팅 아키텍처를 활용합니다. 이를 통해 시스템은 내부적으로 문제를 분해하고, 자신의 논리를 검증하며, 작은 모델에서 오류를 자주 유발하는 통계적 사전 지식을 재정의할 수 있습니다.

기술적 정밀함을 위한 특화

광범위한 GPT-5 제품군과 핵심 학습 데이터를 공유하지만, Pro 모델은 400,000 token의 대규모 context window와 현저히 낮은 할루시네이션 비율로 차별화됩니다. 이 모델은 이론 물리학 및 고위험 수학 증명 분야에서 신뢰할 수 있는 협업 도구로 입증되었습니다. ARC-AGI-2 및 GPQA Diamond와 같은 오염 방지 benchmark에서의 성능은, 인간의 개입 없이 다단계 기술 지침을 처리해야 하는 자율 에이전트의 핵심 프로세스 엔진임을 확고히 합니다.

기업 수준의 성능 및 출력

이 모델은 복잡한 지침을 엄격히 준수하고 전문적인 대화 톤을 유지하는 것이 특징입니다. 전문 작업 benchmark에서 14년 이상의 경력을 가진 인간 업계 전문가들을 일관되게 능가한 최초의 모델입니다. 최대 128,000 tokens의 생성 용량을 갖추어, 이전 세대에서 관찰된 '게으름'에서 벗어나 단 한 번의 pass로 전체 코드 모듈이나 철저한 연구 보고서를 작성할 수 있습니다.

GPT-5.2 Pro

GPT-5.2 Pro 사용 사례

GPT-5.2 Pro을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

자율 소프트웨어 엔지니어링

SWE-Bench Verified에서 84.5%의 성공률로 복잡한 다중 파일 GitHub 이슈를 해결하고 전체 모듈 리팩토링을 수행합니다.

수학 올림피아드

2025년 AIME 경쟁 문제 100% 해결 및 통계 학습 이론의 미해결 문제에 대한 독창적인 증명 기여.

기업용 에이전트 오케스트레이션

다단계 금융 모델링 및 물류 처리를 위해 수십 개의 도구를 순차적으로 실행하는 고성능 컴퓨팅 프로세스 엔진으로 기능합니다.

박사급 과학 연구

GPQA 점수 93.2%를 기록하며 물리학, 화학, 생물학 문제를 분석하여 많은 인간 전문가를 능가합니다.

긴 컨텍스트의 문서 합성

최대 400,000 tokens의 아카이브 데이터를 수집하여 포괄적인 법률 보고서나 기술 매뉴얼을 생성합니다.

인터랙티브 3D 시뮬레이션

복잡한 입자 물리학과 기계적 논리를 포함하여 Three.js나 C++로 수천 줄의 3D 시뮬레이션을 생성합니다.

강점

제한

완벽한 수학적 정확도: AIME 2025 benchmark에서 100% 해결률을 달성하여 현대적인 대회 수준의 수학 시험에서 최고의 성능을 증명합니다.
높은 비용: 출력 tokens 100만 개당 168달러로, GPT-5.1보다 약 16배 비싸 중요도가 높은 워크플로우로 사용이 제한됩니다.
state-of-the-art 코딩 성능: SWE-Bench Verified에서 84.5% 해결률을 달성하여, 중요한 버그 백로그를 처리할 수 있는 주니어 엔지니어 수준으로 기능합니다.
메모리 기능 부재: 하위 티어인 ChatGPT 5.2 모델의 표준 기능인 Saved Memories 및 Reference Chat History를 지원하지 않습니다.
고급 추상적 Reasoning: 이전 모델보다 3배 향상된 ARC-AGI-2 성능(54.2% 대 17.6%)을 통해 새로운 규칙 유도 작업 처리 분야에서 혁신을 이룩했습니다.
상당한 Latency: 심층적인 내부 reasoning 과정으로 인해, 특히 xhigh effort 모드에서 단일 prompt 처리에 15분 이상 소요될 수 있습니다.
128K의 방대한 출력 용량: 단일 inference 과정에서 전체 도서, 코드 저장소 또는 포괄적인 과학 보고서를 생성하도록 설계되었습니다.
프레임 선택 오류: 사고 과정에서 논리적 제약을 올바르게 식별하더라도, 상식 작업에서 통계적 사전 지식을 재정의하지 못하는 경우가 간혹 발생합니다.

API 빠른 시작

openai/gpt-5.2-pro

문서 보기
openai SDK
import OpenAI from 'openai';

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: 'gpt-5.2-pro',
    messages: [{ role: 'user', content: 'Design a leveraged buyout model for a take-private project.' }],
    reasoning_effort: 'xhigh',
    stream: true,
  });

  for await (const chunk of completion) {
    process.stdout.write(chunk.choices[0]?.delta?.content || '');
  }
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

GPT-5.2 Pro에 대한 사람들의 의견

커뮤니티가 GPT-5.2 Pro에 대해 어떻게 생각하는지 확인하세요

reasoning은 존재했지만 결론이 논리를 따라가지 못했습니다. 이런 현상이 당황스럽지 않다면 문제인 겁니다.
Ok_Entrance_4380
reddit
GPT-5.2 Pro는 이론 물리학 분야에서 5.1이 해내지 못한 전문가 검증을 통과한 새로운 결과를 도출해냈습니다.
kevinweil
twitter
GPT-5.2 Pro는 이슈 트래커의 적지 않은 부분을 스스로 처리할 수 있는 주니어 엔지니어처럼 보이기 시작했습니다.
Due_Woodpecker2882
reddit
OpenAI는 Pro 모델에 메모리가 없음을 인정했습니다. 학계에 있는 저로서는 매우 치명적입니다.
Oldschool728603
hackernews
논리는 완벽하지만, latency 때문에 아주 느린 천재와 협업하는 느낌입니다.
User123
reddit
드디어 간단한 텐서 수축 과정에서 할루시네이션을 일으키지 않는 모델이 나왔군요.
PhysicsProf
hackernews

GPT-5.2 Pro에 대한 동영상

GPT-5.2 Pro에 대한 튜토리얼, 리뷰 및 토론 시청

Mensa Norway IQ 점수 145~147 사이로 추정

24,000줄 이상의 코드 생성

선택 가능한 thinking time 옵션 포함

Pro 티어 가격은 기업용 예산에 적합

이 모델이 오후 한나절 만에 내 전체 개발 백로그를 해결함

할루시네이션 30% 감소

5.1과 비교했을 때 레이아웃 전반이 놀라울 정도로 개선됨

정확히 300단어. 단어 수를 지정했는데 정확히 그 숫자를 맞춘 건 이번이 처음

건축 설계도에 대한 vision 성능은 독보적

5.1보다 훨씬 차갑고 로봇 같은 느낌

200달러짜리 GPT5 Pro가 25분 36초 동안 사고함

두 배의 inference 컴퓨팅 자원 할당

복잡한 문제를 복소해석학이라는 분야의 다른 종류의 기계 장치로 변환함

사실상 200달러/월에 이용하는 박사 학위 소지자

사고 과정을 보면 스스로 단계를 검증하고 있음

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

GPT-5.2 Pro 프로 팁

GPT-5.2 Pro을 최대한 활용하기 위한 전문가 팁.

Reasoning 작업 규모 조절

생성 속도보다 논리적 일관성이 중요한 작업의 경우, reasoning_effort API parameter를 xhigh로 설정하십시오.

통계적 사전 지식 다루기

모델이 상식적인 함정에 빠질 경우, 컨텍스트를 제공하여 모델의 활성 reasoning 레이어를 자극하고 기본 학습 데이터를 재정의하도록 유도하십시오.

대규모 출력 활용

128K 출력 버젯을 활용하기 위해 한 번의 prompt로 전체 프로젝트 디렉터리나 완성된 문서 파일을 요청하십시오.

도구 통합 활용

vision 작업 시 항상 function calling을 활성화하십시오. 도구를 사용하여 시각적 데이터를 검증할 때 모델의 multimodal 성능이 크게 향상됩니다.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

GPT-5.2 Pro에 대한 자주 묻는 질문

GPT-5.2 Pro에 대한 일반적인 질문에 대한 답변 찾기