openai

GPT-4o mini

GPT-4o mini는 OpenAI의 가장 비용 효율적인 소형 모델로, 고용량 작업을 위한 탁월한 속도와 multimodal vision 기능을 갖춘 GPT-4급 지능을 제공합니다.

소형 모델비용 효율적Vision 지원고속 AIMultimodal
openai logoopenaiGPT-4o2024년 7월 18일
컨텍스트
128K토큰
최대 출력
16K토큰
입력 가격
$0.15/ 1M
출력 가격
$0.60/ 1M
모달리티:TextImage
기능:비전도구스트리밍
벤치마크
GPQA
40.2%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. GPT-4o mini이 이 벤치마크에서 40.2%점을 기록했습니다.
HLE
2.3%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. GPT-4o mini이 이 벤치마크에서 2.3%점을 기록했습니다.
MMLU
82%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. GPT-4o mini이 이 벤치마크에서 82%점을 기록했습니다.
MMLU Pro
57%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. GPT-4o mini이 이 벤치마크에서 57%점을 기록했습니다.
SimpleQA
8.6%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. GPT-4o mini이 이 벤치마크에서 8.6%점을 기록했습니다.
IFEval
76.5%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. GPT-4o mini이 이 벤치마크에서 76.5%점을 기록했습니다.
AIME 2025
5%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. GPT-4o mini이 이 벤치마크에서 5%점을 기록했습니다.
MATH
50.2%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. GPT-4o mini이 이 벤치마크에서 50.2%점을 기록했습니다.
GSM8k
91.3%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. GPT-4o mini이 이 벤치마크에서 91.3%점을 기록했습니다.
MGSM
87%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. GPT-4o mini이 이 벤치마크에서 87%점을 기록했습니다.
MathVista
42%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. GPT-4o mini이 이 벤치마크에서 42%점을 기록했습니다.
SWE-Bench
8.7%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. GPT-4o mini이 이 벤치마크에서 8.7%점을 기록했습니다.
HumanEval
87.2%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. GPT-4o mini이 이 벤치마크에서 87.2%점을 기록했습니다.
LiveCodeBench
32.5%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. GPT-4o mini이 이 벤치마크에서 32.5%점을 기록했습니다.
MMMU
59.4%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. GPT-4o mini이 이 벤치마크에서 59.4%점을 기록했습니다.
MMMU Pro
34%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. GPT-4o mini이 이 벤치마크에서 34%점을 기록했습니다.
ChartQA
78%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. GPT-4o mini이 이 벤치마크에서 78%점을 기록했습니다.
DocVQA
88%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. GPT-4o mini이 이 벤치마크에서 88%점을 기록했습니다.
Terminal-Bench
40%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. GPT-4o mini이 이 벤치마크에서 40%점을 기록했습니다.
ARC-AGI
8%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. GPT-4o mini이 이 벤치마크에서 8%점을 기록했습니다.

GPT-4o mini 소개

GPT-4o mini의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

소형 모델의 새로운 표준

GPT-4o mini는 개발자를 위한 주력 모델로 GPT-3.5 Turbo를 대체하도록 설계된 AI 효율성의 획기적인 도약을 의미합니다. 기본 multimodal 아키텍처로 구축된 이 모델은 훨씬 낮은 비용과 latency로 GPT-4급 성능을 제공합니다. 128,000 token의 방대한 context window를 특징으로 하며 최대 16,384 tokens의 복잡한 출력을 지원하여, 긴 문서 처리 및 대용량 데이터 스트림 처리에 최적화되어 있습니다.

지능과 경제성의 만남

속도를 위해 지능을 희생하던 기존의 소형 모델들과 달리, GPT-4o mini는 텍스트 및 vision 작업 전반에 걸쳐 높은 reasoning 성능을 유지합니다. GPT-3.5 Turbo보다 60% 저렴하면서도 MMLU benchmark에서 82%를 기록할 만큼 훨씬 뛰어난 성능을 자랑합니다. 이 모델은 실시간 고객 응대 에이전트나 대규모 데이터 분류 엔진과 같이 낮은 latency와 높은 신뢰성이 필수적인 애플리케이션을 위해 최적화되었습니다.

GPT-4o mini

GPT-4o mini 사용 사례

GPT-4o mini을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

고객 지원 자동화

낮은 latency와 높은 정확도를 바탕으로 저렴한 비용으로 대량의 고객 문의를 처리합니다.

콘텐츠 요약

128k context window 내에서 방대한 문서나 긴 콘텐츠를 간결한 요약본으로 변환합니다.

데이터 추출

비정형 텍스트나 이미지를 데이터베이스 입력을 위한 JSON과 같은 구조화된 데이터 형식으로 변환합니다.

다국어 번역

채팅 애플리케이션 및 글로벌 커뮤니케이션을 위해 수십 개의 언어로 실시간 번역을 제공합니다.

교육용 튜터링

수학, 과학, 언어 영역에서 도움이 필요한 학생들을 위한 대화형 학습 보조 도구로 활용됩니다.

기본적인 Vision 작업

이미지를 분석하여 객체를 식별하거나, OCR을 통해 텍스트를 추출하거나, 접근성을 위한 설명을 제공합니다.

강점

제한

압도적인 가성비: 입력 100만 token당 $0.15의 비용으로 82%의 MMLU 점수를 기록하는 frontier model급 reasoning 성능을 제공합니다.
복잡한 reasoning의 한계: GPQA에서 40.2%의 점수를 기록하며, GPT-4o나 o1 같은 대형 모델에 비해 전문적인 과학 분야 reasoning 성능은 뒤처집니다.
높은 Throughput과 속도: 매우 낮은 latency로 응답을 생성하여 실시간 사용자 인터페이스에 최적화되어 있습니다.
코딩 제약 사항: Claude 3.5 Sonnet과 비교했을 때 복잡한 소프트웨어 엔지니어링을 위한 심층적인 아키텍처 이해도가 부족합니다.
대용량 Context Window: 128k context window를 유지하여 작은 모델에서는 드문 복잡한 문서 처리 능력을 갖추고 있습니다.
제한된 출력 창: 16k output limit은 대규모 코드 마이그레이션이나 책 분량의 콘텐츠 생성 작업 시 제약이 될 수 있습니다.
기본 Vision 지원: 소형 폼팩터 내에 multimodal 기능을 포함하여 이미지 분석 및 OCR 작업에서 뛰어난 성능을 보입니다.
사실 정확도 안정성: 소형 모델은 flagship 모델들에 비해 특정 전문 도메인에서 환각 현상(hallucination)이 발생할 가능성이 다소 높습니다.

API 빠른 시작

openai/gpt-4o-mini

문서 보기
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "양자 역학에 대해 설명해줘." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

GPT-4o mini에 대한 사람들의 의견

커뮤니티가 GPT-4o mini에 대해 어떻게 생각하는지 확인하세요

GPT-4o mini는 기본적인 RAG를 위해 구형 모델을 fine-tuning하는 시장을 사실상 종결시켰습니다. 무시할 수 없을 정도로 비용이 낮습니다.
AI_Dev_Central
reddit
속도가 정말 미쳤습니다. 번역 에이전트를 돌리는데 거의 즉각적으로 결과값이 나옵니다.
TechCruncher
twitter
OpenAI가 이 가격 정책으로 Anthropic과 Google을 압박했습니다. 100만 tokens당 $0.15는 새로운 하한선입니다.
hn_reader_99
hackernews
3.5를 mini로 교체했는데 테스트 시작 5분 만에 logic 개선이 눈에 보였습니다.
PromptEngineerPro
youtube
드디어 대규모 클라우드 비용 부담 없이 대규모 데이터 정제 작업에 LLM을 사용할 만큼 저렴해졌습니다.
DataVizWiz
reddit
OCR을 위한 vision 성능은 사실 10배 더 비싼 일부 특수 모델들보다 더 좋습니다.
VisionDev
twitter

GPT-4o mini에 대한 동영상

GPT-4o mini에 대한 튜토리얼, 리뷰 및 토론 시청

전반적으로 GPT-3.5 Turbo보다 빠르고 저렴합니다.

이 정도로 작은 모델에서 보여주는 vision 능력은 정말 놀랍습니다.

이번 출시로 가격 경쟁은 거의 제로(0)에 수렴하는 수준이 되었습니다.

작은 크기임에도 엄청난 context window를 유지합니다.

benchmark 결과를 보면 거의 모든 카테고리에서 Claude Haiku를 앞섭니다.

GPT 40 mini는 경량 모델이라 GPT 40보다 훨씬 빠릅니다.

GPT 4보다 훨씬, 훨씬 빠릅니다.

일상적인 작업에서는 대부분의 사용자가 reasoning 성능 차이를 느끼지 못할 것입니다.

기본적인 객체 인식에 대한 이미지 인식 능력은 매우 일관적입니다.

이전 3.5 모델보다 복잡한 지시 사항을 훨씬 더 잘 처리합니다.

현재 LMC leaderboard의 채팅 선호도에서 기존 gbd4를 능가하고 있습니다.

모든 것이 완벽해 보이며, 특히 이 영수증 데이터는 일반적인 영수증처럼 잘 인식합니다.

짧은 prompt에 대한 응답 시간은 사실상 1초 미만입니다.

API를 통해 긴 PDF 문서를 요약하는 데 매우 효과적입니다.

단 몇 달러로 수백만 tokens을 처리할 수 있습니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

GPT-4o mini 프로 팁

GPT-4o mini을 최대한 활용하기 위한 전문가 팁.

RAG 활용

낮은 입력 비용을 활용하여 큰 비용 부담 없이 대규모 Retrieval Augmented Generation을 수행하세요.

JSON Mode로 구조화

JSON mode 또는 function calling parameters를 사용하여 백엔드 워크플로우에 일관된 데이터 구조를 보장하세요.

Batch Processing

긴급하지 않은 작업에 OpenAI의 Batch API를 이 모델과 함께 사용하여 비용을 50% 절감하세요.

Temperature 튜닝

사실 추출 작업 시에는 0.1에서 0.3 사이의 낮은 temperature를 설정하여 정확도를 극대화하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

GPT-4o mini에 대한 자주 묻는 질문

GPT-4o mini에 대한 일반적인 질문에 대한 답변 찾기