google

Gemini 3.1 Pro

Gemini 3.1 Pro는 DeepThink reasoning 엔진, 1M 이상의 context window, 업계 최고의 ARC-AGI 논리 점수를 갖춘 Google의 엘리트 multimodal 모델입니다.

MultimodalDeep ReasoningVideo GenerationWorkspace AIGoogle Gemini
google logogoogleGemini2026년 2월 19일
컨텍스트
2.0M토큰
최대 출력
66K토큰
입력 가격
$2.50/ 1M
출력 가격
$15.00/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍추론
벤치마크
GPQA
94.3%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Gemini 3.1 Pro이 이 벤치마크에서 94.3%점을 기록했습니다.
HLE
44.4%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 44.4%점을 기록했습니다.
MMLU
80.6%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Gemini 3.1 Pro이 이 벤치마크에서 80.6%점을 기록했습니다.
MMLU Pro
79.2%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Gemini 3.1 Pro이 이 벤치마크에서 79.2%점을 기록했습니다.
SimpleQA
79.6%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 79.6%점을 기록했습니다.
IFEval
92.4%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Gemini 3.1 Pro이 이 벤치마크에서 92.4%점을 기록했습니다.
AIME 2025
92%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Gemini 3.1 Pro이 이 벤치마크에서 92%점을 기록했습니다.
MATH
92%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Gemini 3.1 Pro이 이 벤치마크에서 92%점을 기록했습니다.
GSM8k
98.4%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Gemini 3.1 Pro이 이 벤치마크에서 98.4%점을 기록했습니다.
MGSM
96.5%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Gemini 3.1 Pro이 이 벤치마크에서 96.5%점을 기록했습니다.
MathVista
89.4%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 89.4%점을 기록했습니다.
SWE-Bench
71%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Gemini 3.1 Pro이 이 벤치마크에서 71%점을 기록했습니다.
HumanEval
91.2%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Gemini 3.1 Pro이 이 벤치마크에서 91.2%점을 기록했습니다.
LiveCodeBench
82%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 82%점을 기록했습니다.
MMMU
84.2%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Gemini 3.1 Pro이 이 벤치마크에서 84.2%점을 기록했습니다.
MMMU Pro
62.5%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Gemini 3.1 Pro이 이 벤치마크에서 62.5%점을 기록했습니다.
ChartQA
91.8%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 91.8%점을 기록했습니다.
DocVQA
94.2%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Gemini 3.1 Pro이 이 벤치마크에서 94.2%점을 기록했습니다.
Terminal-Bench
58%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 58%점을 기록했습니다.
ARC-AGI
77.1%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Gemini 3.1 Pro이 이 벤치마크에서 77.1%점을 기록했습니다.

Gemini 3.1 Pro 소개

Gemini 3.1 Pro의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

Gemini 3.1 Pro는 고급 multimodal 처리 엔진과 결합된 Sparse Mixture-of-Experts (MoE) 프레임워크를 성숙하게 구현한 모델입니다. 이 아키텍처의 가장 눈에 띄는 특징은 모델이 출력 토큰을 확정하기 전에 내부적으로 숙고할 수 있도록 하는 DeepThink System 2 계층의 민주화입니다. 이 모델은 Low, Medium, High의 독특한 3단계 thinking 시스템을 도입하여 개발자가 latency, 비용, reasoning 깊이 간의 균형을 명시적으로 제어할 수 있게 합니다.

방대한 100만 토큰의 context window를 갖춘 Gemini 3.1 Pro는 금융, 데이터 분석, 전체 레포지토리 코드 마이그레이션 등 복잡한 워크플로우에 최적화되어 있습니다. ARC-AGI-2 벤치마크에서 전례 없는 77.1%의 점수를 기록하며 새로운 논리 패턴을 해결하는 능력을 보여줍니다. 이는 저지연 multimodal 상호작용과 자율형 agentic 작업을 위한 높은 수준의 인지 성능을 모두 필요로 하는 개발자들에게 선호되는 선택지가 될 것입니다.

Gemini 3.1 Pro

Gemini 3.1 Pro 사용 사례

Gemini 3.1 Pro을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

전체 레포지토리 코드 분석

1M context window를 활용하여 전체 소프트웨어 레포지토리를 수집하고 리팩토링 및 의존성 매핑 수행.

자율형 에이전트 위원회

내부 서브 에이전트들이 실행 전 솔루션을 토론하고 검증하는 다단계 agentic 워크플로우 구동.

과학 연구 종합

수천 개의 연구 논문과 복잡한 데이터셋을 분석하여 구조화된 정보와 사실적 통찰 도출.

Multimodal 콘텐츠 제작

텍스트, 이미지, 오디오를 동시에 처리하여 복잡한 교육 자료 및 인터랙티브 미디어 생성.

터미널 기반 자동화

고급 reasoning 모드를 통해 정밀하게 복잡한 bash 명령어를 실행하고 파일 시스템 조작.

엔터프라이즈 데이터 감사

비정형 금융 데이터와 법률 문서를 파싱하여 거의 완벽한 사실 기억력으로 규정 준수 격차 식별.

강점

제한

ARC-AGI-2 Reasoning 리더: ARC-AGI-2에서 77.1%를 기록하며 기존 flagship 모델들의 reasoning 능력을 두 배 이상 향상시킴.
대용량 context 가격 부담: prompt가 200,000 토큰 임계값을 초과하면 입력 및 출력 가격이 두 배가 되어 대규모 배치 작업에 영향을 미침.
1M 토큰 context window: 대규모 다중 파일 코드베이스와 긴 형식의 비디오를 state-of-the-art 수준의 회상 능력과 낮은 latency로 처리.
과도한 출력 분량: 벤치마크 결과, 모델이 지나치게 장황하게 답변하여 간단한 작업에도 필요한 것보다 훨씬 많은 토큰을 생성할 수 있음.
경쟁력 있는 가격 전략: 100만 토큰당 $2/$12로 책정되어 Anthropic이나 OpenAI의 동급 모델보다 훨씬 저렴함.
미묘한 톤 조절의 어려움: 커뮤니티 피드백에 따르면 Claude 3.5 시리즈에 비해 대화 톤이 덜 자연스럽거나 세밀하지 않다는 평가가 있음.
세분화된 컴퓨팅 계층: 내부 reasoning 깊이와 비용을 개발자가 정밀하게 제어할 수 있는 3단계 thinking 시스템 탑재.
일관되지 않은 reasoning 계층: 계층 간 reasoning 품질 차이가 커서 최적의 설정을 찾기 위해 수동 실험이 필요한 경우가 많음.

API 빠른 시작

google/gemini-3.1-pro-preview

문서 보기
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { tier: "high" }
});

const prompt = "이 코드베이스 전체에서 보안 취약점을 분석해줘.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Gemini 3.1 Pro에 대한 사람들의 의견

커뮤니티가 Gemini 3.1 Pro에 대해 어떻게 생각하는지 확인하세요

Gemini 3.1 Pro의 77.1% 점수는 가장 파괴적인 시장 변화를 보여줍니다. ARC-AGI 최고 기록을 두 배 이상 경신했습니다.
enoumen
reddit
코딩 벤치마크는 거짓말을 하지 않네요. 이 모델은 3.5와 GPT-4o가 완전히 놓친 제 레포지토리의 버그를 찾아냈습니다.
SiliconValleyCoder
hackernews
Gemini 3.1 이슈는 정말 흥미롭네요. 벤치마크는 박살 냈지만 실제 사용자들은 톤과 분위기가 일관되지 않다고 말합니다.
cryptopunk7213
twitter
DeepThink 엔진은 심층 논리가 필요한 작업을 처리할 때 때때로 90초 이상 걸리는 등 상당한 지연을 유발할 수 있습니다.
TechReviewer2026
youtube
Context caching이 여기서 핵심 기능입니다. GPT-4o 대비 거의 푼돈 수준으로 전체 문서 봇을 운영하고 있습니다.
CloudArchitect
reddit
Gemini는 복잡한 계획 작업에서 Python에 대해 논의하는 데 실패했습니다... 최종 계획에 일부 논리가 아예 빠져 있었어요.
Temporary-Mix8022
reddit

Gemini 3.1 Pro에 대한 동영상

Gemini 3.1 Pro에 대한 튜토리얼, 리뷰 및 토론 시청

Gemini 3.1 Pro는 지금까지 나온 것 중 가장 상세한 파고다 버전을 생성합니다

Gemini는 단연코 100만 토큰이라는 가장 넓은 window를 가지고 있습니다

오디오 처리의 multimodal 충실도는 3.0보다 눈에 띄게 좋습니다

context window가 차올라도 토큰 throughput은 안정적으로 유지됩니다

100만 토큰 전체에 걸친 장기 회상 능력은 사실상 완벽합니다

훈련 데이터에 없을 법한 퍼즐에서 Gemini 3 시리즈는 다른 모든 모델을 능가합니다

3.1 Pro는 fine-tuning 스크립트 실행 시간을 300초에서 47초로 단축할 수 있습니다

DeepThink 논리 단계가 추적 내에서 명확하게 보이며 실제 숙고 과정을 보여줍니다

우리는 벤치마크 포화 상태에 도달했으며, 이제 ARC-AGI만이 발전의 진정한 척도가 됩니다

이러한 추상적 reasoning의 도약을 바탕으로 AGI 궤적이 가속화되고 있습니다

3.1은 아주 미세할지라도 분명히 한 단계 업그레이드된 느낌입니다

정확히 동일한 prompt로 사이드 바이 사이드 테스트를 했을 때 Gemini 3.0 Pro를 능가하는 것으로 보입니다

복잡한 Python 리팩토링에서 코딩 정확도가 제가 본 것 중 가장 높습니다

지난 한 달간 테스트한 결과 API 안정성이 크게 향상되었습니다

실제 성능이 마침내 벤치마크 점수의 기대치와 일치하게 되었습니다

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Gemini 3.1 Pro 프로 팁

Gemini 3.1 Pro을 최대한 활용하기 위한 전문가 팁.

Reasoning 계층 선택

복잡한 수학이나 논리 작업에는 High thinking 모드를 사용하고, 일반적인 포맷팅 작업에는 Low 모드를 사용하여 컴퓨팅 자원을 절약하세요.

Context Caching

정적 문서에 대해 context caching을 구현하여 100만 토큰당 입력 비용을 최대 90%까지 절감하세요.

구조화된 아티팩트(Artifacts)

agentic 워크플로우 실행 시 인간의 감독을 용이하게 하기 위해 모델의 구조화된 작업 목록 생성 능력을 활용하세요.

Multimodal Prompting

비디오와 오디오 입력을 결합하여 텍스트 전용 설명보다 실제 상황에 대한 완전한 context를 모델에 제공하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Gemini 3.1 Pro에 대한 자주 묻는 질문

Gemini 3.1 Pro에 대한 일반적인 질문에 대한 답변 찾기