google

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite는 Google의 가장 빠르고 비용 효율적인 모델입니다. 1M context, 네이티브 multimodality, 초당 363 tokens 속도를 제공합니다.

MultimodalHigh SpeedCost EfficientGoogle Gemini
google logogoogleGemini 3.12026년 3월 3일
컨텍스트
1.0M토큰
최대 출력
66K토큰
입력 가격
$0.25/ 1M
출력 가격
$1.50/ 1M
모달리티:TextImageAudioVideo
기능:비전도구스트리밍
벤치마크
GPQA
86.9%
GPQA: 대학원 수준 과학 Q&A. 생물학, 물리학, 화학 분야의 448개 객관식 문제로 구성된 엄격한 벤치마크. 박사 전문가도 65-74%의 정확도만 달성합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 86.9%점을 기록했습니다.
HLE
16%
HLE: 고급 전문 추론. 전문 분야에서 전문가 수준의 추론을 보여주는 모델의 능력을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 16%점을 기록했습니다.
MMLU
88.9%
MMLU: 대규모 다중 작업 언어 이해. 57개 학술 과목에 걸쳐 16,000개의 객관식 문제로 구성된 종합 벤치마크. Gemini 3.1 Flash-Lite이 이 벤치마크에서 88.9%점을 기록했습니다.
MMLU Pro
80%
MMLU Pro: MMLU 프로페셔널 에디션. 더 어려운 10지선다형 형식의 12,032개 문제를 포함하는 MMLU의 향상된 버전. Gemini 3.1 Flash-Lite이 이 벤치마크에서 80%점을 기록했습니다.
SimpleQA
43.3%
SimpleQA: 사실 정확성 벤치마크. 직접적인 질문에 정확하고 사실적인 응답을 제공하는 모델의 능력을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 43.3%점을 기록했습니다.
IFEval
85%
IFEval: 지시 따르기 평가. 모델이 특정 지시와 제약 조건을 얼마나 잘 따르는지 측정합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 85%점을 기록했습니다.
AIME 2025
25%
AIME 2025: 미국 초청 수학 시험. 명문 AIME 시험의 경쟁 수준 수학 문제. Gemini 3.1 Flash-Lite이 이 벤치마크에서 25%점을 기록했습니다.
MATH
78%
MATH: 수학 문제 해결. 대수, 기하, 미적분 등의 분야를 테스트하는 종합 수학 벤치마크. Gemini 3.1 Flash-Lite이 이 벤치마크에서 78%점을 기록했습니다.
GSM8k
95%
GSM8k: 초등학교 수학 8K. 다단계 추론이 필요한 8,500개의 초등학교 수준 수학 문장제. Gemini 3.1 Flash-Lite이 이 벤치마크에서 95%점을 기록했습니다.
MGSM
92%
MGSM: 다국어 초등학교 수학. GSM8k 벤치마크를 10개 언어로 번역한 것. Gemini 3.1 Flash-Lite이 이 벤치마크에서 92%점을 기록했습니다.
MathVista
75%
MathVista: 수학적 시각 추론. 차트, 그래프 등 시각적 요소가 포함된 수학 문제를 푸는 능력을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 75%점을 기록했습니다.
SWE-Bench
35%
SWE-Bench: 소프트웨어 엔지니어링 벤치마크. AI 모델이 오픈소스 Python 프로젝트의 실제 GitHub 이슈를 해결하려고 시도합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 35%점을 기록했습니다.
HumanEval
88%
HumanEval: Python 프로그래밍 문제. 모델이 올바른 Python 함수 구현을 생성해야 하는 164개의 수작업 프로그래밍 문제. Gemini 3.1 Flash-Lite이 이 벤치마크에서 88%점을 기록했습니다.
LiveCodeBench
72%
LiveCodeBench: 라이브 코딩 벤치마크. 지속적으로 업데이트되는 실제 프로그래밍 챌린지에서 코딩 능력을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 72%점을 기록했습니다.
MMMU
76.8%
MMMU: 멀티모달 이해. 대학 수준 문제에서 비전-언어 모델을 테스트하는 대규모 다분야 멀티모달 이해 벤치마크. Gemini 3.1 Flash-Lite이 이 벤치마크에서 76.8%점을 기록했습니다.
MMMU Pro
76.8%
MMMU Pro: MMMU 프로페셔널 에디션. 더 도전적인 문제와 더 엄격한 평가를 갖춘 MMMU의 향상된 버전. Gemini 3.1 Flash-Lite이 이 벤치마크에서 76.8%점을 기록했습니다.
ChartQA
91%
ChartQA: 차트 질문 응답. 차트와 그래프에 제시된 정보를 이해하고 추론하는 능력을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 91%점을 기록했습니다.
DocVQA
92%
DocVQA: 문서 시각 Q&A. 문서 이미지에서 정보를 추출하는 능력을 테스트하는 문서 시각 질문 응답 벤치마크. Gemini 3.1 Flash-Lite이 이 벤치마크에서 92%점을 기록했습니다.
Terminal-Bench
55%
Terminal-Bench: 터미널/CLI 작업. 명령줄 작업을 수행하고 셸 스크립트를 작성하는 능력을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 55%점을 기록했습니다.
ARC-AGI
12%
ARC-AGI: 추상화 및 추론. AGI를 위한 추상화 및 추론 코퍼스 - 새로운 패턴 인식 퍼즐로 유동 지능을 테스트합니다. Gemini 3.1 Flash-Lite이 이 벤치마크에서 12%점을 기록했습니다.

Gemini 3.1 Flash-Lite 소개

Gemini 3.1 Flash-Lite의 기능, 특징 및 더 나은 결과를 얻는 방법에 대해 알아보세요.

Gemini 3.1 Flash-Lite는 처리 속도가 가장 중요한 기술적 요건인 대규모 AI 애플리케이션을 위해 설계되었습니다. 더 큰 Pro 모델과 달리 Flash-Lite는 throughput을 우선시하는 간소화된 아키텍처를 사용하여 초당 363 tokens에 도달합니다. 실시간 음성 에이전트, 자동화된 콘텐츠 모더레이션 시스템, 그리고 무거운 트래픽 속에서도 비용 효율성을 유지해야 하는 대규모 데이터 추출 파이프라인을 구축하는 개발자를 위한 특화된 도구입니다.

Lite라는 이름에도 불구하고 100만 token의 context window를 유지합니다. 단일 요청으로 원시 오디오 파일, 1시간 길이의 비디오, 수백 페이지의 PDF를 입력할 수 있습니다. Google은 Thinking Levels을 도입하여 사용자가 단순한 작업에는 즉각적인 응답을, 복잡한 로직에는 더 깊은 추론 단계를 선택할 수 있도록 했습니다. 이를 통해 단일 API 엔드포인트 내에서 비용과 정확성 사이의 균형을 맞추는 다양한 성능 프로필을 제공합니다.

이 모델은 네이티브 multimodal로, 오디오 전사나 이미지 묘사를 위한 외부 도구가 필요 없습니다. 이러한 네이티브 기능은 문서 질의응답 및 차트 분석과 같은 시각적 작업의 성능을 향상시킵니다. 개발자는 thinking_level 파라미터를 사용하여 내부 추론 시간을 조정함으로써 각 쿼리의 구체적인 복잡성에 따라 모델의 노력을 효율적으로 확장할 수 있습니다.

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite 사용 사례

Gemini 3.1 Flash-Lite을 사용하여 훌륭한 결과를 얻는 다양한 방법을 발견하세요.

대용량 번역

0.1초 미만의 latency로 수천 개의 다국어 채팅 메시지나 지원 티켓을 실시간으로 처리합니다.

지능형 모델 라우팅

들어오는 쿼리가 더 고성능의 모델로 전달되어야 하는지 판단하는 빠른 분류기로 활용합니다.

Multimodal 콘텐츠 모더레이션

저비용으로 대량의 사용자 생성 이미지와 비디오가 안전 규정을 준수하는지 스캔합니다.

실시간 UI 프로토타이핑

손으로 그린 와이어프레임이나 구두 설명을 바탕으로 즉시 실행 가능한 React 또는 Tailwind 컴포넌트를 생성합니다.

긴 문서 요약

1M token context window를 활용하여 대규모 법률 문서나 기술 매뉴얼의 맥락을 잃지 않고 요약합니다.

실시간 오디오 전사

수 시간 분량의 회의나 강의 녹음 내용을 한 번에 구조화된 요약본과 작업 아이템으로 변환합니다.

강점

제한

압도적인 성능: 초당 363 tokens라는 속도는 실시간 응답성을 요구하는 업계 모델 중 가장 빠른 수준입니다.
낮은 사실 관계 회상: SimpleQA 점수 43.3%는 grounding 없이 일반 지식을 다룰 때 환각(hallucination) 가능성이 높음을 의미합니다.
고급 추론(Reasoning): GPQA Diamond 벤치마크에서 86.9%를 기록하며, 가벼운 모델임에도 박사급 과학 논리를 제공합니다.
가격 인상: 이전 모델인 Gemini 2.5 Flash-Lite와 비교했을 때 비용이 상당히 높아졌습니다.
동적 비용 제어: Thinking Levels 파라미터를 통해 요청별로 계산 비용을 세밀하게 제어할 수 있습니다.
높은 Thinking 설정 시 latency 증가: 높은 thinking 설정을 사용하면 생성이 시작되기 전 약 7~10초의 사전 계산 시간이 추가됩니다.
통합된 Multimodality: 오디오, 비디오, PDF를 직접 인식하므로 복잡한 멀티 모델 오케스트레이션 파이프라인이 필요하지 않습니다.
안전 거부: 내부 테스트 결과, 레드팀 훈련 중 이미지-텍스트 안전성 일관성이 21.7% 하락하는 것으로 나타났습니다.

API 빠른 시작

google/gemini-3.1-flash-lite-preview

문서 보기
google SDK
import { GoogleGenAI } from "@google/generative-ai";

const genAI = new GoogleGenAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-flash-lite-preview",
  generationConfig: {
    thinkingConfig: { thinking_level: "high" }
  }
});

const result = await model.generateContent("날씨 대시보드 UI를 만들어줘.");
console.log(result.response.text());

SDK를 설치하고 몇 분 안에 API 호출을 시작하세요.

Gemini 3.1 Flash-Lite에 대한 사람들의 의견

커뮤니티가 Gemini 3.1 Flash-Lite에 대해 어떻게 생각하는지 확인하세요

3.1 Flash-Lite의 코딩 능력은 프론트엔드 개발에 놀라울 정도로 좋습니다. 360도 뷰어를 완벽하게 구현했습니다.
WorldofAI
youtube
Gemini 3.1 Flash-Lite는 상시 가동되는 multimodal AI 에이전트를 만들기 위한 최적의 모델입니다. 모든 것을 읽고 연결하고 통합합니다.
Shubham Saboo
twitter
가격 인상이 충격적입니다. output token 비용이 3.75배 오른 것은 클라우드 예산이 타이트한 경우 뼈아플 것입니다.
Binary Verse AI
youtube
엔지니어링 팀의 아키텍처 복잡성을 Google 인프라로 옮겨줍니다.
Julian Goldie
youtube
지능을 위한 또 다른 가격 인하입니다. 빠른 속도, 저렴한 비용, 높은 지능. 에이전트 라우팅을 위한 훌륭한 모델입니다.
ctgtplb
twitter
1M context는 여전히 이 모델의 킬러 기능입니다. 전체 저장소 폴더를 던져 넣어도 1초 미만의 TTFT로 바로 작동합니다.
DevFlow_26
reddit

Gemini 3.1 Flash-Lite에 대한 동영상

Gemini 3.1 Flash-Lite에 대한 튜토리얼, 리뷰 및 토론 시청

어떻게 이 모델에 이렇게 많은 지능을 담았는지 놀랍습니다.

매우 잘 정의된 고처리량 작업에 사용하기 좋습니다.

Flash-Lite의 프론트엔드 생성 능력은 제가 다뤄본 대부분의 모델보다 뛰어납니다.

한 번에 완전히 작동하는 뷰어를 만들어냈습니다.

로직을 희생하지 않으면서 속도가 필요한 사람들에게 이상적인 모델입니다.

이 모델은 고처리량 작업을 위해 설계된 워크호스(workhorse) 모델입니다.

최소한의 thinking 설정을 사용하면, 비추론 모델처럼 작동하며 극도로 빨라집니다.

출력된 웹사이트 결과물은 놀라운 수준이었습니다.

속도 대 비용 비율 때문에 프로덕션 앱에 이 모델을 도입할 이유가 충분합니다.

Multimodal 입력을 기본적으로 처리한다는 것은 경쟁사 대비 엄청난 강점입니다.

lite라는 이름이 붙었는데 GPQA Diamond에서 87%를 기록한 것은 우리의 분류 시스템을 완전히 뒤흔드는 일입니다.

이 모델을 사실 관계 확인용으로 쓰지 마세요... 사용자가 직접 사실을 제공해야 합니다.

3.1 Flash-Lite를 사용하면 다른 세 개의 마이크로서비스를 실행할 필요가 없습니다. 그 단순함이 곧 돈입니다.

45% 증가한 출력 속도는 스트리밍 응답에서 즉각 체감됩니다.

1M context를 저렴하게 이용할 수 있다는 건 실무에서 여전히 마법처럼 느껴집니다.

단순한 프롬프트 이상

워크플로를 강화하세요 AI 자동화

Automatio는 AI 에이전트, 웹 자동화 및 스마트 통합의 힘을 결합하여 더 짧은 시간에 더 많은 것을 달성할 수 있도록 도와줍니다.

AI 에이전트
웹 자동화
스마트 워크플로

Gemini 3.1 Flash-Lite 프로 팁

Gemini 3.1 Flash-Lite을 최대한 활용하기 위한 전문가 팁.

Thinking Levels 설정

분류 작업 시에는 비용 절감을 위해 최소한의 thinking 설정을 사용하고, 복잡한 코딩 작업에는 높은 설정을 사용하세요.

Grounding 활성화

기본적인 사실 관계 정확도가 다소 낮을 수 있으므로, 사실 확인이 필요한 작업에는 반드시 Google Search grounding을 활용하세요.

Raw 파일 업로드

오디오나 비디오를 텍스트로 미리 변환하지 말고, raw 파일을 직접 업로드하여 네이티브 multimodal 기능을 활용하세요.

시스템 지침(System Instructions) 사용

output correction token을 최소화하기 위해 system_instruction 파라미터를 사용하여 JSON 스키마를 엄격하게 적용하세요.

후기

사용자 후기

워크플로를 혁신한 수천 명의 만족한 사용자와 함께하세요

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

관련 AI Models

anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M

Gemini 3.1 Flash-Lite에 대한 자주 묻는 질문

Gemini 3.1 Flash-Lite에 대한 일반적인 질문에 대한 답변 찾기