google

Gemini 3.1 Pro

Gemini 3.1 Pro je Googleov elitni multimodalni model s DeepThink reasoning motorom, context windowom od 1M+ tokena i vodećim ARC-AGI logičkim rezultatima.

MultimodalDeep ReasoningVideo GenerationWorkspace AIGoogle Gemini
google logogoogleGemini19. veljače 2026.
Kontekst
2.0Mtokena
Maks. izlaz
66Ktokena
Ulazna cijena
$2.50/ 1M
Izlazna cijena
$15.00/ 1M
Modalitet:TextImageAudioVideo
Mogućnosti:VidAlatiStreamingZaključivanje
Benchmarks
GPQA
94.3%
GPQA: Znanstvena pitanja i odgovori na razini doktorata. Rigorozan benchmark s 448 pitanja višestrukog izbora iz biologije, fizike i kemije koje su kreirali stručnjaci. Doktori znanosti postižu samo 65-74% točnosti, dok nestručnjaci postižu samo 34% čak i s neograničenim pristupom internetu (otuda naziv 'otporan na Google'). Gemini 3.1 Pro je postigao 94.3% na ovom benchmarku.
HLE
44.4%
HLE: Rasuđivanje visoke razine stručnosti. Testira sposobnost modela da demonstrira rasuđivanje na razini stručnjaka u specijaliziranim domenama. Procjenjuje duboko razumijevanje složenih tema koje zahtijevaju znanje na profesionalnoj razini. Gemini 3.1 Pro je postigao 44.4% na ovom benchmarku.
MMLU
80.6%
MMLU: Masovno višezadaćno jezično razumijevanje. Sveobuhvatan benchmark s 16.000 pitanja višestrukog izbora iz 57 akademskih predmeta uključujući matematiku, filozofiju, pravo i medicinu. Testira široko znanje i sposobnosti rasuđivanja. Gemini 3.1 Pro je postigao 80.6% na ovom benchmarku.
MMLU Pro
79.2%
MMLU Pro: MMLU profesionalno izdanje. Poboljšana verzija MMLU-a s 12.032 pitanja koristeći teži format s 10 opcija. Pokriva matematiku, fiziku, kemiju, pravo, inženjerstvo, ekonomiju, zdravstvo, psihologiju, poslovanje, biologiju, filozofiju i informatiku. Gemini 3.1 Pro je postigao 79.2% na ovom benchmarku.
SimpleQA
79.6%
SimpleQA: Benchmark činjenične točnosti. Testira sposobnost modela da pruži točne, činjenične odgovore na jednostavna pitanja. Mjeri pouzdanost i smanjuje halucinacije u zadacima dohvaćanja znanja. Gemini 3.1 Pro je postigao 79.6% na ovom benchmarku.
IFEval
92.4%
IFEval: Evaluacija praćenja uputa. Mjeri koliko dobro model slijedi specifične upute i ograničenja. Testira sposobnost pridržavanja pravila formatiranja, ograničenja duljine i drugih eksplicitnih zahtjeva. Gemini 3.1 Pro je postigao 92.4% na ovom benchmarku.
AIME 2025
92%
AIME 2025: Američki pozivni matematički ispit. Matematički problemi natjecateljske razine s prestižnog AIME ispita dizajniranog za talentirane srednjoškolce. Testira naprednu matematičku sposobnost rješavanja problema koja zahtijeva apstraktno rasuđivanje, a ne samo prepoznavanje obrazaca. Gemini 3.1 Pro je postigao 92% na ovom benchmarku.
MATH
92%
MATH: Rješavanje matematičkih problema. Sveobuhvatan matematički benchmark koji testira rješavanje problema iz algebre, geometrije, računa i drugih matematičkih domena. Zahtijeva rasuđivanje u više koraka i formalno matematičko znanje. Gemini 3.1 Pro je postigao 92% na ovom benchmarku.
GSM8k
98.4%
GSM8k: Matematika osnovne škole 8K. 8.500 matematičkih zadataka osnovnoškolske razine koji zahtijevaju rasuđivanje u više koraka. Testira osnovnu aritmetiku i logičko razmišljanje kroz scenarije iz stvarnog života poput kupovine ili izračuna vremena. Gemini 3.1 Pro je postigao 98.4% na ovom benchmarku.
MGSM
96.5%
MGSM: Višejezična matematika osnovne škole. GSM8k benchmark preveden na 10 jezika uključujući španjolski, francuski, njemački, ruski, kineski i japanski. Testira matematičko rasuđivanje na različitim jezicima. Gemini 3.1 Pro je postigao 96.5% na ovom benchmarku.
MathVista
89.4%
MathVista: Matematičko vizualno rasuđivanje. Testira sposobnost rješavanja matematičkih problema koji uključuju vizualne elemente poput grafikona, geometrijskih dijagrama i znanstvenih figura. Kombinira vizualno razumijevanje s matematičkim rasuđivanjem. Gemini 3.1 Pro je postigao 89.4% na ovom benchmarku.
SWE-Bench
71%
SWE-Bench: Benchmark softverskog inženjerstva. AI modeli pokušavaju riješiti stvarne GitHub probleme u Python projektima otvorenog koda s ljudskom verifikacijom. Testira praktične vještine softverskog inženjerstva na produkcijskim kodnim bazama. Najbolji modeli su napredovali s 4,4% u 2023. na preko 70% u 2024. Gemini 3.1 Pro je postigao 71% na ovom benchmarku.
HumanEval
91.2%
HumanEval: Python programerski problemi. 164 ručno napisana programerska problema gdje modeli moraju generirati ispravne implementacije Python funkcija. Svako rješenje se verificira jediničnim testovima. Najbolji modeli sada postižu preko 90% točnosti. Gemini 3.1 Pro je postigao 91.2% na ovom benchmarku.
LiveCodeBench
82%
LiveCodeBench: Benchmark živog kodiranja. Testira sposobnosti kodiranja na kontinuirano ažuriranim izazovima programiranja iz stvarnog svijeta. Za razliku od statičnih benchmarka, koristi svježe probleme za sprečavanje kontaminacije podataka i mjerenje pravih vještina kodiranja. Gemini 3.1 Pro je postigao 82% na ovom benchmarku.
MMMU
84.2%
MMMU: Multimodalno razumijevanje. Masivni višedisciplinarni multimodalni benchmark razumijevanja koji testira modele vida i jezika na problemima sveučilišne razine iz 30 predmeta koji zahtijevaju razumijevanje slika i stručno znanje. Gemini 3.1 Pro je postigao 84.2% na ovom benchmarku.
MMMU Pro
62.5%
MMMU Pro: MMMU profesionalno izdanje. Poboljšana verzija MMMU-a s težim pitanjima i strožom evaluacijom. Testira napredno multimodalno rasuđivanje na profesionalnoj i stručnoj razini. Gemini 3.1 Pro je postigao 62.5% na ovom benchmarku.
ChartQA
91.8%
ChartQA: Pitanja i odgovori o grafikonima. Testira sposobnost razumijevanja i rasuđivanja o informacijama prikazanim u grafikonima i dijagramima. Zahtijeva ekstrakciju podataka, usporedbu vrijednosti i izvođenje izračuna iz vizualnih prikaza podataka. Gemini 3.1 Pro je postigao 91.8% na ovom benchmarku.
DocVQA
94.2%
DocVQA: Vizualna Q&A o dokumentima. Benchmark vizualnih pitanja i odgovora o dokumentima koji testira sposobnost ekstrakcije i rasuđivanja o informacijama iz slika dokumenata uključujući obrasce, izvješća i skenirani tekst. Gemini 3.1 Pro je postigao 94.2% na ovom benchmarku.
Terminal-Bench
58%
Terminal-Bench: Terminal/CLI zadaci. Testira sposobnost izvođenja operacija naredbenog retka, pisanja shell skripti i navigacije u terminalskim okruženjima. Mjeri praktične vještine administracije sustava i razvojnih radnih tokova. Gemini 3.1 Pro je postigao 58% na ovom benchmarku.
ARC-AGI
77.1%
ARC-AGI: Apstrakcija i rasuđivanje. Korpus apstrakcije i rasuđivanja za AGI - testira fluidnu inteligenciju kroz nove zagonetke prepoznavanja obrazaca. Svaki zadatak zahtijeva otkrivanje temeljnog pravila iz primjera, mjereći opću sposobnost rasuđivanja umjesto memoriranja. Gemini 3.1 Pro je postigao 77.1% na ovom benchmarku.

O modelu Gemini 3.1 Pro

Saznajte o mogućnostima, značajkama i načinima korištenja modela Gemini 3.1 Pro.

Gemini 3.1 Pro predstavlja zrelu implementaciju Sparse Mixture-of-Experts (MoE) okvira, nativno uparenog s naprednim motorom za multimodalnu obradu. Istaknuta značajka arhitekture je demokratizacija DeepThink System 2 sloja, koji modelu omogućuje interno promišljanje prije predaje output tokena. Ovaj model uvodi jedinstveni sustav razmišljanja na tri razine (niska, srednja i visoka), dopuštajući programerima da eksplicitno kontroliraju balans između latencije, troškova i dubine reasoninga.

S golemim 1-milijun-tokena context windowom, Gemini 3.1 Pro je visoko optimiziran za složene tijekove rada u financijama, analitici podataka i migracijama cijelih repozitorija koda. Pokazuje emergentnu sposobnost rješavanja novih logičkih uzoraka, ostvarujući rekordnih 77,1% na ARC-AGI-2 benchmarku. To ga čini preferiranim izborom za programere koji zahtijevaju multimodalne interakcije niske latencije i kognitivne performanse visoke razine za autonomne agentic zadatke.

Gemini 3.1 Pro

Slučajevi korištenja za Gemini 3.1 Pro

Otkrijte različite načine korištenja modela Gemini 3.1 Pro za postizanje izvrsnih rezultata.

Analiza cijelog repozitorija koda

Korištenje 1M context windowa za učitavanje cijelih repozitorija softvera radi refaktoriranja i mapiranja ovisnosti.

Autonomni komiteti agenata

Vođenje agentic tijekova rada u više koraka gdje interni pod-agenti raspravljaju i verificiraju rješenja prije izvršenja.

Sinteza znanstvenih istraživanja

Analiza tisuća istraživačkih radova i složenih skupova podataka radi izvlačenja strukturirane inteligencije i činjeničnih uvida.

Multimodalno stvaranje sadržaja

Istodobna obrada teksta, slika i zvuka za generiranje složenih edukativnih materijala i interaktivnih medija.

Automatizacija temeljena na terminalu

Izvršavanje složenih bash naredbi i manipulacija datotečnim sustavima s visokom preciznošću putem naprednih reasoning načina.

Revizija podataka u poduzećima

Parsiranje nestrukturiranih financijskih podataka i pravnih dokumenata radi prepoznavanja nedostataka u usklađenosti uz gotovo savršeno prisjećanje činjenica.

Prednosti

Ograničenja

Lider u ARC-AGI-2 reasoningu: Postigao 77,1% na ARC-AGI-2, čime je više nego udvostručio sposobnost zaključivanja prethodnih flagship modela.
Penalizacija cijene za veliki kontekst: Cijene inputa i outputa se udvostručuju kada prompt premaši prag od 200.000 tokena, što utječe na masovne serijske poslove.
1M token context window: Obrađuje masivne baze koda s više datoteka i dugotrajne videozapise uz state-of-the-art prisjećanje i nisku latenciju.
Ekstremna verboznost outputa: Benchmarkovi pokazuju da model može biti pretjerano opširan, generirajući znatno više tokena nego što je potrebno za jednostavne zadatke.
Konkurentna strategija cijena: Cijena od 2/12 USD po milijunu tokena čini ga znatno pristupačnijim od ekvivalenata iz Anthropic-a ili OpenAI-a.
Izazovi s nijansama tona: Povratne informacije zajednice sugeriraju da ton razgovora može djelovati manje prirodno ili nijansirano u usporedbi sa serijom Claude 3.5.
Granularne compute razine: Sadrži sustav razmišljanja na tri razine za preciznu kontrolu programera nad dubinom internog reasoninga i troškovima.
Nedosljedne razine reasoninga: Kvaliteta reasoninga značajno varira između razina, što često zahtijeva ručno eksperimentiranje kako bi se pronašla optimalna postavka.

API brzi početak

google/gemini-3.1-pro-preview

Pogledaj dokumentaciju
google SDK
import { GoogleGenAI } from "@google/genai";

const genAI = new GoogleGenAI(process.env.GOOGLE_API_KEY);
const model = genAI.getGenerativeModel({
  model: "gemini-3.1-pro-preview",
  thinkingConfig: { tier: "high" }
});

const prompt = "Analiziraj cijelu ovu bazu koda radi sigurnosnih ranjivosti.";
const result = await model.generateContent(prompt);
console.log(result.response.text());

Instalirajte SDK i počnite s API pozivima za nekoliko minuta.

Što ljudi kažu o modelu Gemini 3.1 Pro

Pogledajte što zajednica misli o modelu Gemini 3.1 Pro

Rezultat od 77,1% za Gemini 3.1 Pro predstavlja najrazorniji tržišni pomak; više nego udvostručuje prethodni rekord na ARC-AGI.
enoumen
reddit
Benchmarkovi kodiranja ne lažu. Ovaj model je pronašao bug u mom repozitoriju koji su 3.5 i GPT-4o potpuno propustili.
SiliconValleyCoder
hackernews
Gemini 3.1 ludilo je stvarno zanimljivo. Razbio je benchmarkove, ali stvarni korisnici kažu da su ton i vibra nedosljedni.
cryptopunk7213
twitter
DeepThink motor može dovesti do značajnih kašnjenja, ponekad preko 90 sekundi, pri obradi zadataka koji zahtijevaju duboku logiku.
TechReviewer2026
youtube
Context caching je ovdje ključna značajka. Pokrećem cijeli bot za dokumentaciju za sitniš u usporedbi s GPT-4o.
CloudArchitect
reddit
Gemini uopće nije uspio raspravljati o Pythonu u složenom zadatku planiranja... neka logika jednostavno nije bila prisutna u njegovom konačnom planu.
Temporary-Mix8022
reddit

Videozapisi o modelu Gemini 3.1 Pro

Gledajte tutorijale, recenzije i diskusije o modelu Gemini 3.1 Pro

Gemini 3.1 Pro generira najdetaljniju verziju ove pagode do sada

Gemini daleko ima najširi prozor od milijun tokena

Multimodalna vjernost u obradi zvuka je zamjetno bolja nego kod 3.0

Throughput tokena ostaje stabilan čak i kad se context window popuni

Dugoročno prisjećanje je praktički savršeno kroz cijelih milijun tokena

Na zagonetkama koje ne bi trebale biti u njegovim podacima za trening, serija Gemini 3 nadmašuje sve ostale modele

3.1 Pro bi zaista mogao smanjiti vrijeme izvršavanja fine-tuning skripte s 300 na 47 sekundi

Logički koraci DeepThinka su jasno vidljivi u tragovima, pokazujući stvarno promišljanje

Dosežemo zasićenje benchmarkova gdje je samo ARC-AGI stvarno bitan za napredak

AGI putanja se ubrzava na temelju ovih skokova u apstraktnom reasoningu

Mislim da se kod 3.1 zaista osjeća napredak, čak i ako je vrlo malen

Čini se da nadmašuje Gemini 3.0 Pro kada testiramo potpuno iste promptove jedan pored drugog

Točnost kodiranja pri složenim Python refaktoriranjima je najviša koju sam vidio

Pouzdanost API-ja se značajno poboljšala tijekom prošlog mjeseca testiranja

Performanse u stvarnom svijetu napokon odgovaraju hypeu oko rezultata benchmarkova

Vise od samo promptova

Poboljšajte svoj radni tijek sa AI Automatizacijom

Automatio kombinira moc AI agenata, web automatizacije i pametnih integracija kako bi vam pomogao postici vise za manje vremena.

AI Agenti
Web Automatizacija
Pametni Tokovi

Pro Savjeti za Gemini 3.1 Pro

Stručni savjeti za maksimalno iskorištavanje Gemini 3.1 Pro.

Odabir razine reasoninga

Koristite High thinking način za složenu matematiku ili logiku, ali se prebacite na Low za standardno formatiranje kako biste uštedjeli na compute resursima.

Context Caching

Implementirajte context caching za statičnu dokumentaciju kako biste smanjili cijene inputa do 90% po milijunu tokena.

Strukturirani artefakti

Iskoristite sposobnost modela da generira strukturirane popise zadataka radi lakšeg ljudskog nadzora tijekom agentic izvršavanja.

Multimodalni promptovi

Kombinirajte video i audio inpute kako biste modelu dali potpuni kontekst stvarnih scenarija umjesto samo tekstualnih opisa.

Svjedočanstva

Sto Kazu Nasi Korisnici

Pridruzite se tisucama zadovoljnih korisnika koji su transformirali svoj radni tijek

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Povezani AI Models

google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M

Često Postavljana Pitanja o Gemini 3.1 Pro

Pronađite odgovore na česta pitanja o Gemini 3.1 Pro