openai

GPT-4o mini

GPT-4o mini është model-i i vogël më kosto-efikas i OpenAI, duke ofruar inteligjencë të klasit GPT-4 me shpejtësi superiore dhe vision multimodal për detyra me...

Model i vogëlKosto-EfikasMe aftësi VisionAI i shpejtëMultimodal
openai logoopenaiGPT-4July 18, 2024
Konteksti
128Ktokena
Output maksimal
16Ktokena
Cmimi i inputit
$0.15/ 1M
Cmimi i outputit
$0.60/ 1M
Modaliteti:TextImage
Aftesite:VizioniMjetetStreaming
Benchmarket
GPQA
40.2%
GPQA: Pyetje shkence niveli pasuniversitar. Benchmark rigoroz me 448 pyetje nga biologjia, fizika dhe kimia. Ekspertet PhD arrijne vetem 65-74% saktesi. GPT-4o mini mori 40.2% ne kete benchmark.
HLE
2.3%
HLE: Arsyetim niveli ekspert. Teston aftesine e modelit per te demonstruar arsyetim niveli ekspert ne fusha te specializuara. GPT-4o mini mori 2.3% ne kete benchmark.
MMLU
82%
MMLU: Kuptim masiv gjuhor multitask. Benchmark gjitheperfshires me 16,000 pyetje ne 57 lende akademike. GPT-4o mini mori 82% ne kete benchmark.
MMLU Pro
57%
MMLU Pro: MMLU Edicioni Profesional. Version i permiresuar i MMLU me 12,032 pyetje dhe format me te veshtire me 10 opsione. GPT-4o mini mori 57% ne kete benchmark.
SimpleQA
8.6%
SimpleQA: Benchmark saktesie faktike. Teston aftesine e modelit per te dhene pergjigje te sakta, faktike. GPT-4o mini mori 8.6% ne kete benchmark.
IFEval
76.5%
IFEval: Vleresim i ndjekjes se udhezimeve. Mat sa mire modeli ndjek udhezime dhe kufizime specifike. GPT-4o mini mori 76.5% ne kete benchmark.
AIME 2025
5%
AIME 2025: Provimi Amerikan i Matematikes me Ftese. Probleme matematike niveli konkursi nga provimi prestigjioz AIME. GPT-4o mini mori 5% ne kete benchmark.
MATH
50.2%
MATH: Zgjidhje problemesh matematike. Benchmark gjitheperfshires matematike qe teston zgjidhjen e problemeve ne algebre, gjeometri, kalkulus. GPT-4o mini mori 50.2% ne kete benchmark.
GSM8k
91.3%
GSM8k: Matematike shkolle fillore 8K. 8,500 probleme matematike me fjale niveli shkolle fillore. GPT-4o mini mori 91.3% ne kete benchmark.
MGSM
87%
MGSM: Matematike shkolle fillore shumegjuheshe. Benchmarku GSM8k i perkthyer ne 10 gjuhe. GPT-4o mini mori 87% ne kete benchmark.
MathVista
42%
MathVista: Arsyetim vizual matematik. Teston aftesine per te zgjidhur probleme matematike me elemente vizuale. GPT-4o mini mori 42% ne kete benchmark.
SWE-Bench
8.7%
SWE-Bench: Benchmark inxhinieri software. Modelet AI perpiqen te zgjidhin probleme reale GitHub ne projekte Python. GPT-4o mini mori 8.7% ne kete benchmark.
HumanEval
87.2%
HumanEval: Probleme programimi Python. 164 probleme programimi ku modelet duhet te gjenerojne implementime te sakta funksionesh Python. GPT-4o mini mori 87.2% ne kete benchmark.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark kodimi live. Teston aftesite e kodimit ne sfida programimi te botes reale qe perditsohen vazhdimisht. GPT-4o mini mori 32.5% ne kete benchmark.
MMMU
59.4%
MMMU: Kuptim multimodal. Benchmark kuptimi multimodal nga 30 lende universitare. GPT-4o mini mori 59.4% ne kete benchmark.
MMMU Pro
34%
MMMU Pro: MMMU Edicioni Profesional. Version i permiresuar i MMMU me pyetje me sfiduese. GPT-4o mini mori 34% ne kete benchmark.
ChartQA
78%
ChartQA: Pyetje dhe pergjigje grafiku. Teston aftesine per te kuptuar dhe analizuar informacion nga grafiqet dhe diagramet. GPT-4o mini mori 78% ne kete benchmark.
DocVQA
88%
DocVQA: Pyetje vizuale dokumentesh. Teston aftesine per te nxjerre informacion nga imazhet e dokumenteve. GPT-4o mini mori 88% ne kete benchmark.
Terminal-Bench
40%
Terminal-Bench: Detyra terminal/CLI. Teston aftesine per te kryer operacione te linjes se komandes. GPT-4o mini mori 40% ne kete benchmark.
ARC-AGI
8%
ARC-AGI: Abstraksion dhe arsyetim. Teston inteligjencen e lengeshem permes puzzleve te reja te njohjes se modeleve. GPT-4o mini mori 8% ne kete benchmark.

Rreth GPT-4o mini

Meso per aftesite e GPT-4o mini, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Një standard i ri për model-et e vegjël

GPT-4o mini përfaqëson një hap të rëndësishëm në efikasitetin e AI, i dizajnuar për të zëvendësuar GPT-3.5 Turbo si model-i kryesor për zhvilluesit. I ndërtuar me një arkitekturë multimodale native, ai ofron performancë të klasit GPT-4 me një fraksion të kostos dhe latency-së. Ai përmban një context window masiv prej 128,000 tokens dhe mbështet output-e komplekse deri në 16,384 tokens, duke e bërë atë ideal për procesimin e dokumenteve të gjata dhe flukseve të të dhënave me volum të lartë.

Inteligjenca takon përballueshmërinë

Ndryshe nga model-et e vegjël të mëparshëm që sakrifikonin inteligjencën për shpejtësinë, GPT-4o mini ruan aftësi të larta reasoning në detyrat e tekstit dhe vision-it. Është 60% më i lirë se GPT-3.5 Turbo dhe dukshëm më i aftë, duke shënuar 82% në benchmark-un MMLU. Ky model është i optimizuar specifikisht për aplikacione ku latency e ulët dhe besueshmëria e lartë janë parësore, si asistentët e klientëve në kohë reale dhe motorët e klasifikimit të të dhënave në shkallë të gjerë.

GPT-4o mini

Rastet e perdorimit per GPT-4o mini

Zbulo menyrat e ndryshme per te perdorur GPT-4o mini per te arritur rezultate te shkelvqyera.

Automatizimi i mbështetjes së klientit

Përdorni chatbot-e me latency të ulët dhe kosto-efikasë që mund të menaxhojnë mijëra kërkesa rutinë me saktësi të lartë.

Nxjerrja e të dhënave të strukturuara

Konvertoni vëllime të mëdha teksti të pastrukturuar ose të dhëna imazhi në skema JSON të pastra dhe të formatuara për baza të dhënash.

Përkthimi në kohë reale

Fuqizoni aplikacionet e mesazheve me përkthim pothuajse të menjëhershëm në dhjetëra gjuhë me kosto minimale operative.

Përmbledhja e dokumenteve

Përmblidhni raporte të gjata dhe transkripte mbledhjesh duke përdorur context window-n e gjerë prej 128k.

Analiza vizuale & OCR

Nxirrni tekst nga imazhet, analizoni grafikët dhe përshkruani përmbajtjen vizuale për qëllime aksesueshmërie.

Prototipizimi i shpejtë

Ndërtoni dhe iteroni shpejt aplikacionet AI me shpenzime minimale të API përpara se të kaloni në model-e më të mëdha.

Pikat e forta

Kufizimet

Raport i pakrahasueshëm çmim-performancë: Me $0.15/1M input tokens, ofron një reduktim kostoje prej 99% krahasuar me GPT-4 duke ruajtur logjikë të lartë.
Thellësi e kufizuar e reasoning: Nuk zotëron aftësitë e avancuara të chain-of-thought që gjenden në model-et si OpenAI o1.
Kohë reagimi me latency të ulët: I projektuar për shpejtësi, duke ofruar përgjigje pothuajse të menjëhershme, kritike për agjentët bisedorë në kohë reale.
Kufizimet e output tokens: Limiti prej 16,384 tokens në output është më i ulët se model-et e specializuara që ofrojnë paritet të plotë me 128k output.
Vision multimodal nativ: Ndryshe nga model-et e vjetra të vogla, ai proceson imazhet natyralisht me rezultate të larta në ChartQA (78.0).
Mungesa në kodim kompleks: Has vështirësi me dizajnin arkitekturor të nivelit të lartë dhe debugging në depo kodi me shumë skedarë.
Ndjekje e fortë e instruksioneve: Arrin 76.5% në IFEval, duke demonstruar aftësi superiore në respektimin e rregullave komplekse të formatimit.
Pa input audio nativ: Nuk mbështet procesimin e drejtpërdrejtë audio-to-audio përmes endpoint-it standard të API-së për tekst/vision.

Fillim i shpejte API

openai/gpt-4o-mini

Shiko dokumentacionin
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    model: "gpt-4o-mini",
    messages: [
      { role: "system", content: "Ju jeni një asistent ndihmues." },
      { role: "user", content: "Analizo këto të dhëna dhe kthe JSON." },
    ],
    response_format: { type: "json_object" },
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per GPT-4o mini

Shiko se cfare mendon komuniteti per GPT-4o mini

GPT-4o mini është praktikisht fundi për GPT-3.5. Është më i shpejtë, më i lirë dhe më i zgjuar. Nuk ka më asnjë arsye për të përdorur model-in e vjetër.
rowqi
reddit
OpenAI vërtet ndryshoi lojën me çmimin. 15 cent për një milion tokens është e çmendur për këtë nivel logjike.
peterm1598
hackernews
Po shoh përgjigje pothuajse të menjëhershme për chatbot-in tim. Latency në 4o-mini është mbresëlënës për këtë çmim.
WesternCat5211
twitter
GPT-4o mini u lançua para 4 ditësh. Tashmë po proceson më shumë se 200B tokens në ditë!
Sam Altman
twitter
Performanca e vision-it për diçka këtë lirë është historia e vërtetë. I menaxhon grafikët më mirë se disa model-e flagship të një viti më parë.
VisionDev99
reddit
Ndiq instruksionet e sistemit në mënyrë perfekte për nxjerrjen e JSON. Një përmirësim masiv mbi besueshmërinë e 3.5 Turbo.
LLM_Master
hackernews

Video rreth GPT-4o mini

Shiko tutoriale, rishikime dhe diskutime rreth GPT-4o mini

Era e model-it të vogël është këtu

Ka një çmim prej 15 cent për milion input tokens... kjo është çmendurisht e lirë

GPT-4o mini është shumë shumë i shpejtë... shpejtësi e pabesueshme

Ky model po zëvendëson praktikisht GPT-3.5 Turbo dhe është 60% më i lirë

Shikoni sa shpejt po gjeneron tekst, është pothuajse e menjëhershme

GPT-4o mini është falas, është i shpejtë dhe është vërtet i mirë

GPT-3.5 ka ikur plotësisht... ju kaloni direkt te GPT-4o mini

Shikoni shpejtësinë e kësaj, shumë më shpejt apo jo

Është një model multimodal, që do të thotë se mund të shohë imazhe

Tejkalon GPT-3.5 Turbo dhe madje GPT-4 në disa benchmark-e

OpenAI sapo ka nxjerrë një konkurrent që duket se po mposht shumë nga këto model-e

Është model-i që ata kanë optimizuar për të kushtuar më së paku

Aftësia për të nxjerrë 16,000 output tokens në të njëjtën kohë është vërtet e dobishme

Context window është 128k, gjë që është e shkëlqyer për aplikacionet RAG

Masat e sigurisë në këtë model janë të integruara që në fillim

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI
Automatizimi i web-it
Workflow-e inteligjente

Keshilla Pro per GPT-4o mini

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga GPT-4o mini dhe te arrish rezultate me te mira.

Instruksione të drejtpërdrejta sistemi

Jepni prompt-e sistemi koncizë për ta drejtuar model-in drejt formateve specifike të output-it si JSON ose Markdown.

Grupimi i Context (Batching)

Shfrytëzoni window-n 128k duke grupuar detyra të vogla të lidhura në një prompt të vetëm për të reduktuar kostot operative.

Etiketimi në Vision

Kërkoni atribute vizuale specifike kur procesoni imazhe për të përmirësuar saktësinë e nxjerrjes së metadata-ve.

Streaming për UX

Gjithmonë aktivizoni parametrin stream për të ofruar reagim të menjëhershëm të token-ëve për përdoruesit fundorë.

Rregullimi i Temperaturës

Vendosni temperaturën në 0 për detyrat me të dhëna të strukturuara për të siguruar output-e deterministike dhe konsistente.

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

256K context
$0.14/$0.42/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.50/$15.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.30/$1.20/1M

Pyetjet e bera shpesh rreth GPT-4o mini

Gjej pergjigje per pyetjet e zakonshme rreth GPT-4o mini