openai

GPT-4o mini

GPT-4o mini është modeli i vogël më efiçient i OpenAI, që ofron inteligjencë të klasit GPT-4 me shpejtësi superiore dhe vizion multimodal për detyra me vëllim...

Model i VogëlEfiçient në KostoMe Aftësi VizualeAI i ShpejtëMultimodal
openai logoopenaiGPT-4o18 Korrik, 2024
Konteksti
128Ktokena
Output maksimal
16Ktokena
Cmimi i inputit
$0.15/ 1M
Cmimi i outputit
$0.60/ 1M
Modaliteti:TextImage
Aftesite:VizioniMjetetStreaming
Benchmarket
GPQA
40.2%
GPQA: Pyetje shkence niveli pasuniversitar. Benchmark rigoroz me 448 pyetje nga biologjia, fizika dhe kimia. Ekspertet PhD arrijne vetem 65-74% saktesi. GPT-4o mini mori 40.2% ne kete benchmark.
HLE
2.3%
HLE: Arsyetim niveli ekspert. Teston aftesine e modelit per te demonstruar arsyetim niveli ekspert ne fusha te specializuara. GPT-4o mini mori 2.3% ne kete benchmark.
MMLU
82%
MMLU: Kuptim masiv gjuhor multitask. Benchmark gjitheperfshires me 16,000 pyetje ne 57 lende akademike. GPT-4o mini mori 82% ne kete benchmark.
MMLU Pro
57%
MMLU Pro: MMLU Edicioni Profesional. Version i permiresuar i MMLU me 12,032 pyetje dhe format me te veshtire me 10 opsione. GPT-4o mini mori 57% ne kete benchmark.
SimpleQA
8.6%
SimpleQA: Benchmark saktesie faktike. Teston aftesine e modelit per te dhene pergjigje te sakta, faktike. GPT-4o mini mori 8.6% ne kete benchmark.
IFEval
76.5%
IFEval: Vleresim i ndjekjes se udhezimeve. Mat sa mire modeli ndjek udhezime dhe kufizime specifike. GPT-4o mini mori 76.5% ne kete benchmark.
AIME 2025
5%
AIME 2025: Provimi Amerikan i Matematikes me Ftese. Probleme matematike niveli konkursi nga provimi prestigjioz AIME. GPT-4o mini mori 5% ne kete benchmark.
MATH
50.2%
MATH: Zgjidhje problemesh matematike. Benchmark gjitheperfshires matematike qe teston zgjidhjen e problemeve ne algebre, gjeometri, kalkulus. GPT-4o mini mori 50.2% ne kete benchmark.
GSM8k
91.3%
GSM8k: Matematike shkolle fillore 8K. 8,500 probleme matematike me fjale niveli shkolle fillore. GPT-4o mini mori 91.3% ne kete benchmark.
MGSM
87%
MGSM: Matematike shkolle fillore shumegjuheshe. Benchmarku GSM8k i perkthyer ne 10 gjuhe. GPT-4o mini mori 87% ne kete benchmark.
MathVista
42%
MathVista: Arsyetim vizual matematik. Teston aftesine per te zgjidhur probleme matematike me elemente vizuale. GPT-4o mini mori 42% ne kete benchmark.
SWE-Bench
8.7%
SWE-Bench: Benchmark inxhinieri software. Modelet AI perpiqen te zgjidhin probleme reale GitHub ne projekte Python. GPT-4o mini mori 8.7% ne kete benchmark.
HumanEval
87.2%
HumanEval: Probleme programimi Python. 164 probleme programimi ku modelet duhet te gjenerojne implementime te sakta funksionesh Python. GPT-4o mini mori 87.2% ne kete benchmark.
LiveCodeBench
32.5%
LiveCodeBench: Benchmark kodimi live. Teston aftesite e kodimit ne sfida programimi te botes reale qe perditsohen vazhdimisht. GPT-4o mini mori 32.5% ne kete benchmark.
MMMU
59.4%
MMMU: Kuptim multimodal. Benchmark kuptimi multimodal nga 30 lende universitare. GPT-4o mini mori 59.4% ne kete benchmark.
MMMU Pro
34%
MMMU Pro: MMMU Edicioni Profesional. Version i permiresuar i MMMU me pyetje me sfiduese. GPT-4o mini mori 34% ne kete benchmark.
ChartQA
78%
ChartQA: Pyetje dhe pergjigje grafiku. Teston aftesine per te kuptuar dhe analizuar informacion nga grafiqet dhe diagramet. GPT-4o mini mori 78% ne kete benchmark.
DocVQA
88%
DocVQA: Pyetje vizuale dokumentesh. Teston aftesine per te nxjerre informacion nga imazhet e dokumenteve. GPT-4o mini mori 88% ne kete benchmark.
Terminal-Bench
40%
Terminal-Bench: Detyra terminal/CLI. Teston aftesine per te kryer operacione te linjes se komandes. GPT-4o mini mori 40% ne kete benchmark.
ARC-AGI
8%
ARC-AGI: Abstraksion dhe arsyetim. Teston inteligjencen e lengeshem permes puzzleve te reja te njohjes se modeleve. GPT-4o mini mori 8% ne kete benchmark.

Rreth GPT-4o mini

Meso per aftesite e GPT-4o mini, vecorite dhe si mund te te ndihmoje te arrish rezultate me te mira.

Një Standard i Ri për Modelet e Vogla

GPT-4o mini përfaqëson një hap të rëndësishëm në efiçencën e AI, i krijuar për të zëvendësuar GPT-3.5 Turbo si modeli kryesor për zhvilluesit. I ndërtuar me një arkitekturë native multimodale, ai ofron performancë të klasit GPT-4 me një pjesë të kostos dhe latency-t. Ai përmban një context window masive prej 128.000 tokens dhe mbështet output-e komplekse deri në 16.384 tokens, duke e bërë atë ideal për përpunimin e dokumenteve të gjata dhe rrjedhave të të dhënave me vëllim të lartë.

Inteligjenca Takon Përballueshmërinë

Për ndryshim nga modelet e mëparshme të vogla që sakrifikonin inteligjencën për shpejtësi, GPT-4o mini ruan aftësi të larta arsyetimi në detyrat me tekst dhe vizion. Ai është 60% më i lirë se GPT-3.5 Turbo dhe dukshëm më i aftë, duke shënuar 82% në benchmark-in MMLU. Ky model është optimizuar posaçërisht për aplikacione ku latency-i i ulët dhe besueshmëria e lartë janë parësore, siç janë asistentët e klientëve në kohë reale dhe motorët e klasifikimit të të dhënave në shkallë të gjerë.

GPT-4o mini

Rastet e perdorimit per GPT-4o mini

Zbulo menyrat e ndryshme per te perdorur GPT-4o mini per te arritur rezultate te shkelvqyera.

Automatizimi i Mbështetjes për Klientët

Trajtimi i vëllimeve të larta të kërkesave të klientëve me latency të ulët dhe saktësi të lartë, me një pjesë të kostos.

Përmbledhja e Përmbajtjes

Përpunimi i dokumenteve të mëdha ose përmbajtjeve të gjata në përmbledhje koncize brenda context window prej 128k.

Ekstraktimi i të Dhënave

Shndërrimi i tekstit ose imazheve të pastrukturuara në formate të strukturuara të të dhënave si JSON për futjen në baza të të dhënave.

Përkthimi Shumëgjuhësh

Ofrimi i përkthimit në kohë reale në dhjetëra gjuhë për aplikacionet e chat-it dhe komunikimin global.

Mësimdhënia Edukative

Shërben si një asistent ndërveprues studimi për studentët që kanë nevojë për ndihmë me matematikën, shkencën dhe gjuhët.

Detyrat Bazë të Vizionit

Analizimi i imazheve për të identifikuar objekte, nxjerrja e tekstit përmes OCR, ose ofrimi i përshkrimeve për aksesueshmëri.

Pikat e forta

Kufizimet

Raport i pabesueshëm Çmim-Performancë: Me 0,15 dollarë për milion input tokens, ofron arsyetim në nivel të frontier model me një rezultat 82% në MMLU.
Boshllëqe në Arsyetimin Kompleks: Mbetet pas modeleve më të mëdha si GPT-4o ose o1 në shkencën e nivelit ekspert, duke shënuar 40,2% në GPQA.
Shpejtësi e Lartë e Throughput: Modeli ofron përgjigje me latency jashtëzakonisht të ulët, duke e bërë ideal për ndërfaqet e përdoruesit në kohë reale.
Kufizimet në Kodim: I mungon të kuptuarit e thellë arkitekturor për inxhinierinë komplekse të softuerit krahasuar me Claude 3.5 Sonnet.
Context Window e Madhe: Mban një context window të plotë prej 128k, duke lejuar përpunimin e dokumenteve komplekse që rrallë gjendet në modelet e vogla.
Dritare e reduktuar e Output-it: Limiti prej 16k për output mund të jetë kufizues për detyra që kërkojnë migrime masive të kodit ose gjenerim të librave të tërë.
Mbështetje Native për Vizion: Përfshin aftësi multimodale në një format të vogël, duke shkëlqyer në analizën e imazheve dhe detyrat OCR.
Stabiliteti i Fakticitetit: Modelet më të vogla mbeten më të prirura ndaj halucinacioneve në fusha specifike krahasuar me flagship modelet.

Fillim i shpejte API

openai/gpt-4o-mini

Shiko dokumentacionin
openai SDK
import OpenAI from "openai";

const openai = new OpenAI();

async function main() {
  const completion = await openai.chat.completions.create({
    messages: [{ role: "user", content: "Shpjego fizikën kuantike." }],
    model: "gpt-4o-mini",
  });

  console.log(completion.choices[0].message.content);
}

main();

Instalo SDK-ne dhe fillo te besh thirrje API brenda minutash.

Cfare thone njerezit per GPT-4o mini

Shiko se cfare mendon komuniteti per GPT-4o mini

GPT-4o mini praktikisht ka vrarë tregun për fine-tuning të modeleve më të vjetra për RAG bazik. Kostot janë shumë të ulëta për t'u injoruar.
AI_Dev_Central
reddit
Shpejtësia është thjesht e çmendur. Po marr tokens mbrapsht pothuajse menjëherë për agjentin tim të përkthimit.
TechCruncher
twitter
OpenAI vërtet i detyroi Anthropic dhe Google të reagojnë me këtë çmim. 0,15 dollarë për 1M tokens është një nivel i ri i ulët.
hn_reader_99
hackernews
E zëvendësova 3.5 me mini dhe përmirësimi i logjikës ishte i dukshëm që në pesë minutat e para të testimit.
PromptEngineerPro
youtube
Më në fund është mjaftueshëm lirë për të përdorur LLM për pastrimin bazë të të dhënave në shkallë të gjerë pa një faturë të madhe cloud.
DataVizWiz
reddit
Performanca e vizionit për OCR është në fakt më e mirë se disa modele të specializuara që kushtojnë 10 herë më shumë.
VisionDev
twitter

Video rreth GPT-4o mini

Shiko tutoriale, rishikime dhe diskutime rreth GPT-4o mini

Është më i shpejtë dhe më i lirë se GPT-3.5 Turbo në çdo aspekt.

Aftësitë vizuale për një model kaq të vogël janë vërtet befasuese.

Çmimi është praktikisht një garë drejt zeros me këtë lançim.

Ai arrin të mbajë context window masive ndërsa mbetet i vogël.

Benchmark-et tregojnë se ai mund Claude Haiku në pothuajse çdo kategori.

GPT 4o mini është një model i lehtë, ndaj është shumë më i shpejtë se GPT 4o.

Është shumë më i shpejtë se GPT 4.

Për detyrat e përditshme, shumica e përdoruesve as nuk do ta vërejnë ndryshimin në arsyetim.

Njohja e imazheve është shumë konsistente për objektet bazë.

Ai trajton instruksionet komplekse shumë më mirë se modeli i vjetër 3.5.

Ai aktualisht tejkalon gpt4-ën e tyre në preferencat e chat-it në leaderboard-in e LMSYS.

Gjithçka duket perfekte dhe e dini, kjo faturë specifike duket si një faturë tipike.

Koha e përgjigjes është praktikisht nën një sekondë për prompt-e të shkurtra.

Është shumë efektiv në përmbledhjen e PDF-ve të gjata përmes API.

Mund të përpunoni miliona tokens për vetëm pak dollarë.

Me shume se vetem prompte

Superkariko workflow-n tend me automatizimin AI

Automatio kombinon fuqine e agjenteve AI, automatizimin e web-it dhe integrimet inteligjente per te te ndihmuar te arrish me shume ne me pak kohe.

Agjentet AI
Automatizimi i web-it
Workflow-e inteligjente

Keshilla Pro per GPT-4o mini

Keshilla ekspertesh per te te ndihmuar te marrresh maksimumin nga GPT-4o mini dhe te arrish rezultate me te mira.

Përdore për RAG

Shfrytëzo koston e ulët të input-it për të kryer Retrieval Augmented Generation në shkallë të gjerë pa shpenzime të larta.

Strukturo me JSON Mode

Përdor parametrat e JSON mode ose function calling për të siguruar struktura të qëndrueshme të të dhënave për proceset e backend-it.

Batch Processing

Përdor Batch API të OpenAI me këtë model për të ulur kostot me 50% për detyrat që nuk janë urgjente.

Përshtatja e Temperaturës

Vendos një temperaturë më të ulët midis 0,1 dhe 0,3 për detyrat e nxjerrjes së fakteve për të maksimizuar saktësinë.

Deshmi

Cfare thone perdoruesit tane

Bashkohu me mijera perdorues te kenaqur qe kane transformuar workflow-n e tyre

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Te lidhura AI Models

alibaba

Qwen3-Coder-Next

alibaba

Qwen3-Coder-Next is Alibaba Cloud's elite Apache 2.0 coding model, featuring an 80B MoE architecture and 256k context window for advanced local development.

262K context
$0.12/$0.75/1M
zhipu

GLM-4.7

Zhipu (GLM)

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
minimax

MiniMax M2.5

minimax

MiniMax M2.5 is a SOTA MoE model featuring a 1M context window and elite agentic coding capabilities at disruptive pricing for autonomous agents.

1M context
$0.15/$1.20/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
openai

GPT-5.3 Instant

OpenAI

Explore GPT-5.3 Instant, OpenAI's "Anti-Cringe" model. Features a 128K context window, 26.8% fewer hallucinations, and a natural, helpful tone for everyday...

128K context
$1.75/$14.00/1M
google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M

Pyetjet e bera shpesh rreth GPT-4o mini

Gjej pergjigje per pyetjet e zakonshme rreth GPT-4o mini