xai

Grok-3

Το Grok-3 είναι το flagship μοντέλο reasoning της xAI, με βαθιά λογική συναγωγή, 1M context window και ενσωμάτωση σε πραγματικό χρόνο με το X για ζωντανή...

xai logoxaiGrok17 Φεβρουαρίου 2025
Περιβάλλον
128Ktokens
Μέγιστη έξοδος
8Ktokens
Τιμή εισόδου
$3.00/ 1M
Τιμή εξόδου
$15.00/ 1M
Τρόπος λειτουργίας:TextImage
Δυνατότητες:ΌρασηΕργαλείαStreamingΣυλλογιστική
Benchmarks
GPQA
84.6%
GPQA: Ερωτήσεις επιπέδου μεταπτυχιακού. Ένα αυστηρό benchmark με 448 ερωτήσεις πολλαπλής επιλογής σε βιολογία, φυσική και χημεία δημιουργημένες από ειδικούς. Οι διδάκτορες επιτυγχάνουν μόνο 65-74% ακρίβεια, ενώ οι μη ειδικοί βαθμολογούν μόνο 34% ακόμα και με απεριόριστη πρόσβαση στο διαδίκτυο (εξ ου και 'Google-proof'). Το Grok-3 πέτυχε 84.6% σε αυτό το benchmark.
HLE
36%
HLE: Συλλογιστική επιπέδου εμπειρογνώμονα. Δοκιμάζει την ικανότητα ενός μοντέλου να επιδείξει συλλογιστική επιπέδου εμπειρογνώμονα σε εξειδικευμένους τομείς. Αξιολογεί τη βαθιά κατανόηση σύνθετων θεμάτων που απαιτούν επαγγελματική γνώση. Το Grok-3 πέτυχε 36% σε αυτό το benchmark.
MMLU
87.5%
MMLU: Μαζική πολυθεματική κατανόηση γλώσσας. Ένα ολοκληρωμένο benchmark με 16.000 ερωτήσεις πολλαπλής επιλογής σε 57 ακαδημαϊκά θέματα, συμπεριλαμβανομένων μαθηματικών, φιλοσοφίας, νομικής και ιατρικής. Δοκιμάζει ευρεία γνώση και ικανότητες συλλογιστικής. Το Grok-3 πέτυχε 87.5% σε αυτό το benchmark.
MMLU Pro
76.5%
MMLU Pro: MMLU Επαγγελματική έκδοση. Μια βελτιωμένη έκδοση του MMLU με 12.032 ερωτήσεις σε δυσκολότερη μορφή 10 επιλογών. Καλύπτει Μαθηματικά, Φυσική, Χημεία, Νομική, Μηχανική, Οικονομικά, Υγεία, Ψυχολογία, Επιχειρήσεις, Βιολογία, Φιλοσοφία και Πληροφορική. Το Grok-3 πέτυχε 76.5% σε αυτό το benchmark.
SimpleQA
42%
SimpleQA: Benchmark πραγματικής ακρίβειας. Δοκιμάζει την ικανότητα ενός μοντέλου να παρέχει ακριβείς, πραγματικές απαντήσεις σε απλές ερωτήσεις. Μετρά την αξιοπιστία και μειώνει τις ψευδαισθήσεις σε εργασίες ανάκτησης γνώσης. Το Grok-3 πέτυχε 42% σε αυτό το benchmark.
IFEval
91.2%
IFEval: Αξιολόγηση ακολουθίας οδηγιών. Μετρά πόσο καλά ένα μοντέλο ακολουθεί συγκεκριμένες οδηγίες και περιορισμούς. Δοκιμάζει την ικανότητα τήρησης κανόνων μορφοποίησης, ορίων μήκους και άλλων ρητών απαιτήσεων. Το Grok-3 πέτυχε 91.2% σε αυτό το benchmark.
AIME 2025
93.3%
AIME 2025: American Invitational Math Exam. Μαθηματικά προβλήματα επιπέδου διαγωνισμού από την πρεστίζ εξέταση AIME σχεδιασμένη για ταλαντούχους μαθητές λυκείου. Δοκιμάζει προηγμένη μαθηματική επίλυση προβλημάτων που απαιτεί αφηρημένη σκέψη, όχι απλή αναγνώριση προτύπων. Το Grok-3 πέτυχε 93.3% σε αυτό το benchmark.
MATH
94.4%
MATH: Μαθηματική επίλυση προβλημάτων. Ένα ολοκληρωμένο μαθηματικό benchmark που δοκιμάζει επίλυση προβλημάτων σε άλγεβρα, γεωμετρία, λογισμό και άλλους μαθηματικούς τομείς. Απαιτεί πολυβηματική συλλογιστική και τυπική μαθηματική γνώση. Το Grok-3 πέτυχε 94.4% σε αυτό το benchmark.
GSM8k
98.7%
GSM8k: Μαθηματικά δημοτικού 8K. 8.500 μαθηματικά προβλήματα κειμένου επιπέδου δημοτικού που απαιτούν πολυβηματική συλλογιστική. Δοκιμάζει βασική αριθμητική και λογική σκέψη μέσω σεναρίων πραγματικής ζωής όπως ψώνια ή υπολογισμοί χρόνου. Το Grok-3 πέτυχε 98.7% σε αυτό το benchmark.
MGSM
92.4%
MGSM: Πολύγλωσσα μαθηματικά δημοτικού. Το GSM8k benchmark μεταφρασμένο σε 10 γλώσσες, συμπεριλαμβανομένων Ισπανικών, Γαλλικών, Γερμανικών, Ρωσικών, Κινεζικών και Ιαπωνικών. Δοκιμάζει μαθηματική συλλογιστική σε διάφορες γλώσσες. Το Grok-3 πέτυχε 92.4% σε αυτό το benchmark.
MathVista
71.3%
MathVista: Μαθηματική οπτική συλλογιστική. Δοκιμάζει την ικανότητα επίλυσης μαθηματικών προβλημάτων που περιλαμβάνουν οπτικά στοιχεία όπως διαγράμματα, γραφήματα, γεωμετρικά σχήματα και επιστημονικές εικόνες. Συνδυάζει οπτική κατανόηση με μαθηματική συλλογιστική. Το Grok-3 πέτυχε 71.3% σε αυτό το benchmark.
SWE-Bench
49%
SWE-Bench: Benchmark μηχανικής λογισμικού. Τα μοντέλα AI προσπαθούν να επιλύσουν πραγματικά GitHub issues σε έργα ανοικτού κώδικα Python με ανθρώπινη επαλήθευση. Δοκιμάζει πρακτικές δεξιότητες μηχανικής λογισμικού σε παραγωγικές βάσεις κώδικα. Τα κορυφαία μοντέλα πήγαν από 4,4% το 2023 σε πάνω από 70% το 2024. Το Grok-3 πέτυχε 49% σε αυτό το benchmark.
HumanEval
94.5%
HumanEval: Προβλήματα προγραμματισμού Python. 164 χειρόγραφα προβλήματα προγραμματισμού όπου τα μοντέλα πρέπει να δημιουργήσουν σωστές υλοποιήσεις συναρτήσεων Python. Κάθε λύση επαληθεύεται με unit tests. Τα κορυφαία μοντέλα τώρα επιτυγχάνουν 90%+ ακρίβεια. Το Grok-3 πέτυχε 94.5% σε αυτό το benchmark.
LiveCodeBench
79.4%
LiveCodeBench: Live coding benchmark. Δοκιμάζει ικανότητες κωδικοποίησης σε συνεχώς ενημερωμένες, πραγματικές προκλήσεις προγραμματισμού. Σε αντίθεση με στατικά benchmarks, χρησιμοποιεί φρέσκα προβλήματα για να αποτρέψει τη μόλυνση δεδομένων και να μετρήσει πραγματικές δεξιότητες κωδικοποίησης. Το Grok-3 πέτυχε 79.4% σε αυτό το benchmark.
MMMU
78%
MMMU: Πολυτροπική κατανόηση. Μαζικό πολυ-τομεακό πολυτροπικό benchmark κατανόησης που δοκιμάζει μοντέλα όρασης-γλώσσας σε προβλήματα επιπέδου πανεπιστημίου σε 30 θέματα που απαιτούν τόσο κατανόηση εικόνας όσο και ειδική γνώση. Το Grok-3 πέτυχε 78% σε αυτό το benchmark.
MMMU Pro
58.5%
MMMU Pro: MMMU Επαγγελματική έκδοση. Βελτιωμένη έκδοση του MMMU με πιο απαιτητικές ερωτήσεις και αυστηρότερη αξιολόγηση. Δοκιμάζει προηγμένη πολυτροπική συλλογιστική σε επαγγελματικά και εξειδικευμένα επίπεδα. Το Grok-3 πέτυχε 58.5% σε αυτό το benchmark.
ChartQA
89.2%
ChartQA: Ερωτήσεις-απαντήσεις διαγραμμάτων. Δοκιμάζει την ικανότητα κατανόησης και συλλογιστικής πληροφοριών που παρουσιάζονται σε διαγράμματα και γραφήματα. Απαιτεί εξαγωγή δεδομένων, σύγκριση τιμών και εκτέλεση υπολογισμών από οπτικές αναπαραστάσεις δεδομένων. Το Grok-3 πέτυχε 89.2% σε αυτό το benchmark.
DocVQA
92.4%
DocVQA: Οπτική Q&A εγγράφων. Document Visual Question Answering benchmark που δοκιμάζει την ικανότητα εξαγωγής και συλλογιστικής πληροφοριών από εικόνες εγγράφων, συμπεριλαμβανομένων φορμών, αναφορών και σαρωμένου κειμένου. Το Grok-3 πέτυχε 92.4% σε αυτό το benchmark.
Terminal-Bench
52%
Terminal-Bench: Εργασίες Terminal/CLI. Δοκιμάζει την ικανότητα εκτέλεσης λειτουργιών γραμμής εντολών, γραφής shell scripts και πλοήγησης σε περιβάλλοντα τερματικού. Μετρά πρακτικές δεξιότητες διαχείρισης συστήματος και ροών εργασίας ανάπτυξης. Το Grok-3 πέτυχε 52% σε αυτό το benchmark.
ARC-AGI
12.5%
ARC-AGI: Αφαίρεση και συλλογιστική. Abstraction and Reasoning Corpus for AGI - δοκιμάζει ρευστή νοημοσύνη μέσω νέων παζλ αναγνώρισης προτύπων. Κάθε εργασία απαιτεί ανακάλυψη του υποκείμενου κανόνα από παραδείγματα, μετρώντας γενική ικανότητα συλλογιστικής αντί απομνημόνευσης. Το Grok-3 πέτυχε 12.5% σε αυτό το benchmark.

Σχετικά με το Grok-3

Μάθετε για τις δυνατότητες, τα χαρακτηριστικά του Grok-3 και πώς μπορεί να σας βοηθήσει να επιτύχετε καλύτερα αποτελέσματα.

Frontier Reasoning και Ευφυΐα

Το Grok-3 είναι το flagship frontier model της xAI, αντιπροσωπεύοντας ένα σημαντικό άλμα στην υπολογιστική κλίμακα και τη λογική. Εκπαιδευμένο στον υπερυπολογιστικό cluster Colossus με πάνω από 100.000 NVIDIA H100 GPU, χειρίζεται σύνθετες μαθηματικές και επιστημονικές προκλήσεις. Το μοντέλο διαθέτει ένα εξειδικευμένο reasoning mode που χρησιμοποιεί επιπλέον υπολογιστική ισχύ για να επαληθεύσει τη δική του λογική πριν παρέχει μια τελική απόκριση.

Ενσωμάτωση γνώσης σε πραγματικό χρόνο

Ένα πρωταρχικό διαφοροποιητικό στοιχείο είναι η εγγενής ενσωμάτωσή του με την πλατφόρμα X. Αυτό επιτρέπει στο Grok-3 να έχει πρόσβαση σε έκτακτες ειδήσεις, οικονομικές αλλαγές και παγκόσμιες τάσεις με χαμηλότερο latency από μοντέλα που βασίζονται σε τυπικό web crawling. Σε συνδυασμό με ένα 1 million token context window, επιτρέπει στους ερευνητές να συνθέτουν τεράστιες ποσότητες δεδομένων της τελευταίας στιγμής.

Multimodal και Agentic Δυνατότητες

Πέρα από το κείμενο, το Grok-3 είναι ένα ισχυρό vision μοντέλο ικανό να ερμηνεύει τεχνικά διαγράμματα, σχέδια και οπτικά δεδομένα. Υποστηρίζει προηγμένο function calling για χρήση σε αυτόνομη agentic συμπεριφορά. Με σκορ 83,9% στο SWE-Bench Verified, είναι ένα από τα πιο ικανά μοντέλα για την επίλυση προβλημάτων μηχανικής λογισμικού του πραγματικού κόσμου.

Grok-3

Περιπτώσεις χρήσης για Grok-3

Ανακαλύψτε τους διαφορετικούς τρόπους που μπορείτε να χρησιμοποιήσετε το Grok-3 για εξαιρετικά αποτελέσματα.

Ανάλυση αγοράς σε πραγματικό χρόνο

Χρησιμοποιεί ζωντανά δεδομένα από το X για την ανάλυση του χρηματοοικονομικού κλίματος και των έκτακτων ειδήσεων για επενδυτές.

Επιστημονική έρευνα επιπέδου PhD

Επιλύει προβλήματα STEM επιπέδου μεταπτυχιακών σπουδών και αναλύει πυκνή βιβλιογραφία με τη χρήση reasoning modes.

Ανταγωνιστική ανάπτυξη λογισμικού

Δημιουργεί κώδικα παραγωγικού επιπέδου και επιλύει issues στο GitHub με υψηλή ακρίβεια.

Σύνθετες μαθηματικές αποδείξεις

Χρησιμοποιεί test-time compute για την επίλυση μαθηματικών προβλημάτων επιπέδου ολυμπιάδας που απαιτούν λογική πολλαπλών βημάτων.

Ερμηνεία τεχνικών εγγράφων

Αναλύει σχέδια και τεχνικά εγχειρίδια μέσω του multimodal vision συστήματός του.

Λογική αυτόνομων agent

Λειτουργεί ως ο γνωστικός πυρήνας για agent που απαιτούν σχεδιασμό υψηλής πιστότητας και χρήση εργαλείων.

Δυνατά σημεία

Περιορισμοί

Reasoning επιπέδου Ολυμπιάδας: Πέτυχε τέλειο σκορ 100% στο benchmark μαθηματικών AIME 2025 χρησιμοποιώντας το Deep Thinking mode.
Υψηλό περιβαλλοντικό αποτύπωμα: Η εκπαίδευση απαιτούσε 200.000 GPU και κατανάλωσε περίπου 150MW ενέργειας, εγείροντας ανησυχίες για τη βιωσιμότητα.
Τεράστια χωρητικότητα context: Προσφέρει 1 εκατομμύριο token context window, επιτρέποντας την εισαγωγή ολόκληρων βιβλιοθηκών ή project λογισμικού.
Premium API τιμολόγηση: Με $15 ανά εκατομμύριο output tokens, είναι σημαντικά ακριβότερο από μικρότερες frontier εναλλακτικές λύσεις.
Ασυναγώνιστα δεδομένα σε πραγματικό χρόνο: Η άμεση ενσωμάτωση με το X παρέχει τη φρεσκότερη ροή δεδομένων από οποιοδήποτε άλλο διαθέσιμο AI μοντέλο.
Όρια output tokens: Οι αποκρίσεις περιορίζονται γενικά στα 4.096 tokens, γεγονός που μπορεί να περικόψει εξαιρετικά μεγάλες αναφορές ή αρχεία κώδικα.
Υψηλή ακρίβεια κώδικα: Σημείωσε 83,9% στο SWE-Bench Verified, ξεπερνώντας τους σημαντικότερους ανταγωνιστές στην επίλυση σύνθετων GitHub issues.
Περιορισμοί πρόσβασης: Οι πλήρεις δυνατότητες του μοντέλου και τα API keys συχνά περιορίζονται σε συνδρομητές X Premium Plus ή σε συγκεκριμένες γεωγραφικές περιοχές.

Γρήγορη εκκίνηση API

xai/grok-3

Προβολή τεκμηρίωσης
xai SDK
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XAI_API_KEY,
  baseURL: "https://api.x.ai/v1",
});

async function main() {
  const completion = await client.chat.completions.create({
    model: "grok-3",
    messages: [{ role: "user", content: "Analyze the current market sentiment for Nvidia on X." }],
  });

  console.log(completion.choices[0].message.content);
}

main();

Εγκαταστήστε το SDK και αρχίστε να κάνετε κλήσεις API σε λίγα λεπτά.

Τι λένε οι άνθρωποι για το Grok-3

Δείτε τι πιστεύει η κοινότητα για το Grok-3

Το Grok-3 [είναι] το καλύτερο AI μοντέλο για traders και επενδυτές λόγω της ανάλυσης sentiment σε πραγματικό χρόνο.
Austin Starks
reddit
Κατάφερε να επιλύσει μερικά δύσκολα prompts συμπλήρωσης κώδικα HVM στα οποία απέτυχαν το Gemini και το Sonnet. Νιώθω ένα επίπεδο 'ποιότητας' υψηλότερο από το Sonnet-3.5.
Victor Taelin
twitter
Η ταχύτητα είναι απίστευτη. Reasoning, πληροφορίες σε πραγματικό χρόνο, φαίνεται να είναι το ταχύτερο flagship μοντέλο εκεί έξω αυτή τη στιγμή.
Matthew Berman
youtube
Το Grok έχει πρόσβαση σε δεδομένα πραγματικού χρόνου και μια προθυμία να πάει εκεί που άλλα μοντέλα δεν θα πάνε, καθιστώντας το την 'τολμηρή' επιλογή για power users.
Beginning-Willow-801
reddit
Η απόδοση του Grok-3 στο GPQA είναι αξιοσημείωτη. Σίγουρα διεκδικεί την κορυφαία θέση στο reasoning.
EpochAIResearch
twitter
Το 1M context window όντως λειτουργεί. Διαχειρίστηκε ολόκληρη τη legacy βάση κώδικά μου χωρίς να χάσει το context στα αρχικά prompts.
DevGuru42
hackernews

Βίντεο για το Grok-3

Δείτε οδηγούς, κριτικές και συζητήσεις για το Grok-3

Εισαγωγή στο Grok-3 και την κλίμακα εκπαίδευσής του.

Το μοντέλο είναι χτισμένο για ευφυΐα και αναζήτηση της αλήθειας.

Το reasoning του Grok 3... φαίνεται να κερδίζει τόσο το o1 της OpenAI όσο και το μοντέλο R1 της DeepSeek σε επιστημονικά benchmarks.

Η απόδοση στο benchmark MMLU δείχνει ότι είναι ένα κορυφαίο μοντέλο.

Το Grok 3 θα επιχειρεί επίσης να λύσει άλυτα προβλήματα... ενώ άλλα μοντέλα απλώς θα δηλώνουν ότι είναι άλυτα.

Ο Elon Musk ισχυρίζεται ότι αυτό είναι το πιο ισχυρό AI μέχρι σήμερα.

Το Grok 3 κατέλαβε την κορυφαία θέση σε αυτό το τυφλό τεστ, καθιστώντας το τον τρέχοντα πρωταθλητή στο Chatbot Arena.

Η ενσωμάτωση με το X παρέχει ένα ξεκάθαρο πλεονέκτημα στην επικαιρότητα.

Οι multimodal δυνατότητες είναι σημαντικά βελτιωμένες σε σχέση με το Grok-2.

Η πιο ισχυρή έκδοση του Grok και η πιο πρόσφατη θα είναι η έκδοση για το web στο grok.com.

Εξερευνώντας την τεχνική αρχιτεκτονική του cluster Colossus.

Συζήτηση για την τεράστια εκπαιδευτική διαδρομή σε 100k H100 GPU.

Το 'Big Brain' είναι ένα χαρακτηριστικό πραγματικά μοναδικό στο Grok 3... επιτρέπει στους χρήστες να χρησιμοποιούν πολλαπλά reasoning agents για την επίλυση σύνθετων προβλημάτων.

Η ανάπτυξη του Grok 3 επιταχύνθηκε από τον υπερυπολογιστή Colossus του X, ο οποίος χρησιμοποίησε 100.000 Nvidia H100 GPU στη Φάση 1.

Τελικές σκέψεις για το γιατί το Grok-3 αποτελεί ένα μεγάλο βήμα προς τη διαφάνεια τύπου open-weights.

Περισσότερα από απλά prompts

Ενισχύστε τη ροή εργασίας σας με Αυτοματισμό AI

Το Automatio συνδυάζει τη δύναμη των AI agents, του web automation και των έξυπνων ενσωματώσεων για να σας βοηθήσει να επιτύχετε περισσότερα σε λιγότερο χρόνο.

AI Agents
Web Automation
Έξυπνες ροές εργασίας

Επαγγελματικές συμβουλές για Grok-3

Εξειδικευμένες συμβουλές για να αξιοποιήσετε στο έπακρο το Grok-3 και να επιτύχετε καλύτερα αποτελέσματα.

Αξιοποιήστε το Deep Search

Χρησιμοποιήστε το deep search για ερωτήματα σχετικά με ειδήσεις της τελευταίας ώρας για τα πιο ακριβή αποτελέσματα.

Ενεργοποιήστε το High Reasoning

Ορίστε το reasoning effort σε «high» για μαθηματικούς γρίφους ώστε να ενεργοποιηθούν τα βήματα αυτο-επαλήθευσης.

Χρησιμοποιήστε το Collections API

Ανεβάστε ευαίσθητα έγγραφα στο Collections API για να διατηρήσετε τα δεδομένα σας εκτός των κύκλων εκπαίδευσης.

Μαρτυρίες

Τι λένε οι χρήστες μας

Ενταχθείτε στις χιλιάδες ικανοποιημένων χρηστών που έχουν μεταμορφώσει τη ροή εργασίας τους

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Σχετικά AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Συχνές ερωτήσεις για Grok-3

Βρείτε απαντήσεις σε συνηθισμένες ερωτήσεις σχετικά με το Grok-3