anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 offre des performances de pointe pour le codage et le computer use avec une context window massive de 1M de tokens pour seulement 3 $/1M de...

AI AgentiqueMultimodalCodageComputer UseContext long
anthropic logoanthropicClaude 417 février 2026
Contexte
1.0Mtokens
Sortie max.
64Ktokens
Prix entrée
$3.00/ 1M
Prix sortie
$15.00/ 1M
Modalité:TextImageAudioVideo
Capacités:VisionOutilsStreamingRaisonnement
Benchmarks
GPQA
89.9%
GPQA: Questions-Réponses Scientifiques Niveau Doctorat. Un benchmark rigoureux avec 448 questions à choix multiples en biologie, physique et chimie créées par des experts du domaine. Les experts en doctorat n'atteignent que 65-74% de précision, tandis que les non-experts obtiennent seulement 34% même avec un accès web illimité (d'où le terme 'résistant à Google'). Claude Sonnet 4.6 a obtenu 89.9% sur ce benchmark.
HLE
49%
HLE: Raisonnement d'Expertise de Haut Niveau. Teste la capacité d'un modèle à démontrer un raisonnement de niveau expert dans des domaines spécialisés. Évalue la compréhension approfondie de sujets complexes nécessitant des connaissances de niveau professionnel. Claude Sonnet 4.6 a obtenu 49% sur ce benchmark.
MMLU
89.3%
MMLU: Compréhension Linguistique Multitâche Massive. Un benchmark complet avec 16 000 questions à choix multiples couvrant 57 matières académiques incluant les mathématiques, la philosophie, le droit et la médecine. Teste les connaissances générales et les capacités de raisonnement. Claude Sonnet 4.6 a obtenu 89.3% sur ce benchmark.
MMLU Pro
79.2%
MMLU Pro: MMLU Édition Professionnelle. Une version améliorée du MMLU avec 12 032 questions utilisant un format plus difficile à 10 options. Couvre les mathématiques, la physique, la chimie, le droit, l'ingénierie, l'économie, la santé, la psychologie, les affaires, la biologie, la philosophie et l'informatique. Claude Sonnet 4.6 a obtenu 79.2% sur ce benchmark.
SimpleQA
48.5%
SimpleQA: Benchmark de Précision Factuelle. Teste la capacité d'un modèle à fournir des réponses précises et factuelles à des questions directes. Mesure la fiabilité et réduit les hallucinations dans les tâches de récupération de connaissances. Claude Sonnet 4.6 a obtenu 48.5% sur ce benchmark.
IFEval
89.5%
IFEval: Évaluation du Suivi d'Instructions. Mesure la capacité d'un modèle à suivre des instructions et contraintes spécifiques. Teste la capacité à respecter les règles de formatage, les limites de longueur et autres exigences explicites. Claude Sonnet 4.6 a obtenu 89.5% sur ce benchmark.
AIME 2025
83%
AIME 2025: Examen d'Invitation Américain en Mathématiques. Problèmes mathématiques de niveau compétition issus du prestigieux examen AIME conçu pour les lycéens talentueux. Teste la résolution de problèmes mathématiques avancés nécessitant un raisonnement abstrait, pas simplement de la correspondance de motifs. Claude Sonnet 4.6 a obtenu 83% sur ce benchmark.
MATH
85.3%
MATH: Résolution de Problèmes Mathématiques. Un benchmark mathématique complet testant la résolution de problèmes en algèbre, géométrie, calcul et autres domaines mathématiques. Nécessite un raisonnement en plusieurs étapes et des connaissances mathématiques formelles. Claude Sonnet 4.6 a obtenu 85.3% sur ce benchmark.
GSM8k
96.4%
GSM8k: Mathématiques Niveau Primaire 8K. 8 500 problèmes de mathématiques niveau primaire nécessitant un raisonnement en plusieurs étapes. Teste l'arithmétique de base et la pensée logique à travers des scénarios réels comme les achats ou les calculs de temps. Claude Sonnet 4.6 a obtenu 96.4% sur ce benchmark.
MGSM
92.8%
MGSM: Mathématiques Niveau Primaire Multilingue. Le benchmark GSM8k traduit en 10 langues incluant l'espagnol, le français, l'allemand, le russe, le chinois et le japonais. Teste le raisonnement mathématique dans différentes langues. Claude Sonnet 4.6 a obtenu 92.8% sur ce benchmark.
MathVista
68.7%
MathVista: Raisonnement Mathématique Visuel. Teste la capacité à résoudre des problèmes mathématiques impliquant des éléments visuels comme les graphiques, les diagrammes de géométrie et les figures scientifiques. Combine la compréhension visuelle avec le raisonnement mathématique. Claude Sonnet 4.6 a obtenu 68.7% sur ce benchmark.
SWE-Bench
79.6%
SWE-Bench: Benchmark d'Ingénierie Logicielle. Les modèles d'IA tentent de résoudre de vrais problèmes GitHub dans des projets Python open-source avec vérification humaine. Teste les compétences pratiques en ingénierie logicielle sur des bases de code en production. Les meilleurs modèles sont passés de 4,4% en 2023 à plus de 70% en 2024. Claude Sonnet 4.6 a obtenu 79.6% sur ce benchmark.
HumanEval
92.1%
HumanEval: Problèmes de Programmation Python. 164 problèmes de programmation écrits à la main où les modèles doivent générer des implémentations de fonctions Python correctes. Chaque solution est vérifiée par des tests unitaires. Les meilleurs modèles atteignent maintenant plus de 90% de précision. Claude Sonnet 4.6 a obtenu 92.1% sur ce benchmark.
LiveCodeBench
72.4%
LiveCodeBench: Benchmark de Code en Direct. Teste les capacités de codage sur des défis de programmation réels continuellement mis à jour. Contrairement aux benchmarks statiques, utilise des problèmes frais pour éviter la contamination des données et mesurer les vraies compétences de codage. Claude Sonnet 4.6 a obtenu 72.4% sur ce benchmark.
MMMU
74.2%
MMMU: Compréhension Multimodale. Benchmark de Compréhension Multimodale Multi-discipline Massive testant les modèles vision-langage sur des problèmes universitaires dans 30 matières nécessitant à la fois la compréhension d'images et des connaissances expertes. Claude Sonnet 4.6 a obtenu 74.2% sur ce benchmark.
MMMU Pro
75.6%
MMMU Pro: MMMU Édition Professionnelle. Version améliorée du MMMU avec des questions plus difficiles et une évaluation plus stricte. Teste le raisonnement multimodal avancé aux niveaux professionnel et expert. Claude Sonnet 4.6 a obtenu 75.6% sur ce benchmark.
ChartQA
88.1%
ChartQA: Questions-Réponses sur Graphiques. Teste la capacité à comprendre et raisonner sur les informations présentées dans les graphiques. Nécessite l'extraction de données, la comparaison de valeurs et l'exécution de calculs à partir de représentations visuelles de données. Claude Sonnet 4.6 a obtenu 88.1% sur ce benchmark.
DocVQA
93.4%
DocVQA: Q&R Visuelle sur Documents. Benchmark de Questions-Réponses Visuelles sur Documents testant la capacité à extraire et raisonner sur les informations des images de documents incluant les formulaires, rapports et textes numérisés. Claude Sonnet 4.6 a obtenu 93.4% sur ce benchmark.
Terminal-Bench
59.1%
Terminal-Bench: Tâches Terminal/CLI. Teste la capacité à effectuer des opérations en ligne de commande, écrire des scripts shell et naviguer dans les environnements terminal. Mesure les compétences pratiques en administration système et flux de travail de développement. Claude Sonnet 4.6 a obtenu 59.1% sur ce benchmark.
ARC-AGI
58.3%
ARC-AGI: Abstraction et Raisonnement. Corpus d'Abstraction et de Raisonnement pour l'AGI - teste l'intelligence fluide à travers des puzzles de reconnaissance de motifs nouveaux. Chaque tâche nécessite de découvrir la règle sous-jacente à partir d'exemples, mesurant la capacité de raisonnement général plutôt que la mémorisation. Claude Sonnet 4.6 a obtenu 58.3% sur ce benchmark.

À propos de Claude Sonnet 4.6

Découvrez les capacités, fonctionnalités et façons d'utiliser Claude Sonnet 4.6.

Intelligence agentique haute performance

Claude Sonnet 4.6 est le model le plus polyvalent d'Anthropic, conçu pour agir comme moteur principal pour des flux de travail d'entreprise complexes et des agents autonomes. Lancé le 17 février 2026, il introduit des capacités de computer use de niveau humain et une context window de 1 million de tokens. L'architecture du model équilibre la vitesse des systèmes de milieu de gamme avec la profondeur de raisonnement normalement réservée à la classe Opus, ce qui en fait un choix durable pour les environnements de production à haut volume.

Raisonnement adaptatif et multimodalité

Au cœur de sa technique, Sonnet 4.6 utilise un mécanisme de Adaptive Thinking. Cela permet aux développeurs de mettre à l'échelle l'effort de raisonnement interne en fonction des exigences spécifiques d'une tâche, en optimisant soit la latence sous-seconde, soit la vérification logique approfondie. Le model est nativement multimodal, offrant des performances de pointe dans le traitement de texte, d'images haute résolution et de fichiers audio. Il excelle dans l'interprétation de documentation technique dense et de données visuelles complexes, telles que des plans architecturaux ou des graphiques financiers.

Le standard industriel pour le codage

Avec un score record de 79,6 % sur SWE-bench Verified, Sonnet 4.6 est devenu le choix par défaut pour l'automatisation de l'ingénierie logicielle. Sa capacité à raisonner à travers de vastes bases de code au sein de sa context window de 1M de tokens lui permet de résoudre des bugs multi-fichiers et de planifier des refontes architecturales avec une intervention humaine minimale. En offrant une intelligence proche du niveau Opus à 3 $ par million de tokens d'entrée, il supprime les barrières financières auparavant associées au déploiement de systèmes AI véritablement autonomes.

Claude Sonnet 4.6

Cas d'utilisation de Claude Sonnet 4.6

Découvrez les différentes façons d'utiliser Claude Sonnet 4.6 pour obtenir d'excellents résultats.

Ingénierie logicielle autonome

Résolution de problèmes GitHub complexes impliquant plusieurs fichiers et exécution de refontes de dépôts complets en s'appuyant sur sa précision de 79,6 % au SWE-bench.

Computer use de niveau humain

Navigation directe dans des logiciels de bureau et des interfaces web pour accomplir des tâches administratives multi-étapes sans intégrations API personnalisées.

Analyse de documents à grande échelle

Examen simultané de milliers de pages de contrats juridiques ou d'articles de recherche au sein de la context window de 1 million de tokens.

Intelligence financière et prévisions

Traitement des résultats financiers et des rapports trimestriels pour identifier des anomalies subtiles du marché grâce à un raisonnement adaptatif à effort élevé.

Support technique multimodal

Interprétation de schémas techniques complexes, de photos de circuits imprimés et d'enregistrements audio pour fournir des étapes de dépannage précises.

Stratégie commerciale agentique

Planification et exécution d'opérations à long terme en tirant parti des meilleurs scores sur les benchmarks de stratégie et de logique.

Points forts

Limitations

Précision de codage d'élite: Établit la référence de l'industrie avec 79,6 % sur SWE-bench Verified, surpassant tous les autres models de milieu de gamme et la plupart des frontier models.
Absence d'entrée vidéo native: Nécessite une extraction manuelle d'images pour le traitement visuel de fichiers vidéo, complexifiant les flux de travail multimédia.
Capacité de contexte inégalée: La fenêtre de 1 million de tokens permet l'ingestion de bibliothèques techniques entières ou de bases de code massives sans dégradation des performances.
Latence de raisonnement accrue: L'utilisation d'un raisonnement adaptatif à effort élevé augmente considérablement le time-to-first-token par rapport à une inference standard.
Computer use autonome: Atteint un score de 72,5 % sur OSWorld, permettant au model de naviguer dans des GUI complexes et des outils logiciels comme un opérateur virtuel.
Coûts de raisonnement de sortie élevés: Bien que la tarification à l'entrée soit compétitive, les tâches de raisonnement à effort maximal peuvent consommer de grandes quantités de tokens de sortie, augmentant ainsi les coûts.
Rapport prix-performance optimisé: Offre des niveaux d'intelligence proches d'Opus pour 1/5ème du coût, ce qui en fait le choix le plus économique pour les déploiements d'agents à grande échelle.
Bruit de récupération de contexte: À la limite de 1M de tokens, le model peut occasionnellement souffrir d'une perte de concentration si le contexte est rempli de données non pertinentes.

Démarrage rapide API

anthropic/claude-sonnet-4-6

Voir la documentation
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analyze this repository for architectural bottlenecks." }
  ],
});

console.log(response.content[0].text);

Installez le SDK et commencez à faire des appels API en quelques minutes.

Ce que les gens disent de Claude Sonnet 4.6

Voyez ce que la communauté pense de Claude Sonnet 4.6

Le contexte est du bruit. Les fenêtres de tokens plus grandes sont un piège. Donnez aux agents uniquement le signal étroit et curaté dont ils ont besoin.
Logical-Storm-1180
reddit
Voici Claude Sonnet 4.6 : notre model Sonnet le plus performant à ce jour. C'est une mise à jour complète en matière de codage, de computer use et de planification agentique.
Claude
twitter
Le rapport performance-coût de Claude Sonnet 4.6 est extraordinaire, difficile d'exagérer la vitesse à laquelle ces models évoluent.
Replit
youtube
Sonnet 4.6 est désormais en ligne dans Claude Code. Il est moins cher qu'Opus 4.6 et se rapproche de l'intelligence d'Opus.
Boris Cherny
twitter
Claude 4.6 est le nouveau leader en performance agentique, légèrement devant Opus 4.6 sur des tâches de travail intellectuel du monde réel.
Artificial Analysis
twitter
Le fait que ce model puisse naviguer dans une interface informatique avec 72 % de précision met pratiquement fin au besoin de la plupart des API sur mesure.
DevOpsGuru
hackernews

Vidéos sur Claude Sonnet 4.6

Regardez des tutoriels, critiques et discussions sur Claude Sonnet 4.6

Sonnet 4.6 est là et pourrait remplacer Opus pour 90 % de ce que vous faites au quotidien.

Mais le meilleur point, c'est qu'il est 40 % moins cher que d'utiliser Opus 4.6.

Les résultats au SWE-bench sont incroyables pour un model de milieu de gamme.

Vous pouvez efficacement lui fournir une base de code entière sans qu'il perde le fil.

L'effort de réflexion adaptatif vous permet de sacrifier un peu de vitesse pour une logique plus approfondie.

Les premiers utilisateurs rapportent qu'il est capable d'une performance proche de celle d'un humain sur la manipulation de tableurs complexes.

Ce model est environ deux fois plus rapide par rapport à Opus.

La context window de 1 million de tokens est actuellement en bêta mais fonctionne très bien.

Il navigue dans les interfaces logicielles sans avoir besoin d'intégrations API spécifiques.

La capacité de codage en Python et JavaScript atteint pratiquement le plafond.

Anthropic affirme que la nouvelle context window est assez grande pour contenir des bases de code entières et raisonner efficacement à travers tout ce contexte.

Opus 4.6 est l'option 'nucléaire'... mais nous avons enfin un scalpel, ce qui est une excellente nouvelle.

Le computer use est la fonctionnalité marquante ici, capable de déplacer la souris et de taper au clavier.

Les analystes financiers vont adorer la profondeur de raisonnement pour l'examen de documents.

C'est la première fois qu'un model 'Sonnet' semble être le meilleur de sa catégorie.

Plus que de simples prompts

Optimisez votre flux de travail avec l'Automatisation IA

Automatio combine la puissance des agents IA, de l'automatisation web et des integrations intelligentes pour vous aider a accomplir plus en moins de temps.

Agents IA
Automatisation Web
Flux Intelligents

Conseils Pro pour Claude Sonnet 4.6

Conseils d'experts pour tirer le meilleur parti de Claude Sonnet 4.6.

Optimiser l'effort de réflexion

Utilisez le mode de réflexion 'adaptive' pour économiser sur des requêtes simples tout en réservant l'effort 'max' pour les tâches de mathématiques et de logique.

Implémenter la compaction de contexte

Activez les fonctionnalités de prompt caching et de compaction pour gérer efficacement la fenêtre de 1M de tokens sans coûts redondants.

Ancrage comportemental structuré

Utilisez un fichier markdown de projet central pour maintenir une source de vérité persistante concernant les décisions architecturales du model.

Extraction d'images vidéo

La vidéo native n'étant pas prise en charge, extrayez des images clés à 1 image par seconde pour une analyse visuelle la plus précise possible du contenu vidéo.

Témoignages

Ce Que Disent Nos Utilisateurs

Rejoignez des milliers d'utilisateurs satisfaits qui ont transforme leur flux de travail

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Associés AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Questions Fréquentes sur Claude Sonnet 4.6

Trouvez des réponses aux questions courantes sur Claude Sonnet 4.6