anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6は、コーディングとcomputer useのための最先端のパフォーマンスを提供し、巨大な1M tokenのcontext windowを100万tokenあたりわずか3ドルで利用可能です。

エージェント型AIマルチモーダルコーディングComputer Useロングコンテキスト
anthropic logoanthropicClaude 42026年2月17日
コンテキスト
1.0Mトークン
最大出力
64Kトークン
入力価格
$3.00/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
89.9%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Sonnet 4.6はこのベンチマークで89.9%を記録しました。
HLE
49%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude Sonnet 4.6はこのベンチマークで49%を記録しました。
MMLU
89.3%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Sonnet 4.6はこのベンチマークで89.3%を記録しました。
MMLU Pro
79.2%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Sonnet 4.6はこのベンチマークで79.2%を記録しました。
SimpleQA
48.5%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude Sonnet 4.6はこのベンチマークで48.5%を記録しました。
IFEval
89.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Sonnet 4.6はこのベンチマークで89.5%を記録しました。
AIME 2025
83%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Sonnet 4.6はこのベンチマークで83%を記録しました。
MATH
85.3%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Sonnet 4.6はこのベンチマークで85.3%を記録しました。
GSM8k
96.4%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Sonnet 4.6はこのベンチマークで96.4%を記録しました。
MGSM
92.8%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Sonnet 4.6はこのベンチマークで92.8%を記録しました。
MathVista
68.7%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Sonnet 4.6はこのベンチマークで68.7%を記録しました。
SWE-Bench
79.6%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Sonnet 4.6はこのベンチマークで79.6%を記録しました。
HumanEval
92.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Sonnet 4.6はこのベンチマークで92.1%を記録しました。
LiveCodeBench
72.4%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Sonnet 4.6はこのベンチマークで72.4%を記録しました。
MMMU
74.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Sonnet 4.6はこのベンチマークで74.2%を記録しました。
MMMU Pro
75.6%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Sonnet 4.6はこのベンチマークで75.6%を記録しました。
ChartQA
88.1%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Sonnet 4.6はこのベンチマークで88.1%を記録しました。
DocVQA
93.4%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Sonnet 4.6はこのベンチマークで93.4%を記録しました。
Terminal-Bench
59.1%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Sonnet 4.6はこのベンチマークで59.1%を記録しました。
ARC-AGI
58.3%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Sonnet 4.6はこのベンチマークで58.3%を記録しました。

Claude Sonnet 4.6について

Claude Sonnet 4.6の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

高性能なエージェント型知能

Claude Sonnet 4.6は、複雑なエンタープライズワークフローや自律型agentの主要エンジンとして設計された、Anthropicで最も汎用性の高いモデルです。2026年2月17日にリリースされたこのモデルは、人間レベルのcomputer use機能と100万tokenのcontext windowを導入しています。ミドルティアシステムの速度と、本来Opusクラスに求められる深いreasoningを両立させており、大規模なプロダクション環境にとって持続可能な選択肢となります。

Adaptive Thinkingとマルチモーダル性

技術的な中核として、Sonnet 4.6はAdaptive Thinkingメカニズムを採用しています。これにより、開発者はタスクの特定の要件に基づいて内部的なreasoningの労力をスケーリングし、サブ秒のlatencyか、あるいは深い論理的検証のどちらかに最適化することが可能です。モデルはネイティブにmultimodalであり、テキスト、高解像度画像、音声ファイルの処理において最先端のパフォーマンスを発揮します。建築図面や財務グラフのような高密度な技術文書や複雑な視覚データの解釈に長けています。

コーディングの業界標準

SWE-bench Verifiedで79.6%という記録を打ち立てたSonnet 4.6は、ソフトウェアエンジニアリングの自動化においてデフォルトの選択肢となりました。1Mのcontext window内で広大なコードベース全体をreasoningできる能力により、最小限の人間による介入で、複数ファイルにまたがるバグの解決やアーキテクチャのリファクタリングを計画できます。入力tokens 100万あたり3ドルという価格でOpusに近い知能を提供することで、真に自律的なAIシステムを導入するための経済的な障壁を取り除きます。

Claude Sonnet 4.6

Claude Sonnet 4.6のユースケース

Claude Sonnet 4.6を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律的なソフトウェアエンジニアリング

SWE-benchでの79.6%の精度を活かし、複雑なGitHubの複数ファイルにわたる問題の解決や、リポジトリ全体のリファクタリングを実行します。

人間レベルのcomputer use

デスクトップソフトウェアやWebインターフェースを直接操作し、カスタムAPI統合なしで複数ステップの管理タスクを完了させます。

大規模な文書分析

100万tokenのcontext window内で、数千ページの法務契約書や研究論文を一度にレビューします。

金融インテリジェンスと予測

決算説明会資料や四半期報告書を処理し、高いadaptive reasoningを活用して市場の微細な変化を特定します。

マルチモーダルなテクニカルサポート

複雑な技術図面、回路基板の写真、録音音声を解釈し、正確なトラブルシューティングの手順を提供します。

エージェント型ビジネス戦略

戦略や論理ベースのbenchmarkでトップクラスのスコアを活用し、長期的な業務の計画立案と実行を行います。

強み

制限

エリートレベルのコーディング精度: SWE-bench Verifiedで79.6%を記録し、業界基準を確立。他のミドルティアモデルや多くのflagshipモデルを凌駕しています。
ネイティブビデオ入力の欠如: ビデオファイルの視覚処理には手動のフレーム抽出が必要となり、メディアワークフローが複雑になります。
圧倒的なcontext容量: 100万tokenのwindowにより、パフォーマンスを低下させることなく、技術ライブラリ全体や巨大なコードベースを読み込めます。
reasoningのlatency増大: 高負荷なadaptive reasoningを利用すると、標準的なinferenceと比較して、最初のtokenが出力されるまでの時間が大幅に増加します。
自律的なcomputer use: OSWorldで72.5%のスコアを達成し、仮想オペレーターとして複雑なGUIやソフトウェアツールを操作可能です。
高い出力reasoningコスト: 入力価格は競争力がありますが、最大負荷のreasoningタスクでは大量の出力tokensを消費し、コストが増大する可能性があります。
最適化された価格性能比: Opusに近い知能レベルを5分の1のコストで提供し、大規模なagent展開において最も経済的な選択肢となります。
contextのノイズによる影響: 1M tokenの制限に近い場合、無関係なデータでcontextが埋め尽くされると、モデルの集中力が低下することがあります。

APIクイックスタート

anthropic/claude-sonnet-4-6

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-sonnet-20260217",
  max_tokens: 4096,
  thinking: { type: "adaptive", effort: "high" },
  messages: [
    { role: "user", content: "Analyze this repository for architectural bottlenecks." }
  ],
});

console.log(response.content[0].text);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Sonnet 4.6についてのユーザーの声

Claude Sonnet 4.6についてコミュニティがどう思っているか見てください

Contextはノイズだ。大きなtoken windowは罠になり得る。エージェントには必要な狭く精選された情報だけを与えるべきだ。
Logical-Storm-1180
reddit
これがClaude Sonnet 4.6。これまでで最も能力の高いSonnetモデルだ。コーディング、computer use、エージェントの計画能力が全面的にアップグレードされている。
Claude
twitter
Claude Sonnet 4.6の性能対コスト比は並外れている。これらのモデルがどれほど急速に進化しているか、誇張しすぎることはないだろう。
Replit
youtube
Sonnet 4.6がClaude Codeで利用可能になった。Opus 4.6より安く、Opusレベルの知能に近い。
Boris Cherny
twitter
Claude 4.6はagenticなパフォーマンスにおける新たなリーダーであり、実際の知識作業タスクにおいてOpus 4.6をわずかに上回っている。
Artificial Analysis
twitter
このモデルが72%の精度でコンピュータインターフェースを操作できるという事実は、ほとんどの特注APIの必要性を終わらせるだろう。
DevOpsGuru
hackernews

Claude Sonnet 4.6についての動画

Claude Sonnet 4.6についてのチュートリアル、レビュー、ディスカッションを見る

Sonnet 4.6が登場し、日常業務の90%でOpusを置き換える可能性があります。

さらに素晴らしいのは、Opus 4.6を使用するよりも40%安い点です。

SWE-benchの結果は、ミドルティアのモデルとしては信じられないほどです。

事実上コードベース全体を入力しても、文脈を見失うことはありません。

Adaptive thinking effortにより、速度とより深い論理をトレードオフできます。

初期のユーザーからは、複雑なスプレッドシート操作において人間並みのパフォーマンスを発揮すると報告されています。

このモデルはOpusと比較して約2倍の速度です。

100万tokenのcontext windowは現在ベータ版ですが、非常にうまく機能します。

特定のAPI統合を必要とせずに、ソフトウェアインターフェースをナビゲートします。

PythonとJavaScriptにおけるコーディング能力は、ほぼ天井に達しています。

Anthropicは、新しいcontext windowはコードベース全体を保持し、そのcontext全体で効果的にreasoningできるほど巨大だと述べています。

Opus 4.6は核兵器のような選択肢でしたが、ようやくメスのような精密なツールを手に入れました。

Computer useはここで最も目立つ機能であり、実際にマウスを動かしてタイピングします。

金融アナリストは、ドキュメントレビューにおけるreasoningの深さを高く評価するでしょう。

「Sonnet」モデルがクラス最高の性能だと感じられたのは今回が初めてです。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Claude Sonnet 4.6のプロのヒント

Claude Sonnet 4.6を最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking effortの最適化

シンプルなクエリでは'adaptive'なthinkingモードを使用してコストを節約し、数学や論理タスクには'max'のeffortを割り当てましょう。

Context compactionの実装

prompt cachingとcompaction機能を有効にして、1M tokenのwindowを冗長なコストなしで効率的に活用しましょう。

構造的な行動のアンカリング

プロジェクトの主要なmarkdownファイルを活用し、モデルのアーキテクチャ上の決定事項に対する信頼できる唯一の情報源として維持しましょう。

ビデオフレームの抽出

ネイティブなビデオ入力はサポートされていないため、ビデオコンテンツの最も正確な視覚的分析を行うには、1fpsでキーフレームを抽出してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.40/$2.40/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M

Claude Sonnet 4.6についてのよくある質問

Claude Sonnet 4.6に関するよくある質問への回答を見つけてください