anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6は、コーディングやComputer Useにおいてfrontier performanceを提供します。わずか3ドル/100万tokensという低価格で、100万tokensの巨大なcontext windowを利用可能です。

Agentic AIMultimodalコーディングComputer UseLong Context
anthropic logoanthropicClaudeFebruary 17, 2026
コンテキスト
1.0Mトークン
最大出力
64Kトークン
入力価格
$3.00/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
89.9%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Sonnet 4.6はこのベンチマークで89.9%を記録しました。
HLE
49%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude Sonnet 4.6はこのベンチマークで49%を記録しました。
MMLU
89.3%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Sonnet 4.6はこのベンチマークで89.3%を記録しました。
MMLU Pro
79.2%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Sonnet 4.6はこのベンチマークで79.2%を記録しました。
SimpleQA
48.5%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude Sonnet 4.6はこのベンチマークで48.5%を記録しました。
IFEval
89.5%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Sonnet 4.6はこのベンチマークで89.5%を記録しました。
AIME 2025
83%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Sonnet 4.6はこのベンチマークで83%を記録しました。
MATH
85.3%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Sonnet 4.6はこのベンチマークで85.3%を記録しました。
GSM8k
96.4%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Sonnet 4.6はこのベンチマークで96.4%を記録しました。
MGSM
92.8%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Sonnet 4.6はこのベンチマークで92.8%を記録しました。
MathVista
68.7%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Sonnet 4.6はこのベンチマークで68.7%を記録しました。
SWE-Bench
79.6%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Sonnet 4.6はこのベンチマークで79.6%を記録しました。
HumanEval
92.1%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Sonnet 4.6はこのベンチマークで92.1%を記録しました。
LiveCodeBench
72.4%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Sonnet 4.6はこのベンチマークで72.4%を記録しました。
MMMU
74.2%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Sonnet 4.6はこのベンチマークで74.2%を記録しました。
MMMU Pro
75.6%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Sonnet 4.6はこのベンチマークで75.6%を記録しました。
ChartQA
88.1%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Sonnet 4.6はこのベンチマークで88.1%を記録しました。
DocVQA
93.4%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Sonnet 4.6はこのベンチマークで93.4%を記録しました。
Terminal-Bench
59.1%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Sonnet 4.6はこのベンチマークで59.1%を記録しました。
ARC-AGI
58.3%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Sonnet 4.6はこのベンチマークで58.3%を記録しました。

Claude Sonnet 4.6について

Claude Sonnet 4.6の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

知能における世代交代の飛躍

Claude Sonnet 4.6は、Anthropicがこれまでに開発した中で最も有能で多才なmodelであり、複雑なエンタープライズや開発者のワークフローを支える高性能な主力ツールとして設計されています。2026年2月17日にリリースされたこのモデルは、4.5シリーズからの大きな飛躍を遂げ、ベータ版として人間レベルのComputer Use能力と、巨大な100万tokensのcontext windowを導入しました。このmodelはagenticなタスクに最適化されており、単にテキストを処理するだけでなく、さまざまなソフトウェア環境にわたって多段階の操作を自律的に計画・実行することができます。

技術的な洗練とマルチモーダル性

技術面では、Sonnet 4.6はミドルレンジモデルのスピードと、Opusクラスの深いreasoningのギャップを埋める存在です。Adaptive Thinking機能を備えており、タスクの複雑さに応じて内部のreasoningの労力をスケーリングさせることができます。このモデルはClaudeの無料ユーザーおよびProユーザーの新しいデフォルトとなり、コーディング、財務分析、ドキュメントの理解においてフラッグシップ級の知能を提供します。真のネイティブなmultimodalであり、テキスト、画像、音声、ビデオ入力をサポートし、多様なメディア処理タスクをstate-of-the-artの精度でこなします。

エージェントのための新業界標準

卓越したコストパフォーマンスを誇るSonnet 4.6は、AIエージェントの主要なエンジンとして位置付けられています。SWE-bench Verified (79.6%)OSWorld-Verified (72.5%) で業界をリードするスコアを達成しており、現実世界のソフトウェアエンジニアリングの問題解決や、複雑なオペレーティングシステムのタスクをこなす優れた能力を証明しています。Opusに近い知能をわずかなコストで提供することで、これまで計算リソースやコストの面で不可能だった自律型システムの構築を可能にします。

Claude Sonnet 4.6

Claude Sonnet 4.6のユースケース

Claude Sonnet 4.6を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ソフトウェアエンジニアリング

Claude Codeを使用して、リポジトリ全体のコンテキストを把握しながら、リポジトリ全体の構成変更や複雑な機能の実装を行います。

人間レベルのComputer Use

画面を視認し、仮想マウスとキーボードを介して操作することで、レガシーソフトウェアやWebワークフローの自動化を実現します。

財務書類の高度な理解

数千ページに及ぶ提出書類や表を分析し、複雑な投資戦略やリスクを推論します。

リアルタイム・ビジネスシミュレーション

modelが仮想ビジネスを管理し、収益性を最適化するagenticなシミュレーションを実行します。

多言語テクニカルライティング

完璧なアーキテクチャ仕様への準拠を維持しつつ、数十の言語で技術ドキュメントを生成します。

フロントエンドUI/UX生成

タイポグラフィ、色彩理論、レスポンシブレイアウトに焦点を当てた、洗練されたモダンなダッシュボードインターフェースを作成します。

強み

制限

業界をリードするコーディング性能: SWE-bench Verifiedでstate-of-the-artとなる79.6%を達成。実際のGitHubの問題解決において競合を圧倒しています。
Thinkingモードにおけるレイテンシ: 思考用tokensの予算を増やすと、最初のトークン生成までの時間(time-to-first-token)が長くなるため、即時性が求められるチャットには不向きです。
卓越したコストパフォーマンス: Opus級の知能を5分の1のコストで提供。大規模な自動化において最も経済的な選択肢となります。
レート制限の制約: 無料およびProユーザーは、高負荷なセッション中に厳しいメッセージ制限に達することがあり、APIへの移行が必要になる場合があります。
人間レベルのコンピュータ操作: OSWorld-Verifiedで72.5%を記録。APIのない複雑なソフトウェアの操作において劇的な進化を遂げました。
15万tokens超でのコンテキスト減衰: 100万のwindowを誇りますが、非常に巨大なpromptの中間部分にある特定の詳細を見落とすことが稀にあります。
適応型Reasoningパワー: スケーラブルなThinkingモードを搭載しており、難解なロジックの問題に対して推論の労力を柔軟に調整できます。
プロンプトインジェクションの脆弱性: Computer Use機能には、悪意のあるWebサイトがmodelの仮想ブラウザセッションを乗っ取ろうとするリスクが存在します。

APIクイックスタート

anthropic/claude-sonnet-4-6

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: 'claude-sonnet-4-6',
  max_tokens: 1024,
  messages: [
    { role: 'user', content: 'Analyze this codebase for security vulnerabilities.' }
  ],
});

console.log(msg.content);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Sonnet 4.6についてのユーザーの声

Claude Sonnet 4.6についてコミュニティがどう思っているか見てください

Claude Sonnet 4.6は当社の保険業界ベンチマークで94%を記録しました。コンピュータ操作において、これまでテストした中で最も高いパフォーマンスを誇るmodelです。
Swami Sivasubramanian
twitter
期待以上の出来です。間違いなく私がこれまでに使った中で最高(かつ最も楽しい)LLMです!これまでのものとは一線を画しています。
WolframRavenwolf
reddit
Claude Sonnet 4.6は単に「時々面白い」だけでなく、本当にユーモアがあります。全体的に温かみがあり、誠実で、親社会的な印象です。
Anton P.
twitter
コーディングタスクにおいて、Sonnet 4.6はClineよりもはるかに優れています。もう自分でファイルを手動で開くことすらしていません。
semibaron
hackernews
100万のコンテキストは、コードベースの移行におけるゲームチェンジャーです。レガシーなスタック全体をアップロードするだけで済みました。
DevOpsDan
reddit
複雑なスプレッドシートやWebフォームを、気味が悪いほど正確に処理します。Computer Useのベータ版がついに実用レベルに達しました。
AI_Insights_Daily
youtube

Claude Sonnet 4.6についての動画

Claude Sonnet 4.6についてのチュートリアル、レビュー、ディスカッションを見る

Sonnet 4.6は、現実世界の有意義なタスクを測定するGDP valで、より高いスコアを記録しました。

これらのmodelがCBRN(化学・生物・放射性物質・核)関連の能力を持っているかどうかを判断することさえ、ますます困難になっています。

知能とスピードの比率は、市場にある他のどのmodelと比較しても本質的に比類のないものです。

Anthropicが今回のリリースでagenticな側面に注力しているのは明らかです。

このコスト構造により、大量のAPIリクエストを行う開発者にとって、これが新たなデフォルトになるでしょう。

このmodelは、先月のOpusモデルと比較して約2倍の速さです。

結論として、エンタープライズ向けのコーディングにおいて、これほどコストパフォーマンスの高いmodelはありません。

複雑なアーキテクチャ図を解釈するためのビジョン機能が大幅に向上しています。

50個のファイルを読み込ませたところ、ルーティングロジック全体を完璧にリファクタリングしてくれました。

GPT-4oと比較して、コミュニケーションスタイルがより人間に近いと感じます。

いくつかの分野ではOpus 4.6を凌駕しており、価格は40%も安く抑えられています。

context windowを埋めていく際、約15万tokensを超えると効果が低下し始める傾向があります。

適応型reasoning機能により、基本的にはスピードと深いロジックを切り替えることができます。

今回のリリースは、Anthropicによる初の真の「エージェント第一主義」のmodelのように感じられます。

最高レベルのクリエイティブライティングを除けば、あらゆる用途にこれを使うでしょう。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Claude Sonnet 4.6のプロのヒント

Claude Sonnet 4.6を最大限に活用し、より良い結果を得るための専門家のヒント。

Context Compaction(コンテキスト圧縮)の活用

APIのCompaction機能を有効にすると、長いセッションにおいて古い会話履歴を自動的に要約し、効率化できます。

思考トークンの戦略的利用

数学や複雑なロジックを扱う際は、思考用tokensの予算を高く設定することで、modelが複数のreasoningパスを探索できるようになります。

仕様(SPEC)準拠のプロンプト

このmodelは最新のツールを優先的に利用する傾向があるため、最新のアーキテクチャのベストプラクティスに従うよう明示的に指示してください。

UI用Artifactsの利用

UI Artifactsを使用するよう促すことで、生成されたコードをチャットスレッドから分離し、リアルタイムで反復開発を行うことができます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

200K context
$5.00/$25.00/1M
alibaba

Qwen3.5-397B-A17B

alibaba

Qwen3.5-397B-A17B is Alibaba's flagship open-weight MoE model. It features native multimodal reasoning, a 1M context window, and a 19x decoding throughput...

1M context
$0.60/$3.60/1M
deepseek

DeepSeek-V3.2-Speciale

DeepSeek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
openai

GPT-5.1

OpenAI

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Claude Sonnet 4.6についてのよくある質問

Claude Sonnet 4.6に関するよくある質問への回答を見つけてください