anthropic

Claude Sonnet 4.5

AnthropicのClaude Sonnet 4.5は、世界最高水準のコーディング性能(SWE-benchで77.2%)と200Kのcontext windowを備え、次世代のautonomous agents向けに最適化されています。

AIコーディングAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude 4September 29, 2025
コンテキスト
200Kトークン
最大出力
64Kトークン
入力価格
$3.00/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
83%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Sonnet 4.5はこのベンチマークで83%を記録しました。
HLE
34%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude Sonnet 4.5はこのベンチマークで34%を記録しました。
MMLU
89%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Sonnet 4.5はこのベンチマークで89%を記録しました。
MMLU Pro
78%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Sonnet 4.5はこのベンチマークで78%を記録しました。
SimpleQA
52%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude Sonnet 4.5はこのベンチマークで52%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Sonnet 4.5はこのベンチマークで88%を記録しました。
AIME 2025
87%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Sonnet 4.5はこのベンチマークで87%を記録しました。
MATH
87%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Sonnet 4.5はこのベンチマークで87%を記録しました。
GSM8k
98%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Sonnet 4.5はこのベンチマークで98%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Sonnet 4.5はこのベンチマークで92%を記録しました。
MathVista
72%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Sonnet 4.5はこのベンチマークで72%を記録しました。
SWE-Bench
77%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Sonnet 4.5はこのベンチマークで77%を記録しました。
HumanEval
94%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Sonnet 4.5はこのベンチマークで94%を記録しました。
LiveCodeBench
68%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Sonnet 4.5はこのベンチマークで68%を記録しました。
MMMU
78%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Sonnet 4.5はこのベンチマークで78%を記録しました。
MMMU Pro
55%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Sonnet 4.5はこのベンチマークで55%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Sonnet 4.5はこのベンチマークで89%を記録しました。
DocVQA
92%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Sonnet 4.5はこのベンチマークで92%を記録しました。
Terminal-Bench
50%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Sonnet 4.5はこのベンチマークで50%を記録しました。
ARC-AGI
14%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Sonnet 4.5はこのベンチマークで14%を記録しました。

Claude Sonnet 4.5を無料で試す

Claude Sonnet 4.5と無料でチャット。機能をテストし、質問し、このAIモデルができることを探索してください。

プロンプト
レスポンス
Claude Sonnet 4.5

AIの応答がここに表示されます

Claude Sonnet 4.5について

Claude Sonnet 4.5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

**Agentic Intelligenceの最前線**

Claude Sonnet 4.5は、Anthropicにおける「frontier intelligence」の最も重要な飛躍を象徴しており、特にautonomous AI agentsの時代に向けて最適化されています。2025年後半にリリースされたこのモデルは、業界初の真の「hybrid reasoning」モデルであり、開発者は日常的なタスクのための高速な実行と、複雑な論理的課題のためのextended thinkingを切り替えることができます。特にcomputer useとツールオーケストレーションにおいて従来のベンチマークを塗り替え、ターミナルベースのagentや複数ファイルにわたるソフトウェアエンジニアリングにおいて推奨されるエンジンとなっています。

**精度とhallucinationsの抑制**

このモデルは「二度測って一度で切る」という論理を優先するアーキテクチャで構築されており、3.5シリーズで見られたsycophancyやhallucinationsを大幅に低減しています。64,000 tokenの巨大な出力制限200,000 tokenの入力ウィンドウにより、リポジトリ全体を取り込みながら、1回のパスでアプリケーションファイル全体を生成できます。また、agenticなワークフロー向けにネイティブな「checkpoints」機能を導入しており、agentが自律的にロールバックして自らの過ちを修正することが可能です。

**MultimodalとReasoningの卓越した能力**

コーディング以外でも、Sonnet 4.5はmultimodalなドキュメント分析や複雑な財務モデリングで圧倒的なパフォーマンスを発揮します。内部ロジックはアーキテクチャのコンテキストを優先するようにトレーニングされており、これまでのどのモデルよりも大規模なコードベースを正確にマッピングできます。手書きのメモの処理から完全なStripe連携の実装まで、Sonnet 4.5は高い事実正確性と指示遂行能力を維持します。

Claude Sonnet 4.5

Claude Sonnet 4.5のユースケース

Claude Sonnet 4.5を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ソフトウェアエンジニアリング

Claude Sonnet 4.5を使用して、複雑なコードベースの把握、複数ファイルにわたる機能実装、テストの独立した実行を実現します。

Computer-use agent

デスクトップやWebブラウザを操作するmodelをデプロイし、データ抽出、レガシーシステムの操作、繰り返しの事務作業を自動化します。

エンタープライズAgentic検索

多段階の検索クエリをオーケストレートし、内部ドキュメントやライブWebからバラバラな情報を統合します。

複雑な財務モデリング

AIMEスコア87%という性能を活かし、財務報告書や市場データに対して深い論理的なreasoningを行います。

テクニカルコンテンツの洗練

高レベルの要件を、プロフェッショナルなPRD、技術仕様書、そのままコピー&ペースト可能なコードベースへと変換します。

Multimodalドキュメント分析

state-of-the-artのvision機能を活用し、数千ページに及ぶチャート、手書きのメモ、技術図面を処理します。

強み

制限

Agenticなコーディング能力: 実際のGitHubの問題に対して77.2%の成功率を収め、現在SWE-bench Verifiedで世界記録を保持しています。
利用制限: 月額20ドルのProプランでは、週ごとの利用制限にすぐに達してしまうという報告がプロフェッショナルユーザーから寄せられています。
圧倒的なスピード: 毎秒40〜60 tokensで動作し、インタラクティブな利用において従来のfrontier modelよりも大幅に高速です。
検索のlatency: AgenticなWebブラウジング(BrowseComp)は、特化型の検索モデルと比較すると依然として弱点となっています。
Hybrid Reasoningの柔軟性: 複雑な論理チェーンのための「extended thinking」と「高速チャット」モードを効果的に両立させた最初のmodelです。
ニッチな知識の欠如: 特定のスケートボードのトリックの識別など、高度に専門的な視覚タスクでは苦戦します(SkateBenchでの精度は29%)。
巨大な出力ウィンドウ: 64Kの出力token上限により、1回のAPIコールで複数のファイルにわたる機能全体を生成可能です。
Agenticな運用コスト: ターミナルモードでmodelを自律的に実行すると、1回の複雑なアプリ構築セッションで50〜100ドル分のtokensを消費する可能性があります。

APIクイックスタート

anthropic/claude-sonnet-4.5

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-sonnet-4.5-20250929",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Implement a rate limiter in Node.js" }],
});

console.log(msg.content[0].text);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Sonnet 4.5についてのユーザーの声

Claude Sonnet 4.5についてコミュニティがどう思っているか見てください

"Claude Sonnet 4.5はAIコーディングの新たな王だ... 本当に素晴らしい出来栄えだ"
James Montemagno
youtube
"Sonnet 4.5は非常に良い仕事をしている... 驚くほど速く、精度もかなり向上している"
Cole Medin
youtube
"Sonnet 4.5には圧倒された... このモデルがデザインするページは本当に美しい"
Savage Reviews
youtube
"ターミナルベースのagentは「ターミナルに住むエンジニア」のようだ。コードベースを読み取り、自律的にテストを実行できる"
DevUser_99
reddit
"価格は3.5と同じだが、「Checkpoints」機能のおかげでプロフェッショナルなワークフローにおける価値は10倍以上だ"
AgentArchitect
x
"SWE-benchで77.2%という数字は、実際にシニアエンジニアのように感じられる最初のモデルだ"
HackerNewsReader
hackernews

Claude Sonnet 4.5についての動画

Claude Sonnet 4.5についてのチュートリアル、レビュー、ディスカッションを見る

Anthropicはこのモデルがreasoning、数学、computer useにおいて大幅な向上を遂げた「世界最高のコーディングモデル」であると主張しています。

GPT-5はハイレベルなプランニングに優れているかもしれませんが、実装においては現在Claude 4.5 Sonnetが最も使いやすいモデルです。

スピードがとにかく素晴らしく、対話的なコーディングが非常にスムーズに感じられます。

これまでに見たことのないレベルの精度で、複数ファイルにわたる編集を処理します。

hallucinationsが減少したことで、本番環境のコードを任せられる信頼できるパートナーになっています。

Claude Sonnet 4.5はGPT-5 Codexよりも遥かに速く、精度もかなり向上しています。

Stripeの実装全体を15分で完了させました... これはOpus 4.1よりも2倍以上速いです。

複雑なtool-callingの指示に従う能力こそが、このモデルの秘訣です。

モデルが単に私の悪いアイデアに同意するだけの「sycophancy」の問題が減っているのがわかります。

これは、監視なしでターミナルベースのagentを任せられると確信した最初のモデルです。

これは、1つのpromptから作成されたランディングページとして、これまで見た中で最高、あるいは間違いなくNo.1の出来栄えです。

まさにモンスターです... 非常に洗練されたコードで、本当に素晴らしいページをデザインしています。

UIデザインを解釈するためのvision機能が大幅にアップグレードされています。

技術的な要件だけでなく、美的な要求も理解しているように感じられます。

Sonnet 4.5は公式に、クリエイティブなフロントエンドエンジニアリングの新しいbenchmarkとなりました。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

プロのヒント

このモデルを最大限に活用し、より良い結果を得るための専門家のヒント。

CLAUDE.mdの活用:リポジトリのルートにCLAUDE.mdファイルを配置し、短い概要やポインタをmodelに提供してください。これにより、tokenの無駄を30%削減できます。

Hybrid Reasoningの切り替え:日常的な操作でのlatencyとコストを抑えるため、APIコール時の「thinking」parameterはロジックが重要なタスクにのみ使用してください。

.claude/contextフォルダ:アーキテクチャの決定事項を保存するために.claude/context.mdファイルを作成してください。modelはこのパスをコードベースのマッピングとして優先するように特別にトレーニングされています。

Prompt Caching:静的なドキュメントや大規模なコードベースに対してprompt cachingを有効にすると、繰り返しのクエリにおける入力コストを最大90%削減できます。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

よくある質問

このモデルに関するよくある質問への回答を見つけてください