anthropic

Claude Sonnet 4.5

AnthropicのClaude 4.5 Sonnetは、世界トップクラスのコーディング(SWE-benchで77.2%)と200Kのcontext windowを提供し、次世代の自律型エージェントのために最適化されています。

AIコーディングAgentic AIHybrid ReasoningAnthropicMultimodal
anthropic logoanthropicClaude2025年9月29日
コンテキスト
200Kトークン
最大出力
64Kトークン
入力価格
$3.00/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImageAudioVideo
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
83%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Sonnet 4.5はこのベンチマークで83%を記録しました。
HLE
34%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude Sonnet 4.5はこのベンチマークで34%を記録しました。
MMLU
89%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Sonnet 4.5はこのベンチマークで89%を記録しました。
MMLU Pro
78%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Sonnet 4.5はこのベンチマークで78%を記録しました。
SimpleQA
52%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude Sonnet 4.5はこのベンチマークで52%を記録しました。
IFEval
88%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Sonnet 4.5はこのベンチマークで88%を記録しました。
AIME 2025
87%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Sonnet 4.5はこのベンチマークで87%を記録しました。
MATH
87%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Sonnet 4.5はこのベンチマークで87%を記録しました。
GSM8k
98%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Sonnet 4.5はこのベンチマークで98%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Sonnet 4.5はこのベンチマークで92%を記録しました。
MathVista
72%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Sonnet 4.5はこのベンチマークで72%を記録しました。
SWE-Bench
77%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Sonnet 4.5はこのベンチマークで77%を記録しました。
HumanEval
94%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Sonnet 4.5はこのベンチマークで94%を記録しました。
LiveCodeBench
68%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Sonnet 4.5はこのベンチマークで68%を記録しました。
MMMU
78%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Sonnet 4.5はこのベンチマークで78%を記録しました。
MMMU Pro
55%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Sonnet 4.5はこのベンチマークで55%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Sonnet 4.5はこのベンチマークで89%を記録しました。
DocVQA
92%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Sonnet 4.5はこのベンチマークで92%を記録しました。
Terminal-Bench
50%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Sonnet 4.5はこのベンチマークで50%を記録しました。
ARC-AGI
14%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Sonnet 4.5はこのベンチマークで14%を記録しました。

Claude Sonnet 4.5について

Claude Sonnet 4.5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

**エージェント知能の最前線**

Claude 4.5 Sonnetは、自律型AIエージェント時代のために最適化された、最先端の知能の大きな進歩です。2025年後半にリリースされた本モデルは、日常的なタスクのための高速実行と、複雑な論理的課題のためのExtended Thinkingを切り替えられるハイブリッド推論モデルです。Computer Useやツールオーケストレーションのベンチマークをリードしており、ターミナルベースのエージェントや複数ファイルにまたがるソフトウェアエンジニアリングにおいて好まれるエンジンとなっています。

**精度とハルシネーションの低減**

モデルアーキテクチャは論理と精度を優先しており、初期シリーズで見られた追従性やハルシネーションを低減しています。64,000 tokenの出力制限200,000 tokenの入力ウィンドウにより、単一のパスでリポジトリ全体を処理し、完全なアプリケーションファイルを生成できます。また、エージェントワークフロー向けのネイティブなチェックポイント機能を導入しており、人間の介入なしでシステムが自律的にミスを修正・ロールバックできるようになりました。

**Multimodalと推論能力**

ソフトウェア開発を超えて、Sonnet 4.5はmultimodalなドキュメント分析や財務モデリングに優れています。内部ロジックはアーキテクチャのcontextを優先しており、先行モデルよりも効果的に大規模システムをマッピングできます。手書きのメモを処理する場合でも、API統合を実装する場合でも、このモデルは長期的なタスクを通じて高い事実正確性と厳格な指示順守を維持します。

Claude Sonnet 4.5

Claude Sonnet 4.5のユースケース

Claude Sonnet 4.5を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型ソフトウェアエンジニアリング

ターミナルインターフェースを駆使し、要件定義から自動コミットまで開発サイクル全体を管理します。

GUIベースの自動化

ネイティブなcomputer use機能を利用し、Webブラウジングやレガシーアプリケーションへのデータ入力を自動化します。

マルチエージェントオーケストレーション

中央計画ループ内で、レビュアーやビルダーなどのサブエージェントに専門タスクを委譲します。

複雑なコードのリファクタリング

200,000 tokenのアクティブなcontextを維持しながら、複数ファイルにまたがるコードベースの再構築を行います。

詳細な財務分析

vision機能で四半期報告書やスプレッドシートを分析し、不一致の特定や投資のインサイトを導き出します。

インタラクティブなデータ可視化

組み込みのコード実行とリアルタイム生成を活用し、複雑なデータセットから動的なチャートを作成します。

強み

制限

ネイティブなComputer Use: カーソルの移動やGUI操作を通じてOSと対話し、61.4%の精度を誇ります。
ネイティブ音声入力の非対応: ネイティブなモダリティとして音声ファイルを直接処理することはできず、外部の文字起こしツールが必要です。
エリート級のコーディングパフォーマンス: SWE-bench Verifiedで77.2%を達成し、GitHubの課題解決能力において他モデルを圧倒しています。
推論tokenのコスト: 内部のextended thinkingで使用されるtokenは出力tokenとして課金されるため、複雑なクエリではコストが増加します。
30時間のタスク持続能力: アーキテクチャにより、状態と集中力を維持したまま30時間以上の自律作業が可能です。
Thinking Modeのlatency: extended thinkingを有効にすると、複雑なアーキテクチャ計画を処理するために数分かかる場合があります。
64Kの出力制限: 膨大な出力容量により、1回のAPIコールでアプリケーションのアーキテクチャ全体を生成できます。
競技プログラミングのばらつき: コーディングではトップクラスですが、特定の競技プログラミングのbenchmarkでは、特化型の推論モデルに後れを取る場合があります。

APIクイックスタート

anthropic/claude-4-5-sonnet

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const response = await anthropic.messages.create({
  model: "claude-4-5-sonnet-20250929",
  max_tokens: 1024,
  messages: [
    { role: "user", content: "Analyze this codebase for security flaws." }
  ],
});

console.log(response.content[0].text);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Sonnet 4.5についてのユーザーの声

Claude Sonnet 4.5についてコミュニティがどう思っているか見てください

Claude 4.5 Sonnetが今日どこでも利用可能になりました。世界最高のコーディングモデルです。
ClaudeOfficial
reddit
MCP設定における最も厄介なスケーリング問題の一つが解決しました。作業が始まる前にcontextが消えていくのを見ていたので。
Simon Willison
twitter
Claude Code-Sonnet 4.5は、Dockerを使用した複雑なリファクタリング作業においてGemini 3.0 Proより遥かに進んでいます。
Comfortable-Friend96
reddit
パターン:ミスはドキュメントになる。CLAUDE.mdにルールを追加すれば、二度と起こりません。
Boris Cherny
twitter
ハイブリッド推論モードは、通常のモデルではループしてしまうような複雑な非同期ロジックのデバッグにおいて救世主です。
AsyncDev
hackernews
3.5 Sonnetと同等の価格設定なので、我々のプロダクションエージェントパイプラインへのアップグレードは簡単です。
StartupFounder2025
reddit

Claude Sonnet 4.5についての動画

Claude Sonnet 4.5についてのチュートリアル、レビュー、ディスカッションを見る

この新しい4.5 Sonnetモデルは、Swaybenchの検証テストでOpus 4.1さえ上回っています

複雑なマルチステップタスクにおいて30時間以上も集中力を維持できました

OS worldのcomputer use benchmarkで61.4%のスコアを記録しリードしています

内部の推論エンジンは、3.5よりもはるかに安定してPython環境を扱えます

ターミナル統合はより強固になり、シェルのコマンドハルシネーションはほぼゼロです

Sonnet 4.5は今やagentic tool useでリードしており…20%の飛躍は本当に興奮します

Sonnet 4.5を搭載したClaude Codeは、Stripeの実装全体を15分で完了させました

Claude Sonnet 4.5は大幅に高速化され、性能も着実に向上しています

Thinkingトグルを使えば、特定のコードブロックにより多くの計算リソースを割り当てることができます

150,000 tokenもの巨大なプロジェクトでも完璧にcontextを保持します

コンピュータを操作させる際、史上最高のパフォーマンスを発揮するモデルです

コーディングのエラー率が9%からほぼゼロにまで低下しました

Claude imagineは最高にクールな機能かもしれません…リアルタイムのアプリ構築体験です

MCP統合により、プロンプトのcontextを消費せずにツールを検索できます

複雑なUIレイアウトを分析する際のvisionのlatencyが大幅に削減されました

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Claude Sonnet 4.5のプロのヒント

Claude Sonnet 4.5を最大限に活用し、より良い結果を得るための専門家のヒント。

MCP Tool Searchを有効にする

Model Context Protocol Tool Searchを使用してcontext使用量を85%削減し、アクティブなファイルのための余裕を確保しましょう。

Agentic Checkpointsを活用する

ターミナルインターフェースで /checkpoint コマンドを使用し、大規模なリファクタリングの前に進捗を保存して即座にロールバックできるようにしましょう。

Contextの予算管理

関連のないタスク間では履歴をクリアし、contextの劣化を防いで論理的正確性を高く保ちましょう。

System Promptの階層化

モデルのペルソナと厳格な出力制約を専用の設定ファイルで定義し、エージェント間の一貫性を確保しましょう。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.3 Codex

OpenAI

GPT-5.3 Codex is OpenAI's 2026 frontier coding agent, featuring a 400K context window, 77.3% Terminal-Bench score, and superior logic for complex software...

400K context
$1.75/$14.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M

Claude Sonnet 4.5についてのよくある質問

Claude Sonnet 4.5に関するよくある質問への回答を見つけてください