anthropic

Claude Opus 4.5

Claude 4.5 OpusはAnthropicの最も強力なfrontier modelであり、SWE-benchにおいて記録的な80.9%の性能を達成し、コーディングにおける高度な自律性を実現します。

anthropic logoanthropicClaude2025年11月24日
コンテキスト
200Kトークン
最大出力
64Kトークン
入力価格
$5.00/ 1M
出力価格
$25.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
87%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Opus 4.5はこのベンチマークで87%を記録しました。
MMLU
90.8%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Opus 4.5はこのベンチマークで90.8%を記録しました。
MMLU Pro
80%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Opus 4.5はこのベンチマークで80%を記録しました。
IFEval
90%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Opus 4.5はこのベンチマークで90%を記録しました。
AIME 2025
37%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Opus 4.5はこのベンチマークで37%を記録しました。
MATH
85%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Opus 4.5はこのベンチマークで85%を記録しました。
GSM8k
95%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Opus 4.5はこのベンチマークで95%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Opus 4.5はこのベンチマークで92%を記録しました。
MathVista
72%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Opus 4.5はこのベンチマークで72%を記録しました。
SWE-Bench
80.9%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Opus 4.5はこのベンチマークで80.9%を記録しました。
HumanEval
90%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Opus 4.5はこのベンチマークで90%を記録しました。
LiveCodeBench
75%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Opus 4.5はこのベンチマークで75%を記録しました。
MMMU
80.7%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Opus 4.5はこのベンチマークで80.7%を記録しました。
MMMU Pro
60%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Opus 4.5はこのベンチマークで60%を記録しました。
ChartQA
90%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Opus 4.5はこのベンチマークで90%を記録しました。
DocVQA
94%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Opus 4.5はこのベンチマークで94%を記録しました。
Terminal-Bench
59.3%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Opus 4.5はこのベンチマークで59.3%を記録しました。
ARC-AGI
37.6%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Opus 4.5はこのベンチマークで37.6%を記録しました。

Claude Opus 4.5について

Claude Opus 4.5の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

自律型エージェントの頂点

Claude Opus 4.5は、Anthropicにおけるfrontier intelligenceの最も重要な飛躍を象徴しており、ソフトウェアエンジニアリングや自律運用における最も複雑なタスクのために特別に設計されています。2025年後半にリリースされたこのモデルは、SWE-bench Verifiedベンチマークで80.9%という記録を塗り替え、人間の介入を最小限に抑えながら大規模なデバッグやシステムのリファクタリングを効果的に自動化できる最初のモデルとなりました。

魂を持つ知能

技術的な卓越性に加え、Opus 4.5はAnthropicの「soul document」に導かれた洗練されたペルソナを導入し、外交的な誠実さとニュアンスに富んだ有用性を強調しています。これにより、文筆家のような感性や人間中心のデザインを理解する独自の能力をモデルに与えています。また、agenticなワークフロー向けに最適化されており、200,000 tokenのcontext windowと、計算コストに対してreasoningの深さをスケーリングできる専用の「effort parameter」を備えています。

マルチモーダルにおける卓越性

マルチモーダルの強力な基盤を持つOpus 4.5は、密密なアーキテクチャ図の解析から複雑なドキュメントレイアウトからのデータ抽出まで、visionベースのタスクで威力を発揮します。Claude Codeを介してターミナルネイティブな環境を操作する能力により、システム全体の監査やセキュリティパッチの適用を実行でき、プロフェッショナルなエンジニアリングチームにとって継続的で非常に有能なパートナーとして位置づけられています。

Claude Opus 4.5

Claude Opus 4.5のユースケース

Claude Opus 4.5を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型エンジニアリング

再現、デバッグ、テストを含むGitHub issueのライフサイクル全体を自動化します。

システム管理

直接的なターミナル操作を通じて、自律的なサーバー監査やセキュリティパッチの適用を実施します。

アーキテクチャのリファクタリング

大規模なリポジトリを読み込み、システム全体のセキュリティ強化を提案・実装します。

複雑なドキュメントの統合

数百ページのPDFを、構造化された財務モデルやデータ視覚化に変換します。

クリエイティブなゲーム開発

単一の複雑なpromptから、物理演算が機能する3D環境を生成します。

継続的なリサーチアシスタント

膨大なデータセットを相互参照し、法務や技術文書内の目立たない矛盾を発見します。

強み

制限

記録的なコーディング性能: SWE-bench Verifiedで80.9%を達成し、複雑なソフトウェアエンジニアリング業務を自動化します。
プレミアムな価格設定: 100万tokensあたり5ドル/25ドルという価格は、中間層のモデルよりも大幅に高価です。
優れたtoken効率: 同様のロジックにおいてSonnetよりも最大76%少ないtokensを使用しながら、フロンティア級の知能を実現します。
数学benchmarkの差: AIMEテストのような競技レベルの数学においては、特化型のreasoningモデルに後れを取っています。
20万の巨大なcontext: 大規模なドキュメントセットやリポジトリを、高精度なretrievalで処理します。
ネイティブな音声・動画未対応: 現時点では、前処理なしで音声や動画ストリームを直接処理する機能はありません。
自律型エージェントの論理性: ターミナルネイティブなツールとストップフックを通じて、長時間の自律セッションに最適化されています。
高い実行レイテンシ: 深いreasoningを伴うタスクにはかなりの時間がかかる場合があり、エージェントのセッションが数時間に及ぶこともあります。

APIクイックスタート

anthropic/claude-4.5-opus

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const client = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

async function main() {
  const message = await client.messages.create({
    max_tokens: 4096,
    messages: [{ role: 'user', content: 'Perform a full system audit of this code for security flaws.' }],
    model: 'claude-4.5-opus-20251124',
  });
  console.log(message.content[0].text);
}

main();

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Opus 4.5についてのユーザーの声

Claude Opus 4.5についてコミュニティがどう思っているか見てください

"私の本番コードのすべての行は、Opus 4.5上で動作する Claude Code によって生成されました"
Boris Cherny
x
"Opus 4.5は、文筆家のようなセンスや、いかに人間らしく聞こえるかを考える必要がある領域に達しています"
Nate B Jones
youtube
"知能がついに安価になりつつあります。このモデルは以前のOpusより3倍安いです"
BuildwithVignesh
reddit
"Claude Opus 4.5は賢すぎて抜け穴を突くことでbenchmarkを破壊しました"
MetaKnowing
reddit
"reasoningの深さとコーディング能力は、他の追随を許さないレベルにあります"
Santosh Gupta
x
"Claude Codeを通じたターミナル上でのagenticな能力は、DevOpsにとって際立った存在です"
hn_user_alpha
hackernews

Claude Opus 4.5についての動画

Claude Opus 4.5についてのチュートリアル、レビュー、ディスカッションを見る

価格が3倍安くなりました... 100万input tokensあたり5ドルです。

この単一promptによるMinecraftテストにおいて、これまでのモデルで最高の結果が得られました。

Opus 4.5は、この持ち帰り試験でどの人間の候補者よりも高いスコアを記録しました。

ここでのreasoningは単に指示に従っているのではなく、意図を理解しています。

複雑なアーキテクチャの作業を行うなら、これを確実に処理できる唯一のモデルです。

SWE-bench Verifiedで80.9%を達成... しかもSonnetより50%少ないtokensしか消費しません。

Opus 4.5はホビーのコーディングではなく、プロフェッショナルなソフトウェアエンジニアリングを正面から見据えています。

SWE-benchだけでなく、Terminal BenchでもSonnetに対して15%の向上を見せています。

このモデルは数時間続くこともある長時間の自律セッションが可能です。

Vision性能は、高密度の技術図面を解析する際に著しく詳細になっています。

Claude Opus 4.5は、説得のレイヤーであり、絶対的なagenticモンスターだと考えてください。

多くのエンジニアは、その使い勝手とハーネスの良さからOpus 4.5を好むようになります。

このモデルは、文脈外の方法で自身の「soul spec」を自覚しています。

Opus 4.5は、GPT-5.2にはない文筆家のようなセンスを備えています。

動的なeffort parameterを使用して、タスクに基づいて知能をスケーリングします。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

Claude Opus 4.5のプロのヒント

Claude Opus 4.5を最大限に活用し、より良い結果を得るための専門家のヒント。

ロジックにはHigh Effortを使用する

複雑なアーキテクチャ設計タスクでは、'effort' parameterを 'high' に設定して、最大限のreasoningの深さを確保してください。

ストップフックを導入する

agenticなワークフローにおいて特殊なストップフックを活用することで、modelが数時間にわたって実行と自己修正を行えるようになります。

Claude Codeを活用する

モデルをClaude Code CLIツールと組み合わせることで、ターミナルネイティブなシステムタスクの全ポテンシャルを引き出せます。

token使用量を最適化する

Opus 4.5はSonnetと同等の品質を最大76%少ないtokensで提供できるため、高度なロジックを必要とするタスクに限定して使用してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude 3.7 Sonnet

anthropic

Claude 3.7 Sonnet is Anthropic's first hybrid reasoning model, delivering state-of-the-art coding capabilities, a 200k context window, and visible thinking.

200K context
$3.00/$15.00/1M
xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

Claude Opus 4.5についてのよくある質問

Claude Opus 4.5に関するよくある質問への回答を見つけてください