anthropic

Claude Opus 4.7

Claude Opus 4.7は、100万tokenのコンテキスト、Adaptive Thinking、3.3倍の視覚解像度を備えたAnthropicのフラッグシップモデルです。

Frontier ModelAgentic AICoding AssistantLarge ContextAnthropic
anthropic logoanthropicClaude2026年4月16日
コンテキスト
1.0Mトークン
最大出力
128Kトークン
入力価格
$5.00/ 1M
出力価格
$25.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
94.2%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Opus 4.7はこのベンチマークで94.2%を記録しました。
HLE
54.7%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude Opus 4.7はこのベンチマークで54.7%を記録しました。
MMLU
89.8%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Opus 4.7はこのベンチマークで89.8%を記録しました。
MMLU Pro
89.9%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Opus 4.7はこのベンチマークで89.9%を記録しました。
SimpleQA
31.6%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude Opus 4.7はこのベンチマークで31.6%を記録しました。
IFEval
91.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Opus 4.7はこのベンチマークで91.2%を記録しました。
AIME 2025
100%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Opus 4.7はこのベンチマークで100%を記録しました。
MATH
94.1%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Opus 4.7はこのベンチマークで94.1%を記録しました。
GSM8k
98.4%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Opus 4.7はこのベンチマークで98.4%を記録しました。
MGSM
94.1%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Opus 4.7はこのベンチマークで94.1%を記録しました。
MathVista
78%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Opus 4.7はこのベンチマークで78%を記録しました。
SWE-Bench
87.6%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Opus 4.7はこのベンチマークで87.6%を記録しました。
HumanEval
92.4%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Opus 4.7はこのベンチマークで92.4%を記録しました。
LiveCodeBench
78.5%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Opus 4.7はこのベンチマークで78.5%を記録しました。
MMMU
80.7%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Opus 4.7はこのベンチマークで80.7%を記録しました。
MMMU Pro
85.6%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Opus 4.7はこのベンチマークで85.6%を記録しました。
ChartQA
79.5%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Opus 4.7はこのベンチマークで79.5%を記録しました。
DocVQA
92.5%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Opus 4.7はこのベンチマークで92.5%を記録しました。
Terminal-Bench
59.3%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Opus 4.7はこのベンチマークで59.3%を記録しました。
ARC-AGI
68.8%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Opus 4.7はこのベンチマークで68.8%を記録しました。

Claude Opus 4.7について

Claude Opus 4.7の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

モデル概要

Claude Opus 4.7は、Claude 4アーキテクチャシリーズのフラッグシップモデルです。Adaptive Thinkingフレームワークを採用しており、タスクの難易度に応じて認知能力をスケーリングします。これにより、固定の推論予算が動的な論理レベルへと置き換えられました。開発者はAPIのeffortパラメータを通じて内部の推論深度を制御し、レイテンシと論理的正確性のバランスを最適化できます。本モデルは、高難度のエンタープライズワークフローと自律的なagenticループに特化してチューニングされています。

コンテキストとMultimodal機能

本モデルは、長大なコンテキストに対する追加料金なしで100万tokenのcontext windowを提供します。12万8,000tokenの出力制限により、巨大な技術ドキュメントやコードリポジトリ全体を一度のレスポンスで生成可能です。ビジョン解像度は以前の反復から3.3倍向上し、最大2576ピクセルの画像に対してピクセル単位の正確な理解と1:1の座標マッピングを実現します。これらの改善により、文書分析や視覚的な監査タスクにおいて信頼できる選択肢となります。

Agenticなエンジニアリングと安全性

アーキテクチャの更新は、長期的なタスクとソフトウェアエンジニアリングをターゲットにしています。SWE-bench Verifiedのリーダーボードで87.6%を記録し、実際のGitHub課題を解決する能力において現在先頭に立っています。モデルはタスク予算を導入し、複数ターンのエージェントセッション全体でtoken消費量を管理する手助けをします。Anthropicは、悪意のある攻撃を防止しながらセキュリティ研究者の利便性を維持するため、リアルタイムのサイバーセキュリティ保護を中核アーキテクチャに統合しました。

Claude Opus 4.7

Claude Opus 4.7のユースケース

Claude Opus 4.7を使って素晴らしい結果を得るさまざまな方法を発見してください。

Agenticなソフトウェアエンジニアリング

高い努力レベルを活用し、リポジトリを自律的にリファクタリングし、複雑なファイル間の依存関係を解決します。

大規模リポジトリの統合

100万tokenのソースコードを処理し、アーキテクチャフローをマッピングして技術ドキュメントを生成します。

高解像度ビジョン分析

従来のfrontier modelより3.3倍詳細なデータを用いて、高密度なチャートやピクセル単位のUIスクリーンショットを分析します。

サイバーセキュリティ脆弱性研究

検証された安全境界内で、深いセキュリティ監査やゼロデイ分析を実行します。

エンタープライズ知識の抽出

膨大な技術ライブラリから構造化データを抽出し、複雑な文書間の校正を行います。

インタラクティブな3Dプロトタイピング

自然言語による説明から、機能的な3D環境やゲームロジックを生成します。

強み

制限

業界トップクラスのコーディング精度: SWE-bench Verifiedで87.6%を達成し、一般公開されている他のあらゆるモデルをソフトウェアエンジニアリング分野で上回ります。
高いtoken消費量: 新しいtokenizerにより、これまでのClaudeバージョンと同じテキストでも約35%高いtoken使用量となります。
大規模コンテキストの安定性: 100万tokenのcontext window全体で100%の精度を維持し、長大コンテキストに対する追加料金も発生しません。
固定されたサンプリングパラメータ: temperatureやtop-pの制御が削除されたため、非決定論的なユースケースにおける創造的な柔軟性が制限されます。
優れた視覚的解像度: 最大2576pxの画像をサポートし、ドキュメントやUIの精密な分析のために1:1のピクセルマッピングを可能にします。
最大努力レベルでの高レイテンシ: 'xhigh'のeffortレベルで回答を生成すると、複雑なタスクにおいて顕著な待機時間が発生します。
動的な推論制御: Adaptive Thinkingフレームワークを通じて開発者が努力レベルを切り替え、レイテンシと論理的精度のバランスを調整できます。
厳格な安全性による拒否: リアルタイムのサイバーセキュリティフィルターが、正当なセキュリティ研究に対しても誤検知による拒否を行う場合があります。

APIクイックスタート

anthropic/claude-opus-4-7

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-opus-4-7",
  max_tokens: 4096,
  thinking: { type: "adaptive" },
  messages: [{ role: "user", content: "Analyze this architecture for concurrency bugs." }],
});

console.log(msg.content[0].text);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Opus 4.7についてのユーザーの声

Claude Opus 4.7についてコミュニティがどう思っているか見てください

Claude Opus 4.7はSWE-benchとagenticな推論を牽引しており、GPT-5.4やGemini 3.1 Proを凌駕している。
zarfet
twitter
手続き型3Dスケートゲームを一気に生成できるという事実は、モデルの論理密度の高さの証拠である。
jrandolph
hackernews
Opus 4.7がリリースされた。cursorbenchは58%から70%に跳ね上がった。XBOWの視覚的解像度はOpus 4.6の54.5%に対し98.5%となった。
hirenthakore
twitter
Claudeは過剰にエンジニアリングしがちだ。単純な関数を要求しても、今後10年スケーリング可能なアーキテクチャが出てくる。
Ok_Today5649
reddit
Claude Opus 4.7に対する初期のフィードバックでは、token使用量の増加とプロンプトに対するより厳格な要件が指摘されている。
kimmonismus
twitter
X-Highの推論努力は、複雑なagenticなワークフローに欠けていたピースだ。
Bijan Bowen
youtube

Claude Opus 4.7についての動画

Claude Opus 4.7についてのチュートリアル、レビュー、ディスカッションを見る

Claudeは現在入手可能なモデルの中で、最高レベルの引用能力を持っています。

価格は以前と同じですが、推論に対する制御性が向上しています。

完璧に機能しています。自分で選ぼうと思っていたツールをモデルが選んでくれました。

最高レベルの推論設定を使用しなければ、体感速度は明らかに速いです。

コードを1行書く前にも、エッジケースについて推論しているのがわかります。

このモデルの実行コストはかなり高く、Opus 4.7は35%多く支払うことになります。

ビジョンのアップグレードだけでも価値があります。クロップなしで3倍の解像度の画像を扱えます。

APIを利用する場合、以前よりも35%高いコストがかかることを想定しておくべきです。

トークン化の変更は、注意を怠るとAPI請求額に打撃を与える静かなる要因です。

Opus 4の初期バージョンよりも深いコンテキストをはるかにうまく処理します。

このモデルの視覚処理能力は大幅に向上しています。

X-Highの推論努力は、複雑なagenticワークフローに必要だった中間的な選択肢です。

これは間違いなく「異常」と言えるほどの性能です。本当に驚かされました。

他の3つのモデルが見逃したレガシーコードベースのバグを正確に特定しました。

エージェントループにおける自律性のレベルが、GPT-5との決定的な違いです。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Claude Opus 4.7のプロのヒント

Claude Opus 4.7を最大限に活用し、より良い結果を得るための専門家のヒント。

Adaptive Thinkingを有効にする

API呼び出しでAdaptive Thinkingモードを明示的に有効にすることで、Claudeが最適な推論深度を選択できるようにします。

エージェントにはX-Highを使用する

agenticなループにはeffortパラメータをxhighに設定し、自己検証と論理的精度を最大化します。

不要な指示を取り除く

モデルが内部的な自己修正に最適化されているため、「double-check your work(作業内容を再確認して)」のような従来のプロンプトは削除してください。

token消費量を監視する

同一テキストの入力でもtoken数が35%増加しているため、新しいtokenizerの追跡機能を活用して管理してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

google

Gemini 3.1 Pro

Google

Gemini 3.1 Pro is Google's elite multimodal model featuring the DeepThink reasoning engine, a 1M+ context window, and industry-leading ARC-AGI logic scores.

1M context
$2.00/$12.00/1M
google

Gemini 3.1 Flash Live Preview

Google

Gemini 3.1 Flash Live Preview is Google's ultra-low-latency, audio-to-audio model featuring a 131K context window, high-fidelity multimodal reasoning, and...

131K context
$0.75/$4.50/1M
xai

Grok-3

xAI

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

1M context
$3.00/$15.00/1M
openai

GPT-5.2 Pro

OpenAI

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
google

Gemini 3 Pro

Google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
anthropic

Claude Opus 4.6

Anthropic

Claude Opus 4.6 is Anthropic's flagship model featuring a 1M token context window, Adaptive Thinking, and world-class coding and reasoning performance.

1M context
$5.00/$25.00/1M
google

Gemini 3 Flash

Google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
anthropic

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 offers frontier performance for coding and computer use with a massive 1M token context window for only $3/1M tokens.

1M context
$3.00/$15.00/1M

Claude Opus 4.7についてのよくある質問

Claude Opus 4.7に関するよくある質問への回答を見つけてください