anthropic

Claude Opus 4.6

Claude Opus 4.6は、1M tokenのcontext window、Adaptive Thinking、そして世界クラスのcodingおよびreasoningパフォーマンスを備えたAnthropicのflagshipモデルです。

ReasoningCodingMultimodalAgentic AIエンタープライズ
anthropic logoanthropicClaude2026年2月5日
コンテキスト
200Kトークン
最大出力
128Kトークン
入力価格
$5.00/ 1M
出力価格
$25.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
91%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude Opus 4.6はこのベンチマークで91%を記録しました。
HLE
53%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude Opus 4.6はこのベンチマークで53%を記録しました。
MMLU
91%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude Opus 4.6はこのベンチマークで91%を記録しました。
MMLU Pro
82%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude Opus 4.6はこのベンチマークで82%を記録しました。
SimpleQA
72%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude Opus 4.6はこのベンチマークで72%を記録しました。
IFEval
94%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude Opus 4.6はこのベンチマークで94%を記録しました。
AIME 2025
100%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude Opus 4.6はこのベンチマークで100%を記録しました。
MATH
93%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude Opus 4.6はこのベンチマークで93%を記録しました。
GSM8k
99%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude Opus 4.6はこのベンチマークで99%を記録しました。
MGSM
96%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude Opus 4.6はこのベンチマークで96%を記録しました。
MathVista
75%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude Opus 4.6はこのベンチマークで75%を記録しました。
SWE-Bench
81%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude Opus 4.6はこのベンチマークで81%を記録しました。
HumanEval
95%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude Opus 4.6はこのベンチマークで95%を記録しました。
LiveCodeBench
76%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude Opus 4.6はこのベンチマークで76%を記録しました。
MMMU
77%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude Opus 4.6はこのベンチマークで77%を記録しました。
MMMU Pro
77%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude Opus 4.6はこのベンチマークで77%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude Opus 4.6はこのベンチマークで89%を記録しました。
DocVQA
93%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude Opus 4.6はこのベンチマークで93%を記録しました。
Terminal-Bench
65%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude Opus 4.6はこのベンチマークで65%を記録しました。
ARC-AGI
69%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude Opus 4.6はこのベンチマークで69%を記録しました。

Claude Opus 4.6について

Claude Opus 4.6の機能、特徴、そしてより良い結果を得るための方法について学びましょう。

インテリジェンスの新たなフロンティア

Claude Opus 4.6は、大型言語モデルの能力における重要な飛躍を象徴しており、特に最も要求の厳しい認知タスク向けに設計されています。2026年2月5日にリリースされたこのモデルは、クエリの複雑さに基づいてモデルが動的にreasoningのエフォートをスケールできる画期的な機能、Adaptive Thinkingを導入しました。これにより、単純なクエリは効率的に処理される一方で、複雑な論理パズルや極めて重要なエンジニアリングタスクには、必要とされる深い処理が行われることが保証されます。

Agentic時代の到来を見据えた設計

単なるチャットを超えた設計のOpus 4.6は、自律的なagenticワークフローのための強力なエンジンです。Terminal-Bench 2.0およびSWE-Bench Verifiedにおいて業界をリードするスコアを記録しており、コンピュータ環境の操作、マルチステップのソフトウェアデバッグの管理、および最小限の人間による介入での複雑なプロジェクトのオーケストレーションが可能です。拡張された100万tokenのcontext window(ベータ版)により、技術的なエコシステム全体を同時にメモリに保持することができます。

Claude Opus 4.6のユースケース

Claude Opus 4.6を使って素晴らしい結果を得るさまざまな方法を発見してください。

自律型agenticワークフロー

OSWorldレベルのreasoningを使用して、視覚的なデスクトップ環境にわたるマルチステップのagenticタスクをオーケストレートします。

フルスタックVibe Coding

単一のハイレベルなpromptから、3Dゲームや複雑なダッシュボードのような完全に機能するアプリケーション全体を生成します。

大規模リポジトリ管理

1M tokenのcontext windowとModel Context Protocolを活用して、大規模なコードベースの分析とリファクタリングを行います。

深い科学研究

エリートレベルのGPQA Diamondパフォーマンスにより、生物学、化学、物理学にわたる博士号レベルの情報を統合します。

専門的な財務分析

エンタープライズグレードの意思決定のために、agenticな財務モデリングとマルチソースのデータ統合を実行します。

長期的なプランニング

一貫したツールの使用とタスクの遵守を必要とする、数ヶ月に及ぶ複雑なプロジェクトやシミュレーションを管理します。

強み

制限

エリートなAgentic Reasoning: 自律型エージェント向けのTerminal-Bench 2.0(65%)およびOSWorldでstate-of-the-artのパフォーマンスを発揮します。
高いAPI Latency: 最大限のreasoningエフォートや大規模なcontext windowを使用する場合、Sonnetバリアントよりも大幅に遅くなることがあります。
圧倒的なコンテキスト容量: 1M tokenのウィンドウ(ベータ版)により、フォーカスを失うことなくライブラリ全体や大規模なソフトウェアリポジトリを処理できます。
プレミアムな価格体系: 100万tokenあたり5ドル/25ドルという価格は、最適化された軽量モデルや小型モデルと比較して、開発者にとって高コストな選択肢となります。
動的なAdaptive Thinking: reasoningのエフォートをスケールさせる能力により、迅速なクエリと深い数学的問題の両方で最適なパフォーマンスを保証します。
統合の複雑さ: Adaptive Thinkingのような機能には、最新のAPI実装とAnthropic独自のツールセットに関する深い知識が必要です。
卓越した技術的習熟度: 非常に高い数学および科学の能力を持ち、AIME 2025で100%の満点を、GPQA Diamondで91%を記録しています。
限定的なマルチモーダル出力: vision入力は世界クラスですが、現在のところネイティブなリアルタイムの音声および動画生成機能は備えていません。

APIクイックスタート

anthropic/claude-opus-4-6

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env['ANTHROPIC_API_KEY'],
});

const message = await anthropic.messages.create({
  model: "claude-4-6-opus-20260205",
  max_tokens: 128000,
  messages: [
    { role: "user", content: "Three.jsを使用して、完全に機能する3D物理シミュレーターを作成してください。" }
  ],
});

console.log(message.content[0].text);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude Opus 4.6についてのユーザーの声

Claude Opus 4.6についてコミュニティがどう思っているか見てください

"Claude Opus 4.6は驚くほど強力です。Deep Research + 高度なreasoning + 本格的なcoding能力の融合と言えます。"
Awa K. Penn
x
"GPT-5.2のxhigh reasoningを超えています... Opus 4.5の4.6%というスコアからの巨大な飛躍です!"
Minyang Tian
x
"このモデルは現在、codingにおいて非常に強力です... 細部で迷子になることがありません。"
Dinmukhanbet Aizharykov
x
"1週間使っていますが、コンテキストの保持能力は恐ろしいほど良いです。"
CodeMaster99
reddit
"adaptive thinkingは、複雑なタスクのコスト管理においてゲームチェンジャーです。"
AI_Strategy_Expert
hackernews
"Opus 4.6は基本的に、フィードバックをしっかり聞いてくれるAGIインターンのようなものです。"
TechVlogger2026
youtube

Claude Opus 4.6についての動画

Claude Opus 4.6についてのチュートリアル、レビュー、ディスカッションを見る

「このモデルは他のすべてのfrontierシステムを追い抜きました... まったく別次元のクラスです。」

「膨大なドキュメントライブラリを想像してください。このソフトウェアは実際に400ページの脚注を覚えているのです。」

「モデルは難易度に基づいて、どれだけ頑張る必要があるかを実際に判断し、ギアを切り替えます。」

「AIが複雑なエンジニアリング要件の『ノリ(vibe)』を本当に理解しているのを初めて見ました。」

「これは明らかに、速度よりもゼロショットの正確性を必要とするエンタープライズ開発者向けに構築されています。」

「ClaudeにOpus 4.6という新しいflagshipモデルが登場しました。ネタバレすると、これまで見たものの中で最高です。」

「このモデルは以前の何よりもはるかに自律的です... agenticな力は本物です。」

「個人的な感想としては、これは実質Opus 5だと感じました。それほどまでに挙動が素晴らしかったです。」

「長い会話における『漂流(ドリンフト)』問題がついに解決されたように感じます。」

「adaptive thinkingの切り替え機能は、2026年で最も過小評価されている機能です。」

「Opus 4.6です。私はいつもOpusモデルを使っているので、個人的にはこれにとても興奮しています。」

「素晴らしいコントロール機能を提供してくれました... これまでで断トツの最高の結果です。」

「たった一つのpromptで... Steamでリリースできるような完全に機能するゲームを作成しました。」

「ツールの呼び出し方が非常に信頼できるようになり、引数のハルシネーションも起こしません。」

「重いcodingプロジェクトにおいて、これは正式に私の以前の環境に取って代わりました。」

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Claude Opus 4.6のプロのヒント

Claude Opus 4.6を最大限に活用し、より良い結果を得るための専門家のヒント。

Adaptive Thinkingの活用

thinking parametersを使用してエフォートレベルを切り替え、異なるタスクに対してコストと認知的な深さのバランスを調整してください。

Context Compaction

長時間実行されるagenticなタスクでは、ベータ版のcontext compaction機能を有効にすることで、token制限を超えずにパフォーマンスを維持できます。

MCPツールの利用

Opus 4.6をModel Context Protocolと組み合わせることで、ローカルのファイルシステムやデータベースへの安全なアクセスをモデルに許可できます。

複雑なアプリのワンショット生成

包括的なシステムpromptを提供してください。Opus 4.6は、1,000行を超えるファイルを一度に正確に生成する能力があります。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

deepseek

DeepSeek-V3.2-Speciale

deepseek

DeepSeek-V3.2-Speciale is a reasoning-first LLM featuring gold-medal math performance, DeepSeek Sparse Attention, and a 131K context window. Rivaling GPT-5...

131K context
$0.28/$0.42/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M
moonshot

Kimi K2 Thinking

moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.15/1M
openai

GPT-5.2

openai

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
openai

GPT-5.2 Pro

openai

GPT-5.2 Pro is OpenAI's 2025 flagship reasoning model featuring Extended Thinking for SOTA performance in mathematics, coding, and expert knowledge work.

400K context
$21.00/$168.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
moonshot

Kimi K2.5

moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

262K context
$0.60/$2.50/1M

Claude Opus 4.6についてのよくある質問

Claude Opus 4.6に関するよくある質問への回答を見つけてください