anthropic

Claude 3.7 Sonnet

Claude 3.7 SonnetはAnthropic初のハイブリッドreasoningモデルであり、最高峰のコーディング能力、200kのcontext window、可視化された思考プロセスを提供します。

anthropic logoanthropicClaude 32025年2月24日
コンテキスト
200Kトークン
最大出力
128Kトークン
入力価格
$3.00/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
84.8%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude 3.7 Sonnetはこのベンチマークで84.8%を記録しました。
HLE
34%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで34%を記録しました。
MMLU
89%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで89%を記録しました。
MMLU Pro
74%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude 3.7 Sonnetはこのベンチマークで74%を記録しました。
SimpleQA
42%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで42%を記録しました。
IFEval
93.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude 3.7 Sonnetはこのベンチマークで93.2%を記録しました。
AIME 2025
54.8%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude 3.7 Sonnetはこのベンチマークで54.8%を記録しました。
MATH
96.2%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで96.2%を記録しました。
GSM8k
97%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude 3.7 Sonnetはこのベンチマークで97%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude 3.7 Sonnetはこのベンチマークで92%を記録しました。
MathVista
70%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで70%を記録しました。
SWE-Bench
70.3%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude 3.7 Sonnetはこのベンチマークで70.3%を記録しました。
HumanEval
94%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude 3.7 Sonnetはこのベンチマークで94%を記録しました。
LiveCodeBench
65%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで65%を記録しました。
MMMU
75%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで75%を記録しました。
MMMU Pro
55%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude 3.7 Sonnetはこのベンチマークで55%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで89%を記録しました。
DocVQA
94%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで94%を記録しました。
Terminal-Bench
35.2%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで35.2%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude 3.7 Sonnetはこのベンチマークで12%を記録しました。

Claude 3.7 Sonnetについて

Claude 3.7 Sonnetの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

ハイブリッドreasoning設計

Claude 3.7 Sonnetは、ユーザーが速度と深さを選択できる新しいアーキテクチャを採用しています。これは拡張されたthinkingのトグル機能を備えた初のモデルであり、システムが答えを出す前に複雑な論理を検討することを可能にします。この透明性により、開発者はモデルがどのように結論に達したかを正確に把握でき、技術的な作業における隠れたエラーのリスクを軽減できます。

技術的な問題解決

このモデルは高度なソフトウェアエンジニアリングのために構築されています。SWE-bench Verified benchmarkで62.1%を記録し、実際のGitHubの課題を修正する強力な能力を示しています。Claude Codeのようなツールと併用することで、大規模なリポジトリ全体にわたるファイルの編集やコマンド実行を管理します。数学やコーディングのタスクを、現在の最高クラスのreasoningモデルと同等、あるいはそれ以上の精度で処理します。

大規模なcontext容量

20万tokenのcontext windowにより、モデルは膨大なドキュメントやコードベースを一括で処理します。thinkingモードが有効な場合は最大12万8,000 tokenの出力に対応しており、長いスクリプトや詳細なレポートの生成に役立ちます。また、本モデルはmultimodalであり、テキストとともにグラフや図を解釈することも可能です。

Claude 3.7 Sonnet

Claude 3.7 Sonnetのユースケース

Claude 3.7 Sonnetを使って素晴らしい結果を得るさまざまな方法を発見してください。

Agenticソフトウェアエンジニアリング

ターミナルツールを使用して、大規模なファイル構造全体にわたるバグ修正やリファクタリングを行います。

数学的証明の検証

モデルに論理的なステップを考えさせることで、困難な数学的問題を解決します。

リポジトリ分析

1つのpromptで、技術的なコードベース全体からデータを抽出したり、パターンを特定したりします。

視覚データ解析

複雑なグラフ、フローチャート、技術図を構造化されたJSONデータに変換します。

システムアーキテクチャ設計

拡張されたthinkingモードを使用して、詳細な論理チェックを行いながらソフトウェアシステムを設計します。

自動化されたGitワークフロー

agenticなツール活用を通じて、コミットメッセージの管理、コードレビュー、テスト実行を行います。

強み

制限

ハイブリッドなthinkingオプション: 高速な標準応答と深いreasoningモードを切り替えられる初のモデルです。
reasoningのlatency: thinkingモードを有効にすると、モデルの応答時間が大幅に増加します。
最高峰のコーディングエージェント: SWE-bench Verifiedで62.1%のスコアを記録し、本番環境の課題解決においてトップクラスの性能を誇ります。
thinkingのコスト: 内部的なreasoning tokensは出力100万tokenあたり15ドルの料金が適用されるため、長時間のタスクではコストがかさみます。
極めて高い出力容量: 1回の応答で最大12万8,000 tokenを生成でき、大規模なコードやドキュメントの生成を容易にします。
動画非対応: 競合他社とは異なり、APIを通じて生の動画ファイルをネイティブに取り込んだり分析したりすることはできません。
透明性の高い論理: 外部化されたchain-of-thoughtにより、モデルの内部的な推論プロセスを監査・デバッグできます。
知識のカットオフ: 学習データは2024年10月までのものであり、それ以降の最新の業界動向は反映されていません。

APIクイックスタート

anthropic/claude-3-7-sonnet

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic();

const message = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 4096,
  thinking: {
    type: "enabled",
    budget_tokens: 2048
  },
  messages: [{ role: "user", content: "このアーキテクチャの欠陥を分析して..." }],
});

console.log(message.content);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude 3.7 Sonnetについてのユーザーの声

Claude 3.7 Sonnetについてコミュニティがどう思っているか見てください

Claude Codeと3.7 Sonnetの組み合わせは、私のターミナルに新人開発者が強化状態で入ったようなものだ。Agentic AIがリアルだと感じた初めての経験だ。
dev_guru_99
reddit
ハイブリッドreasoningは大きなアップデートだ。30秒間も考えさせる必要がない時もあるが、デバッグ時には信じられないほど役に立つ。
TechLead_X
twitter
Anthropicは、日常的なチャットで役立つ状態を維持しつつ、数学でo1と競合できるモデルを作り上げた。
logic_fanatic
hackernews
Claudeは、引用付きの包括的で美しくフォーマットされたレポートを5分以内で作成してくれる。
ThinkingDeeplyAI_mod
reddit
128kの出力制限は隠れた名機能だ。長いスクリプトの途中で切れることのないモデルがついに登場した。
code_monk_42
reddit
Claude 3.7 + MCPは、現時点で最もJarvisに近い存在だ。私のローカルツールを正しく使用してくれる。
julie_codes_it
twitter

Claude 3.7 Sonnetについての動画

Claude 3.7 Sonnetについてのチュートリアル、レビュー、ディスカッションを見る

Claude 3.7はまさに本物だ。新しいベースモデルは自己改善を果たし、プログラミング能力がさらに向上した。

この新しい3.7モデルは、OpenAI o3 miniを含む他のあらゆるモデルを完全に凌駕している。

GitHubの課題の70%を解決できる能力がある。

拡張されたthinking機能により、モデルはコードを出力する前に問題について深く考察できる。

これは開発者体験にとって非常に大きな進歩だ。

チャットボットは助言をくれるだけだが、Claude Codeは自ら行動する。ファイルの作成、Webサイト構築、パッケージのインストールが可能だ。

拡張されたthinkingとは、Claudeが実際に行動を起こす前に推論を行う機能のことだ。

このツールはターミナル環境向けに最適化されている。

MCPによる接続性こそが、これと従来のChatGPTを決定的に分ける要素だ。

モデルは曖昧なターミナルコマンドの背後にある意図を理解する。

Claude Codeを通じたターミナルとの統合は、これまで見たことのないレベルの自律性だ。

Claude 3.7 Sonnetの思考プロセスを可視化する能力は、競合他社よりもはるかに透明性が高い。

SWE-bench Verifiedでは驚異的な62%を達成した。

ハイブリッドreasoningにより、必要ない時にlatencyペナルティを支払う必要がない。

以前のClaudeモデルが持っていた高品質な文章スタイルを維持している。

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー

Claude 3.7 Sonnetのプロのヒント

Claude 3.7 Sonnetを最大限に活用し、より良い結果を得るための専門家のヒント。

reasoning予算の設定

APIのthinkingパラメータを使用してreasoning tokensの数を制限し、コストを管理しましょう。

思考プロセスの確認

応答内の内部的なchain-of-thoughtを確認し、複雑な回答の論理が正しいかを検証しましょう。

MCPコネクタの活用

モデルをローカルデータベースやクラウドストレージに接続し、リアルタイムのプロジェクトcontextを活用しましょう。

contextの更新

長いagenticループの中で要約コマンドを使用し、context windowを関連性の高いデータに集中させましょう。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

moonshot

Kimi K2 Thinking

Moonshot

Kimi K2 Thinking is Moonshot AI's trillion-parameter reasoning model. It outperforms GPT-5 on HLE and supports 300 sequential tool calls autonomously for...

256K context
$0.60/$2.50/1M
openai

GPT-5.4

OpenAI

GPT-5.4 is OpenAI's frontier model featuring a 1.05M context window and Extreme Reasoning. It excels at autonomous UI interaction and long-form data analysis.

1M context
$2.50/$15.00/1M
openai

GPT-5.2

OpenAI

GPT-5.2 is OpenAI's flagship model for professional tasks, featuring a 400K context window, elite coding, and deep multi-step reasoning capabilities.

400K context
$1.75/$14.00/1M
zhipu

GLM-5

Zhipu (GLM)

GLM-5 is Zhipu AI's 744B parameter open-weight powerhouse, excelling in long-horizon agentic tasks, coding, and factual accuracy with a 200k context window.

200K context
$1.00/$3.20/1M
google

Gemini 3.1 Flash-Lite

Google

Gemini 3.1 Flash-Lite is Google's fastest, most cost-efficient model. Features 1M context, native multimodality, and 363 tokens/sec speed for scale.

1M context
$0.25/$1.50/1M
anthropic

Claude Opus 4.5

Anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xAI

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
moonshot

Kimi K2.5

Moonshot

Discover Moonshot AI's Kimi K2.5, a 1T-parameter open-source agentic model featuring native multimodal capabilities, a 262K context window, and SOTA reasoning.

256K context
$0.60/$3.00/1M

Claude 3.7 Sonnetについてのよくある質問

Claude 3.7 Sonnetに関するよくある質問への回答を見つけてください