anthropic

Claude 3.7 Sonnet

Claude 3.7 SonnetはAnthropic初のhybrid reasoning modelであり、state-of-the-artなコーディング能力、200kのcontext window、そして可視化された思考プロセスを提供します。

anthropic logoanthropicClaude 3February 24, 2025
コンテキスト
200Kトークン
最大出力
128Kトークン
入力価格
$3.00/ 1M
出力価格
$15.00/ 1M
モダリティ:TextImage
機能:ビジョンツールストリーミング推論
ベンチマーク
GPQA
84.8%
GPQA: 大学院レベル科学Q&A. 生物学、物理学、化学の448問の選択問題からなる厳格なベンチマーク。博士号専門家でも65-74%の正解率。 Claude 3.7 Sonnetはこのベンチマークで84.8%を記録しました。
HLE
34%
HLE: 高レベル専門推論. 専門分野でエキスパートレベルの推論を示すモデルの能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで34%を記録しました。
MMLU
89%
MMLU: 大規模多タスク言語理解. 57の学術科目にわたる16,000問の選択問題からなる包括的なベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで89%を記録しました。
MMLU Pro
74%
MMLU Pro: MMLUプロフェッショナル版. より難しい10択形式の12,032問を含むMMLUの強化版。 Claude 3.7 Sonnetはこのベンチマークで74%を記録しました。
SimpleQA
42%
SimpleQA: 事実精度ベンチマーク. 直接的な質問に対して正確で事実に基づく回答を提供するモデルの能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで42%を記録しました。
IFEval
93.2%
IFEval: 指示遵守評価. モデルが特定の指示と制約にどれだけ従うかを測定。 Claude 3.7 Sonnetはこのベンチマークで93.2%を記録しました。
AIME 2025
54.8%
AIME 2025: アメリカ招待数学試験. 名門AIME試験からの競技レベルの数学問題。 Claude 3.7 Sonnetはこのベンチマークで54.8%を記録しました。
MATH
96.2%
MATH: 数学問題解決. 代数、幾何、微積分などの分野をテストする包括的な数学ベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで96.2%を記録しました。
GSM8k
97%
GSM8k: 小学校算数8K. 多段階推論を必要とする8,500問の小学校レベルの算数文章問題。 Claude 3.7 Sonnetはこのベンチマークで97%を記録しました。
MGSM
92%
MGSM: 多言語小学校算数. GSM8kベンチマークを10言語に翻訳したもの。 Claude 3.7 Sonnetはこのベンチマークで92%を記録しました。
MathVista
70%
MathVista: 数学的視覚推論. グラフや図などの視覚要素を含む数学問題を解く能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで70%を記録しました。
SWE-Bench
70.3%
SWE-Bench: ソフトウェアエンジニアリングベンチマーク. AIモデルがオープンソースPythonプロジェクトの実際のGitHub課題を解決しようとする。 Claude 3.7 Sonnetはこのベンチマークで70.3%を記録しました。
HumanEval
94%
HumanEval: Pythonプログラミング問題. モデルが正しいPython関数実装を生成する必要がある164問の手書きプログラミング問題。 Claude 3.7 Sonnetはこのベンチマークで94%を記録しました。
LiveCodeBench
65%
LiveCodeBench: ライブコーディングベンチマーク. 継続的に更新される実世界のプログラミングチャレンジでコーディング能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで65%を記録しました。
MMMU
75%
MMMU: マルチモーダル理解. 大学レベルの問題でビジョン言語モデルをテストする大規模多分野マルチモーダル理解ベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで75%を記録しました。
MMMU Pro
55%
MMMU Pro: MMMUプロフェッショナル版. より挑戦的な問題とより厳格な評価を備えたMMMUの強化版。 Claude 3.7 Sonnetはこのベンチマークで55%を記録しました。
ChartQA
89%
ChartQA: チャート質問応答. チャートやグラフに表示された情報を理解し推論する能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで89%を記録しました。
DocVQA
94%
DocVQA: ドキュメント視覚Q&A. ドキュメント画像から情報を抽出する能力をテストするドキュメント視覚質問応答ベンチマーク。 Claude 3.7 Sonnetはこのベンチマークで94%を記録しました。
Terminal-Bench
35.2%
Terminal-Bench: ターミナル/CLIタスク. コマンドライン操作を実行し、シェルスクリプトを書く能力をテスト。 Claude 3.7 Sonnetはこのベンチマークで35.2%を記録しました。
ARC-AGI
12%
ARC-AGI: 抽象化と推論. AGIのための抽象化と推論コーパス - 新しいパターン認識パズルで流動的知性をテスト。 Claude 3.7 Sonnetはこのベンチマークで12%を記録しました。

Claude 3.7 Sonnetを無料で試す

Claude 3.7 Sonnetと無料でチャット。機能をテストし、質問し、このAIモデルができることを探索してください。

プロンプト
レスポンス
anthropic/claude-3-7-sonnet-20250219

AIの応答がここに表示されます

Claude 3.7 Sonnetについて

Claude 3.7 Sonnetの機能、特徴、そしてより良い結果を得るための方法について学びましょう。

hybrid reasoning と透明性

Claude 3.7 Sonnetは、Anthropic初の「hybrid reasoning」modelとして、LLMアーキテクチャにおける画期的な転換点となります。標準的な低latencyな回答と、内部のchain-of-thoughtを表示する「extended thinking」モードをユーザーが切り替えられるのが特徴です。この透明性により、ユーザーはmodelのロジックを明確に把握でき、複雑なトラブルシューティングや重要なreasoningタスクにおいて特に威力を発揮します。

ソフトウェアエンジニアリングの熟達

ソフトウェアエンジニアリングと本番環境向けの出力に重点を置いて設計されたこのmodelは、SWE-bench Verifiedなどのbenchmarkで新たな業界標準を確立しました。開発者がハイレベルな意図を説明し、modelが複数のファイルにわたる実装を担当する「Vibe Coding」に優れています。従来のfrontier modelを凌駕する精度で、複雑なリファクタリングやアーキテクチャの決定を処理します。

巨大な context window と agentic なツール

200,000 tokensの大規模なcontext windowと、Claude Codeと呼ばれるagenticなツールセットにより、単なるチャットボットから協力的な技術パートナーへと進化しました。初期のドキュメント確認からgitワークフローの自動化、テストの実行まで、プロジェクトのライフサイクル全体を管理でき、迅速でバグのない開発を実現します。

Claude 3.7 Sonnet

Claude 3.7 Sonnetのユースケース

Claude 3.7 Sonnetを使って素晴らしい結果を得るさまざまな方法を発見してください。

Vibe Coding

自然言語で意図を伝えるだけで、ゼロから機能するソフトウェアを構築する手法。

高度なデバッグ

extended thinkingを活用して複雑なログを分析し、的確なワンショットでの修正案を提示。

大規模なcontext分析

codebase全体や長い技術ドキュメントを1つのpromptでレビューおよびリファクタリング。

Agenticな開発

Claude Codeのようなターミナルベースのツールを動かし、gitワークフローやテスト実行を自動化。

フロントエンドUI生成

デザインセンスを活かし、洗練されたメンテナンス性の高いReactやSvelteのコンポーネントを作成。

事実に基づくリサーチ

膨大なPDFドキュメントやデータセットを、高い精度と低いhallucination率で分析。

強み

制限

業界をリードするコーディング能力: SWE-bench Verifiedでstate-of-the-artとなる70.3%を達成し、実際のGitHubのissueをかつてない精度で解決。
レスポンスの遅延: 「extended thinking」モードを有効にすると、標準的なmodelのレスポンスと比較して、最初のtokenまでの時間が大幅に増加します。
可視化されたreasoning: 複雑で重要な問題解決のために、ユーザーが制御可能な可視化された「extended thinking」プロセスを提供する初のmodel。
プレミアムな価格設定: 1M tokensあたり15ドルの出力コストは、多くの「mini」やオープンウェイトの代替案よりも依然としてかなり高額です。
Agenticな統合: Claude Codeエージェントフレームワークを介した、ツール利用とCLI操作に最適化されたエンドツーエンドのタスク自動化。
オーディオ/ビデオのネイティブ非対応: GPT-4oやGemini 2.0とは異なり、ネイティブなオーディオおよびビデオ入力の処理機能がありません。
優れたデザインセンス: 他のfrontier modelと比較して、一貫してエレガントでアクセシブル、かつメンテナンス性の高いUIコードを生成。
計算コスト: 大規模なcodebaseのリファクタリング中、高度なreasoningセッションはtoken予算とcontext制限を急速に消費する可能性があります。

APIクイックスタート

anthropic/claude-3-7-sonnet-20250219

ドキュメントを見る
anthropic SDK
import Anthropic from '@anthropic-ai/sdk';

const anthropic = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const msg = await anthropic.messages.create({
  model: "claude-3-7-sonnet-20250219",
  max_tokens: 1024,
  thinking: { type: "enabled", budget_tokens: 1024 },
  messages: [{ role: "user", content: "Write a high-performance Rust function for matrix multiplication." }],
});

console.log(msg.content);

SDKをインストールして、数分でAPIコールを開始しましょう。

Claude 3.7 Sonnetについてのユーザーの声

Claude 3.7 Sonnetについてコミュニティがどう思っているか見てください

"Claude 3.7 Sonnetは世界最高のコーディングAI modelです。難しいタスクでも驚かされました。"
rawcell4772
reddit
"たった一つのpromptで、複雑なTypeScriptプロジェクトのすべてを完璧に仕上げてくれました。"
rawcell4772
reddit
"Claude CodeとSonnet 3.7の組み合わせはClineよりもはるかに優れており、現在最高のツールです。"
peterkrueck
reddit
"3.7のようなトップティアmodelによる品質の飛躍は、私の今後の展望を大きく変えました。"
lurking_horrors
reddit
"Claude 3.7はマジでヤバい、次元が違う… 控えめに言って最高すぎる。"
Fireship
youtube
"Claude 3.7のreasoningモードは、ロジックのデバッグにおける完全なパラダイムシフトです。"
DevLead99
x

Claude 3.7 Sonnetについての動画

Claude 3.7 Sonnetについてのチュートリアル、レビュー、ディスカッションを見る

新しい3.7 modelは他のすべてのmodelを完全に圧倒しました… 今やGitHubのissueの70.3%を解決可能です

静的型付け言語とTDDを組み合わせることで、AIが書いたコードが実際に有効であることを検証できます

このmodelは指示に従う能力が信じられないほど高いです

SWE-benchでのパフォーマンスは正直言って異常なレベルです

可視化されたreasoningは、透明性の面でゲームチェンジャーになります

Claude 3.7 Sonnetは… おそらくコード生成において最高のLLMでしょう

APIを使用すれば、一度に128,000 tokensを出力できます

128kの出力制限は驚異的なアップグレードです

フロントエンドコンポーネントに対するデザインのセンスは比類なきものです

ツール利用とagenticな機能はこのmodelの中核をなしています

reasoningは完全に別のmodelにするのではなく、frontier modelの統合された機能であるべきです

Claude 3.7は、それらのmodel(DeepSeek、o3)をかなりの差で上回っています

reasoningモードではlatencyがわずかに高くなります

いくつかの指示追従タスクにおいてDeepSeek R1を打ち負かしています

Anthropicは本番環境でそのまま使える出力に真剣に注力しています

プロンプト以上のもの

ワークフローを強化する AI自動化

AutomatioはAIエージェント、ウェブ自動化、スマート統合のパワーを組み合わせ、より短時間でより多くのことを達成するお手伝いをします。

AIエージェント
ウェブ自動化
スマートワークフロー
デモ動画を見る

プロのヒント

このモデルを最大限に活用し、より良い結果を得るための専門家のヒント。

Thinking Budget

複雑なロジックやアーキテクチャ設計には、より高品質な結果を得るために「extended thinking」モードを明示的に使用して思考リソースを割り当ててください。

contextの制御

contextコストを節約し、modelの動作が遅くなるのを防ぐために、定期的に /clear を使用するかチャットを再開してください。

検証

Claude Codeツールを使用して、Claudeが作成したコードに対してテストを作成・実行させ、本番環境の安定性を確保してください。

Markdownによる仕様定義

大規模なプロジェクトで指示の追従性を高めるために、機能要件を構造化されたMarkdownファイルで提供してください。

お客様の声

ユーザーの声

ワークフローを変革した何千人もの満足したユーザーに加わりましょう

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

Jonathan Kogan

Jonathan Kogan

Co-Founder/CEO, rpatools.io

Automatio is one of the most used for RPA Tools both internally and externally. It saves us countless hours of work and we realized this could do the same for other startups and so we choose Automatio for most of our automation needs.

Mohammed Ibrahim

Mohammed Ibrahim

CEO, qannas.pro

I have used many tools over the past 5 years, Automatio is the Jack of All trades.. !! it could be your scraping bot in the morning and then it becomes your VA by the noon and in the evening it does your automations.. its amazing!

Ben Bressington

Ben Bressington

CTO, AiChatSolutions

Automatio is fantastic and simple to use to extract data from any website. This allowed me to replace a developer and do tasks myself as they only take a few minutes to setup and forget about it. Automatio is a game changer!

Sarah Chen

Sarah Chen

Head of Growth, ScaleUp Labs

We've tried dozens of automation tools, but Automatio stands out for its flexibility and ease of use. Our team productivity increased by 40% within the first month of adoption.

David Park

David Park

Founder, DataDriven.io

The AI-powered features in Automatio are incredible. It understands context and adapts to changes in websites automatically. No more broken scrapers!

Emily Rodriguez

Emily Rodriguez

Marketing Director, GrowthMetrics

Automatio transformed our lead generation process. What used to take our team days now happens automatically in minutes. The ROI is incredible.

関連 AI Models

xai

Grok-3

xai

Grok-3 is xAI's flagship reasoning model, featuring deep logic deduction, a 128k context window, and real-time integration with X for live research and coding.

128K context
$3.00/$15.00/1M
zhipu

GLM-4.7

zhipu

GLM-4.7 by Zhipu AI is a flagship 358B MoE model featuring a 200K context window, elite 73.8% SWE-bench performance, and native Deep Thinking for agentic...

200K context
$0.60/$2.20/1M
anthropic

Claude Sonnet 4.5

anthropic

Anthropic's Claude Sonnet 4.5 delivers world-leading coding (77.2% SWE-bench) and a 200K context window, optimized for the next generation of autonomous agents.

200K context
$3.00/$15.00/1M
anthropic

Claude Opus 4.5

anthropic

Claude Opus 4.5 is Anthropic's most powerful frontier model, delivering record-breaking 80.9% SWE-bench performance and advanced autonomous agency for coding.

200K context
$5.00/$25.00/1M
xai

Grok-4

xai

Grok-4 by xAI is a frontier model featuring a 2M token context window, real-time X platform integration, and world-record reasoning capabilities.

2M context
$3.00/$15.00/1M
openai

GPT-5.1

openai

GPT-5.1 is OpenAI’s advanced reasoning flagship featuring adaptive thinking, native multimodality, and state-of-the-art performance in math and technical...

400K context
$1.25/$10.00/1M
google

Gemini 3 Flash

google

Gemini 3 Flash is Google's high-speed multimodal model featuring a 1M token context window, elite 90.4% GPQA reasoning, and autonomous browser automation tools.

1M context
$0.50/$3.00/1M
google

Gemini 3 Pro

google

Google's Gemini 3 Pro is a multimodal powerhouse featuring a 1M token context window, native video processing, and industry-leading reasoning performance.

1M context
$2.00/$12.00/1M

よくある質問

このモデルに関するよくある質問への回答を見つけてください