発表直後から話題沸騰:Claude Sonnet 5 が切り拓くエージェントAIの新地平
室谷代表取締役ついに来ましたね。AnthropicからClaude Sonnet 5が発表されました。
Xのタイムラインもこのニュースで持ちきりです。
Xのタイムラインもこのニュースで持ちきりです。
テキトー教師.AI認定講師はい、もう本当に待望のモデルでした。何と言っても「最もエージェント的なSonnet」という謳い文句ですからね。
従来のSonnetシリーズはコスパは良いけど複雑な自律タスクはOpus頼み、という構図があったんですが、Sonnet 5でその壁が大きく崩れた印象です。
従来のSonnetシリーズはコスパは良いけど複雑な自律タスクはOpus頼み、という構図があったんですが、Sonnet 5でその壁が大きく崩れた印象です。
室谷代表取締役そうですよね。僕もMYUUUでAIエージェントの実装をいくつか手がけているんですが、これまではOpus 4.8クラスを使うとコストがかさむし、Sonnetだと途中で止まっちゃうみたいなケースが多かった。
Sonnet 5はその「ちょうどいい」を狙ったモデルだと感じます。
Sonnet 5はその「ちょうどいい」を狙ったモデルだと感じます。
テキトー教師.AI認定講師公式発表では「わずか数ヶ月前までは、より大きく高価なモデルが必要だったレベル」をSonnet 5で実現したとあります。実際、早期アクセスパートナーからは「従来のSonnetでは途中で止まっていた複雑なタスクを完遂する」「指示なしで出力を自己チェックする」といった声が寄せられているそうです。
Sonnet 5 の核心:推論・ツール使用・コーディングで大幅向上
室谷代表取締役具体的な性能改善の数字も気になりますね。公式ページにはSonnet 4.6やOpus 4.8との比較チャートが出てます。
テキトー教師.AI認定講師はい、いくつかのベンチマークで見てみましょう。まずエージェント検索評価のBrowseCompと、コンピュータ使用評価のOSWorld-Verifiedにおいて、Sonnet 5はSonnet 4.6を明確に上回り、Opus 4.8と同等かそれ以上のコストパフォーマンスの選択肢を提供しているんです。
室谷代表取締役特に面白いのは「努力レベル(effort level)」を調整できる点ですね。中程度の努力レベルで圧倒的なコスパを発揮し、高努力レベルではOpus 4.8に肩を並べる。
つまり、ユーザーがタスクに応じて性能とコストのバランスを細かく選べるわけです。
つまり、ユーザーがタスクに応じて性能とコストのバランスを細かく選べるわけです。
テキトー教師.AI認定講師その通りです。具体的な数値としては、Sonnet 5は推論、ツール使用、コーディング、知識作業においてSonnet 4.6から「substantial improvement」とされています。
Opus 4.8との性能差は「close」という表現で、価格は大幅に低い。
Opus 4.8との性能差は「close」という表現で、価格は大幅に低い。
室谷代表取締役ちなみに、料金体系ですが、発表時から8月31日まではイントロダクトリー価格で入力100万トークンあたり2ドル、出力100万トークンあたり10ドル。それ以降はそれぞれ3ドルと15ドルになります。
Opus 4.8がいくらかは公開されていませんが、これまで通りの価格帯を考えるとかなりお得ですね。
Opus 4.8がいくらかは公開されていませんが、これまで通りの価格帯を考えるとかなりお得ですね。
エージェント性能の飛躍:自律的な計画・実行・自己チェック
テキトー教師.AI認定講師今回のSonnet 5の最大の売りは、エージェント性能の強化です。具体的には「計画を立てる」「ブラウザやターミナルなどのツールを使う」「自律的に動作する」の3点が強調されています。
室谷代表取締役これはまさに以前から私が求めていた機能です。MYUUUでも、例えば「市場調査してレポートを自動作成する」というワークフローを組もうとすると、従来は工程ごとに人間がチェックしないと間違ったまま進んでしまうことがよくありました。
テキトー教師.AI認定講師講座で受講生さんからも「一度指示したら後は全部自動でやってほしい」という声が多かったんですよね。Sonnet 5は「自己チェック」機能を内蔵していて、出力した内容を自分で検証し、誤りがあれば修正する。
これが結構大きい。
これが結構大きい。
室谷代表取締役それに加えて、ツール使用の精度も上がっているようです。公式の文言では「makes plans, uses tools like browsers and terminals, and runs autonomously」とあります。
特にブラウザ操作とターミナル操作は、実際のエージェントタスクで頻繁に使うものなので、ここが改善されたのは開発者にとって喜ばしいですね。
特にブラウザ操作とターミナル操作は、実際のエージェントタスクで頻繁に使うものなので、ここが改善されたのは開発者にとって喜ばしいですね。
テキトー教師.AI認定講師開発者の方であれば、Claude Codeとも組み合わせて使うことになるでしょう。Claude Codeはコマンドライン上でコードを書いたり実行したりするツールですが、Sonnet 5がそのエンジンになることで、より複雑なタスクを自律的に処理できるようになります。
料金と提供形態:驚きの低価格でエンタープライズまで
室谷代表取締役提供形態についても確認しておきましょう。Sonnet 5は本日から全プランで利用可能です。
FreeとProではデフォルトモデルに設定され、Max、Team、Enterpriseでも選択できます。
FreeとProではデフォルトモデルに設定され、Max、Team、Enterpriseでも選択できます。
テキトー教師.AI認定講師APIももちろん用意されていて、モデル名は
claude-sonnet-5 でアクセスできるそうです。Claude PlatformやClaude Codeでも即日使えるようになっています。
室谷代表取締役この価格設定はかなり攻めてますね。特に、今後エージェントを大量に動かすようなユースケースでは、トークンコストが命になりますから。
初期限定とはいえ、入力$2/100万トークンは業界的にも非常に競争力のある価格です。
初期限定とはいえ、入力$2/100万トークンは業界的にも非常に競争力のある価格です。
テキトー教師.AI認定講師そうですね。背景ブリーフにもありましたが、「安価なモデルでも複雑なタスクを自律的に完遂してほしい」という要望に応える形です。
特にスタートアップや個人開発者にとって、Opusクラスの性能をSonnet価格で使えるのは大きなメリットです。
特にスタートアップや個人開発者にとって、Opusクラスの性能をSonnet価格で使えるのは大きなメリットです。
安全性評価とガードレール:望ましくない挙動の低減
テキトー教師.AI認定講師気になるのは安全性ですね。エージェントモデルは自由度が高い分、悪用のリスクも高まります。
Anthropicもこの点はしっかり評価しているようです。
Anthropicもこの点はしっかり評価しているようです。
室谷代表取締役公式のシステムカードによると、Sonnet 5はSonnet 4.6と比較して「望ましくない挙動の発生率が全体的に低い」とされています。つまり、より安全にエージェントとして使えるということですね。
テキトー教師.AI認定講師ただし、サイバーセキュリティタスクの能力は、現在のOpusモデルよりも「はるかに低い」と明記されています。これは意図的なのかもしれませんね。
エージェント機能を悪用した攻撃を抑えるためのガードレールとして。
エージェント機能を悪用した攻撃を抑えるためのガードレールとして。
室谷代表取締役なるほど。強力だけど危険な領域にはブレーキをかける。
Anthropicの責任ある姿勢が感じられます。ただ、このあたりは今後のアップデートでどう変わっていくか注目ですね。
Anthropicの責任ある姿勢が感じられます。ただ、このあたりは今後のアップデートでどう変わっていくか注目ですね。
今後の展望:SonnetとOpusの役割分担と業界への波及
室谷代表取締役今回のSonnet 5で、Anthropicのモデルラインナップはどう変わるんでしょうか。
テキトー教師.AI認定講師従来は「Sonnetはコスパ、Opusは最高性能」という明確なすみ分けがありました。しかしSonnet 5がOpus 4.8に迫る性能を持ったことで、特にエージェントタスクにおいてはSonnetで十分というケースが増えそうです。
室谷代表取締役ただ、Opusの方もさらに進化しているはずです。Opus 4.8の後継モデルもいずれ出てくるでしょう。
そうなると、Sonnetは「日常的なエージェントワークの主力」、Opusは「研究レベルの高度な推論」という棲み分けになるかもしれません。
そうなると、Sonnetは「日常的なエージェントワークの主力」、Opusは「研究レベルの高度な推論」という棲み分けになるかもしれません。
テキトー教師.AI認定講師業界全体としては、エージェント性能を軽量モデルで実現する流れが加速するでしょう。OpenAIもGoogleも同様の方向に進んでいますが、Anthropicが先鞭をつけた形です。
Claude Codeとの連携などエコシステムも含めて、今後の競争が楽しみですね。
Claude Codeとの連携などエコシステムも含めて、今後の競争が楽しみですね。
室谷代表取締役そうですね。私もすぐにAPIを試してみようと思います。
特に自己チェック機能は、これまでのエージェントワークフローで悩まされていたポイントなので、実用性を検証したいです。
特に自己チェック機能は、これまでのエージェントワークフローで悩まされていたポイントなので、実用性を検証したいです。
よくある質問
Q: Claude Sonnet 5はいつから使えますか?
A: 2026年6月30日より、すべてのプラン(Free、Pro、Max、Team、Enterprise)で即日利用可能です。APIでも claude-sonnet-5 でアクセスできます。
Q: Claude Sonnet 5の料金は? A: 2026年8月31日までのイントロダクトリー価格は、入力100万トークンあたり2ドル、出力100万トークンあたり10ドルです。以降は入力3ドル、出力15ドルになります。
Q: Claude Sonnet 5はClaude Codeで使えますか? A: はい、Claude Codeでもデフォルトモデルとして利用可能です。Claude Codeとは?で詳細を解説しています。
Q: Claude Sonnet 5はOpus 4.8と比べてどうですか? A: 性能はOpus 4.8に近く、特にエージェントタスクではコストパフォーマンスで優れます。ただし最高性能はOpus 4.8が上回る可能性があります。
Q: Claude Sonnet 5の安全性は? A: 公式の評価ではSonnet 4.6よりも望ましくない挙動が少なく、エージェント用途で安全に使えるとされています。ただしサイバーセキュリティ能力はOpusより低く抑えられています。
出典
- Anthropic公式:Introducing Claude Sonnet 5 https://www.anthropic.com/news/claude-sonnet-5
- Anthropic公式Xアカウント:https://x.com/claudeai/status/2072017450611142835
