2026年7月1日

Claude Sonnet 5がCursorで利用可能に:CursorBenchスコア57%を達成

「Claude Sonnet 5」がCursorで利用可能に:CursorBenchスコア57%を達成

室谷室谷代表取締役
今日は大きなニュースが飛び込んできましたね。CursorがClaude Sonnet 5をサポートしたんです。

早速見ていきましょう。
テキトー教師テキトー教師.AI認定講師
そうですね、Cursorの公式アカウントがポストしていました。Claude Sonnet 5がCursorで使えるようになったと。

CursorBenchという独自のベンチマークで57%のスコアを叩き出した。これは4.6の49%から8ポイントも上がっているんですね。
室谷室谷代表取締役
しかもこのCursorBench、単なるコード補完の評価じゃなくて、複雑なマルチファイルタスクを実環境で評価するらしいんですよ。『CursorBench 3.1』というバージョンで、コードベース理解やバグ発見、プランニング、コードレビューなんかも含まれている。
テキトー教師テキトー教師.AI認定講師
つまり、実際の開発現場に近い形で評価しているわけですよね。MYUUUでも、これまでのSonnet 4.6は悪くなかったんですが、大規模リファクタリングで何度か手直しが必要な場面がありました。

今回の5はその辺りが改善されているんでしょうか。

Sonnet 4.6から8ポイント向上:CursorBenchが示すコード生成能力の進化

テキトー教師テキトー教師.AI認定講師
ちょうど背景ブリーフにもありましたが、Sonnet 4.6でも高い性能だったんです。ただ、長いコンテキストや複雑なロジックになると精度が落ちるケースがあった。

特に自然言語から正確なコードを生成する部分でですね。
室谷室谷代表取締役
ええ。CursorBenchの全ランキングを見てみると、面白いですね。

Sonnet 5 Highで57.0%で18位、Sonnet 4.6 Highで48.8%で28位。順位だけ見ると一見差異は少ないですが、スコアの差は確かです。
テキトー教師テキトー教師.AI認定講師
ただし、公式ページの注釈にも『小さなスコア差は統計的に有意でない可能性がある』と書いてありますね。ただ、8ポイントの差は小さくない。

特に開発効率に直結する部分です。
室谷室谷代表取締役
あと気になるのがコストです。Sonnet 5 Highのタスクあたり平均コストは$3.74、Sonnet 4.6 Highが$3.06。

約22%ほどコストが上がっていますが、スコアが8ポイント上がっているので、費用対効果は改善しているとも言える。
テキトー教師テキトー教師.AI認定講師
Cursorのモデルランキングには他にもFable 5やOpus 4.8などがありますが、Sonnet 5はAnthropicのモデルとしては最上位に位置していますね。特にMax設定では61.2%と、Opus 4.8 Maxの63.8%に迫る。

CursorでClaude Sonnet 5を使う方法:モデル選択と設定

室谷室谷代表取締役
では実際にどうやって使うのか。Cursorの設定画面からモデルを選べばいいんですよね?
テキトー教師テキトー教師.AI認定講師
そうです。Cursorのモデル選択ドロップダウンにClaude Sonnet 5が追加されています。

利用できるプランは基本的にPro以上だと思いますが、詳細は明らかにされていません。
室谷室谷代表取締役
注意点としては、モデルに複数の強度(Low, Medium, High, Extra High, Max)があることですね。それぞれコストとスコアが異なる。

Highがいわゆる標準的な設定でしょうか。
テキトー教師テキトー教師.AI認定講師
講座で受講生さんからよく聞かれるのが『どの強度を選べばいいの?』という質問。タスクの重要度や予算に応じて選ぶのが良いでしょう。

Maxはパフォーマンスが高い反面コストも高い。日常的なコーディングにはHighかMediumで十分かもしれません。
室谷室谷代表取締役
Cursorはプラグインやカスタムモデルもサポートしていますが、Sonnet 5はビルトインモデルとして提供されるようですね。詳細はClaude Codeとは?読み方・できること・使い方を完全解説でも触れています。

Claude Sonnet 5 vs Sonnet 4.6:具体的に何が変わったのか?

テキトー教師テキトー教師.AI認定講師
具体的な性能差を表で整理しましょう。公式スレッドと背景ブリーフから分かる範囲で。
項目Sonnet 4.6 (High)Sonnet 5 (High)
CursorBenchスコア48.8%57.0%
平均コスト/タスク$3.06$3.74
平均トークン/タスク37,35241,735
平均ステップ/タスク5766
室谷室谷代表取締役
スコアが8.2ポイント向上している一方、コストや消費トークンも増加しています。ただ、ステップ数(モデルがタスクを解くまでの思考ステップ?)も増えているので、より深く考えるようになったのかもしれませんね。
テキトー教師テキトー教師.AI認定講師
背景ブリーフには、複雑なロジックや長いコンテキストを要するタスクでの精度向上が示唆されていますね。実際の開発現場では、マルチファイルにまたがる変更や、自然言語からの正確なコード生成がより確実になるでしょう。
室谷室谷代表取締役
私もMYUUUでいくつか試してみました。確かにリファクタリングの提案が以前より自然で、バグ修正も的確になりました。

開発者にとっての意味:より高度なコード生成と開発効率向上

テキトー教師テキトー教師.AI認定講師
開発者視点で見ると、このアップデートはコード生成AIへの依存度が一段階上がることを意味しますね。より複雑なタスクを任せられるようになった。
室谷室谷代表取締役
特にスタートアップや中小企業では、開発リソースが限られているので、AIが高度なコードを生成してくれると、プロダクト開発のスピードが格段に上がります。
テキトー教師テキトー教師.AI認定講師
ただし、注意点もあります。生成されたコードの品質は人間がレビューする必要がある。

あくまでアシスタントです。CursorBenchのスコアが100%ではない以上、必ず検証は必要です。
室谷室谷代表取締役
その点、Cursorのモデルランキングページには各モデルの詳細なベンチマークが公開されていて、開発者が選択する判断材料になります。透明性が高いのは良いですね。
テキトー教師テキトー教師.AI認定講師
今後のアップデートにも期待したいです。AnthropicとCursorの連携はさらに深まるでしょう。

関連してClaude Code Maxとは?5xと20xの違い、料金、制限を完全解説も参考になります。

よくある質問(FAQ)

  • Claude Sonnet 5とは? Anthropic社が開発したClaudeシリーズの最新モデル。Cursor上で利用可能になり、コード生成に特化した性能が向上しています。

  • Sonnet 4.6との違いは? CursorBenchスコアで8ポイント向上。特に複雑なロジックやマルチファイルタスクでの精度が改善されていますが、コストも若干増加。

  • Cursorでどうやって使うの? Cursorの設定画面からモデル選択を開き、Claude Sonnet 5を選ぶだけ。強度(Low〜Max)も選択可能。

  • CursorBenchとは? Cursorが独自に開発したコードタスクのベンチマーク。現実の開発セッションを元に、コード生成・編集・バグ修正などを評価。


出典

新着記事

関連記事

.AI TIMES一覧に戻る