Claude CodeとCodex、どっちを使うべき?2026年最新比較
室谷今回はClaude CodeとOpenAIのCodexを徹底比較していきましょう。.AI(ドットエーアイ)のコミュニティでも「どっちを使えばいいんですか?」って質問が毎週来るんですよね・・・
テキトー教師講座でも同じです。「すでにClaude Codeを使ってるんですが、Codexに乗り換えた方がいいですか?」って聞いてくる受講生さんが増えてきました。
2026年に入ってから特に多くなった気がします。
2026年に入ってから特に多くなった気がします。
室谷そうですよね。もともとはClaude Codeが「ターミナル系AIコーディングツール」の代名詞みたいな存在でしたけど、OpenAIがCodexをGA(一般公開)にしてから一気に比較が増えましたね。
テキトー教師整理すると、Codexは2025年5月にローンチして、2025年10月に一般公開。今は2026年のバージョンが動いてる感じですね。
Claude Codeも2025年2月から限定プレビューが始まって、2025年5月にGAになった。ほぼ同時期に育ってきたツールなんです。
Claude Codeも2025年2月から限定プレビューが始まって、2025年5月にGAになった。ほぼ同時期に育ってきたツールなんです。
室谷で、今回これを取り上げようと思ったのは、最近個人的にすごく使い方が変わってきたから。Codexをリサーチャーとして使いながら、Claude Codeをオーケストレーターにするっていう連携が、MYUUUのチームで結構ハマってまして・・・
テキトー教師あ、それ私も気になってました。単純にどっちが優れてるかじゃなくて、「使い分け」「連携」まで含めて話せるのが今回の記事のポイントですね。
CodexとClaude Code、そもそも何が違うの?

テキトー教師まず基本から押さえましょう。「Codex」って名前、昔聞いたことあるって人も多いと思うんですよ。
室谷そうですよね。2021年のOpenAI Codexと全然別物なんで、ここは先に整理しておきたい。
旧Codexはコード補完モデルで、GitHub Copilotの初期バージョンを動かしてたやつ。2023年3月に廃止されてます。
旧Codexはコード補完モデルで、GitHub Copilotの初期バージョンを動かしてたやつ。2023年3月に廃止されてます。
テキトー教師今のCodexは、それとは全く別の「ソフトウェアエンジニアリングエージェント」です。コードを補完するんじゃなくて、「この機能を実装して」と頼むと、計画を立てて、実行して、プルリクエストまで出してくれる。
室谷一方のClaude CodeはAnthropicが開発した「ターミナルで動くコーディングエージェント」。こちらもコード補完じゃなくて、開発作業を一緒にやってくれるエージェント的な存在ですね。
テキトー教師2つとも「AIコーディングエージェント」というカテゴリは同じなんですが、動き方の哲学が根本的に違う。それが2026年の使い分けを考える上でのキーポイントだと思います。
| Claude Code | OpenAI Codex | |
|---|---|---|
| ベースモデル | Claude Opus 4.6 / Sonnet 4.6 | GPT-5.3-Codex |
| 実行環境 | ローカルターミナル(自分のマシン) | クラウドサンドボックス + ローカルCLI |
| 操作スタイル | 対話型(都度確認) | 自律型(バックグラウンド実行) |
| コンテキスト窓 | 200K標準 / 1M(ベータ) | 400K |
| マルチエージェント | Agent Teams(リサーチプレビュー) | 並列クラウドエージェント |
| 設定ファイル | CLAUDE.md(独自形式) | AGENTS.md(オープン標準) |
| オープンソースCLI | なし | あり(Apache 2.0) |
| 料金の入口 | Claude Pro: 月$20 | ChatGPT Plus: 月$20 |
室谷この表を見てまず気になるのが「実行環境」の差ですよね。ここが一番大きい。
テキトー教師そうなんです。これ、単なる技術的な違いじゃなくて「どういう働き方をするか」に直結するんですよ。
動作環境の根本的な違い:ローカルvsクラウド

室谷Codexは、タスクを投げるとOpenAI管理のクラウドコンテナの中でコードが動く。自分のマシンは一切関係ない。
テキトー教師Claude Codeは逆で、自分のターミナル、自分のファイルシステム、自分のgit環境で動く。AnthropicのAPIを処理のために呼ぶだけで、コードは全部手元にある。
室谷これって、セキュリティや機密性を重視する企業にとっては大きな判断ポイントになりますよね。コードをクラウドに送りたくないというニーズ、MYUUUのクライアントにも結構あるんですよ。
テキトー教師一方で、「バックグラウンドで非同期に動かしたい」という人にはCodexの方が合ってます。Claude Codeは基本的に「あなたが画面の前にいて、ステップごとに確認しながら進める」スタイルなので。
室谷Codexの動き方、整理するとこうです。まずリポジトリをクラウドコンテナにロードして、セットアップフェーズ(依存関係インストール)は一時的にネット接続あり。
エージェントフェーズに入るとネットワークを遮断して、外部への意図しないアクセスを防ぐ。タスクが終わったらdiffかPRを返してくれる。
エージェントフェーズに入るとネットワークを遮断して、外部への意図しないアクセスを防ぐ。タスクが終わったらdiffかPRを返してくれる。
テキトー教師この「セットアップ後にネット遮断」って設計は賢いですよね。生成したコードが意図しない外部リソースをダウンロードするのを防ぐ。
企業ユーザーへの安心材料になってる。
企業ユーザーへの安心材料になってる。
室谷Claude CodeはCodexと逆で、「コードはマシンに残る。APIには処理だけ投げる」という設計。
ただ実際には、Claudeがファイルを読む内容はAPIリクエストに含まれるので、「コードを全く外に出さない」わけでもない。ここは誤解されやすいので注意が必要ですね。
ただ実際には、Claudeがファイルを読む内容はAPIリクエストに含まれるので、「コードを全く外に出さない」わけでもない。ここは誤解されやすいので注意が必要ですね。
テキトー教師両方とも、機密コードを扱う場合はそれぞれのプライバシーポリシーをきちんと確認することが前提ですね。
インストール方法の違い
室谷実際に始める時の手順も確認しておきましょう。Claude Codeはこちら。
# macOS / Linux
curl -fsSL https://claude.ai/install.sh | bash
# セッション開始
claude
# 直前のセッションを続ける
claude -c
テキトー教師Codex CLIはnpmで入れます。
# Codex CLI インストール
npm install -g @openai/codex
# 対話モード
codex "認証モジュールをasync/awaitにリファクタリングして"
# フルオートモード(確認なし)
codex --full-auto "全APIエンドポイントのテストを書いて"
室谷Claude Codeはインストーラーがシンプルになりましたね。以前はnpmで入れてたんですが、今は専用のインストールスクリプトがあります。
Homebrew(
Homebrew(
brew install claude)やWinGetも使えます。
テキトー教師Codex CLIはnpmが基本ですね。クラウドエージェントはChatGPTのインターフェースからアクセスする形です。
ベンチマーク比較:どっちが賢い?
室谷ベンチマークの話、これ気になってる人多いですよね。
テキトー教師「数字で出てるんでしょ?どっちが上?」って聞かれるんですが、2026年の状況はかなり面白くて・・・
室谷SWE-bench ProとTerminal-Bench 2.0で両者が出した数字、まとめるとこうなります。
| ベンチマーク | GPT-5.3-Codex | Claude Opus 4.6 |
|---|---|---|
| SWE-bench Verified | 約80% | 約79%(Thinking使用) |
| SWE-bench Pro | 約57% | 約57〜59%(WarpGrep v2) |
| Terminal-Bench 2.0 | 約77% | 約65% |
| OSWorld-Verified | 低め | 高め |
テキトー教師これ見ると、SWE-benchはほぼ同点なんですよね。差が出るのはTerminal-BenchとOSWorldで、方向が逆。
室谷Terminal-BenchはCodexが明確にリード。OSWorldはClaude Opus 4.6の方が上。
「ターミナル作業はCodex、インターフェース操作はClaude」って解釈できますよね。
「ターミナル作業はCodex、インターフェース操作はClaude」って解釈できますよね。
テキトー教師ただ注意が必要なのが、OpenAI自身が「SWE-bench Verifiedはコンタミネーション(汚染)の問題でもう信頼できない」と2026年初めに声明を出してるんです。
室谷そうなんですよ。これほんと重要なポイント。
ベンチマーク結果を「どっちが賢いか」の最終判断に使うのはやめた方がいい。特にSWE-bench Verifiedは。
ベンチマーク結果を「どっちが賢いか」の最終判断に使うのはやめた方がいい。特にSWE-bench Verifiedは。
テキトー教師実際の開発タスクでは、使い方と設定の方が数字よりずっと影響が大きい。コミュニティのメンバーさんに「ベンチマーク見て選びました」って言う人がいますけど、「実際に使って比べてみてください」って返すようにしています。
実際のコーディングタスクでのパフォーマンス
室谷ベンチマーク以外で、実際のタスクどうかというのも確認しておきましょう。Composioのエンジニアが同じプロンプトで両方に同じタスクをやらせた比較があって、これが興味深かった。
テキトー教師Figmaのデザインを再現するタスクと、ジョブスケジューラーを実装するタスクですよね。結果的に、Claude Codeはより詳細な実装とドキュメントを出したけど、トークンは2〜3倍使った。
室谷Figmaの再現タスクでは、Claude Codeが6,232,242トークン使ったのに対して、Codexは1,499,455トークン。トークン効率でいうとCodexが圧倒的に上ですね・・・
テキトー教師ただ、コード品質という点ではClaude Codeの方が包括的だったと。詳細なドキュメント、エラーハンドリング、プロダクション品質の構造。
Codexはシンプルで直接的、「とにかく動かす」寄りだった。
Codexはシンプルで直接的、「とにかく動かす」寄りだった。
室谷どちらが「良い」かは何を重視するかによる。「早く動くものが欲しい、リファクタは後でいい」ならCodex。
「メンテナンスしやすいコードが欲しい」ならClaude Codeという感じですね。
「メンテナンスしやすいコードが欲しい」ならClaude Codeという感じですね。
料金プランの比較
テキトー教師料金の話、これも定番の質問です。「どっちが安く使えますか?」って。
室谷入口の$20/月は同じなんですが、中身が結構違います。
テキトー教師まずCodex(ChatGPT)側の料金から整理しましょう。
| プラン | 月額 | Codexへのアクセス |
|---|---|---|
| Free | $0 | なし |
| Go | $8 | なし |
| Plus | $20 | Codexの使用制限あり |
| Pro | $200 | 優先スピードのCodexエージェント |
| Business | $20/ユーザー | Codexシートを標準または従量課金で割り当て可能 |
室谷Claude Code側はこちら。
| プラン | 月額 | 特徴 |
|---|---|---|
| Claude Pro | $20 | Claude Code利用可。週次・5時間のローリング制限あり |
| Claude Max 5x | $100 | 制限緩和、より強力なモデルアクセス |
| Claude Max 20x | $200 | さらに高い使用上限 |
| API(従量課金) | 使用量次第 | エンタープライズ向け |
テキトー教師表にすると$20/$200で並ぶんですよね。Claude Pro $20 vs ChatGPT Plus $20、Claude Max $200 vs ChatGPT Pro $200って感じで。
室谷ただこれ、$20プランと$200プランで受けられるCodexのアクセスレベルが結構違うんですよね。Codex agentをがっつり使いたいなら$200のProプランが必要になってくる。
テキトー教師Claude Code側も、本格的に使うならMax($100〜)からが安心です。$20のProプランだと「使いすぎて制限に当たった」という声がコミュニティでも多いので。
室谷ヘビーユーザーで毎日コーディングに使う場合、API従量課金という選択肢も実は重要で。自分のトークン消費量によっては、月額プランより安くなることもあるんですよ。
テキトー教師この「どのプランを選ぶか」問題、私の講座では「まず$20プランで1ヶ月使ってみて、制限に毎週当たるようなら上のプランを検討してください」って話してます。いきなり$200にして使い切れないケースも結構あるので。
室谷Codexはプランによって「何のモデルで動くか」も変わってくるんで、そこも確認ポイントですね。Plus($20)だとGPT-5.3を制限付きで、Pro($200)だとGPT-5.4 ProとCodexエージェントへのより広いアクセスが得られる。
実際の開発ワークフローでの使い分け
室谷じゃあ次は「実際どう使うか」の話をしましょう。これが一番大事だと思っていて・・・
テキトー教師そうですね。スペックや料金より、「自分の開発スタイルに合うか」の方がよっぽど重要ですよね。
室谷Codexが向いてるのは、こういうケースだと思います。「このissueを修正して」「このテストを全部通してみて」みたいな、明確に定義されたタスクをバックグラウンドで処理させたい時。
タスクを投げて、他の作業をしながら待つ、という使い方。
タスクを投げて、他の作業をしながら待つ、という使い方。
テキトー教師非同期の開発ワークフロー、いわゆる「デリゲーション型」ですよね。コードレビューでいうと、Codexがプルリクを自動で出してくれて、自分はそれをレビューするだけ、みたいな。
室谷一方のClaude Codeは「コラボレーション型」。特に大きなリファクタリングや、複数ファイルにわたる変更が必要な時、ステップごとに「これで合ってますか?」と確認しながら進められるのが強い。
テキトー教師講座でよく使う例えが「料理」なんですよ。Codexは「デリバリー」。
頼んで待ってたら出来上がってくる。Claude Codeは「一緒に料理する」。
横で見ながらアドバイスできる。
頼んで待ってたら出来上がってくる。Claude Codeは「一緒に料理する」。
横で見ながらアドバイスできる。
室谷うまい例えですよね(笑)。で、MYUUUのエンジニアに聞くと、単純な機能実装はCodexに任せて、アーキテクチャの相談やコードの品質向上はClaude Codeを使うって分けてる人が多い。
テキトー教師それ、「タスクの複雑さと不確実性」で使い分けてる感じですね。明確で単純なタスクはCodex、探索的で複雑なタスクはClaude Code。
IDEとの統合
室谷両ツールのIDE連携も確認しておきましょう。Claude Codeは現在、VS Code、JetBrains系IDE(ベータ)、VS CodeフォークのCursorやWindsurfに対応。
ブラウザベースのインターフェースもあります(
ブラウザベースのインターフェースもあります(
テキトー教師CodexはVS Code、Cursor、IDEエクステンション、macOSのデスクトップアプリ(2026年2月にローンチ)、そしてChatGPTのサイドバーからアクセスできる。
室谷テキストエディタやIDEの中でどちらを使うかというより、「ターミナルで作業するのが好きか、GUIが好きか」で選ぶのも一つの視点ですよね。
テキトー教師Claude Codeはターミナルネイティブなので、コマンドラインに慣れてるエンジニアには相性がいい。Codexのデスクトップアプリはよりビジュアルなインターフェースで、GUIに慣れた人には入りやすいですね。
Claude CodeからCodexを呼び出す:連携活用術
室谷ここからが個人的に一番面白い話。さっきちらっと触れた「Claude CodeとCodexの連携」について詳しく話しましょう。
テキトー教師これ、知らない人多いと思いますよ。「どっちか一方を選ぶ」じゃなくて「一緒に使う」という発想。
室谷実はCodexはClaude CodeからTool Useで呼び出せるんですよ。僕はこの使い方にかなりハマってまして・・・
テキトー教師「CodexをリサーチャーとしてClaude Codeから呼ぶ」、これ画期的な発想ですよね。Claude CodeのWeb Searchはレートリミットにすぐ当たるけど、Codexをリサーチャー代わりに使うとトークンを節約できる。
室谷MYUUUでこの使い方を取り入れてから、Web検索が必要なタスクのコストが体感で3分の1くらいになりましたね。Codexはトークン効率がいいので、大量データの取得はCodexに任せる。
処理・整理・統合はClaude Codeが担う。
処理・整理・統合はClaude Codeが担う。
テキトー教師役割分担として整理すると、こんな感じですね。
- Claude Code: オーケストレーター(全体の指揮・複雑な判断・コードの統合)
- Codex: ワーカー(データ収集・単純なタスク・並列処理)
室谷さらに面白いのが、WhartonビジネススクールのMollick教授が「CodexとClaude Codeのスキル設計思想の違い」を分析してたんですよ。
テキトー教師Codexの原則が「Codexはすでに賢い、知らないことだけ書け」。コンテキストウィンドウを公共財として最小限に保つ。
Claude Codeの原則が「ドラフト→テスト→評価→改善の反復が前提」。対話でスキルを育てていく。
Claude Codeの原則が「ドラフト→テスト→評価→改善の反復が前提」。対話でスキルを育てていく。
室谷根本的な設計哲学が違う。これが「どっちが優れてる」じゃなくて「どう使い分けるか」という話に繋がってくる。
テキトー教師受講生さんに「どっちか一方に決めないといけないんですか?」って聞かれることがよくあるんですけど、「両方使えるなら両方使うのが正解です」って答えるようにしています。
設定ファイルの違い:CLAUDE.mdとAGENTS.md
室谷次は設定ファイルの話。地味に重要なんですよ。
テキトー教師CLAUDE.mdとAGENTS.md、それぞれ何が書けるかで使い勝手が結構変わりますよね。
室谷AGENTS.mdはオープン標準で、CursorやAiderなどのツールでも読まれます。チームで複数のツールを使ってる場合、AGENTS.mdを書いておくとCodex以外のツールにも設定が共有される。
テキトー教師CLAUDE.mdはAnthropicのツール専用ですが、できることが多い。階層化された設定、ポリシーの強制、フック(アクション前後に実行されるスクリプト)、MCPの統合など。
カスタマイズの幅が広い。
カスタマイズの幅が広い。
室谷実際の使い方として、MCPを活用したワークフロー自動化を組む場合はCLAUDE.mdじゃないとできないことが多い。MYUUUではかなり細かくCLAUDE.mdを設定してます。
テキトー教師一方で、「シンプルに使いたい」「他のツールとも共通の設定を持ちたい」なら、AGENTS.mdで書く方が汎用性が高い。
室谷両方のファイルを置いておくというチームも出てきてますよね。Codexには設定がAGENTS.mdとして伝わって、Claude Codeにはより詳細な設定をCLAUDE.mdで渡す、という運用。
テキトー教師ただこれ、「2つのファイルを常に同期させなきゃいけない」という手間も生まれるんですよ。チームが大きくなってくると、設定の管理コストが無視できなくなる。
室谷そのあたりは、チームの規模と使い方次第ですね。個人や小チームなら気にしなくていいレベルかな。
こんな人はClaude Code、こんな人はCodex
テキトー教師「どっちを選ぶか」の判断基準をまとめましょう。
室谷シンプルにまとめると「一緒に考えながら作りたい」vs「任せて待ちたい」の違いに行き着くと思いますよ。
テキトー教師Claude Codeが向いてる人は、こんな感じですね。
- コードの文脈をしっかり理解した上で、ステップごとに確認しながら進めたい
- ローカル環境でのファイル操作や、複数ファイルにまたがるリファクタリングが多い
- MCPや外部ツールとの連携を細かく設定したい
- 大きなコードベースを扱っていて、コンテキストを長く保ちたい(1Mトークンのベータが必要なレベル)
- ターミナルに慣れているか、IDE内でAIと対話するスタイルが好き
室谷Codexが向いてる人はこちら。
- 「これやっといて」と頼んでバックグラウンドで処理している間に他の作業をしたい
- GitHubとの連携でPRを自動生成する自動化ワークフローを作りたい
- OpenAIのエコシステム(ChatGPT、GitHub Copilot等)に既に投資している
- トークンコストを抑えながら高速にプロトタイプを作りたい
- コードのドキュメントや設計の詳細さより、とにかく動くものを早く出したい
テキトー教師あと「どっちのモデルが好きか」という個人の好みも正直あると思います。Claude派、GPT派、みたいな。
室谷それは確かにありますよね(笑)。ただ2026年時点でのベンチマークはほぼ横並びなので、「好みのモデルを使えるツールを選ぶ」という視点でもあながち間違ってない。
テキトー教師個人的には「まずClaude Codeから始めてみて、Codexも試してみる」が一番おすすめの入り方ですね。料金プランも両方$20からなので、1ヶ月ずつ試してみるのが現実的。
室谷その時に、「両方試す」じゃなくて「同じタスクを両方でやってみる」が大事。ベンチマークより、自分の仕事での使い心地の方がよっぽど参考になるので。
Agent Teamsとマルチエージェント対決
テキトー教師マルチエージェントの話も少し触れておきましょうか。これ2026年の大きなトレンドですよね。
室谷Claude Codeに「Agent Teams」という機能が追加されて、複数のClaude Codeセッションが並列で動いて、リードセッションが全体を調整できるようになった。現在リサーチプレビュー段階です。
テキトー教師Codexの方は、クラウドコンテナ上で並列エージェントが動く。ただClaudeのAgent Teamsとの違いは、「共有タスクリストでコミュニケーションしながら動くか、独立して動くか」ですよね。
室谷Agent Teamsは複数のエージェントが「今どのファイルをいじってるか」を把握し合いながら動く。大規模なReactコードベースのマイグレーションとかで、一方が依存関係をマッピングして、別のエージェントが置換コードを書いて、三つ目がテストを走らせる、みたいな協調が実現できる。
テキトー教師Codexの並列処理は「独立したタスクを同時に処理する」に向いてる。「このissueを5個並列で処理して」みたいな使い方。
室谷最近の研究でも面白い方向が出てきていて・・・
テキトー教師「AIがAI自身の指揮系統を設計する」という方向性。今はまだ研究段階ですが、Claude CodeやCodexのような現行ツールがベースになっていくわけですよね。
室谷マルチエージェントのアーキテクチャ、2026年はここが一番進化してる領域だと思います。どちらのツールも追いかけていく価値がある。
よくある質問(FAQ)
テキトー教師コミュニティでよく出てくる質問にも答えておきましょう。
室谷まず「Codexは日本語で使えますか?」という質問、これよく来ます。
テキトー教師答えはYesで、ChatGPTのインターフェース越しに日本語で指示できます。ただコードのコメントやドキュメントは英語で書かせた方が品質が高い傾向があります。
Claude Codeも同様。
Claude Codeも同様。
室谷「Claude CodeとCodexを同時に契約するとコスパが悪くないですか?」という質問も。
テキトー教師両方$20プランで契約しても月$40。毎日AIコーディングツールを使ってる人なら、1日あたり133円。
時給換算でのROIは十分取れると思いますよ。
時給換算でのROIは十分取れると思いますよ。
室谷「企業での利用はどっちが安全ですか?」という質問は難しい。コードがどこで処理されるかという観点では、Claude Codeはローカル寄り、Codexはクラウド寄り。
ただ両方ともコードをAPIに送る側面があるので、企業ポリシーに従って各社のDPA(データ処理契約)を確認することが前提ですね。
ただ両方ともコードをAPIに送る側面があるので、企業ポリシーに従って各社のDPA(データ処理契約)を確認することが前提ですね。
テキトー教師「Codex CLIはオープンソースと聞いたんですが、それ何がメリットですか?」という質問も。
室谷Codex CLIはApache 2.0ライセンスのオープンソースです。コードを見て、フォークして、改造できる。
Claude Codeはクローズドソース。これは「ツールの中身を自分でコントロールしたい」エンジニアにとっては意味のある差ですね。
Claude Codeはクローズドソース。これは「ツールの中身を自分でコントロールしたい」エンジニアにとっては意味のある差ですね。
まとめ:2026年のAIコーディングツール選び
テキトー教師まとめましょう。結局、「Claude CodeとCodex、どっちがいいか」の答えは何でしょう?
室谷どちらも2026年時点でトップクラスのAIコーディングエージェントで、ベンチマーク上の差はほぼない。選ぶ基準は「開発スタイル」と「何を重視するか」です。
テキトー教師整理するとこうなります。
- ローカルで対話しながらコードを育てたい → Claude Code
- バックグラウンドでタスクを非同期処理させたい → Codex
- MCPや複雑なカスタマイズが必要 → Claude Code
- トークンコストを抑えてプロトタイプを早く出したい → Codex
- 大規模コードベースの長期セッション → Claude Code(1Mコンテキスト)
- GitHubと連携してPR自動化 → Codex
- 両方のいいとこ取りをしたい → Claude Code(オーケストレーター)+ Codex(ワーカー)連携
室谷最後に一つ言わせてください。「どっちかを選ぶ」という問いより「どう組み合わせるか」を考え始めると、AIコーディングの生産性が一段階上がると思います。
テキトー教師まずは$20プランで両方を試してみる。そこから自分のワークフローに合う使い方を見つけていく。
それが一番の近道だと思います。
それが一番の近道だと思います。
