- ・OpenAI Codex CLIは2026年4月にリリースされたOpenAI公式のターミナル型AIコーディングエージェント。2026年4月23日にGPT-5.5を搭載し、5月7日にはCodex for Chrome拡張でブラウザ全体を操れるようになった(週間400万ユーザー突破)。
- ・「Claude Codeで作る→Codexで直す」のハイブリッドワークフローがX上でバズ中。SWE-Bench ProでOpus 4.7(64.3%)がGPT-5.5(58.6%)を上回る一方、SWE-Bench Verifiedでは逆転する補完関係を本記事で詳解。
- ・Code with Claude 2026(5月6日)でClaude Code側もRoutines・Auto Mode・Dreamingを発表。両陣営の競争激化を受けた最新比較表とOpenAI公式
codex-plugin-ccの使い方を完全網羅。
1. OpenAI Codex CLIとは何か?2026年4月リリースの全貌
OpenAI Codex CLIは、ターミナルから直接動作するオープンソースのコーディングエージェントだ。2026年4月にOpenAIが公式リリースし、GitHubのOpenAI公式リポジトリ(openai/codex)でApache-2.0ライセンスのもと公開されている。
最大の特徴は「ローカルで動くAIコーディングエージェント」である点だ。既存のIDEやエディタとは独立して動作し、コードの読み取り・編集・コマンド実行をターミナルから直接制御できる。
Codex CLIが登場した背景には、AIによるコーディング支援の大きな変化がある。従来のCopilotやCursorのような補完・提案型のツールに対し、Codex CLIは自律実行型エージェントとして設計された。プロンプトを送るだけでファイルを読み、コードを書き、テストを実行し、修正まで完了する。
何ができるか:主要機能一覧
| 機能 | 概要 |
|---|---|
| インタラクティブTUI | フルスクリーンのターミナルUIでリアルタイム対話 |
| 非対話型自動化 | codex execでスクリプト連携・CI/CD組み込み |
| ファイル操作 | 作業ディレクトリ内のファイル読み取り・編集・作成 |
| コマンド実行 | シェルコマンドの実行(サンドボックスポリシー制御) |
| Web検索 | デフォルト有効。開発タスクに必要な最新情報を取得 |
| 画像入力 | スクリーンショット・デザイン仕様の添付 |
| サブエージェント | 複雑なタスクを並列処理で分割実行 |
| MCP連携 | Model Context Protocolでサードパーティツール統合 |
| コードレビュー | /reviewコマンドでdiff解析・コミット前チェック |
| クラウドタスク | codex cloudでリモートタスクの管理・差分適用 |
ChatGPT Plus・Pro・Business・Edu・Enterpriseプランに加入済みであれば、Codex CLIは追加費用なしで利用できる。API経由でも利用可能だが、その場合はトークン消費分が請求される。
Claude Codeとの位置づけの違い
同じ「ターミナルで動くAIコーディングエージェント」として比較されることが多いが、設計思想に重要な違いがある。
Claude Codeは「開発者と並走するペア・プログラマー」として設計されており、各ステップを確認しながら進む共同作業スタイルだ。一方でCodex CLIは「タスクを投げて待つ自律エージェント」のスタイルを前面に出しており、codex execによる非対話型実行やクラウドタスクとの連携を重視している。
両者は競合というより補完的な関係にある。複雑な要件定義→設計→実装というフローにはClaude Codeが、CI/CDパイプラインへの組み込みや大規模リファクタリングの一括実行にはCodex CLIが向くことが多い。詳細は後述の比較章で掘り下げる。
2. 【2026年5月最新】GPT-5.5搭載でCodexはこう変わった
2026年4月23日、OpenAIは新フロンティアモデルGPT-5.5をChatGPTおよびCodexで提供開始した。Codex CLIにとって最大の転換点となる。
API版は翌4月24日から提供開始されたが、Codex内のGPT-5.5は当面ChatGPTサインインのみで利用可能で、APIキー認証では選択できない仕様だ。これはOpenAIがChatGPT Plus/Pro/Business/Enterprise/Edu/Goプランの利用者を優先する戦略である。
2-1. GPT-5.5の何が変わったか
GPT-5.5は単なるバージョンアップではなく、「実務向けの新しい知能クラス」としてOpenAIが位置づけているモデルだ。コーディングだけでなく、リサーチ・データ分析・ドキュメント作成・ソフトウェア操作までをまたぐ複合タスクで強みを発揮する。
| 項目 | GPT-5.4(従来) | GPT-5.5(新) |
|---|---|---|
| コンテキストウィンドウ | 200K | 400K(Codex内) |
| トークン消費 | 標準 | 同等タスクで大幅減 |
| 推論レイテンシ | 標準 | GPT-5.4と同等 |
| エージェント的コーディング | 強い | さらに強化 |
| Computer Use | 対応 | 大幅向上 |
| API提供 | あり | あり(4/24〜) |
| Codex内利用 | API・ChatGPT両対応 | ChatGPTサインインのみ |
ポイント:GPT-5.5は同じCodexタスクをGPT-5.4より少ないトークンで完了する。コスト感度の高い利用者にとっては、性能向上と料金圧縮が同時に進んだ稀なアップデートだ。
2-2. Codex CLIでGPT-5.5を使う方法
# 1. ChatGPTサインインで起動(必須)
codex login
# 2. インタラクティブモードに入る
codex
# 3. /modelコマンドでGPT-5.5に切り替え
> /model
# → モデル選択画面で「gpt-5.5」を選ぶ
# 4. または起動時にモデル指定
codex --model gpt-5.5 "このコードベースをリファクタリング"
~/.codex/config.tomlのmodel = "gpt-5.5"でデフォルト化もできる。ただしAPIキー認証セッションでGPT-5.5を選んでもエラーになる点に注意したい。
2-3. GPT-5.5が特に効くタスク
OpenAIの公式アナウンスとリリースノートを総合すると、以下のタスクで効果が顕著だ。
・実装・リファクタリング・デバッグ・テスト・検証 ・ナレッジワーク(ドキュメント・スプレッドシート作成) ・Computer Use経由のソフトウェア操作 ・長時間にわたる自律エージェントタスク ・初期段階の科学研究
GPT-5.5 Proは推論時間をさらに伸ばした上位版で、複雑な数学・科学タスク・大規模リファクタリングで特に強い。Codex CLIでは通常版GPT-5.5で十分なケースが多く、Proは「30分以上かかる難題」のときだけに使うのが効率的だ。
3. 【バズ中】「Claude Codeで作る→Codexで直す」ハイブリッドワークフロー
2026年4〜5月、X上で爆発的に拡散した使い方が「Claude Codeで作る → Codexで直す」だ。AnthropicとOpenAIの双方を併用し、それぞれの強みを役割分担させる手法である。
3-1. なぜハイブリッドなのか
両ツールには明確な得意分野の違いがあり、片方だけでは取りこぼすケースが目立ってきた。
Claude Code(Claude Opus 4.7・1Mコンテキスト)の強み
・大規模コードベースを丸ごと読み込んで設計する力 ・抽象的なゴールから実装計画を立てる構造把握力 ・対話的な作業でユーザーと並走するペアプロ的スタイル ・1Mコンテキストで長文書類・巨大ログを丸ごと処理可能
Codex CLI(GPT-5.5)の強み
・深い推論を時間をかけて回す論理性
・細かい穴・エッジケース・型不整合の検出
・サンドボックス隔離で安全にコマンド実行
・codex execで非対話型レビューをCIに組み込み可能
つまりClaude Code=設計者・実装者、Codex=レビュアー・品質ゲートとして並べると、それぞれの長所が補完し合う。
3-2. 標準ワークフロー:3ステップ
X上で広まっている標準的な流れは次の3ステップだ。
Step 1: Claude Codeで設計+実装
→ 機能ブランチに大胆にコミット
Step 2: Codex CLIでレビュー+エッジケース修正
→ codex --sandbox read-only で読む
→ 指摘箇所をPR coverに追記
Step 3: Claude Codeで最終整理(コメント・docstring・README)
→ 日本語ドキュメント整備
→ PR本文作成
ポイント:CodexはあえてLinearやJIRAではなく、ローカルのGitブランチに対して走らせる。両エージェントが同一ブランチに直接コミットでき、人間は最終PRをレビューするだけで済むからだ。
3-3. 具体的なコマンド例
# Step 1: Claude Codeで実装
claude "user_serviceにマルチテナント対応を追加。
既存のRBACロジックは活かしつつ、tenant_idをすべての
クエリに注入してほしい。テストも書いて"
# Step 2: Codexでレビュー
codex --sandbox read-only "直前のコミットを
セキュリティとパフォーマンス観点でレビュー。
SQLインジェクション・N+1・型不整合を重点確認"
# Step 3: Codexの指摘を再度Claude Codeで修正
claude "Codexが指摘した3点(SQL文字列結合・N+1・
nullable型の扱い)を修正してテストを追加"
# 仕上げ:Claude Codeでドキュメント
claude "今回の変更をCHANGELOG.mdに追記。
README.mdのテナント分離セクションも更新"
3-4. なぜこの順番なのか:実証ベースの理由
複数の実践記事(CARTA TECH BLOG・azukiazusa.dev・Qiita等)で報告されている観察結果を整理すると次のようになる。
「Codexで作ってClaude Codeで直す」順だと、Codexのサンドボックス制約がボトルネックになりがちだ。マイグレーション実行・staging API接続・ローカルサービステストといった作業はClaude Codeのほうが安定する。**まず広い視野で組むのがClaude Code、細部を詰めるのがCodex**という分担が自然になる。
3-5. ワークフロー図
(Opus 4.7・1M)"] B --> B1["設計→実装→テスト"] B1 --> C["Codex CLI
(GPT-5.5・400K)"] C --> C1["レビュー
エッジケース検出"] C1 --> D{"問題あり?"} D -->|"Yes"| E["Claude Codeで修正"] E --> C D -->|"No"| F["Claude Codeで
ドキュメント整備"] F --> G["PR作成
人間レビュー"]
3-6. ベンチマーク実数値で見る両者の差
2026年5月時点のSWE-Bench結果は、両ツールの「役割分担」を裏付けるデータになっている。
| ベンチマーク | GPT-5.5(Codex) | Opus 4.7(Claude Code) |
|---|---|---|
| SWE-Bench Verified | 88.7% | 87.6% |
| SWE-Bench Pro(実GitHub Issue) | 58.6% | 64.3% |
| Terminal-Bench 2.0 | 勝ち | — |
| 出力トークン(同タスク) | 72%少ない | 標準 |
| 10ベンチマーク総合 | 4勝 | 6勝 |
読み解き:細かいツール操作・ファイルナビはGPT-5.5、大規模アーキテクチャ推論はOpus 4.7。ハイブリッド運用が合理的な理由が、ベンチマーク数値からも見えてくる。
4. 【2026年5月最新】Code with Claude 2026とCodex for Chromeで競争激化
2026年5月6日、AnthropicはCode with Claude 2026カンファレンスを開催し、Claude Code側で7つの新機能を一挙に発表した。翌5月7日にはOpenAIがCodex for Chromeを投入し、競争はさらに加速している。
4-1. Anthropic側:Code with Claude 2026の主要発表
| 機能 | 概要 |
|---|---|
| Routines | バックグラウンドでPR自動作成。GitHubイベントトリガー or schedule(毎時/日次/週次) |
| Auto Mode | 多段階の自律コーディング。承認ゲートと2段階分類で安全装置 |
| Dreaming | 夜間に過去セッションを自己レビューしメモリ更新(research preview) |
| Outcomes | 成功条件のrubricを書くと、別gradeingコンテキストで評価しイテレーション |
| Multi-Agent Orchestration | エージェント艦隊の調整実行(Public Beta) |
| Code Review | 社内全面採用→一般公開。PR自動レビュー |
| CI Auto-Fix | 失敗チェックを自動修正(PRオーナーは赤×を見ない設計) |
| 使用上限2倍 | Claude Code 5時間枠を2倍に拡張 |
ポイント:Anthropicはモデル発表ではなく既存ツールの一括強化を選んだ。CPOが冒頭で「今日は新モデル発表はない」と宣言したのが象徴的だ。
4-2. OpenAI側:Codex for Chrome拡張(5月7日)
OpenAIは翌日にCodex for Chromeを投入した。Codexアプリ(macOS・Windows)から起動するChrome拡張で、署名済みブラウザセッションをCodexが直接操作できる。
・マルチタブcontext:複数タブ横断で情報収集 ・DevTools連携:Webアプリのデバッグ ・サインイン済みサイト操作:LinkedIn・Salesforce・Gmail・社内ツール ・ホスト単位の許可制御:「このチャットだけ許可」「常に許可」 ・EU/UK除く全リージョン提供
GmailやSalesforceなど、企業の重要情報にアクセスできるブラウザでCodex拡張を有効化する場合、ホスト許可を慎重に管理すること。意図しないドメインへのアクセスはCodex側で都度確認するが、許可ホストの設定は管理者が監督すべき項目だ。
4-3. Codexの週間ユーザー400万人突破
OpenAIは同時に週間アクティブユーザー400万人突破を発表した。年初比で8倍の成長で、4月時点の300万人からさらに加速している。
4-4. Codex-Spark(Cerebrasパートナーシップ)
ChatGPT Pro限定のresearch previewとしてCodex-Sparkが登場した。Cerebrasの推論インフラで動く特化版で、テキスト専用・128Kコンテキスト。ChatGPT Pro加入者のCodexアプリ・CLI・IDE拡張に同梱されている。
位置づけ:超高速レスポンスを優先する開発タスク向け(Cerebrasは秒速2000トークン級の推論で知られる)。重い推論はGPT-5.5・GPT-5.5 Pro、瞬発系はCodex-Sparkという棲み分けだ。
4-5. Codex CLI 5月の追加機能
ベース機能側でも複数の改良が加わった。
Plan Mode : プランを立てた後、フレッシュコンテキストで実装に移行
/side : TUI内でメイン会話を中断せず脇道質問
/diff : ワークスペース対応の差分表示
TUI Vim : modal Vim編集(/vim, default-mode config)
codex exec : --json で reasoning-token使用量レポート
deny-read : ファイルシステムglob単位の読み取り拒否ポリシー
4-6. 競争のまとめ
両陣営の動きを並べると、明確な戦略の違いが見える。
・Anthropic:Routines/Auto Mode/Dreamingで「自律性」を深掘り、開発フロー自体をエージェント化 ・OpenAI:Chrome拡張で「ブラウザ全体」へ進出、Codex-Sparkで「速度」を武器に
どちらも「ターミナル+エディタ」の枠を超え、開発者ワークフローの上流(プランニング)と下流(PR・CI・ブラウザ実行)まで取りに行く動きだ。
5. インストール・セットアップ完全ガイド
システム要件
- macOS: 正式サポート(Apple Silicon・x86_64)
- Linux: 正式サポート(x86_64・arm64)
- Windows: WSL2(Windows Subsystem for Linux 2)推奨、実験的サポート
- Node.js: npm経由の場合はNode.js環境が必要
インストール方法
npm経由(推奨)
# グローバルインストール
npm install -g @openai/codex
# バージョン確認
codex --version
# 最新版へのアップデート
npm install -g @openai/codex@latest
Homebrew経由(macOS)
brew install --cask codex
GitHub Releasesからバイナリ取得
macOS Apple Silicon・x86_64、Linux x86_64・arm64向けのコンパイル済みバイナリがGitHub Releasesページで配布されている。npmが使えない環境ではこちらを利用する。
APIキー・認証設定
Codex CLIには2つの認証方法がある。
方法1: ChatGPTアカウントでログイン(推奨)
codex login
ブラウザが開き、OpenAIアカウントでのOAuth認証が行われる。ChatGPT Plus/Pro/Business以上のプランに加入していれば、そのままCodex CLIが利用できる。
方法2: APIキーを使用
# 環境変数で設定
export OPENAI_API_KEY="sk-proj-..."
# または設定ファイル(~/.codex/config.toml)で永続化
# [provider]
# api_key = "sk-proj-..."
APIキーをコードにハードコードしないこと。環境変数か`~/.codex/config.toml`(適切なパーミッション設定済み)を使用すること。`.gitignore`に`~/.codex/config.toml`や`.env`ファイルが含まれていることを必ず確認すること。
初回起動の流れ
# ターミナルでプロジェクトディレクトリに移動
cd /path/to/your/project
# Codex CLIを起動(インタラクティブモード)
codex
# または最初のプロンプトを引数で渡す
codex "このプロジェクトのバグを修正して"
初回起動時にモデルの選択・サンドボックス設定の確認が表示される。デフォルト設定で始めて、使いながら調整していくのがおすすめだ。
config.toml による設定
~/.codex/config.tomlで各種設定を永続化できる。
# ~/.codex/config.toml の基本設定例
# デフォルトモデルの設定(2026/4/23以降のChatGPTサインインならgpt-5.5推奨)
model = "gpt-5.5"
# Web検索の設定("live" / "cached" / "disabled")
web_search = "live"
# サンドボックスポリシー
sandbox = "workspace-write"
# AGENTS.mdの代替ファイル名(既存ドキュメントを流用する場合)
agents_md_fallback_names = ["TEAM_GUIDE.md", "CONTRIBUTING.md"]
(グローバル → プロジェクト)"] C --> D["認証確認
ChatGPT / API Key"] D --> E{"モード選択"} E -->|"codex"| F["インタラクティブTUI起動"] E -->|"codex exec"| G["非対話型実行"] E -->|"codex cloud"| H["クラウドタスク管理"] F --> I["プロンプト送信"] G --> I I --> J["モデル推論"] J --> K{"アクション種別"} K -->|"ファイル操作"| L["サンドボックスチェック"] K -->|"コマンド実行"| L K -->|"Web検索"| M["検索実行"] L -->|"許可"| N["アクション実行"] L -->|"要承認"| O["ユーザーへ確認"] O -->|"承認"| N O -->|"拒否"| P["スキップ"] N --> Q["結果をユーザーに表示"] M --> Q
6. AGENTS.md の書き方:完全リファレンス
AGENTS.mdはCodex CLIに対する永続的な指示ファイルだ。プロジェクトのルールやチームの規約、コーディング規約をMarkdown形式で記述しておくと、Codexは毎回セッション開始前にこのファイルを読み込み、指示に従って動作する。
AGENTS.md の優先度チェーン
Codex CLIはAGENTS.mdを「グローバル→プロジェクトルート→サブディレクトリ」の順で収集し、連結して使用する。
優先度(高) ~/.codex/AGENTS.override.md ← 一時的な上書き用
~/.codex/AGENTS.md ← グローバル設定
優先度(低) {repo_root}/AGENTS.md ← プロジェクト設定
{subdir}/AGENTS.md ← サブディレクトリ設定
ポイント:AGENTS.override.mdは実験的な設定を一時的に追加したいときに使う。ベースファイルを変更せずに済むため、後で消去するだけで元に戻せる。
AGENTS.md 基本フォーマット
# Project Rules
## Working Agreements
- コミットメッセージは日本語で書く
- プルリクエストは1機能1PRとする
- テストなしのコードはマージしない
## Code Style
- TypeScript を使用。`any`型は禁止
- 関数は100行以内に収める
- コンポーネントはアトミックデザイン原則に従う
## Repository Structure
- `src/components/` — UIコンポーネント
- `src/api/` — APIクライアント
- `src/types/` — 型定義
- `tests/` — テストファイル
## Testing Rules
- ユニットテストは `vitest` を使用
- E2Eテストは `playwright` を使用
- カバレッジ80%以上を維持する
## Service-Specific Rules
### API Integration
- 外部APIは必ずリトライロジックを実装
- タイムアウトは10秒を上限とする
サイズ制限と分割戦略
AGENTS.mdのデフォルト上限は32 KiBだ。大規模プロジェクトでは以下の戦略で管理する。
| 戦略 | 説明 |
|---|---|
| ディレクトリ単位で分割 | src/api/AGENTS.mdにAPI専用ルールを置く |
| グローバルは汎用ルールのみ | ~/.codex/AGENTS.mdには全プロジェクト共通のみ |
| override.mdで一時変更 | 実験的ルールはAGENTS.override.mdに隔離 |
| 既存ドキュメントを流用 | config.tomlでCONTRIBUTING.mdなどを代替指定 |
AGENTS.md vs CLAUDE.md の詳細比較
AI MDファイル完全対応表では、AGENTS.md・CLAUDE.md・.cursorrules・Copilot Instructions の4ファイルを横断比較している。Codex CLIを使う開発者が知っておくべき主要な違いを以下に示す。
| 項目 | AGENTS.md(Codex) | CLAUDE.md(Claude Code) |
|---|---|---|
| 読み込み元ツール | OpenAI Codex CLI | Claude Code |
| 優先度チェーン | グローバル→プロジェクト→サブディレクトリ | ~/.claude/ → プロジェクト → サブディレクトリ |
| 上書きファイル | AGENTS.override.md | なし(直接編集) |
| サイズ制限 | 32 KiB(デフォルト) | 実質無制限だが200行推奨 |
| 代替ファイル名 | config.tomlで設定可能 | 固定(CLAUDE.md) |
| ベストプラクティス | ディレクトリ階層で役割分担 | /initで自動生成→育てる |
Claude CodeとCodex CLIを併用しているチームでは、AGENTS.mdとCLAUDE.mdの両方を用意することを推奨する。各ツールが自分専用の設定ファイルのみを読み込むため、ルールの混在が起きない。
7. 基本的な使い方:コマンドリファレンス完全版
起動コマンド
# インタラクティブモード(TUI起動)
codex
# 初期プロンプトありで起動
codex "src/components/Button.tsx のバグを修正して"
# 作業ディレクトリを指定して起動
codex -C /path/to/project "テストを全部通して"
# 特定のモデルを使用(2026年5月時点の推奨はgpt-5.5)
codex --model gpt-5.5 "パフォーマンスを最適化して"
# 画像を添付して起動
codex -i screenshot.png "このUIデザインを実装して"
# デスクトップアプリを開く(macOS限定)
codex app
主要サブコマンド一覧
| コマンド | 安定度 | 用途 |
|---|---|---|
codex |
安定 | インタラクティブTUI起動 |
codex exec "..." |
安定 | 非対話型実行・スクリプト組み込み |
codex resume |
安定 | 前回セッションの継続 |
codex resume --last |
安定 | 直前のセッションを即座に継続 |
codex fork |
安定 | セッションを分岐(別スレッド化) |
codex apply |
安定 | クラウドタスクの差分をローカルに適用 |
codex login |
安定 | 認証(OAuth/APIキー) |
codex logout |
安定 | 認証情報を削除 |
codex mcp |
実験的 | MCPサーバー管理 |
codex cloud |
実験的 | クラウドタスクの実行・閲覧 |
codex sandbox |
実験的 | サンドボックスポリシーでコマンド実行 |
codex completion |
安定 | シェル補完の生成(bash/zsh/fish) |
codex features |
安定 | フィーチャーフラグの管理 |
3つの承認(アプルーバル)モード
Codex CLIはファイル操作とコマンド実行の権限を3段階で制御できる。
デフォルト"] A --> C["read-only
読み取り専用"] A --> D["danger-full-access
全アクセス許可"] B --> B1["作業ディレクトリ内
ファイル読み書き可"] B --> B2["コマンド実行可"] B --> B3["️ ネットワーク → 承認必要"] C --> C1["読み取り可"] C --> C2["書き込み不可"] C --> C3["コマンド実行不可"] D --> D1["すべて許可"] D --> D2["️ 開発環境専用"] D --> D3["本番環境では絶対に使わない"]
# 承認モード付きで起動
codex --sandbox read-only "このコードを解析して"
codex --sandbox workspace-write "バグを修正して"
codex --sandbox danger-full-access "プロジェクト全体をリファクタリング"
# 全自動モード(承認をスキップ)
codex --full-auto "テストを実行してすべて修正"
# --yolo(全制約解除・危険環境専用)
codex --dangerously-bypass-approvals-and-sandbox "..."
このフラグはすべての安全チェックを無効化する。Docker/VM等の隔離された環境専用だ。本番環境やローカル開発環境での使用は強くお勧めしない。誤ったコマンドが承認なしで実行されるリスクがある。
exec コマンド:CI/CDへの組み込み
# 非対話型でバグ修正を実行
codex exec "src/utils/parser.ts のTODOを全部解決して"
# JSON形式で出力
codex exec --json "テストカバレッジを分析して"
# 最後のメッセージをファイルに保存
codex exec -o output.txt "コードレビューして"
# セッションを保存しない(使い捨て実行)
codex exec --ephemeral "このdiffをレビューして"
# Gitリポジトリ外のディレクトリで実行
codex exec --skip-git-repo-check "このスクリプトを解析して"
スラッシュコマンド(TUI内部)
インタラクティブモード中に使用できる組み込みコマンドだ。
| スラッシュコマンド | 機能 |
|---|---|
/model |
使用モデルの切り替え |
/review |
コードレビューの実行 |
/review --base main |
mainとの差分をレビュー |
/review --uncommitted |
未コミット変更のレビュー |
Ctrl+G |
外部エディタでプロンプトを編集 |
8. サンドボックス実行の仕組み
Codex CLIのセキュリティ設計の核心がサンドボックス機能だ。macOSではseatbelt、LinuxではLandlockという仕組みを使い、Codexが実行するプロセスの権限を制限する。
重要:Codexはすべてのアクション履歴をトランスクリプトとして残す。何かおかしな変更があっても、git diffやgit resetで即座に元に戻せる安全設計だ。
サンドボックスポリシーの詳細
# macOSでのseatbeltポリシーを確認
codex sandbox -- ls /tmp
# Linuxでのlandlockポリシーを確認
codex sandbox -- cat /etc/passwd
# 追加ディレクトリへの書き込み権限を付与
codex --add-dir /tmp/workspace "一時ファイルを使って処理して"
9. Claude Code vs Codex CLI 徹底比較(2026年5月版)
2026年5月9日時点の最新情報に基づく詳細比較だ。両ツールともこの3週間で大きな前進があったため、4月以前の比較記事は鵜呑みにしないこと。
9-1. 基本スペック比較表
| 項目 | OpenAI Codex CLI | Claude Code |
|---|---|---|
| 開発元 | OpenAI | Anthropic |
| ライセンス | Apache-2.0(OSS) | 独自ライセンス |
| 言語(実装) | Rust | TypeScript |
| 最新版 | v0.121.0+(2026/4/15〜) | v2.1.138(2026/5/9) |
| 主要モデル | GPT-5.5(4/23〜), GPT-5.4 | Claude Opus 4.7(4/16〜), Sonnet 4.6 |
| コンテキスト長 | 400K(GPT-5.5・Codex内) | 1M(Opus 4.7・標準価格) |
| 無料プラン | ChatGPT Plus以上に付属 | Claude Proに付属 |
| API課金モデル | OpenAI APIトークン料金 | Anthropic APIトークン料金 |
| Windows対応 | WSL2推奨(実験的) | 正式対応(v2.1で安定化) |
| macOS/Linux | 正式サポート | 正式サポート |
| OSSステータス | フルOSS | 非OSSクライアント |
| 動作環境 | ローカル | ローカル+クラウドsandbox |
9-2. 機能比較表
| 機能 | OpenAI Codex CLI | Claude Code |
|---|---|---|
| インタラクティブTUI | ✅ | ✅ |
| 非対話型自動化 | ✅ codex exec |
✅ -pフラグ |
| サンドボックス | ✅ 3段階ポリシー | ✅ |
| MCP対応 | ✅(実験的) | ✅(本番品質) |
| マルチエージェント | ✅ サブエージェント | ✅ エージェントチーム |
| クラウドタスク | ✅ Codex Cloud | ❌(ローカルのみ) |
| Git連携 | ✅ | ✅ |
| 設定ファイル | AGENTS.md | CLAUDE.md |
| 設定ファイルOSS | ✅ | ✅ |
| Web検索 | ✅ デフォルト有効 | ✅(ツール使用) |
| 画像入力 | ✅ | ✅ |
| シェル補完 | ✅ bash/zsh/fish/PowerShell | ✅ |
| セッション再開 | ✅ codex resume |
✅ |
| Copilot系IDE統合 | ❌ | ❌(スタンドアロン) |
9-3. 得意分野の違い
Claude Codeが得意なこと
- 複雑な多段階タスク(設計→実装→テスト→デバッグ)
- 精密な局所的コード修正
- 長文コンテキストを必要とするタスク(100万トークン)
- CLAUDE.md/スキル/エージェントによる高度なカスタマイズ
- Agentハーネスエンジニアリングとの深い統合
Codex CLIが得意なこと
- 広範なリファクタリング・一括置換
- CI/CDパイプラインへの組み込み(
codex exec) - クラウドタスクとローカルの行き来(
codex cloud+codex apply) - 軽量なコードレビュー(
/reviewコマンド) - GitHubアプリとの統合(Codex Cloudとの連携)
9-4. 使い分けの指針
タスクの性質で使い分ける:
日常的な開発作業(コード理解・逐次実装)
→ Claude Code が向く
大規模バッチ処理(全ファイルに同じ変更)
→ Codex CLI の --full-auto が向く
CI/CDでの自動コードレビュー
→ Codex CLI の codex exec が向く
複雑なバグ調査(コンテキスト量が多い)
→ Claude Code の大コンテキストが向く
チームのコーディング規約自動適用
→ どちらもAGENTS.md/CLAUDE.mdで対応可能
10. codex-plugin-ccでClaude Code内からCodexを呼ぶ
2026年3月、OpenAI公式のcodex-plugin-ccが登場した。Claude Codeのプラグイン機構を使い、Claude Code内から直接Codexのレビュー・タスク委譲ができる仕組みだ。
これは「ライバル同士がプラグインで握手した」象徴的な出来事として技術系メディアで大きく取り上げられた。前述の「Claude Codeで作る→Codexで直す」ワークフローを、ツール切り替えなしで完結できる。
10-1. インストール手順
# 1. Claude Code内でマーケットプレイスを追加
> /plugin marketplace add openai/codex-plugin-cc
# 2. プラグインをインストール
> /plugin install codex-plugin-cc
# 3. Claude Codeを再起動
# 4. Codex側のセットアップ確認
> /codex:setup
# 5. 必要ならCodexにログイン
> !codex login
10-2. 提供される3つのコマンド
| コマンド | 役割 |
|---|---|
/codex:review |
現在のブランチ・差分をCodexにレビューさせる(標準) |
/codex:rescue |
codex:codex-rescueサブエージェントにタスクを丸投げ |
/codex:adversarial-review |
より懐疑的・敵対的なレビュー(穴探し特化) |
/codex:adversarial-reviewが特に強力。「このコードを批判的に見て、潜在的バグ・セキュリティリスク・パフォーマンス問題を洗い出して」という指示を内部的にCodexに投げる。Claude Codeが書いたコードに対する「対抗レビュー」として機能する。
10-3. 使い方の例
# Claude Codeで実装後、すぐ同じセッション内でCodexレビュー
> 認証ミドルウェアを実装して
... [Claude Codeが実装] ...
> /codex:review
# Codexが返した指摘を踏まえて再修正
> 指摘されたCSRF対策を追加してテストも書いて
# 仕上げに敵対的レビュー
> /codex:adversarial-review
10-4. 仕組みの裏側
codex-plugin-ccはCodex App ServerとJSON-RPC 2.0で双方向通信する。Claude Code側のスラッシュコマンドが呼ばれると、ローカルのCodex CLI認証情報を使ってCodexが起動し、結果がClaude Codeのセッションに返る。追加の認証作業なしで動くのが大きな利点だ。
向く:単独開発・PRレビューを高頻度で回したい・両ツールのアカウントを持っている人。
向かない:チーム全体のCI/CD自動化(こちらは`codex exec`を直接GitHub Actionsで回すのが定石)。
11. Cursor / GitHub Copilot との位置づけ
ターミナルエージェント型の Codex CLI・Claude Code と、IDE統合型の Cursor・Copilot はそもそもカテゴリが違う。
| ツール | カテゴリ | 動作環境 | 主な用途 |
|---|---|---|---|
| Codex CLI | ターミナルエージェント | ターミナル | 自律タスク実行・CI組み込み |
| Claude Code | ターミナルエージェント | ターミナル | 精密開発・複雑タスク |
| Cursor | IDE(VSCode派生) | GUI | リアルタイム補完・Composer |
| GitHub Copilot | IDEプラグイン | VSCode/JetBrains等 | インライン補完・チャット |
| Windsurf | IDE(カスケードAI) | GUI | エージェント型IDE操作 |
2026年の主流は「ターミナルエージェント + IDE補完の併用」だ。Codex CLIやClaude Codeで大きなタスクを実行しながら、CopilotやClaude Code vs Cursor比較記事で紹介したCursorでリアルタイムの補完・レビューを行うハイブリッドスタイルが広まっている。
IDEの補完が「一行ずつの会話」なら、ターミナルエージェントは「機能丸ごとの委任」だ。この使い分けを意識することで、各ツールの強みを最大化できる。
12. 実践ユースケース
ユースケース1:バグ修正の自動化
テストが失敗しているが原因がわからない場合に有効だ。
# テスト失敗を解析して修正
codex "npm test を実行して失敗しているテストをすべて修正して。
修正前に必ずコミットして、各修正の理由をコミットメッセージに書いて"
# 特定ファイルのバグを修正
codex "src/api/auth.ts の認証トークン検証に脆弱性がある。
修正して対応するテストも追加して"
実行するとCodexがテストを実行し、スタックトレースを読み、ソースコードを確認し、修正案を提示する。承認モードがautoの場合は確認なしで修正される(変更はgitで追跡される)。
ユースケース2:テスト生成
既存コードに対するテストがない場合に威力を発揮する。
# カバレッジレポートを渡してテスト生成
codex "vitest でカバレッジを計測して、80%未満のファイルに
ユニットテストを追加して。既存のテストパターンに合わせること"
# 特定モジュールのテスト生成
codex "src/utils/ 以下のすべての関数に対して、
エッジケースを含むテストを生成して"
ユースケース3:大規模リファクタリング
プロジェクト全体に渡る変更はCodex CLIが特に得意とする場面だ。
# CommonJS → ESModules 変換
codex --full-auto "すべての require() を ES imports に変換して。
package.json の type: module も設定して。テストが通ることを確認して"
# TypeScript any型の除去
codex "src/ 以下のすべての any 型を適切な型定義に置き換えて。
型定義が必要な場合は src/types/ に追加して"
`--full-auto`フラグは承認ステップを省略する。gitで管理されているプロジェクトで使用し、実行後は必ず`git diff`で変更内容を確認することを推奨する。
ユースケース4:ドキュメント生成
# APIドキュメントの自動生成
codex "src/api/ 以下のすべてのエンドポイントを解析して、
OpenAPI 3.0 形式の docs/api.yaml を生成して"
# READMEの自動更新
codex "package.json と src/ を解析して README.md を更新して。
インストール方法、使い方、API一覧を含めて"
ユースケース5:CI/CDへの組み込み
# GitHub Actions での使用例
# .github/workflows/codex-review.yml
name: Codex Code Review
on:
pull_request:
types: [opened, synchronize]
jobs:
review:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- uses: actions/setup-node@v4
with:
node-version: '20'
- run: npm install -g @openai/codex
- run: |
codex exec \
--ephemeral \
--json \
"このPRのdiffをセキュリティ・パフォーマンス・可読性の観点でレビューして"
env:
OPENAI_API_KEY: $
13. MCPとサブエージェント:高度な活用方法
MCP(Model Context Protocol)連携
Codex CLIはMCPをサポートしており、外部ツールやデータソースとの連携が可能だ。
# ~/.codex/config.toml での MCP サーバー設定
[[mcp_servers]]
name = "github"
command = "npx"
args = ["-y", "@modelcontextprotocol/server-github"]
env = { GITHUB_TOKEN = "${GITHUB_TOKEN}" }
[[mcp_servers]]
name = "filesystem"
command = "npx"
args = ["-y", "@modelcontextprotocol/server-filesystem", "/workspace"]
# MCPサーバーをCLIで追加
codex mcp add github
# 利用可能なMCPサーバーを確認
codex mcp list
MCPサーバーはセッション開始時に自動的に起動され、Codexの組み込みツールと同列で利用できる。
サブエージェントによる並列処理
複雑なタスクを分割して並列実行できる。
# ~/.codex/config.toml でのサブエージェント設定
[[subagents]]
name = "test-runner"
description = "テスト実行専門エージェント"
model = "gpt-5.5"
[[subagents]]
name = "doc-writer"
description = "ドキュメント生成専門エージェント"
model = "gpt-5.5"
# サブエージェントを使った並列処理の例
codex "フロントエンドのリファクタリング、バックエンドのテスト追加、
ドキュメント更新を並列で実行して"
14. 制限事項・注意点
技術的な制限
| 制限 | 内容 |
|---|---|
| AGENTS.mdサイズ | デフォルト32 KiB(設定変更可) |
| Windows | 正式サポートはWSL2経由の実験的段階 |
| ネットワーク | autoモードではデフォルトで承認必要 |
| セッション保存 | ローカルストレージに依存(クラウド同期なし) |
| ファイルシステム | デフォルトは作業ディレクトリのみ(--add-dirで拡張可) |
コスト管理
APIキーを使用している場合、トークン消費量に注意が必要だ。
# コスト管理のベストプラクティス
# 1. 作業範囲を明確に指定する
codex "src/components/Button.tsx のみを修正して" # ❌ 全体参照より安い
codex "すべてのコンポーネントを最適化して" # ⚠️ トークン大量消費
# 2. --ephemeral でセッション保存をスキップ
codex exec --ephemeral "このファイルを分析して"
# 3. read-onlyモードで分析のみ
codex --sandbox read-only "コードベースの問題点を洗い出して"
セキュリティ上の注意点
Codex CLIはローカル開発・ステージング環境での使用を想定している。プロダクションサーバーに直接接続したターミナルでの実行、本番DBへのアクセス権があるシェルでの実行は避けること。
- APIキーは環境変数か設定ファイルで管理し、コードにハードコードしない
--dangerously-bypass-approvals-and-sandbox(--yolo)は隔離環境専用- AGENTS.mdに機密情報(APIキー・パスワード)を書かない
- Gitリポジトリ外のディレクトリで実行する場合は
--skip-git-repo-checkが必要
15. FAQ
Q: Codex CLIはオフラインで動きますか?
A: 基本的にはオンライン環境が必要だ。ただし--ossフラグを使うとOllamaを通じてローカルのオープンソースモデルを使用できる。この場合、クラウドAPIは使用しない。
# Ollamaと連携してオフライン動作
codex --oss "このコードを解析して"
Q: Codex CLIのモデルはどれを選べばいいですか?
A: 2026年5月時点はChatGPTサインイン環境ならgpt-5.5が第一選択肢だ。同じCodexタスクをGPT-5.4より少ないトークンで完了するため、品質とコストの両立が可能。難易度の高い数学・大規模リファクタはgpt-5.5-proに切り替える。APIキー認証では現状GPT-5.5は使えず、GPT-5.4・GPT-5.3-Codexから選ぶことになる。
Q: Codex CLIを複数プロジェクトで使う際のベストプラクティスは?
A: ~/.codex/AGENTS.mdにすべてのプロジェクト共通ルール(コミットメッセージ形式・言語設定等)を書き、各リポジトリのルートにはAGENTS.mdでプロジェクト固有ルールを追加する。config.tomlでプロファイルを分けることも有効だ。
Q: Claude CodeとCodex CLIを同じリポジトリで併用できますか?
A: できる。むしろ2026年5月の主流は併用だ。Claude Codeベストプラクティス完全ガイドで解説しているCLAUDE.mdと、本記事で解説したAGENTS.mdを両方配置すれば、ツール切替時にルールの混在が起きない。さらに前述のcodex-plugin-ccを使えば、Claude Code内から/codex:reviewで呼び出せる。
Q: Codex CLIのデバッグ方法は?
A: セッションはcodex resumeで再開・確認できる。トランスクリプトはローカルに保存されるため、codex resume --allで過去の全セッションを一覧表示できる。--jsonフラグを使うと全イベントをJSONで出力できるため、CI/CDでのデバッグに有効だ。
16. まとめ:Codex CLIを使いこなすために
OpenAI Codex CLIは、2026年4月にリリースされ、5月時点でGPT-5.5搭載とcodex-plugin-cc登場により大幅に進化したターミナルコーディングエージェントだ。以下の4点を押さえることで、すぐに活用を始められる。
1. まずインストールしてGPT-5.5で試す:npm i -g @openai/codex → codex login → codex --model gpt-5.5 "このプロジェクトを説明して"で5分で動作確認できる。
2. AGENTS.mdを育てる:チームのコーディング規約やプロジェクト固有ルールをAGENTS.mdに追記していくと、Codexが毎回同じルールに従うようになる。最初は空でいい。使いながら気づいたことを追加していく。
3. Claude Codeとハイブリッド運用する:「Claude Code(Opus 4.7・1Mコンテキスト)で作る → Codex(GPT-5.5・400K)で直す」がX上でバズ中の主流スタイルだ。設計力と批判的レビュー力を両取りできる。
4. codex-plugin-ccで両ツール統合:Claude Code内から/codex:reviewを呼べる公式プラグインが2026年3月に登場した。/plugin marketplace add openai/codex-plugin-ccでインストールするだけで、ツール切替なしの開発体験が手に入る。
AI時代のターミナルは単なるコマンド入力インターフェイスではなく、AIエージェントとの協働空間に進化している。Codex CLIとClaude Codeを武器に、開発生産性の新しい次元を体験してほしい。
17. 参照ソース
- GitHub - openai/codex — 公式リポジトリ(Apache-2.0)
- Codex CLI公式ドキュメント — OpenAI公式
- AGENTS.md完全ガイド — OpenAI公式
- Codex Changelog — OpenAI公式
- Introducing GPT-5.5 — OpenAI公式(2026/4/23)
- GPT-5.5 System Card — OpenAI公式
- Codex Chrome extension — OpenAI公式(2026/5/7)
- openai/codex-plugin-cc — Claude Code向け公式プラグイン
- Introducing routines in Claude Code — Anthropic公式
- Auto mode for Claude Code — Anthropic公式
- New in Claude Managed Agents: dreaming, outcomes, multi-agent — Anthropic公式
- Live blog: Code w/ Claude 2026 — Simon Willison
- Claude Opus 4.7 Release — Anthropic公式(2026/4/16)
- Claude Code Changelog — Anthropic公式
- SWE-Bench Verified Leaderboard — 2026年5月時点