この記事のポイント
  • Claude Codeのトークンコスト削減ツールはclaude-token-efficient・Token Optimizer・Token Savior・Token Optimizer MCP・claude-memの5種が主流
  • 実測の削減幅は40〜97%と幅が大きい。アプローチは「圧縮」「可視化」「シンボルナビ」「キャッシュ」「セッション記憶」と異なる
  • 用途別フローチャート+RTKとの位置づけ付き。最短ルートで月額APIコストを半減させる組み合わせを提示

Claude Codeのトークンコスト:何がここまで消費するのか

Claude Codeを業務で使い続けると、必ずトークンコストの壁にぶつかる。Claude Sonnet 4.6では入力トークン1Mあたり$3.00・出力1Mあたり$15.00だ(Claude API料金の詳細はこちら)。コードベースが大きくなるほど、また会話が長くなるほど、1セッションで消費するトークン数は跳ね上がる。

問題の根本は3つある。第一に「ファイル読み込みの非効率性」だ。Claude Codeはデフォルトで3行を調べるために数百行のファイル全体を読み込む。第二に「出力の冗長性」で、モデルはデフォルトで「もちろん!」「素晴らしい質問ですね!」などの前置きや、要求していない追加提案を生成する。第三に「セッション間のコンテキスト重複」で、前のセッションで確認済みの情報を毎回最初から説明し直すことになる。

この3つの問題に対して、アプローチの全く異なる5つのOSSが2024〜2025年にかけて登場した。合計GitHubスター数は約72,000を超え、それぞれが異なる層のトークン消費を狙い撃ちにする。本記事ではこれら5ツールの仕組み・実測データ・導入コストを横断的に比較する。

Claude Code完全ガイド2026でClaudeの基本を理解した上で、コスト最適化を本格的に取り組みたい開発者・チーム向けの内容だ。


5ツール一覧:アプローチ別に整理する

まず5ツールの全体像を俯瞰する。アプローチは大きく「プロンプト制御」「MCPサーバー」「プラグイン(フック)」の3カテゴリに分かれる。

ツール GitHub★ 削減率 アプローチ 言語 ライセンス
claude-token-efficient 4,777 40〜63% プロンプト制御(CLAUDE.md) なし 不明
Token Optimizer 615 非公開 分析ツール+スキル Python PolyForm NC
Token Savior 629 97% MCPサーバー Python MIT相当
Token Optimizer MCP 271 60〜90% MCPサーバー TypeScript MIT
claude-mem 65,767 非公開 プラグイン(フック) TypeScript AGPL-3.0

削減率の「非公開」とは数値をREADMEが明示していないという意味であり、効果がないわけではない。特にclaude-memは文脈圧縮によるトークン節約が主目的ではなくセッション記憶の継続が主眼だ。


ツール選択フローチャート

flowchart TD A["トークン最適化
を始める"] --> B{"主な課題は?"} B -->|Claudeの出力が冗長| C["claude-token-efficient
619バイトCLAUDE.md
40〜63%削減"] B -->|コード読み込みが多い| D{"MCP設定できる?"} B -->|"セッションをまたいで
文脈を保持したい"| E["claude-mem
65K プラグイン"] B -->|"トークン消費を
可視化・分析したい"| F["Token Optimizer
HTMLダッシュボード"] D -->|はい・複雑な設定OK| G["Token Savior
97%削減 Python MCP"] D -->|はい・シンプルに使いたい| H["Token Optimizer MCP
60〜90%削減 npm"] C --> I["コスト削減達成"] E --> I F --> I G --> I H --> I

1. claude-token-efficient(4,777★):619バイトで40〜63%削減

発想の原点

2024年後半にGitHubに登場したclaude-token-efficientは、最もシンプルな解決策を提示した。1ファイル、619バイト、コード変更ゼロ。CLAUDE.mdに記述するルールセットだ。

Claudeはデフォルトで以下の無駄な出力を大量に生成する:

  • 「もちろん!」「素晴らしいご質問ですね!」などのフィラー文
  • 回答の末尾に付く「何かお役に立てることがあればお知らせください!」
  • 要求していないコード抽象化・エラーハンドリングの追加
  • em ダッシュ(—)やスマートクォートなどのUnicode文字
  • 質問の内容を冒頭で繰り返す確認文

これらは全てトークンを消費するが、付加価値はゼロだ。claude-token-efficientはこの問題をCLAUDE.mdのインストラクション层で解決する。

仕組みとインストール

インストールは3ステップで完了する:

# GitHubからCLAUDE.mdの中身を取得
curl -s https://raw.githubusercontent.com/drona23/claude-token-efficient/main/CLAUDE.md

# プロジェクトのCLAUDE.mdに追記(既存ファイルがある場合は結合)
cat claude-token-efficient.md >> your-project/CLAUDE.md

または手動で以下のルールをCLAUDE.mdに追記する:

Rules: Read files first. Write complete solution. Test once. No over-engineering.

CLAUDE.mdの詳細な設定方法はClaude Codeベストプラクティスガイドで解説している。

実測データ

README記載の実測値によると、出力ヘビーなワークフローで40〜63%のトークン削減が確認されている。ただし重要な注意点が2つある:

第一に「小さいコンテキストでは逆効果になる可能性がある」点だ。CLAUDE.mdはメッセージのたびにコンテキストに読み込まれる。短い1回限りのクエリでは、ルールファイルの読み込みコストが削減効果を上回ることがある。

第二に「削減対象は出力トークンのみ」という点だ。ファイル読み込みのような入力トークンの非効率には手を入れない。

最適な使用シナリオ

向いている場面 向かない場面
自動化パイプライン(高出力量) 単発の短いクエリ
繰り返し構造化タスク 深いアーキテクチャ修正
チームで一貫した出力フォーマットが必要 フレッシュセッション主体の運用
API経由のコード生成ループ 構造化出力(JSON mode)が使えない環境

2. Token Optimizer(615★):「幽霊トークン」をHTMLダッシュボードで可視化

「幽霊トークン」とは何か

Token Optimizerが提唱する「幽霊トークン(ghost tokens)」は他のツールが見落としている問題を指摘する。

一般的なトークン最適化ツールはコマンド出力の圧縮(コンテキスト全体の15〜25%を占める層)のみを扱う。しかし残りの75〜85%——膨らんだ設定ファイル、使われていないスキル定義、重複したシステムプロンプト、古くなったメモリファイル——は手つかずのままだ。

幽霊トークンとは、コンテキストウィンドウに存在しているが実際の推論に貢献していないトークンのこと。コンパクション(長い会話の圧縮)のたびに60〜70%の品質が失われる問題も含め、Token Optimizerはこれらを「コンテキスト品質の崩壊」として定義する。

主要機能

Token Optimizerはv5.6.0(2025年時点)で以下の機能を提供する:

  • 全層スキャン: コマンド出力だけでなく、設定ファイル・スキル・メモリ・システムプロンプト全体を分析
  • HTMLダッシュボード: セッションごとのトークン数・コスト・削減率をリアルタイムで可視化(オートアップデート)
  • コンパクション耐性: 会話圧縮後も作業が継続できるよう、重要コンテキストを保護する仕組み
  • Claude Code + OpenClaw対応: 両プラットフォームで動作

Token Optimizer ダッシュボード

特筆すべきはゼロランタイム依存・ゼロテレメトリの方針だ。外部へのデータ送信なし、インターネット接続なしで完全ローカル動作する。Python 3.8以上があれば追加パッケージは不要だ。

インストールとスキャン実行

# Claude Codeプラグインとしてインストール
/plugin install alexgreensh/token-optimizer

# または手動でスキャンを実行
python token-optimizer/scan.py --project-path /path/to/project

ライセンスの注意点

Token OptimizerはPolyForm Noncommercialライセンスを採用している。商用利用には別途ライセンスが必要だ。個人・OSS・研究目的では無料で使用できる。


3. Token Savior(629★):シンボルベースナビで実測97%削減

アーキテクチャの発想転換

Token Savior(正式名称:Token Savior Recall)は最も技術的に野心的なアプローチを取る。コードベース全体をシンボル(関数・クラス・インポート・コールグラフ)でインデックス化し、モデルがcatコマンドでファイル全体を読む代わりに、シンボルポインタで必要箇所だけを参照できるようにする。

MCPサーバー(Model Context Protocol)として動作し、Python 3.11以上が必要だ。

ベンチマークデータ

Token Saviorのページには90の実際のコーディングタスクを使ったベンチマーク結果が公開されている:

指標 素のClaude Code Token Savior使用時
スコア 141/180(78.3%) 180/180(100.0%)
使用トークン 1.55M 804K(−48%)
処理時間 166分 35分(−79%)
勝ち/引き/負け 25勝/65引/0敗

評価カテゴリはauditbug_fixingcode_generationcode_reviewconfig_infradocumentationexplanationgitnavigationrefactoringwriting_testsの11種類。全カテゴリで100%を達成し、素のClaude Codeに1敗もしていない。

また、Sonnet 4.6でも検証されており、94.4%(170/180)vs 86.7%(156/180)と改善が確認されている。

永続メモリエンジン

Token Saviorのもう一つの柱が永続メモリエンジンだ。コードナビゲーション以外に、以下の情報をSQLite WAL + FTS5 + ベクトル埋め込みで保存・管理する:

  • 意思決定の記録(アーキテクチャの選択理由など)
  • バグ修正の経緯
  • コーディング規約・ガードレール
  • セッション終了時のサマリー

これらはセッション開始時に「コンパクトなデルタ」として再注入される。矛盾する情報は保存時に検出され、観測データはTTLで自然に減衰する。3層のプログレッシブ・ディスクロージャー契約でルックアップコストが抑制されている。

インストール

# uvを使ってMCPサーバーをインストール
uvx install token-savior-recall

# Claude Code設定(.claude/settings.json)に追加
# mcpServers セクションに以下を記述
{
  "mcpServers": {
    "token-savior": {
      "command": "uvx",
      "args": ["token-savior-recall"],
      "env": {
        "WORKSPACE": "/path/to/your/project"
      }
    }
  }
}

MCPサーバーの設定詳細はMCPサーバーの仕組みと作り方ガイドを参照のこと。

97%削減の解剖

「97%削減」は全操作ではなくコードナビゲーション操作に限定した数値だ。170以上の実セッションで計測された「注入文字数の削減率」として定義されている。ファイル全体を読む代わりに関数シグネチャとドキュメントのみを返す、というアプローチが効く場面——大規模なコードベースのリファクタリング・バグ調査・コードレビュー——では特に威力を発揮する。

sequenceDiagram participant C as Claude Code participant TS as Token Savior MCP participant DB as SQLite+FTS5
シンボルDB participant F as ファイルシステム C->>TS: get_function("authenticate_user") TS->>DB: シンボル検索 DB-->>TS: シグネチャ+docstring (200 tokens) TS-->>C: 関数情報を返す Note over C,F: 従来のcatコマンド C->>F: cat auth.py (全体) F-->>C: 全コード (2000 tokens)

4. Token Optimizer MCP(271★):Brotli圧縮とSQLiteキャッシュで60〜90%削減

アプローチ:外部ストレージへのオフロード

Token Optimizer MCPは異なる角度からトークン削減に取り組む。大きなコンテンツをBrotli圧縮してSQLiteデータベースに保存し、コンテキストウィンドウ上には「参照キー」だけを残す方式だ。

Brotli圧縮は繰り返しパターンが多いコンテンツで最大82倍の圧縮率を達成する。APIレスポンスのJSON、ログファイル、設定ファイルなどは特にこの恩恵を受けやすい。38,000件以上の実運用での計測では60〜90%の削減が確認されている。

TypeScript製でnpm経由でインストールでき、Claude Desktop・Cursor・Clineなど複数のAIツールに自動対応する。

65ツールの全体像

Token Optimizer MCPは65のツールを提供するが、中核となるのはスマートファイル操作カテゴリだ:

ツール 説明 削減率
smart_read キャッシュと差分更新でファイル読み込みを最適化 80%
smart_edit 行ベース編集で差分のみ出力 90%
smart_grep マッチ部分のみ返す検索 80%
smart_glob パスのみ返すファイル検索 75%
smart_diff gitの差分のみ出力 85%
optimize_text 汎用テキスト圧縮・キャッシュ 60〜90%
get_cached キャッシュ済みコンテンツの取得

これらは標準ツール(Read・Grep・Glob)の代替として機能し、Claude Codeが自動的に選択することを想定している。

インストール

# グローバルにインストール(フック自動設定付き)
npm install -g @ooples/token-optimizer-mcp

# インストール後に各AIツールの設定が自動検出・更新される
# Claude Desktop, Cursor, Clineなどをサポート

ポストインストールスクリプトが各AIツールの設定ファイルを自動検出し、MCPサーバーの設定を追記する。手動設定が不要な点で導入障壁が低い。

クロスセッションキャッシュの活点

Token Optimizer MCPの最大の強みはセッションをまたいでキャッシュが持続する点だ。Token SaviorのシンボルDBと同様、一度圧縮・保存したコンテンツは次のセッションでも即座に取得できる。同じファイルを繰り返し参照するプロジェクトでは、時間経過とともに削減率が向上する傾向がある。


5. claude-mem(65,767★):セッション記憶の圧縮で「文脈の重複注入」を防ぐ

なぜ65K星を集めたか

claude-memは今回紹介する5ツールの中で群を抜いた支持を得ている。その理由は「トークン最適化」ではなく「記憶の継続性」という、より本質的な問題を解決するからだ。

Claude Codeはセッションが終了すると全ての文脈を忘れる。次のセッションでは「このプロジェクトのコーディング規約は?」「前回どこまで実装したか?」を全て説明し直すことになる。claude-memはこの問題をClaude Codeのライフサイクルフック(PostToolUse、Stop等)を利用して解決する。

仕組み

claude-memはセッション中の以下の情報を自動的にキャプチャする:

  • ツール呼び出しの結果と観測事項
  • 意思決定の記録
  • セッション終了時のサマリー

キャプチャしたデータはAI(Claude自身のAgent SDK)で圧縮され、次のセッション開始時にプログレッシブ・ディスクロージャーで段階的に再注入される。全文脈を一度に注入するのではなく、現在のタスクに関連性の高い情報から優先的に提供することでトークンコストを最小化する。

インストール

# npxでワンコマンドインストール
npx claude-mem install

# Claude Code内のプラグインマーケットプレイスからも可能
/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem

インストール後はClaude Codeを再起動するだけで自動動作が始まる。手動操作は不要だ。

特徴的な機能

機能 詳細
Webビューア http://localhost:37777 でメモリストリームをリアルタイム閲覧
プライバシー制御 <private> タグで特定コンテンツを記録から除外
自然言語検索 mem-searchスキルで過去の観測を検索
マルチプラットフォーム Claude Code・Gemini CLI・OpenCode対応
無限モード (Beta) Endless Modeで超長期プロジェクトに対応

重要な注意点:AGPL-3.0ライセンスはコピーレフト条項を含む。claude-memを組み込んだソフトウェアを配布する場合、そのソフトウェアのソースコードも公開義務が生じる可能性がある。社内ツールや個人利用では問題ないが、商用製品への組み込みは法務確認を推奨する。


詳細比較:導入コストと効果の全体像

quadrantChart title トークン削減効果 vs 導入コスト x-axis 導入が簡単 --> 導入が複雑 y-axis 削減効果が小さい --> 削減効果が大きい quadrant-1 高効果・高コスト quadrant-2 高効果・低コスト quadrant-3 低効果・低コスト quadrant-4 低効果・高コスト claude-token-efficient: [0.1, 0.55] Token Optimizer: [0.25, 0.40] Token Savior: [0.75, 0.95] Token Optimizer MCP: [0.45, 0.75] claude-mem: [0.30, 0.65]

各ツールの具体的な設定・運用コストを整理する:

ツール 前提要件 初期設定時間 継続メンテコスト 外部依存
claude-token-efficient なし 5分 ほぼゼロ なし
Token Optimizer Python 3.8+ 15〜30分 定期スキャン なし
Token Savior Python 3.11+, uv 30〜60分 低(自動更新) SQLite
Token Optimizer MCP Node.js 18+, npm 10〜20分 低(自動設定) SQLite
claude-mem Node.js 18+, npm 10分 ほぼゼロ(自動) Claude API

claude-memだけが外部のClaude APIを使ってメモリを圧縮する点に注意が必要だ。圧縮処理自体でトークンを消費するため、純粋なコスト削減としては他ツールと比較するのが難しい。長期的なコンテキスト維持コストの削減と、圧縮コストのトレードオフで評価する必要がある。


用途別:どのツールを選ぶべきか

ケース1:まず試してみたい・最小コストで始めたい

推奨:claude-token-efficient

導入に5分とかからず、コード変更もサーバー設定も不要だ。Claude Codeベストプラクティスガイドを読んで既にCLAUDE.mdを設定している人なら、数行追記するだけで効果が出る。まず「Claudeの出力がどれだけ変わるか」を体感してから他ツールの導入を判断することを勧める。

ケース2:大規模コードベースで繰り返しファイル参照が多い

推奨:Token Savior

ベンチマークデータが最も充実しており、コードナビゲーション操作での97%削減という数値は90タスクの実計測に基づいている。Python 3.11以上とuv(Pythonパッケージマネージャ)の設定が必要だが、一度動かせば自動的に効果が出る。

ケース3:APIレスポンスや設定ファイルを繰り返し参照する

推奨:Token Optimizer MCP

Brotli圧縮とSQLiteキャッシュの組み合わせは、繰り返し参照するテキストコンテンツで特に効果が高い。npmでインストールして自動設定されるため、MCPに慣れていないチームでも導入しやすい。65のスマートツールは標準ツールの完全な代替として機能する。

ケース4:長期プロジェクトでセッション間の文脈断絶が問題

推奨:claude-mem

65,000星を超える支持は伊達ではない。「毎回プロジェクトの説明をし直す」問題はclaude-memで根本的に解決できる。AGPL-3.0ライセンスの制約を確認した上で、個人・OSS・社内プロジェクトであれば積極的に試したい。

ケース5:まずトークン消費の実態を把握したい

推奨:Token Optimizer

削減する前に「どこで消費しているか」を可視化することが大切だ。Token OptimizerのHTMLダッシュボードは、設定ファイル・スキル・メモリなど見落としがちな「幽霊トークン」の発生箇所を特定する。他のツールを導入した後の効果測定にも使える。

組み合わせ戦略

最大限の効果を得るには複数ツールの組み合わせが有効だ。推奨する組み合わせパターンを示す:

目標 組み合わせ
基本的なコスト削減 claude-token-efficient + claude-mem
コードベース特化の最大化 Token Savior + claude-token-efficient
汎用的な最適化 Token Optimizer MCP + claude-mem
完全な分析+最適化 Token Optimizer(分析)+ Token Savior(削減)

claude-token-efficientはCLAUDE.mdへの追記のみなので、どの組み合わせにも追加費用なしに加えられる。MCPサーバー(Token SaviorとToken Optimizer MCP)はclaude_desktop_config.jsonに並列設定で同時利用可能だ。


RTKとの位置づけの整理

本記事で紹介した5ツールとは別に、RTK(Rust Token Killer)というCLIプロキシも存在する。RTKはClaude Codeのシェルコマンド出力をフィルタリングすることで60〜90%のトークン削減を実現する。git statuslsなどのコマンド出力から不要な情報を除去するアプローチで、今回紹介したツールとは異なるレイヤーで動作する。

RTKはCLAUDE.mdのフックとして設定され、コマンド実行時に自動的にフィルタリングが行われる。Token Saviorやclaude-token-efficientと組み合わせることで、さらなるコスト削減が期待できる。


まとめ:コスト削減の最短ルートはどれか

Claude Codeのトークン最適化は「一つの解決策がすべてをカバーする」問題ではない。出力冗長性・コードナビゲーション・セッション記憶という3つの層それぞれに対して、異なるアプローチが存在する。

まず試すべき優先順位は以下の通りだ:

  1. claude-token-efficient:コスト最小・効果最速。5分で導入して即効果を確認
  2. claude-mem:長期プロジェクトなら早期に導入するほど価値が高まる
  3. Token Optimizer MCP:npm一発で設定完了。スマートツールで継続的に節約
  4. Token Savior:大規模コードベースで確実に97%削減を狙う
  5. Token Optimizer:上記4つを入れた後、消費の可視化・分析に活用

コスト削減のROIは、セッション数・コードベースの規模・チーム規模に比例して大きくなる。個人の週1回の試験的利用ではclaude-token-efficient一本で十分かもしれないが、チームで毎日Claude Codeを使うなら複数ツールの組み合わせで月間コストを半分以下にすることも現実的だ。


参照ソース