Claude CodeのExtended Thinkingセッションログに含まれる「思考ブロック(thinking blocks)」が、実際の推論プロセスではなく暗号化された要約に過ぎないことが、エンジニアのPatrick McCanna氏の調査で明らかになった。ローカルに保存されたログには600文字のシグネチャが含まれるだけで、モデルが実際に行った推論テキストは含まれていない。

Extended Thinkingログの実態

Claude Codeはセッションを自動的にディスクに記録し、そのログには「思考ブロック」と呼ばれるセクションが含まれる。多くのユーザーがこれをモデルの実際の推論過程と理解していたが、Anthropicの公式ドキュメントには以下の仕様が記載されている。

  • 推論は暗号化される: Claudeの推論はシグネチャに暗号化されており、復号キーはAnthropicが保有する
  • APIが返すのは要約: ローカルに記録されるのは実際の推論そのものではなく、推論プロセスの「要約(summary)」
  • フル出力はエンタープライズ限定: 実際の思考プロセスへのアクセスにはエンタープライズ契約が必要

McCanna氏はこの状況を「JPEGをBMPとして保存し直してから編集し、元のJPEGですと提示するようなもの」と表現している。形式は似ているが変換によって情報が失われているという指摘だ。

なお、Ctrl+Oで表示されるExtended Thinking出力も、モデルの思考の要約であり、セッション中にエージェントの動作を実際に駆動した推論そのものではない点も合わせて指摘されている。

ドキュメントの記述が不明瞭

問題をより複雑にしているのが、Anthropicの公式ドキュメントにおける記述のあいまいさだ。「extended thinkingはClaude の完全な思考プロセスの要約を返す(returns a summary of Claude’s full thinking process)」という記述は存在するものの、サラッと読むと実際の推論ログが手元にあると誤解しやすい構成になっている。

McCanna氏は「コーヒーを飲む前に流し読みすると気づかないレベルの間接的な表現」と指摘しており、Hacker Newsでも170件以上のコメントが集まる議論に発展している。

実務への影響:監査・コンプライアンスの観点から

監査証跡として使えるか?

現時点では使えない、が結論だ。AIエージェントが何らかの判断を下した際に「なぜそう判断したか」の根拠をローカルログから再現することは不可能で、記録できるのは以下に限られる。

  • 入力(プロンプト・コンテキスト)
  • 出力(レスポンス)
  • 実行されたアクション(ファイル操作・コマンドなど)

判断の根拠となった内部推論は手元には残らない。

コンプライアンス要件がある環境での注意点

金融・医療・行政など、意思決定の説明責任(Explainability)が厳しく問われる業種では、この仕様が導入上の制約になりうる。「AIがこの推論でこう判断したから」を証明できないと困る場面では、エンタープライズ契約の検討か、代替手段の設計が必要になる。

現実的な対策

推論トレースが必要なケースでは以下の対応を検討したい。

  • Anthropicのエンタープライズプランを検討する — フル思考出力にアクセスできる可能性がある
  • 入出力ログを徹底的に記録する — 推論そのものは取れないが、コンテキストの再現性は高められる
  • 高リスクな判断ポイントに人間レビューを組み込む — エージェントを完全自律にしない設計
  • チームや顧客への説明を正確にする — 「思考ログがある」と言い切らない

筆者の見解

Claude Codeは今も自分が最も信頼して使い倒しているツールだ。その前提を置いた上で、今回の件については率直に書く。

技術的な理由は理解できる。推論を暗号化してAnthropicがキーを保持することには、モデル保護やビジネス上の合理性があるだろう。しかし、ユーザーがローカルに保存されたファイルを「自分のエージェントの推論ログ」と思って作業しているとき、その認識が間違っているとしたら、それはドキュメントが正面から説明すべき事実だ。

「要約を返す」という記述が存在するのに、それが埋もれてしまっているのはもったいない。Anthropicの技術力は本物で、AIエージェントの分野での先進性も疑っていない。だからこそ、仕様の透明性という点でももっと正面から向き合えるはずだ、と感じる。

AIエージェントが業務の意思決定に関与する場面が増えるほど、「エージェントが何を考えてその行動を取ったか」の説明責任は重要になる。今後のアップデートでこの点の透明性がさらに改善されることを期待している。

エンタープライズ導入を検討している場合や監査証跡が必要なユースケースでは、「ローカルのthinkingログ=完全な推論記録」という前提を見直すことが第一歩だ。


出典: この記事は The text in Claude Code’s “Extended Thinking” output の内容をもとに、筆者の見解を加えて独自に執筆したものです。