Anthropicが認めたClaude Code品質低下の真因——推論努力の誤設定とバグ2件が1ヶ月間複合、修正済みで使用制限もリセット

PC Watchの報道によると、Anthropicは2026年4月23日（現地時間）、過去1ヶ月にわたってClaude Codeの品質が低下していた問題について、原因と再発防止策を公式発表した。問題はバージョンv2.1.116で修正済みで、同社はすべての加入者に対して使用制限をリセットしている。

なぜこの問題が注目されるのか

Claude Codeはコーディングや自動化タスクへの本格活用を前提に使われることが多く、応答品質の一貫性はツールの信頼性に直結する。今回の問題はモデル自体の劣化ではなく、Claude CodeとAgent SDK層での設定変更・バグが複合して発生したという点が技術的に興味深い。ユーザー目線では「品質が不安定になった」という印象しか持てなかったものが、今回の発表で整理された。

品質低下の3つの原因

PC Watchの解説によると、モデル自体やAPIへの影響はなく、Claude CodeとAgent SDK層での以下3点が原因だった。

1. 推論努力をhigh→mediumに引き下げ（3月4日〜4月7日）

UIが長時間フリーズして見える問題を軽減するため、デフォルトの推論努力をhighからmediumに変更。Anthropicはこれを「誤ったトレードオフだった」と認め、4月7日に元に戻した。現在はOpus 4.7でxhigh、その他のモデルではhighがデフォルトとなっている。Sonnet 4.6とOpus 4.6が影響を受けた。

2. セッション再開時の思考削除バグ（3月26日〜4月10日）

セッション再開時の遅延軽減を目的として、1時間アイドル状態のセッションから古い思考を削除する変更が導入された。しかしバグにより、この処理がセッション終了まで毎ターン繰り返される状態になり、「物忘れがひどく、繰り返しや不適切なツール選択が増えた」という症状が現れた。4月10日に修正済み。

3. システムプロンプト変更による品質低下（4月16日〜4月20日）

冗長性を減らすためのシステムプロンプト変更が、他の変更と組み合わさってコーディング品質を低下させた。4月20日に変更を復元している。Sonnet 4.6/Opus 4.6/Opus 4.7に影響があった。

これらの変更が異なる期間に行われ、異なるトラフィックに影響を与えたため、ユーザーからは「一貫性のない劣化」として認識されていたという。

再発防止策

Anthropicはすでに以下の対策を実施済みとしている。

プロンプト変更を容易にレビュー・監査できる新ツールの構築
CLAUDE.mdへのガイダンス追加（モデル固有の変更が対象モデルのみに適用されるよう）

今後の計画として、社内スタッフが公開ビルドを実際に使用する体制への移行、コードレビューツールの改良と一般提供、変更ごとのモデル別評価スイート実行、知能とのトレードオフが生じる変更へのソーク期間設定と段階的ロールアウトが予定されている。

日本市場での注目点

Claude Codeは個人・法人向けに有料サブスクリプションとして提供されており、今回の問題は日本のユーザーも含む全加入者に影響していた。使用制限のリセットもグローバルで実施済みで、v2.1.116以降で修正が完了している。利用中のユーザーは最新バージョンへの更新状況を確認することを勧める。

AgentSDK上で動作するCoworkにも影響があったとされており、AIエージェントをワークフローに組み込んでいる法人ユーザーは、この期間中の出力品質を改めて振り返っておく価値があるかもしれない。

筆者の見解

今回の件でまず評価したいのは、「何が」「いつから」「なぜ」起きたかを具体的なタイムラインと技術詳細とともに公開したAnthropicの透明性だ。推論努力の引き下げを「誤ったトレードオフだった」とはっきり認める姿勢は、企業として誠実な対応だと思う。

一方で、3つの変更が重なって「一貫性のない劣化」として現れたという経緯は、変更管理プロセスに課題があったことを示している。個々の変更意図はいずれも合理的だっただけに、複合影響の見落としはもったいない。

特に2件目の「毎ターン思考が消えるバグ」は、単純な回答品質の低下とは異なり、タスクの継続性そのものに影響するため、エージェントとして本格的に業務へ組み込んでいる場合には検知が難しい類の問題だ。再発防止策としてアブレーション実施と段階的ロールアウトを明示した点は評価できる。今後の安定性で、この教訓が変更管理の仕組みとして定着するかどうかを判断したい。

出典: この記事は Claude Code品質低下1カ月、原因はバグと設定変更の内容をもとに、筆者の見解を加えて独自に執筆したものです。

なぜこの問題が注目されるのか#

品質低下の3つの原因#

1. 推論努力をhigh→mediumに引き下げ（3月4日〜4月7日）#

2. セッション再開時の思考削除バグ（3月26日〜4月10日）#

3. システムプロンプト変更による品質低下（4月16日〜4月20日）#

再発防止策#

日本市場での注目点#

筆者の見解#