Claude Opus 4.7のリリースにともない、Anthropicは新しいトークナイザーを導入した。公式移行ガイドには「おおよそ1.0〜1.35倍のトークン数」と記載されているが、実際にAPIで計測したところ、英語技術文書では1.47倍、Claude Codeユーザーが日常的に送信するCLAUDE.mdファイルでは1.45倍という結果が出た。上限ではなく、それを超えた数字だ。

同じ料金体系のまま、トークン消費が増える。これが実務にどう響くのかを整理しておきたい。

実測データが示すもの

計測に使われたのはAnthropicが提供する無料のトークンカウントAPI(POST /v1/messages/count_tokens)。同じコンテンツをOpus 4.6と4.7に投げて差分を見るシンプルな手法で、推論コストはかからない。

コンテンツ種別ごとの実測比率(4.7 / 4.6)は以下のとおり。

コンテンツ種別 比率

英語技術文書 1.47x

シェルスクリプト 1.39x

TypeScriptコード 1.36x

Markdownコードブロック混じり 1.34x

Pythonコード 1.29x

英語散文 1.20x

一方で、日本語・中国語テキストは1.01倍とほぼ変化なし。CJK文字やJSON、CSVなどの構造データも影響が小さい(1.01〜1.13倍)。

なぜ英語・コードだけが膨らむのか

トークナイザーはByte-Pair Encoding(BPE)という手法を使っており、「頻繁に出現する文字の組み合わせをひとつのトークンとして学習する」仕組みだ。4.7ではこのマージが英語やコードに対してより細粒度になった——つまり、以前は1トークンで表現していた単語やキーワードが複数トークンに分解されるようになっている。

英語1文字あたりのトークン効率は4.6の「4.33文字/トークン」から4.7では「3.60文字/トークン」に低下。TypeScriptに至っては3.66→2.69と大幅な悪化だ。

CJKはそもそも1文字が1〜2トークン相当の表現を取ることが多く、BPEのマージ効率の変動を受けにくい。これが非対称性の構造的な理由と考えられる。

実務への影響

Claude Codeユーザーへ

Claude Codeのプロンプトには英語のコードやMarkdown、設定ファイルが大量に含まれる。実測で7種のリアルファイルの加重平均は1.325倍。Maxプランの利用枠が同じなら、実質的な処理量は約25%減ると考えてよい。コンテキストウィンドウの消費ペースも速くなる。

具体的には、

  • 長いシステムプロンプトやCLAUDE.mdを使っている場合、キャッシュプレフィックスのコストが上昇
  • レートリミットに到達するタイミングが早まる
  • 1回のセッションで扱えるコンテキスト量が減る

日本語中心のワークロードは影響軽微

日本語のドキュメント作成、日本語コメント付きコード、日本語プロンプトを主に使う場合は、比率がほぼ1.0のため実質的な変化はない。これは日本のユーザーにとって重要な朗報だ。

APIを直接使うエンジニアへ

count_tokens エンドポイントは無料で使えるため、既存のプロンプトをOpus 4.7で事前計測しておくことを強く勧める。想定より早くコスト上限に達するケースが出てくる可能性がある。

なぜAnthropic はトークン数を増やしたのか

公式の説明では「より細粒度のトークン表現により、モデルの推論精度が向上する」とされている。細かく分割したほうが複雑なパターンを学習しやすいという設計上の判断だ。

ただし、今回の計測はあくまで「コストの変化」を示すものであり、「性能向上が本当にコスト増に見合うか」については別途検証が必要だ。

筆者の見解

正直に言えば、トークナイザーの変更は地味に見えて実は大きな話だ。ユーザーが意識しないところで消費量が増え、体感として「なんか遅くなった」「上限に当たりやすくなった」という形で現れる。これは透明性の問題でもある。

一点、データとして非常に興味深いのが日本語・中国語がほぼ影響を受けていないという事実だ。英語・コード中心のユーザーと、日本語・アジア系言語中心のユーザーとで、実質的なコスト構造が違うモデルになっている。日本のエンジニアは「日本語で書けば節約できる」という逆説的なインセンティブを得たとも言える。

とはいえ、実務では英語コードベースを扱う場面が多い。その前提で考えると、プロンプト設計のスリム化——不要なコンテキストを削る、キャッシュを適切に活用する——が以前より重要になってくる。これは良い設計習慣の後押しとも取れるし、余計な負担とも取れる。どちらに転ぶかは、使い方次第だ。

今後のモデルアップデートのたびにトークナイザーが変わるなら、コスト見積もりの前提を毎回見直す必要が生じる。この種の実計測を習慣化しておくことが、APIを本番利用するチームには不可欠になっていくだろう。


出典: この記事は Claude Opus 4.7 costs 20–30% more per session の内容をもとに、筆者の見解を加えて独自に執筆したものです。