Claude Opus 4.5・GPT-5.5がCTFセキュリティ競技を「課金ゲー」に変えた——フロンティアAIがスコアボードを崩壊させた

世界CTFランキング（CTFTime）でトップ10に常連ランクインしていたセキュリティ研究者が、「CTFシーンはもう死んだ」と宣言した。Claude Opus 4.5やGPT-5.5といったフロンティアAIの登場により、セキュリティ競技のスコアボードが人間のスキルを測るものではなく、AIエージェントへの投資規模——つまりどれだけトークンを買えるか——を反映するものに変質してしまったという告発だ。

CTF（Capture The Flag）とは

CTFは、暗号解読・バイナリ解析・Webセキュリティ・フォレンジックなど多様なセキュリティ領域の問題を解き、「フラグ」と呼ばれる文字列を獲得して競うセキュリティ競技だ。世界最大のランキングサイト「CTFTime」には年間数百の大会が登録されており、学生から現役セキュリティ研究者まで幅広い層が参加している。日本でも就職・転職のポートフォリオとして機能しており、上位入賞者は即戦力として高く評価される文化がある。

記事の著者は2021年からCTFを開始し、オーストラリア最大のCTF「DownUnderCTF」でチームBlitzkriegとして複数回優勝。後に国際トップチーム「TheHackersCrew」に加入し、2025年末まで世界トップ10の常連として活躍してきた人物だ。単なる外野の批評ではなく、当事者の証言として重みがある。

GPT-4が「予兆」を示した

GPT-4の登場以降、中程度の難易度の問題であれば問題文を貼り付けるだけで解答が出てくる「ワンショット解答」が可能になった。ただし当初は、難問は解けず時間短縮効果も限定的で、競技バランスを大きく崩すほどではなかった。

著者が強調するのはAIツールの利用そのものは問題ではないという点だ。CTFプレイヤーはデバッガやスクリプトなど昔から様々なツールを活用してきた。問題の本質は、「モデルが推論し、解答を書き、人間には旗をコピペする以外にやることが残らない」状態になったことにある。

Claude Opus 4.5が転換点になった

著者が「ゲームが変わった」と指摘するのが、Claude Opus 4.5の登場だ。このモデル以降、中程度の難易度の問題はほぼすべて、一部のハード問題さえも、AIエージェントが自律的に解けるようになった。

決定打になったのがClaude Codeの存在だ。CLIとして提供されたClaude Codeにより、CTFdのAPI（競技プラットフォームのAPI）経由でClaude インスタンスを各問題に対して自動起動するオーケストレーターの構築が容易になった。「競技開始後1時間はシステムを走らせておき、残った問題だけ人間が取り組む」というアプローチが、現実的な勝利戦略になったのだ。

これにより、AIを使わないチームは「利便性を捨てている」のではなく、「遅い別のゲームをやっている」状態になった。スコアボードはセキュリティスキルに加えて、AIエージェントのオーケストレーション能力と最先端モデルへの投資意欲を反映するものに変わり始めた。

GPT-5.5が「止めを刺した」

さらにGPT-5.5・GPT-5.5 Proの登場が状況を決定的にした。GPT-5.5 Proは、HackTheBoxの最高難度カテゴリ「Insane」のヒープ・エクスプロイト問題（leakless heap pwn）をワンショットで解けることが確認されている。48時間のCTFでPro相当のモデルをInsane問題に対して投入すれば、イベント終了前にフラグを取れる可能性が十分あるという。

これはオープンCTFが事実上の課金ゲー（pay-to-win）になったことを意味する。より多くのトークンを投入できるチームが、より早くボードを制圧できる。その結果、世界トップ常連チームのCTFTimeでの出現が減り、選手のアクティビティも低下。何週間もかけて良問を作り込んだ出題者も、数分でAIエージェントに食い尽くされる現状に直面している。

日本のセキュリティ現場への影響

この状況は、日本のセキュリティ業界にとって複数の意味を持つ。

採用・評価指標として： これまでCTF上位入賞は即戦力の証明として機能していた。今後は「CTF成績」だけを採用基準にすることのリスクを認識する必要がある。AIを駆使した成績なのか、純粋なスキルを示す成績なのか、文脈の理解が重要になる。

防御側への警告として： CTFを「攻撃者の練習場」と捉えるなら、AIエージェントが既知の脆弱性を自動的に発見・悪用できる時代が来ていることは深刻な警告だ。従来の「既知攻撃パターンへの防御」だけでは不十分で、AIエージェントによる自律的な攻撃への備えが急務だ。

実践的なヒント：

自社のペネトレーションテストにAIエージェントを組み込む前に、倫理・法的枠組みを整備する
「AIが解けない問題の特性（新規性、文脈依存の直感、未公開の攻撃手法）」を理解することが、次世代のブルーチームに必要な視点
HackTheBox・picoCTFなど主要プラットフォームがAI利用ポリシーをどう変えるか動向を注視する

筆者の見解

CTFがここまで急速に変質してしまったことは、セキュリティ教育の観点からとてももったいないと感じる。洗練された問題を何週間もかけて作り込む文化、そこで育つ人材の質——これらはセキュリティ業界全体の財産だった。

ただし、これは「AIが悪い」という話ではない。AIエージェントがInsane難度の問題を自律的に解くという事実は、同じエージェントが実際の攻撃シナリオでも機能しうることを示している。これをCTFの問題として矮小化せず、実環境のセキュリティ設計にどう組み込むかを考える機会として捉えるべきだ。

スコアボードの形が変わっても、本物のスキルが活きる場所はなくならない。「AIエージェントを設計・制御し、AIが解けない問題を特定する能力」こそが次世代のセキュリティエキスパートに求められる資質になるだろう。競技の形が変わるのは技術進化の必然であり、新たなゲームのルールを早く見極めた人が次のフェーズでも先頭を走れると思っている。

出典: この記事は Frontier AI has broken the open CTF format の内容をもとに、筆者の見解を加えて独自に執筆したものです。

CTF（Capture The Flag）とは#

GPT-4が「予兆」を示した#

Claude Opus 4.5が転換点になった#

GPT-5.5が「止めを刺した」#

日本のセキュリティ現場への影響#

筆者の見解#