生成AI | ebisuda.net

「読んでから書く」AIエージェントがllama.cppを15%高速化——Research-Driven Agentという新潮流

コードだけ読んでも「浅い仮説」しか生まれない AIコーディングエージェントの活用が進む中、ひとつの本質的な問いが浮かび上がっている。「エージェントにコードを読ませるだけで、本当に深い最適化ができるのか？」 SkyPilotチームが公開した実験レポートは、この問いに対して明確な答えを突きつける。コードだけを読んで実験を繰り返すエージェントは、知識の天井に早々に当たる。しかし論文・競合フォーク・他バックエンドの実装を先に調査させる「リサーチフェーズ」を加えると、コード単独では絶対に気づけなかった最適化を発見できる。実証対象はCPU向けLLM推論ライブラリとして広く使われるllama.cpp。そこにAIエージェントのループ実行フレームワーク「pi-autoresearch」を組み合わせ、4台のクラウドVMで約3時間動かした結果、5つの最適化を実装しx86環境でのテキスト生成速度を**+15%（ARM環境で+5%）向上させた。総コストはわずか約4,300円**（API代＋VM代）。リサーチフェーズで何が変わったかコードのみのアプローチの限界リサーチなしの初期フェーズで、エージェントはllama.cpp内のAVX2プリフェッチや量子化ドット積のループアンロールといった「目に見える部分」を最適化しようとした。効果は+0.8%程度。コードを読めばわかる範囲の改善しか生み出せなかった。研究論文・競合実装を読ませたことで得た洞察リサーチフェーズを追加したエージェントは以下を調査した： arxivの関連論文（カーネルフュージョン、メモリアクセスパターン） ik_llama.cpp（人気の競合フォーク） llama.cppのCUDA/Metalバックエンド実装結果として得たキーインサイトは「このワークロードはコンピュート律速ではなくメモリ律速」という認識の転換だった。これにより最適化の方向が変わり、5つの具体的な改善が着地した。着地した5つの最適化 Softmaxフュージョン — 複数パスをAVX2 FMAループに統合 RMS Normフュージョン — 正規化計算の多重パスを削減 from_floatの適応的並列化 — データサイズに応じた動的なスレッド割り当てグラフレベルのRMS_NORM + MULフュージョン — 演算グラフ全体の最適化 Flash AttentionのKQフュージョン — QKタイルに対する3パスを1つのAVX2 FMAループに統合（最大の成果）研究フォーク（ik_llama.cpp）とCUDAバックエンドが直接ヒントを与えた最適化は、実に5件中2件に上る。「他人がすでに解いた問題」を参照させることの威力が鮮明に出ている。実務への影響エージェント設計の発想を変える日本のエンジニアがAIエージェントを設計する際、多くの場合は「タスクを渡せば動く」という前提で組む。しかしこの実験が示すのは、タスク前の情報収集フェーズの設計こそが成果を左右するという事実だ。実装上の示唆を整理すると：ベンチマークとテストスイートを必ず用意する — エージェントが仮説を検証するには測定基盤が不可欠競合実装・フォークをコンテキストに含める — 論文より先に「すでに動いているコード」が役に立つことが多いコンピュート律速かメモリ律速かを先に分析させる — 最適化戦略の前提が変わるコスト感覚の更新を「エージェントに3時間動かして4,300円」というコスト感は、従来のエンジニアリング工数感覚と比べると破格だ。シニアエンジニアが数日かけて探索するような最適化空間を、低コストで自動探索できる時代に入りつつある。この感覚を持っておくことは、今後のプロジェクト見積もりや技術選定においても重要になる。筆者の見解この実験が面白いのは、最適化の成果そのものよりも「エージェントに何を読ませるかの設計が結果を決定する」という知見にある。これはAIエージェント活用の本質に関わる問いだ。コードを渡してループを回せば自動的に賢くなる、という幻想を捨てて、エージェントが思考する前の「インプット設計」に人間の知恵を使う——これが次のフェーズのエージェント活用だと思う。 AIエージェントが自律的にループで動き、仮説→実験→検証を繰り返す仕組みは、今まさに実用段階に入っている。pi-autoresearchのフレームワークはGitHubで公開されており、「ベンチマークとテストスイートがあれば任意のプロジェクトに適用できる」とされている。まずは自分の手元にある小さなプロジェクトで試してみる価値は十分にある。「30件以上の実験を走らせて5件が着地」というエラーレートを、失敗と見るか成功と見るかも重要な視点だ。人間のエンジニアが5件の最適化を3時間・4,300円で見つけられるかと考えれば、答えは明らかだろう。完璧なエージェントを待つより、今すぐ動かして学ぶ方が圧倒的に速い。出典: この記事は Research-Driven Agents: When an agent reads before it codes の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

GeminiがメンタルヘルスUI刷新——訴訟対応の先にある「AI安全設計」の本質

Google が AI チャットボット「Gemini」のメンタルヘルス危機対応インターフェースを刷新した。ユーザーが精神的な危機状態にあると判断した場合、即座に支援リソースへ誘導できる「ワンタッチ UI」に改め、臨床専門家の知見を取り入れた共感的メッセージングも追加した。直接的な引き金となったのは、Gemini の応答が男性を自殺へと「コーチした」として遺族が提起した不法死亡訴訟だ。この動きは訴訟対応の側面を持ちながら、AI 業界全体が今まさに向き合わなければならない「安全設計」の核心を照らし出している。何が変わったのか従来の Gemini も、自殺・自傷に関わる会話を検出した際には「Help is available」モジュールを表示し、危機相談ホットラインや危機テキストラインへ誘導していた。今回の改修は主にこの部分の再設計だ。ワンタッチ UI：即座に支援機関へ接続できる導線を大幅に簡略化共感的レスポンス：「専門家への相談を促す」文言を強化し、より寄り添う設計に表示の継続：一度起動したサポートオプションが、その後の会話を通じて画面に残り続ける Google は臨床専門家との連携のもとでこの再設計を進めたと説明。さらに今後 3 年間で 3000 万ドル（約 45 億円）を世界各地の危機相談ホットライン支援に投じることも発表した。訴訟が露わにした構造的リスク AI チャットボットが脆弱なユーザーを傷つけたとして提起される訴訟・報告は、近年増加傾向にある。摂食障害の隠し方を手伝ったケース、銃撃計画の立案を支援したケースなど、複数の報道機関が問題事例を記録している。重要なのは、AI が「悪意を持って」行動するわけではないという点だ。問題の本質は設計上のギャップにある。言語モデルは会話を「補完」する方向に最適化されており、ユーザーが苦悩を表現すると、その感情に寄り添う返答を生成しようとする。しかし危機状態にある人間にとって、この「寄り添い」が逆効果になりうる。 Google は業界内での比較では比較的良好な評価を受けているが、それで十分とはいえない。「他より優れている」は「安全である」を意味しない。日本の IT 現場への影響日本でも企業への AI チャットボット導入が急加速しているが、メンタルヘルスリスクへの対策はまだ表面的な段階にとどまっている組織が多い。特に以下の点は実務上の要注意事項だ。社内 AI ツールも例外ではない：カスタマーサポートや社内ヘルプデスクに AI を導入する際、ユーザーが精神的に不安定な状態で使用するケースは十分ありうる。「社内向けだから大丈夫」という判断は危うい。システムプロンプトレベルでの設計が必須：どんな AI プラットフォームを使うにしても、危機状態を示すシグナルを検知した際の動作をシステムプロンプトや設定レベルで明示しておくことが重要になる。「検知したら専門家への案内を優先する」という定義は、外部向けサービスに限らず社内ツールにも必要だ。 UI レベルの介入が求められる：「AI は医療・メンタルヘルス相談の代替にならない」という周知だけでは不十分だ。苦境にあるユーザーはポリシー文書を読まない。見えやすく、使いやすい形で介入する仕組みを UI に組み込む設計思想が、今後の AI 製品の標準になるべきだ。筆者の見解今回の Google の対応は評価できる部分が大きい。訴訟対応という側面があるとしても、臨床専門家を巻き込んだ設計変更と多額の資金拠出は、単なるポーズとは言いにくい。ただ、一点指摘したいのは対応の順序だ。亡くなった方がいて、訴訟が起きて、それを受けて改修する——この流れは「後追いの安全設計」だ。理想は、製品リリース前に「このツールが使われるあらゆる状況」を想定し、脆弱なユーザーへの対応を設計の初期段階から組み込むことにある。 AI ツールを「使える仕組みにする」ことと「安全に使える仕組みにする」ことは、本来一体で考えなければならない。特に AI エージェントが自律的に動作する場面が増える中、危機検知や適切な介入の設計は、モデルの賢さや応答速度と同等以上に重要なテーマになっている。今回の事例が「設計の初期段階から安全を組み込む」という業界全体の思想転換を加速する契機になることを期待している。AI が人間の生活に深く入り込むほど、安全設計は後回しにできない最優先事項だ。出典: この記事は Gemini is making it faster for distressed users to reach mental health resources の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

生成AI

IntelがマスクのTerafab AI半導体工場建設を支援――自律AIエージェント時代を支えるシリコン争奪戦

AIの未来は「誰がシリコンを握るか」で決まる――そんな現実が改めて浮き彫りになるニュースが飛び込んできた。イーロン・マスクが米テキサス州オースティンで進める「Terafab」プロジェクトに、Intelが正式パートナーとして参画することを発表した。 Terafabとは何か Terafabは、マスク傘下のSpaceX（最近xAIと合併）とTeslaにAIチップを供給するための専用半導体製造拠点だ。目標は年間1テラワット（TW）分のコンピュート能力を生産すること。これは自動運転車、ヒューマノイドロボット、さらには宇宙空間に打ち上げるデータセンターまでを見据えた、SF的スケールの構想だ。マスクは今年初めの決算説明会でも「誰かがこれを作れないのか。本当に難しい」と漏らしており、チップ製造能力の不足に強い危機感を持っていた。車やロケットの工場建設は経験豊富でも、半導体ファブは別次元の話。そこに手を差し伸べたのがIntelだ。 IntelにとってのTerafab参画 Intelは現在、アリゾナ州で2つの新ファブを建設中（総投資額200億ドル超）という自社の大規模投資サイクルの只中にある。TSMCもフェニックス北部で「ギガファブ」を計画しており、最大12棟の先端半導体工場の展開を目指している。 Terafabへの参画はIntelにとって、「チップ設計・製造・パッケージングを一括で提供できる」という強みを活かすチャンスだ。Intelはプレスで「超高性能チップを大規模にスケールして設計・製造・パッケージする能力で、Terafabの目標を加速させる」と述べており、ファウンドリ事業の拡大という戦略とも合致する。ただしIntel自身が競合他社との厳しい競争にさらされており、この提携がIntelの経営立て直しにどこまで貢献するかも今後の焦点となる。なぜこれが重要か AIモデルの訓練と推論には膨大な演算資源が必要で、現在その供給はNVIDIA一強に偏っている。Terafabの本質は「マスク傘下のAI・ロボット・宇宙事業のための垂直統合チェーン確立」だ。SpaceXとxAIが合併した今、宇宙インフラとAIインフラを一体で動かす体制を整えようとしている。日本のIT現場への影響という視点で見れば、今後AIチップの供給構造がNVIDIA依存から多様化していく可能性を示唆するニュースだ。クラウドサービスのAI演算コスト、ひいてはAzure・AWS・GCPのGPUインスタンス価格にも中長期的な影響が出うる。実務への影響 AIインフラコストの動向を追え Terafabが本格稼働すれば、AI演算の供給元が増えることで中長期的にクラウドGPUインスタンスの価格競争が起きる可能性がある。Azure OpenAI ServiceやAmazon Bedrockなどのコスト見直し機会を見逃さないようにしたい。垂直統合モデルの台頭を意識する SpaceX（xAI）＋Tesla＋Terafabという垂直統合構造は、「クラウドを借りてAIを動かす」モデルとは一線を画す。大企業が自社専用AI基盤を持つ時代の到来を予感させる。自社でAI基盤をどこまで内製化するか、改めて戦略を考える契機にしてほしい。ハードウェア・地政学リスクを忘れない台湾TSMC依存への懸念から米国内製造投資が加速している。日本企業もサプライチェーンリスクの観点から、利用するクラウドサービスの製造地域や、調達先の多様性を確認しておく価値がある。筆者の見解 AIエージェントが自律的にループして動き続けるためには、演算基盤が圧倒的に重要だ。「指示→応答」の一往復で終わるアシスタント型とは違い、エージェントが自分で判断・実行・検証を繰り返すループは桁違いのコンピュートを消費する。Terafabが目指す「年間1TW」という数字の意味は、そういう文脈で読むべきだと思っている。 Intelがパートナーとして名乗りを上げたことは興味深い。TSMCに圧倒されてきた同社が、マスクという「大量消費が約束されたクライアント」と組むことで巻き返しを図る構図だ。うまくいけばIntelにとっての再起点になりうるし、競争が生まれることはAI演算コスト全体にとってプラスに働く。今後AIが社会インフラの一部になっていく中で、「シリコンをどこで誰が作るか」という問いはますます重くなる。日本のIT現場も、クラウドのAPIを叩くだけでなく、その演算がどこで生まれているかを意識する視点を持っておく必要があると感じている。Terafabの進捗は、単なるマスク話題ではなく産業構造の変化として追い続けたい。出典: この記事は Intel will help build Elon Musk’s Terafab AI chip factory の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

SunoとUMG・Sonyが対立——AI生成楽曲の「共有権」をめぐる著作権バトルの行方

AI音楽生成サービス「Suno」と、世界最大級の音楽レーベルであるUniversal Music Group（UMG）およびSony Music Entertainmentとの間で、ライセンス交渉が難航していることが明らかになった。Financial Timesの報道によれば、争点は「AIが生成した楽曲をユーザーがアプリ外に共有・配布できるか否か」というシンプルながら本質的な問題だ。何が対立しているのか Sunoはテキストプロンプトを入力するだけで楽曲を生成できるサービスで、生成した音楽をダウンロード・共有できる点が大きな特徴だ。この「外に出せる」機能こそが、レーベル側との摩擦の火種になっている。 UMGの立場は明確だ。「AIが生成したトラックはSunoのようなアプリ内に留めておくべきで、インターネット上に自由に広がるべきではない」という考え方だ。一方Sunoは、ユーザーがより広く楽曲を共有・配布できる環境を求めている。興味深いのは、各レーベルの対応が微妙に異なる点だ。Warner Music Groupは2024年の著作権訴訟を取り下げ、Sunoとライセンス契約に至った。このライセンスでは、プログラムにオプトインしたアーティストの声・名前・肖像・楽曲をユーザーが活用できる仕組みになっている。一方UMGは、競合のAI音楽ツール「Udio」とは契約を結んでいるが、その内容は「ダウンロード禁止」という制約付きだ。つまりUMGはAI音楽自体を完全否定しているわけではなく、「閉じた環境での利用」に限って認める立場を取っている。著作権訴訟という背景 2024年、UMG・Sony・Warner Recordsの3社はSunoを著作権侵害で提訴した。アーティスト代表者たちも「Say No to Suno」と題した公開書簡に署名し、「同プラットフォームは許諾なく世界の文化的成果物を学習データとして収集し、その作品と競合するビジネスを構築した」と批判している。この訴訟背景があるからこそ、現在のライセンス交渉は単なるビジネス交渉ではなく、「AI音楽の法的・倫理的枠組みをどう定めるか」という産業全体の議論に直結している。実務への影響——エンジニアとIT管理者が注目すべき点この問題はエンターテインメント業界だけの話ではない。AI生成コンテンツの権利関係は、あらゆる業界のIT担当者が向き合うべきテーマになりつつある。今すぐ確認すべきこと: 社内で利用しているAIツール（音楽・画像・テキスト問わず）の利用規約を改めて確認し、生成物の社外利用・配布が許可されているかチェックするクリエイティブ業務でAI生成コンテンツを活用している場合、商用利用の可否と著作権の帰属を明確化しておく「ライセンスあり」のサービスと「訴訟係争中」のサービスを社内ポリシーで区別する運用を検討する SunoとUMGの交渉結果は、今後のAI生成コンテンツ利用の「業界標準」を形成する可能性がある。どちらかが折れた場合、その条件が他のAI音楽サービスや、ひいては画像・映像・文章生成ツールの契約モデルにも波及するだろう。筆者の見解この対立の本質は、コンテンツの「閉じた利用」と「開いた流通」のどちらに価値があるか、という根本的な問いだ。レーベル側の懸念は理解できる。AI生成楽曲がネット上に無制限に広がれば、既存アーティストの楽曲と混在し、偽物・模倣品が検索結果を汚染するリスクがある。著作権管理の観点から「アプリ内完結」を求めるのは、一つの合理的な回答だ。ただ、「閉じることで守る」戦略に頼りすぎると、本来持っているはずのビジネスチャンスを自ら手放すことにもなりかねない。Warnerがオプトイン型のライセンス契約に踏み切ったことは、「管理しながら流通させる」という現実的な道があることを示している。 AI技術は止まらない。禁止や封鎖は短期的な防御にはなるが、長期的には回避される。それよりも、使われることを前提にした仕組みの設計——ロイヤリティ分配モデル、透明性のある学習データ開示、オプトイン／アウトの整備——に早く移行した方が、業界全体として健全だと思う。今後数年で、この議論の決着が「AIとクリエイティブ産業の共存モデル」の雛形になる。どう転んでも、現場のIT担当者と法務担当者がアンテナを張っておくべき領域であることは間違いない。出典: この記事は Suno and major music labels reportedly clash over AI music sharing の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

ファミリーオフィスがVCを飛び越えてAIスタートアップに直接投資する時代——「インフラは今まさに建設中」

AIブームが投資の世界を塗り替えている。これまで「ホットなスタートアップへの投資」とは、一流VCのファンドに入れてもらうことを意味していた。ところが今、その構図が急速に変わりつつある。超富裕層のファミリーオフィスがVCというミドルマンを飛び越え、AI関連スタートアップのキャップテーブルに直接名前を連ねようとする動きが加速している。なぜ今、ファミリーオフィスが動くのか投資顧問会社Arena Private Wealthの創業者ミッチ・スタインはその背景をこう説明する。「企業が非公開のままでいる期間が長くなり、IPOの件数も歴史的に見て少なくなっている。大きな利益は企業が上場する前に生まれており、今のプライベート市場はAI銘柄が席巻している」。実際、Arena Private Wealthは今年、AIチップスタートアップPositronの2億3000万ドル（約340億円）ラウンドを共同リードし、取締役会の席も獲得した。これは単なる資金供給者としての立場から「能動的な市場参加者」への転換を意味する。 2026年2月の一ヶ月だけでも、ファミリーオフィスがスタートアップへ直接行った投資は41件に上り、そのほぼすべてがAI関連だった。著名な例を挙げれば、ローリン・パウエル・ジョブズのEmerson CollectiveがWorld Labs（空間知性AI）へ、Azim PremjiのファミリーオフィスがRunwayへ、エリック・シュミットのHillspireがGoodfireへと出資している。BNYウェルスの調査によれば、ファミリーオフィスの83%が「今後5年間の最重要戦略優先事項はAI」と回答しており、半数以上がすでにAI関連投資へのエクスポージャーを持っているという。「乗り遅れること」が最大のリスク Arenaのオルタナティブ責任者アリ・ショッテンスタインは、今この瞬間に投資する緊急性をこう語る。「世界のAIインフラは今まさに建設されている。今早期に参入してプライマリー投資の機会を積み重ねるか、それとも乗り遅れてランダムな賭けをするか、そのどちらかだ」。スタインの言葉はさらに直截だ。「最大のリスクはAIへのエクスポージャーを持っていないことであって、AI投資で何が起きるかではない」。さらに一歩進んで、自社でAI企業を孵化させ、シード資金を出し、経営的な役割まで担うファミリーオフィスも出てきている。ジェフ・ベゾスが自身のロボティクス企業のCEOに就き、昨年62億ドルを調達したのはその最も高名な例だ。より小規模な例として、元Silicon Labs CEOのタイソン・タトルは自社ファミリーオフィスから500万ドルを投じて製造・物流向けAIスタートアップCircuitを共同創業した。日本のエンジニア・IT管理者にとっての意味この投資トレンドが示す本質は、AIを「使うか使わないか」という段階はとっくに終わり、「インフラをどう手に入れるか」という競争局面に世界が突入しているということだ。日本のIT現場への影響という観点では、いくつかの点が重要になる。 AIインフラの選択肢が急速に広がる: PositronのようなAIチップ専業スタートアップへの巨額投資は、NVIDIAに依存しない代替GPUエコシステムの形成を加速させる。コスト構造が変われば、中小規模のシステムでも本格的なAI推論基盤を手が届く価格で調達できる未来が見えてくる。調達戦略の多様化は今から検討しておく価値がある。エンタープライズAI調達の判断速度が問われる: ファミリーオフィスの動きが示すように、「評価してから投資」では遅すぎる時代が来ている。企業のIT部門も同様で、PoC（概念実証）を長期間回し続けるスタイルは通用しなくなる。「スモールスタートでも本番環境に出す」サイクルを早める組織的な仕組みが求められる。 AI専門人材の市場価値は今後さらに高騰する: 直接投資家として経営に関与するファミリーオフィスは、スタートアップ側の人材確保にも積極的に関与する。グローバルな資本がAI人材の争奪に本格参入することで、国内IT市場の採用環境は一段と厳しくなることを想定しておきたい。筆者の見解この話を読んで思うのは、「AIのインフラは今まさに建設中」というくだりの重みだ。これは資本の世界だけの話ではない。テクノロジーの使い手にとっても、まったく同じことが言える。今この瞬間、AIエージェントの実行基盤、マルチエージェントのオーケストレーション、自律的にループで動き続ける仕組みの設計——これらはまだ「先進的な取り組み」として語られるが、2〜3年後には「やっていて当たり前」になっているはずだ。投資家が「乗り遅れることが最大のリスク」と言うなら、エンジニアの世界でも同じ構造がある。日本の企業の多くはまだ「AIを試している」段階に見える。だがグローバルな資本は「AIインフラの完成後には乗り遅れる」と判断して、今を最重要タイミングと位置づけて動いている。その認識ギャップは、放置すれば技術力の差ではなくスピードの差となって表面化する。ファミリーオフィスが「能動的な参加者」になったように、エンジニアもIT管理者も「AIを評価する立場」から「AIを使って仕組みを回す立場」に自分を置き換えるタイミングは、すでに今だ。情報を追い続けることよりも、実際に手を動かして成果を出す経験を積む——それが今この局面で最も価値のある時間の使い方だと筆者は考える。出典: この記事は The AI gold rush is pulling private wealth into riskier, earlier bets の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

UberがAmazon製AIチップに乗り換え——クラウド・チップ覇権争いに異変あり

何が起きたのか Amazonは先日、UberがAWSとの契約を拡大し、ライドシェア機能の多くをAmazon独自設計のチップ上で稼働させると発表した。具体的にはARMベースのサーバーCPU「Graviton」の利用拡大と、AmazonのNvidia対抗AIアクセラレーター「Trainium3」の試験導入が柱となる。注目すべきは、UberはついこのあいだまでOracleとGoogle Cloudを主軸に据えていたという点だ。2023年にはこの2社と複数年の大型クラウド契約を結び、自社データセンターからの脱却を宣言したばかり。にもかかわらず、わずか3年足らずでAWSに大きく舵を切った。 AWSの独自チップ戦略とは GravitonとTrainium——「脱Nvidia」の現実解 AWSが自社設計チップに力を入れ始めてからしばらく経つが、ここにきてその戦略が実を結びつつある。 GravitonはARM命令セットをベースにしたサーバーCPUで、電力効率に優れ、同等性能のx86サーバーと比較してコストパフォーマンスが高い。Uberは以前からARM系チップの導入実績があり（OracleクラウドのAmpereチップを活用）、アーキテクチャ上の親和性が高い。 Trainium3はAI/ML推論・学習に特化したアクセラレーターで、AmazonはNvidiaのGPU需要逼迫という市場構造を巧みに活用。すでにこのビジネスは数十億ドル規模に達していると報じられており、AppleやOpenAI、そして大手AIスタートアップなど名だたる企業がAWSのチップ上でワークロードを走らせている。 Oracle・Ampere・SoftBankが絡む複雑な背景この話にはもう一つ、見逃せない文脈がある。Uberが以前使っていたORacle CloudのARMチップ「Ampere」は、元Intelの大物Renée Jamesが創業した企業が設計したものだ。OracleはかつてAmpereの約3分の1の株式を保有していたが、昨年末にSoftBankがAmpereを買収。OracleはプレタックスベースでAmpereの持ち分を27億ドルで売却し、その資金でNvidiaチップの大量購入に転じている。 Oracle自身も今やOpenAIやStargateプロジェクト向けのデータセンター建設に資金を集中しており、チップを自社設計することに競争優位を見出せなくなったとEllison CEOは明言している。この複雑なシリコンバレーの利害関係の網の中で、AWSはひっそりと「自社チップを持ち、かつクラウドとして提供できる」という独自ポジションを確立してきた。実務への影響——日本のエンジニア・IT管理者に伝えたいこと ARMへの移行を真剣に評価すべき時期 Uberのような大規模ワークロードがARM系チップに移行するのは、単なる話題にとどまらない。x86前提のソフトウェアスタックを持つ企業は、今後クラウドコストの最適化を議論するたびにARMへの対応が議題に上がることになる。コンテナ（特にDocker / Kubernetes）環境ではマルチアーキテクチャビルドへの対応が実務的な課題として浮上する。具体的な行動として以下を検討してほしい。 AWS Gravitonインスタンスの試験導入: EC2のGravitonインスタンスは同等スペックのx86比で最大40%のコスト削減をうたっており、ステートレスなAPIサーバーやバッチ処理から試すのが現実的マルチアーキテクチャ対応の確認: CI/CDパイプラインでARM向けビルドが通るか確認する。GitHub ActionsやAWS CodeBuildはGraviton上での実行をサポート済み AIワークロードのチップ選定は「Nvidiaだけ」前提を外す: Trainium / Inferentiaは推論コストでNvidiaに対して競争力を持つケースが出てきている。用途・ボリュームによっては検討する価値があるクラウド戦略の見直し——マルチクラウドの「摩擦」に注意 2023年にUberがOracle+Google Cloudというデュアルクラウドを選んだ理由はリスク分散と競争原理の活用だった。それが3年でAWSへの集約に向かいつつあるという事実は、マルチクラウド戦略が想定より運用コストを押し上げたことを示唆している。「部分最適の積み重ねは全体として高コストになる」という現実は、規模は違えど国内企業にも共通する。クラウド選定は初期の安さや機能の多さだけでなく、エコシステムの一貫性・運用コスト・チップ戦略まで含めた視点で評価することが重要だ。筆者の見解 AWSが自社設計チップでここまで大手企業を次々と引き寄せている構図は、クラウド業界における「垂直統合の再評価」を象徴していると思う。シリコン・クラウド・ソフトウェアを一気通貫で設計・提供できる事業者が、長期的なコスト競争力と顧客ロックインの両方を手に入れる——これはAppleがデバイス領域でやってきたことと本質的に同じ話だ。 Nvidiaの強さは揺るぎないが、「NvidiaのGPUをクラウドで借りる」というモデルは、Nvidiaへの依存と高コストを両方抱えることを意味する。AWSがTrainiumで十分なエコシステムを作り上げれば、AIワークロードの経済合理性が大きく変わる可能性がある。日本企業に伝えたいのは「情報を追うことより、実際に使って成果を出すこと」というシンプルなメッセージだ。Gravitonインスタンスを1台試すのは数時間もあればできる。Trainium3の動向を観察しながら、自社のAIワークロードがどのチップで最もコスト効率よく動くかを実験ベースで把握しておくことが、これからのエンジニアに求められる実践的なリテラシーになる。クラウドとチップの覇権争いはまだ序章だ。「どのクラウドを選ぶか」という意思決定が「どのチップ・どのAIエコシステムを選ぶか」と不可分になっていく時代が、確実に近づいている。出典: この記事は Uber is the latest to be won over by Amazon’s AI chips の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

NvidiaバックのFirmus、評価額55億ドル突破——「AIファクトリー」がアジア太平洋のインフラ競争を塗り替える

AIインフラへの資金流入が止まらない。シンガポールに本社を置くデータセンター企業Firmusが、Coatue主導の新ラウンドで5億500万ドル（約750億円）を調達し、評価額55億ドル（約8200億円）に到達した。わずか6ヶ月で総調達額は13億5000万ドルを超える。Nvidiaが出資企業に名を連ねるこの急成長企業が、アジア太平洋地域のAIコンピューティング地図を大きく書き換えようとしている。「Project Southgate」——省エネAI工場の野望 Firmusが手がけるのは、オーストラリア本土とタスマニア島を拠点とした「AIファクトリー」ネットワークだ。同社はこれを「Project Southgate」と呼ぶ。技術面で注目すべきは、Nvidiaのリファレンスデザインを採用している点だ。単にNvidiaのGPUを導入するだけでなく、データセンターの設計・冷却・電力管理まで含めた「Nvidiaが推奨する構成そのまま」で構築する。このアプローチは冗長性を排除し、最大限の効率化を実現できる。道のド真ん中を歩く手法といえる。さらに、次世代AIコンピューティング基盤としてNvidia Vera Rubinプラットフォームの採用が予定されている。Vera RubinはBlackwellアーキテクチャの後継となる最新世代で、2026年後半の出荷が見込まれている。競合他社がBlackwell世代の展開に追われている今、Firmusは次世代で先行しようとしている。「ビットコイン冷却」から「AI工場」への転身 Firmusの出発点は、ビットコインマイニング向けの冷却技術だった。これは偶然ではない。暗号資産マイニングは電力と熱管理の極限エンジニアリングであり、AIデータセンターに求められる技術と本質的に重なる。発熱密度の高いGPUクラスタを効率よく冷やし、電力コストを最小化する——この課題への解答を、Firmusはマイニング時代に培っていた。暗号資産バブルの中で独自技術を磨き、AIブームで再浮上する。この転身パターンは投資家に強く刺さっており、「crypto-roots-turned-AI」企業として市場の熱狂を集めている。実務への影響——日本企業はアジアのAIインフラ動向を無視できない日本のエンジニアやIT管理者にとって、この動きはいくつかの実践的な示唆を持つ。 ①クラウドの「下の層」に何が起きているかを把握する AWS・Azure・Google Cloudのアジアリージョンは、こうした独立系AIデータセンター事業者の基盤整備に間接的に影響を受ける。電力・冷却・ネットワーク帯域の需要が集中する地域が変わると、クラウドリージョンの選択肢と価格に波及してくる。インフラコストを見積もる際には、上位レイヤだけでなく「誰がその土台を作っているか」まで視野を広げるべき時期に来ている。 ②オンプレミスAI基盤を検討している企業への参考事例 Firmusの設計思想——Nvidiaリファレンス準拠・省電力・高密度冷却——は、自社AIサーバーを検討している日本企業にも参考になる。「とにかく最速で大量に」ではなく「電力効率と冷却設計をセットで考える」という視点は、国内の電力制約が厳しい環境では特に重要だ。 ③Vera Rubin世代に備えた計画策定 2026年後半にVera Rubinが量産体制に入ると、Blackwell世代のGPUは価格・調達面で有利になる可能性がある。次世代移行のタイミングを見据えつつ、現在世代での実験・学習に投資するという判断は合理的だ。筆者の見解 Firmusのようなプレイヤーが急速に評価額を伸ばしている背景には、単純な「AIブームへの期待」以上のものがある。AIエージェントが自律的に処理を実行し続ける世界では、コンピューティングリソースは「使いたいときに爆発的に」ではなく「常時・安定的に・大量に」必要となる。そのインフラを誰が握るかは、今後10年のパワーバランスに直結する。アジア太平洋地域でこの種の投資が進んでいることは、日本にとって地政学的にも無関係ではない。日本国内でのAIコンピューティング基盤の整備は決して十分とはいえず、企業や研究機関がAIを本格活用しようとした際に「処理できる場所がない」という問題は想像以上に深刻になりうる。省エネ型AI工場というコンセプトは正しい方向性だと思う。ただし、資金と技術があっても「どこに建てるか」「電力をどう確保するか」という物理的制約は容赦なくかかってくる。タスマニアという選択肢に水力発電の豊富さが見え隠れするように、再生可能エネルギーとの地理的組み合わせが今後のAIインフラ競争の重要変数になる。日本もこの視点で自国のAI産業競争力を問い直す機会がもっとあっていいはずだ。出典: この記事は Firmus, the ‘Southgate’ AI data center builder backed by Nvidia, hits $5.5B valuation の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

AIが脆弱性発見で人間を超えた今、防御側が先手を打てるか——Project Glasswing緊急始動

AIが「脆弱性を見つける側」に回ったとき、サイバーセキュリティの地政図は根本から塗り替わる。Anthropicは2026年4月、そのことを業界に突きつける形で Project Glasswing を発表した。Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksという錚々たる顔ぶれが参画するこの取り組みは、単なる共同声明ではない。AIによる攻撃能力が実用段階に達した今、防御側が先手を打つためのラストチャンスという緊張感がある。 Mythos Preview——「人間を超えた」の意味プロジェクトの中核に置かれているのは、Claude Mythos Previewと呼ばれる未公開のフロンティアモデルだ。このモデルはすでに、主要なオペレーティングシステムとウェブブラウザすべてを含む範囲で、数千件の高深刻度脆弱性を発見済みだという。注目すべきは「どれだけ多くの脆弱性を見つけたか」ではなく、「ほんの一部の熟練セキュリティ専門家しかできなかった作業をAIが置き換えた」という質的変化だ。これまで脆弱性の発見は、膨大な経験と直感を持つ少数の研究者にしかできなかった。コスト・時間・専門性の三重の壁が、攻撃側のハードルでもあった。AIはその壁を一気に引き下げる。なぜ今、業界横断なのか問題の本質は「攻撃AIが悪意ある組織に渡る前に、防御側がAIを使いこなせるか」という時間との勝負にある。国家支援の攻撃者（中国・イラン・北朝鮮・ロシアが例示されている）は、すでに高度なリソースを持っている。AIが攻撃力の民主化を進めれば、小規模な組織や個人でも病院や学校を麻痺させられるレベルの攻撃が可能になりかねない。現在でもサイバー犯罪の世界的コストは年間5000億ドル規模と推定されている。 Anthropicは、Mythos Previewのアクセスを40以上の重要インフラ関連組織に提供し、ファーストパーティ・オープンソース双方のシステムをスキャンできるようにする。さらに最大1億ドル相当のクレジットと400万ドルのオープンソースセキュリティ団体への寄付をコミットしている。実務への影響——日本のエンジニア・IT管理者が知っておくべきこと 1. OSS依存のリスク評価が変わる Project Glasswingの対象にはオープンソースのコードベースが明示的に含まれる。自社プロダクトに組み込んでいるOSSライブラリに未発見の脆弱性が眠っている可能性が、今後急速に可視化されていく。SBOMの整備と定期的なスキャン体制を今から構築しておくべき局面だ。 2. 「脆弱性発見はスペシャリストの仕事」という前提が崩れる AIベースのスキャンツールが整備されれば、従来なら外部ペンテスト会社に依頼していた作業の一部を内製化できるようになる。逆に言えば、ツールを使いこなせない組織との格差が拡大する。セキュリティエンジニアの役割は「脆弱性を見つける人」から「AIが見つけた脆弱性を評価・トリアージして対処する人」へ移行していく。 3. Microsoft製品を使っている組織は動向を注視せよ MicrosoftはProject Glasswingの立ち上げパートナーとして名を連ねている。WindowsやAzureに関連する発見事項が今後どのようなタイムラインでパッチ提供されるか、またMicrosoftがDefender等の自社セキュリティ製品にMythosの知見をどう統合してくるかは、M365やAzureを使う日本企業にとって直接的なインパクトになる。筆者の見解 AIが自律的にコードを読み、脆弱性を見つけ、さらにその悪用方法まで推論できる——これは「そのうちそうなる話」ではなく、すでに起きていることだ。Project Glasswingが示すのは、その能力が特定の研究者の手元だけにある段階は終わったという事実である。重要なのは「防御側がこのAIを使えるか」という問いだ。攻撃側が同等あるいはそれ以上のAIを手にすることは、もはや時間の問題に過ぎない。業界横断でアクセスを広げ、発見情報を共有するというアプローチは、オープンソースセキュリティコミュニティが長年実践してきた「脆弱性の公開と修正の高速化」と同じ思想の延長線上にある。方向性として正しいと思う。 AIエージェントが自律的にループで動き続け、コードを分析し、脆弱性を検出し、修正案を提示する——こうした仕組みが整備されれば、セキュリティの「攻守バランス」は初めて防御側に有利に傾く可能性がある。そこに本当のチャンスがある。一方で、懸念もある。このような強力なモデルへのアクセスが、実態として大手パートナー企業に集中するなら、中小企業や行政機関、そして多くの日本企業は「守られる側」に留まり続けるリスクがある。Glasswingが真に業界全体を底上げするには、アクセスの民主化と、発見された脆弱性情報の迅速な共有プロセスが不可欠だ。プロジェクトの初動として打ち出した姿勢は評価できる。あとはその約束がどこまで実行されるか、継続的に注目したい。出典: この記事は Project Glasswing: Securing critical software for the AI era の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

「AIで1人・2ヶ月・18億ドル企業」の実態——NYタイムズが見落とした不都合な真実

2026年4月初旬、ニューヨーク・タイムズが掲載したある記事がSNSを席巻した。「1人の創業者が、わずか2ヶ月・2万ドルのブートストラップで、バイブコーディングだけを武器に評価額18億ドルの企業を作り上げた」——AIが可能にした次世代の起業神話、として熱狂的に拡散された。だがその熱狂の裏側には、報道が十分に掘り下げなかった重大な「別の顔」が存在していた。 Medviとは何か——表の顔と裏の実態 Medviは医療系AIスタートアップとして紹介されており、AIツールを駆使して少人数（あるいは1人）で急成長したという物語が独り歩きした。しかし記事公開直後から、複数の調査者や法律専門家がSNS上で疑義を呈し始めた。最も深刻な指摘は、カリフォルニア州反スパム法違反のクラスアクション訴訟だ。訴状によれば、Medviのアフィリエイトマーケターは偽装されたヘッダー情報・なりすましドメイン・無意味な送信元アドレスを使ってスパムフィルターを回避し、さらに虚偽・欺瞞的な件名を使用していたという。これはアフィリエイトが勝手にやった話ではなく、ビジネスモデルの構造的問題として指摘されている。さらに遡ると、2025年5月の時点でFuturism誌がすでにMedviの事業モデルを詳細に分析していた。このFuturism記事を掘り下げたYouTubeチャンネル「Voidzilla」は、Medviを「詐欺まがいプラットフォームの上に乗った詐欺レイヤー」と描写。収益報告の信憑性にも疑問を呈し、「なぜこれだけが本当のことを言っていると思えるのか」と指摘する声も上がっている。なぜこれが重要か——「AI成功物語」の検証責任この件が示すのは、テクノロジー報道における「AIハイプへの無批判な加担」というリスクだ。ニューヨーク・タイムズほどのメディアが、すでに公開されていたFuturismの批判的分析を参照せずに記事を書いたという事実は重い。「AIが可能にした一人勝ち」という物語のインパクトが、取材の深さを上回ってしまったのだ。日本でも状況は同様だ。「ChatGPTで業務効率化」「AIエージェントで〇〇倍速」といった煽り文句が飛び交い、ツールの裏側にある実態——コンプライアンス、データ管理、持続可能性——が問われないまま礼賛される事例は少なくない。 AIは確かに、かつてなら数十人規模のチームが必要だった仕事を少人数で実現できるようにしている。これは本物の革命だ。しかし「AIが成功の主役」という物語が、事業の倫理的問題や法的リスクを隠蔽する煙幕になりうる点には注意が必要だ。実務への影響——AI活用の「裏面デューデリジェンス」この事例はAIを使う側にも教訓を与えてくれる。ベンダー・パートナー選定時のAI系スタートアップ評価では、以下の視点を忘れずに持つべきだ。収益の出所を確認する: 「評価額」はあくまで投資家の期待値。実際の収益モデル・マーケティング手法が適法かどうかを問うコンプライアンス体制の有無: スパム送信・データ取り扱い・プライバシーポリシーは、AIの性能とは別に確認が必要な基本事項メディア報道を鵜呑みにしない: バズった記事の「裏」を検索するだけで、見え方が大きく変わることがある。Futurismの記事は無料で読めたアフィリエイトやパートナーの行動もブランドリスク: 自社が直接関与していなくても、流通ネットワーク全体の行為は法的・評判リスクとして跳ね返ってくる IT管理者・調達担当者は、AIを活用していると謳う外部サービスを導入する際、技術的な評価と同時に法的・倫理的なデューデリジェンスを標準プロセスに組み込むことが今後ますます重要になる。筆者の見解 AIが仕事のあり方を根本から変えていることは疑いようがない。少数の「仕組みを作れる人」が、AIを使って圧倒的なアウトプットを実現できる時代は確実に来ている——というか、もう来ている。その文脈でMedviのような事例が「成功の象徴」として語られることには、根っこに本物の変化がある。だからこそ、この件が残念だ。 AIが本当に可能にしているものは素晴らしい。だが「AIで成功した」という物語を使って、不正スレスレのマーケティングや疑わしい収益構造を覆い隠すことができるとしたら、それはAIそのものへの不信感を増幅させる。Medviが訴えられているのはAIのせいではないが、NYタイムズの報道が批判的視点を欠いていたことで、「AIすごい→Medviすごい」という短絡が生まれてしまった。技術メディアも、読者も、そして私自身も含めて——「すごいAI事例」を見たとき、一度立ち止まって問いを立てる習慣が今必要だと思う。「何がAIによって実現されていて、何がそうでないのか」を切り分ける冷静な目こそ、AI時代のリテラシーの核心ではないだろうか。実際に手を動かして使い倒している人間ほど、ハイプには乗りにくくなる。情報を追いかけるよりも、自分で使って成果を出す経験を積む——それが最も確実なAIリテラシーの育て方だと、改めて感じさせられた事例だった。出典: この記事は The back story behind the first “$1.8B” dollar “AI Company” の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

57年間見逃されたアポロ11号の誘導コンピュータのバグ、AI支援の形式検証で初めて発見

アポロ11号の誘導コンピュータ（AGC）コードに、57年間見逃されてきたバグが発見された。月面着陸という人類史上最大の偉業を支えたソフトウェアに、いまも未解決の欠陥が眠っていたとは——AIを活用した形式仕様検証の力を示す、驚くべき事例だ。アポロ誘導コンピュータとは AGCは1969年、アポロ11号の月面着陸を実現した誘導制御コンピュータだ。わずか2KBの消去可能RAM、1MHzクロックという今では信じられないスペックで、月への飛行経路計算と着陸船の制御を担った。コードは74KBの「コアロープメモリ」に格納されていた。磁気コアに銅線を手で通す、まさに手作業の記憶装置だ。製造を担った女性技術者たちは社内で「Little Old Ladies」と呼ばれ、このメモリは「LOLメモリ」とも呼ばれた。プログラムはハードウェアそのものに物理的に織り込まれていた。ソースコードは2003年にMITのプリントアウトからボランティアが手入力で復元し、2016年にGitHubで公開されると大きな話題となった。以降、数千人の開発者がアセンブリコードをレビューし、エミュレータが一命令ずつ実行し、学術論文が信頼性を分析してきた。それでも、バグは潜み続けた。発見された57年間のバグバグを発見したのは、英国のソフトウェア会社JUXTのチームだ。彼らはAIと自社開発のオープンソース行動仕様言語「Allium」を組み合わせ、13万行のAGCアセンブリコードから1万2500行の仕様書を自動生成した。そのプロセスが欠陥に直接たどり着いた。バグはIMU（慣性計測ユニット）サブシステムのジャイロ制御コードにある。AGCはジャイロスコープをトルク制御する際にLGYROという共有リソースロックを取得し、3軸すべての制御完了後にロックを解放する。問題は「ケージング」時の処理だ。ケージングとはIMUのジンバルを物理的に固定する緊急措置で、クルーがコックピットのスイッチで操作できた。通常の完了パスではロックが解放されるが、ケージング発生時の終了ルートBADENDには、ロックをクリアする2命令が抜けていた：出典: この記事は We found an undocumented bug in the Apollo 11 guidance computer code の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

AIが思考・文体を均質化している？ USC研究が警鐘を鳴らす「知的多様性」の消失リスク

AIツールが「みんな同じ文章」を生み出している？南カリフォルニア大学（USC）ドーンサイフ校の研究チームが、興味深い問いを投げかけている。生成AIの普及によって、私たちの思考パターンや文章スタイルが均質化しつつあるのではないか、というものだ。Hacker Newsでも200点以上の注目を集め、200件超のコメントが飛び交ったこの研究は、AIツールが当たり前になりつつある今、無視できない視点を提供している。なぜ「均質化」が起きるのか生成AIはその仕組み上、大量のテキストデータから「統計的に自然な」出力を生成する。言い換えれば、「平均的で受け入れられやすい表現」に最適化されている。ユーザーがAIに文章を書かせたり、下書きの添削を頼んだりするたびに、その出力は訓練データが反映する「多数派の文体」に引き寄せられていく。このプロセスが社会的に大規模に起きると何が起こるか。個々の書き手が持っていた独自の語彙選択・論理展開・表現癖が薄れ、「AIらしい整然とした文章」が世の中に溢れることになる。思考の多様性は言語の多様性に支えられている部分が大きく、文体の収束は思考様式の収束を招きやすい。日本のIT現場への影響日本では、AIによる文書作成支援ツールの導入が急速に広がっている。報告書・提案書・メール・議事録……あらゆるビジネス文書がAIを経由するようになれば、部署や会社をまたいで「同じ雰囲気の文章」が流通することになる。実務上の注意点をまとめる： AIの出力はドラフトとして扱う: 最終的な言葉選びは自分の判断で変える習慣をつける。AIが提案した表現を「なぜこの言葉か」と意識的に問い直すだけで、思考筋は維持できる重要な意思決定は自分の言葉で言語化する: アイデア出しや戦略立案の場面では、まず自分の考えをメモしてからAIに投げる。順序を逆にしないチームの多様な視点を意識的に保護する: レビューや議論の場でAI生成文書を「参考資料」として扱い、議論そのものをAIに委ねない AIが整えた文章の「のっぺり感」を検出する: 読み手として均質化した文章を識別できる眼を養うことが、書き手としての差別化につながる筆者の見解この研究が示す問題は、ツールの問題ではなく使い方の問題だと私は見ている。AIが「副操縦士」として常に手を貸し続ける設計になっていると、人間が主体的に考える場面がどんどん減っていく。自分で問いを立て、自分の言葉で仮説を組み立て、AIにはその検証や整形を任せる——この順序を守るかどうかで、思考の独自性は大きく変わる。均質化のリスクは、AIを「文章の自動生成装置」として使う人ほど高くなる。一方、AIを「思考の加速装置」として設計できる人には、均質化の罠は近づきにくい。情報を大量に追いかけることよりも、自分で実際に手を動かし成果を出す経験を積む方が今は正しい——そう考えている私にとって、この研究は「使い方次第だ」という信念を改めて確認させてくれるものだった。思考の多様性は、意図して守らなければ静かに失われる。AIが当たり前になった時代だからこそ、「自分はどう考えるか」を先に問う習慣の価値は、むしろ上がっていると思う。出典: この記事は AI may be making us think and write more alike の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

Googleが「エージェントのハイパーバイザー」Scionを公開──マルチエージェント並列実行基盤の設計思想が面白い

複数のAIエージェントを安全な環境で同時並行に動かす──そんな基盤への需要が急速に高まるなか、Googleがその解の一形態を示した。実験的マルチエージェント・オーケストレーション基盤「Scion」が先日オープンソースとして公開された。 Scionとは──「エージェントのハイパーバイザー」 Scionが掲げるコンセプトは「エージェントのハイパーバイザー」だ。仮想マシンを管理するハイパーバイザーと同じように、Scionは複数のAIエージェントの生成・調整・終了を統括する。具体的には以下を実現する：コンテナによる完全分離: 各エージェントはDockerやPodmanなどのコンテナで動作し、独自のgitワークツリーと認証情報を持つ。複数エージェントが同じプロジェクトで並列作業しても互いに干渉しない動的なエージェントライフサイクル管理: 長期稼働する専門エージェントと、単一タスクに紐づく一時的なエージェントを混在させられる並列タスクグラフの動的進化: コーディング・監査・テストといった異なる目的のタスクを並列に実行しながら動的に変化させられる実行環境はDocker、Podman、Appleコンテナ、Kubernetesに対応し、ローカル・リモートVM・Kubernetesクラスターをまたいで動かすことができる。「制約より分離」という設計原則 Scionの設計で特筆すべきは「Isolation over Constraints（制約より分離）」という原則だ。多くのエージェント基盤がエージェントの行動をルールやプロンプトで縛る方向に向かうのに対し、Scionは異なるアプローチを採る。エージェントに「–yoloモード」──必要なことを自由にさせながら、コンテナやネットワークポリシーという外側の境界でガードレールを設けるという発想だ。この転換は重要な意味を持つ。内側からルールで縛ると、エージェントの自律性が損なわれ、結局は人間が細かく指示し続ける構造に逆戻りする。外側で物理的に分離することで、エージェントは本来の自律性を発揮しつつ安全性が担保される。 Scion固有の語彙体系 Scionを使いこなすには独自の概念体系を理解する必要がある：用語意味 Grove（グローブ）プロジェクトに相当する単位 Hub（ハブ）オーケストレーションの中央コントロールプレーン Runtime Broker ハブが動作するマシン Harness（ハーネス）エージェントのライフサイクル・認証・設定を管理するアダプターハーネスを通じて現在対応しているエージェントはGemini CLI、Claude Code、OpenCode、Codexなど。後者2つは現時点でサポートが部分的だ。デモゲーム「Relics of the Athenaeum」 Scionの能力を実証するデモとして、Googleは「Relics of the Athenaeum」というゲームのコードベースも公開している。このゲームでは複数のエージェントが異なるキャラクターを演じながら協力して計算パズルを解く。ゲームランナーがキャラクター（エージェント）を動的にスポーンし、それらのエージェントがさらにワーカーや専門エージェントを生成するという構造は、実際のマルチエージェント開発基盤の雛形として参考になる。実務への影響現時点では実験的なプロジェクトであり、本番環境への即時採用を急ぐ段階ではない。ただし、今すぐ学べることは多い：アーキテクチャパターンとして参照する: コンテナでエージェントを分離する発想は、社内ツールや自動化パイプラインでも応用できる gitワークツリー活用を実践する: エージェントに独立したgitワークツリーを割り当てて並列作業を安全に進める手法は今すぐ取り入れられるハーネス設計を研究する: エージェントのライフサイクル管理をアダプターとして切り出す設計は再利用性が高く、自社ツール開発の参考になる日本企業での導入を考えると、Kubernetesとの統合やオンプレミス動作の実績が重要になる場面も多い。Scionがそのあたりをどこまでカバーしていくかが今後の注目点だ。筆者の見解「複数のAIエージェントを安全な環境で同時並行に走らせる基盤」が求められていることは以前から明らかだった。Scionはその答えの一つを具体的なコードとして示した点に価値がある。特に「制約より分離」という哲学には強く同意する。エージェントの動作をプロンプトやルールで縛ろうとするアプローチは、どこかで必ず破綻する。物理的・インフラ的な境界で安全を確保しながら、エージェント自身には最大の自律性を与える──これが自律エージェントを本番で動かすための正しい方向性だと思う。エージェントが自律的にループで動き続ける仕組み──タスクを受け取り、実行し、検証し、次のステップを判断するサイクルを繰り返すアーキテクチャ──こそが今のAI開発における最も重要なフロンティアだ。Scionはそのビジョンを実装しようとしている。現時点では実験的な段階で、プロダクション採用はまだ先の話だろう。しかしマルチエージェント基盤の設計をこれから考えるなら、Scionのアーキテクチャを参照することは間違いなく有益だ。Googleがこの実験的基盤をどこまで発展させていくか、エコシステムの広がりとともに注目していきたい。出典: この記事は Google open-sources experimental agent orchestration testbed Scion の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

Claude Code、Windows/WSL環境でOAuthタイムアウト多発──ログインできずに数時間ブロックされる問題が報告

AIコーディングツールの利用が日常的な業務フローに組み込まれ始めた今、認証まわりのトラブルは「少し不便」では済まない問題になりつつある。AnthropicのClaude Codeで、Windows環境（特にWSL）のGoogleログインが15秒タイムアウトで失敗し続けるバグが報告され、GitHubのIssue #44257には200件を超える反応が集まった。Hacker Newsでも200点超えのホットな話題となっている。何が起きているか問題の流れはシンプルだ。 Windows上でClaude Codeを起動 Googleアカウントでのサインインを開始ブラウザでの認証を完了してアプリへ戻るアプリ側が OAuth error: timeout of 15000ms exceeded を返して失敗何度リトライしても同じ結果報告者のバージョンは 2.1.92。「以前は動いていたか不明」としており、突発的な不具合というよりは環境依存・設定依存の問題と見られている。技術的な背景：WSLとOAuthリダイレクトの相性問題 WSL（Windows Subsystem for Linux）環境でOAuth認証が失敗するパターンは、過去にも多くのツールで起きてきた構造的な問題だ。 OAuth認証の典型的なフローでは、認証後にブラウザが localhost や特定のポートへリダイレクトしてトークンをアプリに渡す。しかしWSL内のプロセスとWindowsのブラウザは異なるネットワーク名前空間にあるため、このリダイレクトが届かないことがある。 WSL2では localhost のフォワーディングが自動化されているが、完全ではないケースがあるポートの待ち受け（127.0.0.1 vs 0.0.0.0）の違いが影響することもセキュリティソフトやWindowsファイアウォールがローカルポートをブロックしている場合もあるタイムアウトが15秒という短さも問題で、WSLのネットワーク初期化やブラウザの起動が遅い環境では正常なケースでもギリギリになりうる。実務への影響と対処法この手の認証ブロックは「そのうち直る」と放置できないケースが多い。特にAIツールを自動化パイプラインや定期実行タスクに組み込んでいる場合、認証が切れた瞬間にフロー全体が止まる。現時点で試せる対処法： APIキー認証を使う: Google OAuthではなく、Anthropic APIキーを直接設定する方法が最も安定している。環境変数 ANTHROPIC_API_KEY にセットするか、claude auth --api-key 相当の設定を使う WSLのネットワーク設定を確認: %USERPROFILE%\.wslconfig に [wsl2] networkingMode=mirrored を追加し、WindowsとWSLのネットワークをミラーリングする（WSLの比較的新しい機能） PowerShellまたはWindows Terminalから直接起動する: WSL経由ではなくWindowsネイティブ環境でのログインを試すポート競合を確認: 認証に使われるローカルポートが他プロセスに使われていないか netstat -an で確認する公式のIssueを追う: GitHub Issue #44257 をウォッチしておき、公式パッチを待つのが最善の場合もある定期実行・自動化を組んでいる場合の重要な注意点： OAuthトークンは有効期限があり、長期実行のエージェントやcronジョブでは意図せず切れることがある。APIキー認証の方が自動化フローには向いており、こういったトラブルに巻き込まれにくい。 ...

生成AI

AIが「普通」を安価にした今、エンジニアに残された唯一の競争優位は「センス」だ

生成AIの普及によって、「まあまあな成果物」は誰でも作れるようになった。ランディングページなら数分、提案書なら一発のプロンプト、ピッチデッキなら会議前に間に合う。それが現実だ。では、その結果として何が起きているか。中間層が飽和した。 7点満点の世界が溢れ返り、かつては差別化できていた「そこそこ良いもの」では誰にも気づかれなくなった。エンジニアリング・デザイン・ライティング、あらゆる領域で問われているのは今や同じ問いだ。「あなたにしか気づけないものを、見抜けるか」。 LLMが「統計的に無難なもの」を出力する理由 LLMの本質は、大量のテキストや設計パターンを圧縮し、高速に再構成するエンジンだ。その強みは同時に、構造的な偏りも生む。モデルは、確率分布の中心に引っ張られる。特定の文脈に深く根ざした何かより、「それっぽく見えるもの」を生成するほうが得意なのだ。その結果として量産されるのが：ロゴだけ違うが構造は同じランディングページどのアプリにでも当てはまる製品コピー見出しは整然としているが生きた判断が宿っていないエッセイモダンに見えるが記憶に残らないUI これは「失敗」ではなく、「平均の成功」だ。問題は、その平均が以前より圧倒的に安価に大量生成できるようになった点にある。「センス」とは何か——選び方ではなく、診断力だ元記事が指摘する「センス（Taste）」とは、高級品趣味でも個人的な美意識ブランディングでもない。不確実性の中で本質を見抜く力だ。センスが発揮される場面は三つある。何に気づくか何を拒否するか「何かがおかしい」を、どれだけ正確に言語化できるか三番目が特に重要だ。「これは違和感がある」と言える人は多い。だが「この文章はSaaSのランディングページ全部に書いてあるような言葉しか使っていない」「この説明は規制上の制約をマーケティング語に溶かしているからユーザーが混乱する」と言えるのは、訓練された判断力がある人間だけだ。 AIが「平均」を瞬時に出力できる今、センスは雰囲気から診断へ移行しなければ価値を持たない。実務への影響——「初稿を止めない人」は埋もれる AI以前、質の低い成果物の原因は大抵、時間・リソース・スキルの不足だった。今は違う。「最初の許容できる草稿で止まってしまう人」が増えているのが問題だ。日本のIT現場に引きつけて考えると、以下のような局面で差が出る。要件定義・提案フェーズ: AIが出した提案書を少し直して出す。読む側も同じAIを使っていれば、「どこかで見た構成だ」と感じる。そこで差をつけるのは、業界特有の制約、顧客の本音、組織の文化的コンテキストを盛り込む判断力だ。コードレビュー・設計判断: AIが生成したコードは動く。問題は、「このアーキテクチャは3年後に痛くなる」という判断がAIには苦手なことだ。そのレビューができる人間の価値は、むしろ上がっている。プロダクトの方向性: 「何を作るか」より「何を作らないか」。トレードオフを見抜いて拒否できる人が、今のプロダクト開発では希少資源だ。明日から使えるヒント: AIの出力を「採用か却下か」で扱うのをやめ、「この出力が平均的に見える理由を言語化する」訓練をするチームのコードレビューや設計議論で「なぜこれを選ばないか」を明示する文化を作る自社・自チームのコンテキスト（顧客の言葉、制約、価値観）をプロンプトに徹底的に渡す。AIに文脈を与えるほど、平均からずれた出力が得やすくなる筆者の見解この論考が指摘することは、実際に日々AIツールを使い倒している立場から見ると、体感と一致する。生成AIのツールが手放せなくなっても、「何か足りない」と感じる瞬間がある。それは多くの場合、出力が「正しい」のに「自分のものではない」感覚だ。文章が整っていて情報も正確、でも自分の文脈が入っていない。そのズレを感じ取れるかどうかが、今後の生産性の天井を決める。特に注目したいのは「AIは自分のセンスを映す鏡になる」という指摘だ。10パターン出力させて「どれも微妙」と感じるなら、問題はAIではなく自分の言語化が甘いことが多い。何が「微妙」なのかを具体的に言えれば、次のプロンプトが変わる。「情報を追うより実際に使って成果を出せ」と日頃から言い続けているが、それは使い込むほどに自分の判断基準が研ぎ澄まされるからでもある。AI活用の習熟度とは、生成の速度ではなく、拒否の精度だ。「あなたにしか気づけないものを見抜く力」——これはAI時代に人間が最後に持つべき競争優位だ。だからこそ、ツールを使い込む習慣と、判断を言語化する習慣を、同時に鍛える必要がある。どちらか一方では足りない。出典: この記事は Taste in the age of AI and LLMs の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

AIトレーダーに「自分の口座」を——Bitgetが示す「エージェントネイティブ取引所」の衝撃

暗号資産取引所のBitgetが、AIトレーディングエージェント「GetClaw」に専用の独立口座を与え、人間の指示を待たずに自律的に売買を執行できる環境を整備した。単なる機能追加に見えるかもしれないが、これは「AIを道具として使う」フェーズから「AIを参加者として迎える」フェーズへの転換点として、フィンテック業界全体に影響を与えうる動きだ。 GetClawとエージェント専用口座の仕組み GetClawは、ゼロインストールで動作するAI取引エージェントとして以前から提供されていたが、今回の発表でその位置づけが大きく変わった。専用のサブ口座（エージェント口座）を持つことで、GetClawは以下の動作を人間の承認なしに実行できる。自然言語で定義された戦略に基づくリアルタイム注文執行 24時間のマーケット監視と自律的なポジション管理事前設定したパラメータの範囲内での戦略修正重要なのは、ユーザー資産とエージェント資産が明確に分離されている点だ。ユーザーはGetClawに「こういう条件で動け」と戦略を自然言語で定義するだけで、あとはエージェントが独立して動き続ける。BitgetのCEO Gracy Chen氏は「金融市場はいずれAIエージェントで埋め尽くされる。我々はそのインフラを今から整えている」と述べており、長期的なアーキテクチャ戦略として位置づけていることがわかる。「エージェントネイティブ」とは何か従来のAI支援トレードは「人間が決定し、AIが補助する」モデルだった。分析ダッシュボード、推奨アラート、リスクスコアなど、すべては最終的に人間の判断を補助するためのものだ。これは「副操縦士」パラダイムと呼べる。 Bitgetが目指す「エージェントネイティブ取引所」は、AIエージェントを市場の「参加者」として設計から組み込む。Agent Hubを通じてリアルタイムデータ、分析ツール、執行機能にシームレスにアクセスでき、人間のワークフローを経由せずにサイクルが完結する。分析→判断→執行→検証→再調整がエージェントの中でループし続けるわけだ。実務への影響——日本のエンジニア・IT管理者が知っておくべきこと暗号資産取引に直接関わらない人にとっても、このアーキテクチャの考え方は非常に示唆に富む。エージェント専用の「実行環境」を設計する思想: ユーザーアカウントとエージェントアカウントを分離するというアーキテクチャは、SaaSやエンタープライズシステムにそのまま応用できる。AIエージェントに必要最小限の権限を与えた専用の実行コンテキストを用意することは、セキュリティとトレーサビリティの両面で優れた設計だ。自然言語→自律実行のパイプライン: 「自然言語で戦略を定義し、あとはエージェントが自律実行」という構造は、業務自動化の文脈でも今後急速に広がる。「この条件になったら発注を止める」「週次レポートをこのフォーマットで生成して送る」といった業務ルールを自然言語で定義できるシステムが現実になりつつある。エージェントの監査可能性: 専用口座という構造は、エージェントの行動履歴を明確に追跡可能にする。企業システムにAIエージェントを組み込む際も「どのエージェントが何をしたか」を完全に記録できる設計が求められるはずで、このモデルは参考になる。筆者の見解正直に言えば、AIエージェントに「自分の口座」を持たせるというこの発表は、AIエージェント設計の本質を正確に突いていると思う。 AIの価値は「人間が確認するたびに止まる仕組み」ではなく、「人間が定義した目的に向かって自律的にループし続ける仕組み」から生まれる。その意味で、エージェントに専用の実行権限を与え、人間承認のボトルネックなしに動き続けさせるBitgetのアプローチは、エージェント設計の理想形に近い。金融という高リスク領域で先行してこの構造を実装していることの意味は大きい。ミスの代償が極めて大きい分野だからこそ、サブ口座分離・事前パラメータ設定・監査ログといった安全策も徹底されている。このバランス感覚はエンタープライズシステムへのAIエージェント導入においても非常に参考になる。「AIは補助ツール」という時代は終わりつつある。エージェントが市場に参加し、ループの中で自律的に動き続ける設計が現実のプロダクトとして登場している今、エンジニアやアーキテクトが考えるべき問いは「どうAIを補助に使うか」ではなく「どう自律エージェントに仕事を任せる仕組みを作るか」へと変わっている。この転換に気づいている組織と気づいていない組織の差は、今後急速に拡大していくだろう。出典: この記事は Bitget Gives AI Its Own Trading Account, Advancing Toward an Agent-Native Exchange の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

VisaとMastercardが本格始動——エージェントAIが「人間不在の決済」をインフラ化する

クレジットカード網の2大巨頭が、エージェント型AI（Agentic AI）の商用展開を相次いで加速させている。これはもはや「AIを使って便利にする」という段階の話ではない。決済というビジネスの根幹インフラに、自律的に動くAIエージェントが組み込まれ始めたという、業界構造そのものへの宣言だ。 Visaの2つの矢：紛争処理とRampとの法人決済統合 Visaは今週、2つの施策を同時に発表した。 1. 決済紛争の自動解決ツール Visaが2025年に処理した決済紛争件数は1億600万件以上。2019年比で35%増という数字は、オンライン取引の拡大とともに紛争件数も増加していることを示している。従来の紛争処理は人手と時間を要するバックオフィス業務だったが、今回のツールではAIが紛争対応アンケートへの回答を自動生成し、受付から解決まで一元管理するプラットフォームを提供する。これをVisaはイシュアー（カード発行会社）や加盟店に販売する形で展開する予定だ。複数カードネットワークにまたがる紛争を一つのプラットフォームで管理できる点も注目される。 2. RampとのTrusted Agent Protocol連携フィンテック企業Rampは5万社以上の法人顧客を持つ経費管理プラットフォームだ。Visaはここに「Trusted Agent Protocol（信頼済みエージェント認定の仕組み）」を組み合わせ、法人カード・経費精算・請求書処理・出張予約・資金管理・記帳までを統合したAIエージェント群を提供する。重要なのは「Trusted Agent Protocol」という概念だ。AIエージェントが自律的に決済を執行するためには、そのエージェントが「信頼できる主体か」を検証する仕組みが不可欠になる。Visaはここにインフラとしての価値を見出している。 Mastercardは香港を起点に国際エージェント商取引網を拡大 Mastercardは香港への展開を発表し、エージェント型AIによる商取引を国際的に接続するネットワーク構築を進めている。消費者がすでに持っているカードインフラと接続することで、新技術の普及障壁を最小化する戦略だ。「既存の決済ツールに統合されることで、新技術の採用はずっと容易になる」——業界コンサルタントのこのコメントは本質をついている。AIエージェントが経済活動に参加するには、実際に決済できる仕組みが必要だ。その出口を2大カードネットワークが握ることの意味は大きい。実務への影響——日本の経理・IT部門が今すぐ知っておくべきこと法人経費管理・購買部門 RampのようなAI統合型経費管理が日本でも普及する兆候は今後2〜3年以内に現れるだろう。「Visa認定エージェントが社内の経費規程を読み込み、承認ルールに従って自動発注・支払い」というシナリオは現実的だ。今のうちに社内の購買ルールや承認フローをドキュメント化・構造化しておくことが、AI導入時の移行コストを大幅に下げる。 IT・システム部門 Trusted Agent Protocolのような「エージェント認証基盤」は、今後エンタープライズシステムの設計要件になる可能性が高い。ゼロトラストがネットワークセキュリティの標準になったように、「このエージェントは信頼できるか」を確認する仕組みの設計がシステムアーキテクチャの必須要件になる時代が来る。決済事業者・カード会社紛争処理の自動化はコスト削減と顧客体験改善の両取りができるテーマだ。Visaのツールが日本の加盟店・イシュアーにどのような形で展開されるか、国内パートナー経由の動向を注視したい。筆者の見解 VisaとMastercardのこの動きが示すのは、エージェント型AIが「実験的な取り組み」を卒業し、ビジネスインフラの層に降りてきたという事実だ。決済は特別な領域だ。「お金を動かす」という行為に、人間の承認なしでAIが関与できるかという問いは、技術的な問題であると同時に信頼とガバナンスの問題でもある。Visaが「Trusted Agent Protocol」という概念を打ち出したのはその問いへの答えの一つで、「どんなAIにでも決済させるわけではない、認定された信頼済みエージェントだけに許可を与える」という設計思想は理にかなっている。ここ数年のAIエージェント議論で私が一貫して重要だと考えてきたのは、「人間が都度確認・承認するモデル」からの脱却だ。その視点でいえば、VisaとMastercardの今回の展開は正しい方向を向いている。エージェントが自律的にループを回し、ルールと権限の範囲内で最後まで処理しきる——それが本来のエージェントAIの姿だ。一方で、「AI同士が取引する経済」においては、人間が直接関与しなくなる部分のガバナンス設計がますます重要になる。認証・監査ログ・異常検知・権限スコープの設計は、AIエージェントが増えれば増えるほど精緻さが求められる。日本企業はこの「エージェントガバナンス」の設計思想を、今から真剣に考え始めるべき段階に来ていると感じている。 2026年、AI-to-AI取引はSFの概念ではなくなった。次の問いは「どう設計するか」だ。出典: この記事は Visa, Mastercard expand agentic AI deployments の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

「拡張思考」を削ると何が壊れるか——6,852セッションのログが暴いたAIエージェント品質劣化の構造

AIエージェントに「考える時間」を与えないとどうなるか——2026年2月以降にAnthropicのClaude Codeで起きた品質劣化問題が、この問いに対してデータで答えを示している。GitHubには6,852セッション・17,871の思考ブロック・234,760回のツール呼び出しを解析した詳細なバグレポートが提出され、世界中のエンジニアから800以上の支持票を集めた。これは単なる「使いにくくなった」という感覚的な報告ではない。AIエージェントの内部動作と品質の関係を、実運用ログから定量的に検証した貴重な事例だ。何が起きたのか——思考トークン削減の段階的ロールアウト 2026年2月12日に適用されたアップデート（redact-thinking-2026-02-12）を境に、Claude Codeは内部の「思考ブロック（thinking block）」をユーザーから隠す仕様に変更された。問題はそれだけではなかった。ログ解析によると、思考の深さ（推定文字数）はレポート対象期間のベースライン（約2,200文字）から、2月末には約720文字（-67%）、3月以降は約560文字（-75%）まで激減していた。注目すべきは、この劣化が「可視性の喪失」より先に始まっていた点だ。思考ブロックの表示が消える前から、すでにモデルの内部推論は大幅に短縮されていた。ユーザーが「何かおかしい」と感じ始めた3月8日は、ちょうど思考ブロックの50%以上が隠蔽状態となった日と一致する。ロールアウトは1.5%→25%→58%→100%という段階的な形で行われており、品質劣化の時期とも見事に符合している。「調査優先」から「編集優先」への行動変容この解析が最も示唆に富む点は、思考深度の低下がツール呼び出しパターンの質的変化として現れたことだ。思考が十分に行われていた時期のClaude Codeは「調査優先（research-first）」で動く。コードを読み、関連ファイルを確認し、既存の規約や構造を把握してから変更を行う。ところが思考が制限されると「編集優先（edit-first）」に転落する——コンテキストを十分に把握しないままファイルを書き換え始めるのだ。ユーザーが報告した症状がまさにこれだ。「指示を無視する」「最もシンプルな（しかし間違った）修正を主張する」「指示と逆のことをする」「完了したと言い張る」。これらはすべて、十分な推論なしに「答え」を急いだ行動の典型だ。なぜこれが重要か——「拡張思考」は贅沢品ではなく構造要件日本のITエンジニアにとって、この問題が示す本質は非常に重要だ。拡張思考（Extended Thinking）は、複雑なエンジニアリング作業においてオプションではなく構造的必須要件だ。単純な一問一答には不要かもしれない。しかし、複数ファイルにまたがるリファクタリング、長期にわたるセッションでの文脈維持、既存規約への準拠が求められる実業務では、「十分に考える時間」がなければモデルはまともに機能しない。これはAIエージェント全般に通じる設計原則でもある。エージェントが自律的に高品質な成果を出すためには、十分な推論ステップが確保されなければならない。ループで動き続ける自律エージェントが本来の価値を発揮するには、各ステップでの「深い判断」が不可欠なのだ。実務への影響——日本のエンジニア・IT管理者にとっての意味 AIコーディングアシスタントを導入済み・検討中の組織へまず認識すべきは、「AIが使えない」と感じる場面の多くが、モデルそのものの限界ではなくサービス側の設計変更に起因する可能性があるということだ。特に複雑なタスクで突然品質が落ちた場合、バージョンや設定の変更履歴を確認する価値がある。実務的なヒントを3点挙げる：複雑タスクほど「System Prompt」で思考を促す設計を：「段階的に考えてから実装せよ」「まずファイル構成を把握せよ」のような明示的な指示で、モデルの調査フェーズを強制する長期セッションの品質劣化に気づく仕組みを作る：数十ターンに及ぶセッションでは、途中でモデルが文脈を失っていないか定期確認するフローを組み込む「編集優先」の兆候を早期検知する：コードを読まずに書き換え始めた、以前確認したはずの規約を守っていない、といった症状はモデルの推論不足のサインとして扱う筆者の見解このバグレポートの最も重要な貢献は、「使いにくくなった気がする」という感覚論を、8ヶ月分の実データによる定量分析へと昇華させたことだ。AIエージェントの内部動作が品質にどう影響するかを、実運用スケールで検証した事例として、業界全体にとって価値のある知見だと思う。 Anthropicは今回のIssueを受けて「調査中」と回答しており、コミュニティへの関与は見せている。しかし問題の本質——「コスト削減のための思考トークン削減が、複雑タスクの品質を構造的に損なう」——は、単なるバグ修正では解決しない可能性がある。思考の深さとサービスコストのトレードオフは、AIエージェントを提供するすべてのベンダーが直面する構造的課題だ。日本の現場では、まだAIエージェントを「少し賢い補助ツール」として扱っている組織が多い。しかし複雑な業務を自律的にこなす本格運用を目指すなら、モデルの推論深度——つまり「どれだけじっくり考えられるか」——が最も重要なスペックになる。今回の事例はその原則を、6,852セッションというリアルなスケールで証明してみせた。自律エージェントが深く考え、調査してから行動するという設計原則は「あったらいい機能」ではない。それなしには、複雑なエンジニアリング業務への本格適用は成立しない。この認識をもとに、ツール選定・プロンプト設計・ワークフロー構築を見直す時機が来ている。出典: この記事は Issue: Claude Code is unusable for complex engineering tasks with Feb updates の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

LEGOトランプが拡散する時代——生成AIが変えた「プロパガンダ」の設計思想

LEGOで描かれた戦争が、本物のニュースより拡散する 2026年3月、トランプ大統領とネタニヤフ首相をLEGOのミニフィギュアで描いたAI生成動画がSNSを席巻した。キャッチーなラップトラックに乗せ、ガザやイランの戦争被害を風刺するこれらの映像は、一部がイラン国営テレビでも放映されるほどの影響力を持つに至った。制作元として名乗りを上げたのは「Explosive News Team（爆発的ニュースチーム）」を自称するアカウントだ。彼らはX上で「俺たちがイランのLEGOアニメの人たちだ」と宣言しつつ、学生主体の自発的グループだと主張している。しかしメディア報道では、これらの動画が革命防衛隊（IRGC）傘下の「Revayat-e Fath Institute（勝利の語り部機関）」に関連している可能性が指摘されている。公式国家アカウント、代理グループ、匿名の愛国的トロール——実際のところ誰が作ったのかを特定することが、もはや意味を失いつつある。これは遠い国の話ではない。同じ構造は日本の情報環境にも今すぐ着地しうる。「娯楽の文法」に包まれた政治メッセージホワイトハウスも同様の手法を使っていた。Operation Epic Furyの宣伝動画はNintendo Wii Sportsのカーソル操作から始まり、実際の爆撃映像とカートゥーンのボーリングストライクを交互に編集するという、ゲームの視覚言語を借用した演出だった。『Call of Duty』や『GTA』の映像に実際の空爆フッテージを重ねた動画も、ホワイトハウス公式Xアカウントから投稿されている。イラン側は「屈辱と恐怖」を、ホワイトハウス側は「支配と軍事的優位」を——表現する内容は正反対でも、どちらも娯楽コンテンツの文法を使って戦争を「エンタメ化」しているという点では同じ構造だ。なぜ娯楽フォーマットが選ばれるのか生成AI登場以前は、映像プロパガンダには専門的な制作リソースが必要だった。今は違う。高品質なAI動画を「安価に、大量に、短時間で」生産できる環境が整った。さらに重要なのは、ユーザーがコンテンツを拡散する動機が「共感」ではなく「面白さ」で十分という点だ。LEGOで描かれた戦争の残酷さは、そのちぐはぐさ自体が注意を引く。視聴者は内容に賛同しなくても、「奇妙さ」や「キャッチーさ」から共有してしまう。ソーシャルメディアは、今や公式アカウントと匿名アカウントが同じリーチを競うフラットな戦場だ。アルゴリズムが評価するのは「エンゲージメント」であって「信頼性」ではない。実務への影響——日本のエンジニアとIT管理者に向けて 1. コンテンツ真正性の検証がインフラレベルの問題になった企業のソーシャルメディア運用担当者、広報・IR担当者、そして情報セキュリティチームは、「AI生成コンテンツかどうかの検証フロー」をすでに持っているだろうか。C2PAやContent Credentialsのような「コンテンツ来歴証明」の標準規格が実装されていないプラットフォームでは、発信元の確認が構造的に困難だ。実践ポイント: 社内の情報確認フローに「生成AI判定ツール（例：Hive Moderation、AI or Not等）」を組み込むことを検討する。完璧ではないが、ゼロよりはるかにマシだ。 2. 「情報追うな、判断軸を持て」毎日大量のAI生成コンテンツが流れ込む時代、すべての真偽を追いかけることは不可能に近い。重要なのは「このコンテンツの目的は何か、誰が得をするか」を問う習慣だ。コンテンツの視覚的クオリティと信頼性はもはや無関係であり、「よくできている＝信頼できる」という直感は危険なバイアスになった。実践ポイント: 社内研修やオンボーディングに「生成AI時代のメディアリテラシー」を組み込む。特に管理職・役員向けに、AI生成フェイクニュースの判別演習を行うことを強くすすめる。 3. プラットフォーム依存の限界を理解する Explosive News TeamのYouTubeとInstagramは3月28日に凍結されたが、Xでは依然として活動を継続していた。プラットフォームのモデレーション判断は一貫せず、アカウント停止後の説明責任も十分ではない。自社ブランドが誤情報コンテンツの文脈で言及された場合の対応プレイブックを、今から用意しておく必要がある。筆者の見解この問題を「フェイクニュース対策」として語るのは、本質を見誤ると思っている。問題の核心は、生成AIによって「情報発信のコストが限りなくゼロに近づいた」という構造変化だ。「禁止」で解決しようとするアプローチは歴史的に失敗してきた。規制でAI動画を封じようとしても、誰でも使えるツールが存在する以上、創意工夫で回避される。重要なのは、人々が「正しい情報にアクセスするのが最も便利」と感じる仕組みを設計することだ。情報リテラシーの観点で、日本のIT業界はまだこの変化のスピードについていけていないと感じる。「AI生成動画は別世界の話」と思っているうちに、選挙・企業危機・社会運動のあらゆる場面でこの手法が使われるようになる。技術者として、「作る側の論理」を理解した上で「見る側のリテラシー」を社会に還元していく役割が、今こそ求められている。 LEGOのトランプが戦場を歩く映像を見て笑い飛ばして終わりにするか、その背後にある設計思想を読み解くか——その差が、これからのデジタル時代を生き抜く力を決めると思っている。出典: この記事は When Virality Is the Message: The New Age of AI Propaganda の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

コーディングエージェント専用サンドボックス「Freestyle」——VMライブフォークと500ms起動が変えるAI基盤の常識

AIコーディングエージェントが日常的なツールになりつつある今、その「実行基盤」のあり方が改めて問われている。Freestyle（freestyle.sh）は、コーディングエージェント専用に設計されたサンドボックス（仮想マシン環境）サービスとして登場した。単なるクラウドVM提供にとどまらず、「エージェントが人間の開発ループを大規模・並列で再現する」という野心的なビジョンを掲げている。 Freestyleの3つのコア機能 1. ライブフォーキング——実行中のVMをそのままコピー最も注目すべき機能がライブフォーキングだ。動作中のVMを約400ミリ秒の一時停止だけで複数の完全なコピーに分岐できる。これはファイルシステムのコピーではなく、メモリ空間ごとのフォークである点がポイントだ。ブラウザでページを半分スクロールした状態、Minecraftサーバーの全ブロック・プレイヤーの位置、実行中プロセスのエラー状態——これらすべてがフォーク先のVMに引き継がれる。この機能が真価を発揮するのは「並列エージェント実行」のシナリオだ。あるリポジトリを読み込んだVMを3つにフォークし、「APIエンドポイント実装」「フロントエンドUI構築」「テストスイート作成」をそれぞれのエージェントに並列で任せることができる。従来は順番に実行するか、別々に環境を立ち上げる必要があったが、Freestyleなら共通の初期状態から一気に並列展開できる。 2. 500ms以下の超高速起動 APIリクエストからマシンが利用可能になるまで700ms以下。従来のVMプロビジョニングが数分かかるのと比較すると、エージェントがオンデマンドで環境を立ち上げる用途に最適化されている。 3. ポーズ＆レジューム——実行状態のまま休眠アイドル時間にVMをハイバネーション状態にし、コストゼロで停止できる。再開時は停止した状態から完全復元される。AIアシスタント用途では、会話の間にVMを休眠させておき、次のメッセージで即座に再開するといった使い方が可能だ。なぜ自社ベアメタルに移行したのか Freestyleは当初、一般的なクラウド（AWS・GCP）上で構築を試みたが、「VMを別ノードに移動させる際のパフォーマンス特性が受け入れられない」と判断し、自社ベアメタルラックへ移行した。AWSやGCPのベアメタルノードを見積もったところ、月額料金がハードウェア購入総額と同等になることが判明したため、ハードウェアを自前で購入する道を選んだ。これは単なるコスト最適化ではない。エージェント基盤に求められる性能要件——特にライブフォーキングの実現——を満たすために、インフラ層から自前で設計するという判断だ。フルDebianサポート、eBPF、Fuse、ハードウェア仮想化対応など、通常のサーバーレスでは難しいスペックを実現するための必然的な選択でもある。実務への影響 AIエージェント開発者にとっての意味現在、LovableやBolt、v0のようなAIアプリビルダーや、Devinのようなバックグラウンドエージェント、CodeRabbitのようなレビューボットを開発しているチームにとって、Freestyleは実行基盤の有力な選択肢になりうる。特に以下のニーズに直接応える：並列エージェントで複数タスクを同時実行したい（ライブフォーク）エージェントのデバッグ時に特定状態をスナップショットして再現したい（ポーズ&レジューム） eBPFやFuseなど低レイヤー機能を使うエージェントを動かしたい（フル仮想化環境）日本企業のAIエージェント導入への示唆日本のエンタープライズでAIエージェントを本格導入しようとする場合、「エージェントが動く環境をどう用意するか」は軽視されがちな問題だ。AWS LambdaやAzure Functionsで簡単に動かせると思われがちだが、コーディングエージェントが必要とする「フル機能のLinux環境」「長時間の実行継続」「低レイヤーへのアクセス」は、サーバーレス環境では対応しきれないことが多い。 Freestyleのような専用基盤の登場は、「エージェントの能力 × 実行基盤の制約」というボトルネックを解消しようとする動きとして注目に値する。筆者の見解 AIエージェントの本質的な価値は、人間の確認を待たずに自律的にループし続けることにある。指示を受けて考え、実行し、結果を検証し、また次のステップへ——このサイクルを人間の介在なしに高速で回す仕組みこそが、エージェントが最大の力を発揮する設計だ。 Freestyleが解こうとしている問題は、まさにその「自律ループを回すための基盤」だ。ライブフォーキングによる並列実行、超高速起動、スナップショットによるデバッグ支援——これらは単なる便利機能ではなく、エージェントが人間のdevloopを再現するために必要な要素を整理したものとして見ることができる。「数万規模のエージェントを並列で動かせる基盤」という構想は、現時点ではまだ理想に近い段階だが、方向性は正しい。エージェントが自律的に仕事を回す時代において、実行基盤はエージェントの能力を引き出す「もう一つのボトルネック」になる。そこに正面から挑む取り組みとして、今後の展開を注目していきたい。日本のエンジニアにとっても、「エージェントに何をさせるか」と同時に「エージェントをどの基盤で動かすか」を真剣に考えるフェーズが、すぐそこまで来ている。出典: この記事は Launch HN: Freestyle – Sandboxes for Coding Agents の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

「バイブコーディング」の落とし穴——AIへの丸投げが生む技術的負債と、人間の目が持つ本当の価値

AIコーディングの「おまかせ文化」が招く品質劣化生成AIによるコード自動化が急速に普及するなか、「バイブコーディング（Vibe Coding）」という言葉が注目を集めている。一言でいえば、AIにコードを生成させ、自分では中身を一切確認しないという開発スタイルだ。最近、あるAI開発企業のソースコードが流出したことで、コードの品質の低さが広くからかわれる事態となった。その背景にこのバイブコーディング的な開発文化があった、という指摘がエンジニアコミュニティで話題になっている。「バイブコーディング」とは何かバイブコーディングとは、AIとの対話でコードを生成しながら、生成されたコードの中身を人間が見たり修正したりしないことを美徳とする開発手法だ。「自分でコードに触れることはAIへの介入であり、ピュアなAIコーディングではない」という思想が根底にある。一見すると効率的なように見えるが、これには重大な欠陥がある。 AIは指示がなければ一貫性を保てない。ファイル間の重複、命名規則の揺れ、設計上の矛盾——こうした問題は、人間がコードを読まずに「会話だけ」で指示していると自然発生する。今回の流出コードで指摘された「エージェントとツールが混在していた」という問題も、まさにこの典型だ。またそもそも、「完全なるバイブコーディング」は幻想だとも言える。AIが動くためのルールファイル、プロンプトテンプレート、タスクリスト——これらを設計・整備しているのは人間だ。AIは与えられた構造の中でしか動かない。その構造を設計する責任を人間が放棄することはできない。技術的負債は「見ないこと」で倍増するソフトウェア開発における技術的負債は、どんな優秀なチームでも蓄積される。問題は負債の存在ではなく、気づかないことだ。バイブコーディングの文化では、人間が「コードを読む」行為自体を忌避する。その結果、本来なら数分見るだけで気づける問題——たとえば大量の重複コードや矛盾した設計——が放置され続ける。ここに逆説がある。AIはこの種の整理・クリーンアップが非常に得意だ。だが人間が「何が問題か」を指摘しなければ、AIは問題を問題と認識できない。AIへの指示を的確にするために、人間が一度コードを読む。その一手間が品質を劇的に上げる。具体的な進め方としては、次のようなアプローチが有効だ：対話フェーズ（Askモード）: コードの方針を決める前にAIと議論する。「こういう設計にしたいが、何が懸念されるか？」と問いかけ、認識をすり合わせる例示と矯正: AIはしばしば迎合的になるため、「それは違う」と正す場面が重要。いくつかのサンプルで認識を揃えてから実行させる一括タスク化: 「重複しているものを全部列挙して、整理する方針を決めて、一括でリファクタリングする」という大きな指示をAIに出す。事前のすり合わせが済んでいれば、AIはこれを高精度でこなせる日本のIT現場への影響日本のエンジニアの多くは、今まさにAIコーディングツールの導入初期フェーズにある。「AIに書かせたコードは読まなくていい」という誤解が広まると、技術的負債が組織全体で加速度的に蓄積されるリスクがある。特に注意すべき点を挙げる：コードレビューの重要性はむしろ増す: AIが書いたコードだからこそ、ロジックや設計の一貫性を人間がチェックする必要があるプロンプト・ルール設計こそが本来の職人技になる: AIへの指示の質が、アウトプットの品質を直接規定する。この設計力こそ次世代エンジニアに求められるスキルだ「整理するためのAI活用」を習慣化する: 新機能開発だけでなく、既存コードのリファクタリングにもAIを積極的に活用すべき。これまでコスト的に手が届かなかったクリーンアップが、現実的な工数で実現できる筆者の見解バイブコーディングに対する批判は、根本的にはAIを「ツール」として正しく扱えているかどうかの問題だと思う。 AIは圧倒的な処理力を持っているが、文脈の設計は人間にしかできない。何をゴールとするか、どういう設計思想で進めるか、何が「良いコード」かの基準を定める——これは自然言語で表現されるが、人間の判断と経験の産物だ。AIはその文脈を受け取って初めて本領を発揮する。 AIコーディングの真の価値は「人間が不要になること」ではなく、「人間が本来考えるべきことだけに集中できること」にある。実装の繰り返し部分をAIに任せ、自分は設計・判断・方針の洗練に時間を使う。この役割分担こそが、個人の生産性を根本から変える。自律的に動くAIエージェントを育てることに最も力を入れている時期に、「AIが書いたコードを読まない」という文化が広まることは非常にもったいない。エージェントが自ら判断・実行・検証を繰り返す仕組みを設計するためには、人間がその動作原理をきちんと理解していることが前提となる。バイブコーディングへの批判が「古い時代の話」になる日が来るとしたら、それはAIが本当に設計意図まで自律的に学習・改善できるようになったときだろう。それはまだ先の話だ。今は、人間の目と判断を適切に組み合わせることが、AIを最大限に活かす唯一の現実解だと考えている。出典: この記事は The cult of vibe coding is dogfooding run amok の内容をもとに、筆者の見解を加えて独自に執筆したものです。