Tech News JP

AIエージェントの「無駄な行動」はなぜ起きる？ベイズ整合性が切り開くオーケストレーション理論

AIエージェントが本当に「使えるもの」になるためには、モデルを賢くするだけでは足りない。エージェントが「次に何をするか」を決めるオーケストレーション層そのものが、根本から見直される必要がある――そう主張するのが、30名の研究者がarXivに投稿したポジションペーパーだ。その核心にある概念が「ベイズ整合性（Bayes-consistency）」である。ベイズ整合性とは何かベイズ整合性とは、AIシステムが持つ「信念（belief）」が数学的に整合的であることを指す。エージェントが「この情報を取得するためにツールを呼び出すべきか？」という判断をする際、その確率的な見積もりが一貫しており、得た証拠によって適切に更新される状態のことだ。従来のAIエージェントは「杞憂」をしやすい。不確実な場面で念のためツールを呼び出す、すでに得た情報があるのに再確認のためAPIを叩く――こうした挙動は、確率的判断がキャリブレーション（較正）されていないことから生じる。今回の論文は、オーケストレーション層にベイズ統計の枠組みを導入することで、冗長なツール呼び出しを削減し、リソース配分を最適化できる理論的根拠を提示した。なぜオーケストレーション層が鍵を握るか AIエージェントのアーキテクチャは大きく3層で構成される。モデル層 — LLM本体の推論能力オーケストレーション層 — いつ・何を・どのように実行するかを決める制御ロジックツール層 — Web検索やコード実行などの実際のアクション昨今の研究はモデル層の改善（より大きく、より賢く）に集中しがちだが、現場で「エージェントが使いものにならない」と感じる原因の多くはオーケストレーション層の設計にある。過剰なツール呼び出しは、実行時間の増加・コスト増大・最悪の場合には副作用を伴う操作の不必要な繰り返しを引き起こす。実務での活用ポイントエンジニア・AIアーキテクト向けツール呼び出し条件を明示化する: 「このツールをいつ呼ぶか」の条件をあいまいにしない。必要性の閾値を設計段階で定義することが、ベイズ的思考の第一歩だ。信念更新のメカニズムを組み込む: 一度取得した情報を次の判断に反映する仕組みを明示的に設計する。コンテキストに情報があるのに再度ツールを呼ぶのは、更新機構が欠落しているサインだ。キャリブレーション評価をパイプラインに加える: エージェントの出力する信頼度が実際の正答率と一致しているかを評価する仕組みを評価パイプラインに取り入れる。これはコスト分析レポートにも直接使える。 IT管理者・意思決定者向け複数のAIエージェントを連携させるマルチエージェント構成を検討しているなら、オーケストレーション層の設計に今から投資すべきだ。モデル性能の差よりも、この層の設計品質が実用性を左右する。APIコスト管理の観点からも、「なぜそのツールを呼んだのか」を説明可能な形で設計することは、コスト最適化とガバナンスの両方に効いてくる。筆者の見解この論文の方向性は正しいと思っている。 AIエージェントが「本当に自律的に動くもの」と「指示を待ち続けるもの」に分かれていく流れの中で、前者の品質を決めるのはオーケストレーション層の洗練度だ。エージェントが自律的に判断・実行・検証を繰り返すループが機能するかどうかは、「いつ行動するか」の判断精度に大きく依存する。ベイズ整合性の概念は、そのループの判断部分に数学的な確かさを与えようとするアプローチであり、方向性として極めて真っ当だ。一方で、理論と実装の間には大きなギャップがある。現実のLLMベースエージェントで確率的な信念をどう内部表現するかは自明ではない。この論文が「ポジションペーパー」である点は正直に受け止めるべきで、「あるべき姿」の提言であり、「すぐに使えるレシピ」ではない。それでも、この方向に向けて研究コミュニティが動き始めたことは重要だ。AIエージェントを実際に動かしてみたことがある人ならわかるはずだ――今、最も痛いのはモデルの性能ではなく、「エージェントが余計なことをやり続ける」問題なのだから。オーケストレーション層の理論的基盤が整備されることは、この問題を根本から解決する足がかりになる。日本のエンジニアコミュニティにとっても、単なるモデル選定の議論から一歩踏み込んで、制御設計そのものを議論するフェーズに入った証だと受け止めている。出典: この記事は Agentic AI Orchestration Should be Bayes-consistent — Position Paper by 30 Researchers の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

NVIDIA Nemotron 3 Nano Omni が OCI に登場——動画・音声・画像・テキストを1モデルで処理するOSSマルチモーダルAIの実力

NVIDIA が開発したマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Oracle Cloud Infrastructure（OCI）のエンタープライズ AI プラットフォームで利用可能になった。動画・音声・画像・テキストを単一システムで推論できる完全オープンソースのモデルであり、これまで複数モデルを組み合わせていた複雑なパイプラインを一本化できる可能性がある。同タイミングで xAI の Grok 4.3 も OCI に追加されており、エンタープライズ向け AI の選択肢は着実に広がっている。「つなぐ時代」から「統合する時代」へ Nemotron 3 Nano Omni の最大の特徴は「マルチモーダル統合」と「完全オープンソース」の組み合わせだ。従来、マルチモーダル AI 処理を実現するには、音声認識・画像認識・テキスト処理のモデルをそれぞれ選定し、データの受け渡し処理を自前で実装する必要があった。このオーケストレーション層は見えにくいバグを生みやすく、保守コストも高くつく。 Nemotron 3 Nano Omni はこれらを単一モデルで処理できる。より自然な「見て・聞いて・読んで・答える」AI アプリケーションを、複雑な配管なしに構築できる点が実務では大きい。加えて完全オープンソースであることで、商用 API を呼び出すだけでなく、自社データでのファインチューニングや専用 AI クラスターへのデプロイが選択できる。OCI の専用 AI クラスターとの組み合わせにより、データをどこに置き、どのように処理するかを組織が完全にコントロールできる構成が現実のものになる。 Grok 4.3 の OCI 展開も注目同じタイミングで xAI の Grok 4.3 も OCI Enterprise AI に追加された。τ²-Bench Telecom で 98%、IFBench で 81% というベンチマーク性能を示し、100 万トークンのコンテキストウィンドウにも対応している。高度なロジック・数学・コーディング・多段階分析に強く、インテリジェンス対コスト比では同等クラスのフロンティアモデルより競争力があるとされる。用途によってはコスト効率の面で魅力的な選択肢になりうる。日本直結の事例：SoftBank の主権 AI プラットフォーム今回の発表の中で日本に特に関係が深いのが、SoftBank が OCI を使って国内主権クラウドプラットフォームを構築しているという事例だ。自社の生成 AI モデルと OCI Enterprise AI を組み合わせ、データをすべて国内のデータセンターに留めながら高度な AI 機能を提供する構成を実現している。 ...

生成AI

OpenAIがAI実装支援専門法人を設立——40億ドル超の初期投資で「モデル提供者」から「成果責任者」へ

AIの競争軸が、「どのモデルが賢いか」から「誰が企業の現場でAIを動かし切れるか」へと移行しつつある。OpenAIが2026年5月に設立を発表した「OpenAI Deployment Company」は、その象徴的な一手だ。Applied AIコンサルティング会社Tomoroの買収と40億ドル超の初期投資により、OpenAIはAPIプロバイダーという立場を超え、企業のAI導入を一気通貫で支援する体制へと踏み込んだ。「モデルを売る」から「成果まで責任を持つ」へこれまでOpenAIのビジネスモデルの中心は、APIとChatGPTの提供だった。企業が実際の業務システムに組み込む際のアーキテクチャ設計、既存システムとの統合、セキュリティ・コンプライアンス対応、従業員トレーニング——これらは国内外のSIerやコンサルティングファームが担う領域とされてきた。 OpenAI Deployment Companyの設立は、そのポジションへの直接参入を意味する。Tomoroの買収によって、現場のAI実装経験を持つコンサルタントチームとノウハウを一括で獲得した形だ。単なる「AIツールの販売代理店」ではなく、成果にコミットするパートナーとしての役割を取りにいっている。「PoC墓場」問題への構造的な回答この動きの背景にある課題は明確だ。企業のAI導入が「実験止まり」「PoC墓場」に終わりやすいという現実である。優れたモデルがあっても、既存データとの接続、権限管理、業務プロセスの再設計、そして何よりも「現場の人間がどう使うか」をデザインしなければ、生産性向上には結びつかない。40億ドル超という初期投資規模は、この支援業務が片手間のサービスではなく、戦略的なコアビジネスと位置づけられていることを示している。競合との構図——「実装力」が次の勝負どころ同様のDeployment Company構想を進める他社との競合は避けられない。また、Azureのインフラ基盤、M365のユーザーベース、そして広大なパートナーエコシステムを持つMicrosoftも、この「企業AI実装支援」の戦場における重要プレイヤーだ。純粋なモデル性能の比較競争から、「誰が企業のAI化を成功に導けるか」という実力勝負へと、業界の競争軸が移りつつある。日本のIT現場への影響選択肢の変化大手AIベンダー自身が実装支援を提供するようになることで、「モデル提供者」と「実装パートナー」の役割分担が解消されるケースが増える。これまで国内SIerが担っていた上流の実装設計に、直接圧力がかかることは避けられない。国内SIer・コンサルへの影響付加価値の再定義が急務だ。AIモデルの知識を持つだけでは差別化にならなくなる。業界固有の業務知識、法規制への対応、日本語環境特有の課題解決——こうした領域でいかに深い専門性を発揮できるかが問われる。「本番化圧力」の高まり OpenAIのような企業が「成果まで責任を持つ」モデルで参入することで、PoC段階で止まっていた日本企業の取り組みに本番化を求める機運が高まる可能性がある。明日から使えるヒント自社のAI導入ロードマップを「モデル選定」ではなく「成果定義」から逆算して設計し直すベンダーやSIerとの契約で「成果ベースの評価指標」を明示的に盛り込む OpenAI Deployment CompanyやAzure AI推進体制など、直接支援サービスの情報収集を今のうちに始める筆者の見解「企業のAI化を支援する」という言葉は以前から飛び交っていたが、それが現場で本当に機能していたかは怪しい。PoC（概念実証）を量産して「成功事例」として飾り立てながら、実際の業務フローで動いているAIは少ない——そんな状況が長く続いてきた。大手AIベンダーが自ら実装責任を持つ形に踏み込んできたことで、この「PoC墓場」問題が解消に向かう可能性はある。ただし40億ドルの投資規模が示すように、当面はグローバル大企業向けの話から始まるだろう。中小規模の日本企業が直接の恩恵を受けられるまでには、もう少し時間がかかると見ている。あらためてMicrosoftのポジションが気になる。Azureのインフラ、M365の膨大なユーザーベース、Copilotの展開力、そしてパートナーエコシステム——これだけの武器を持ちながら、「AI実装まで責任を持つ」という価値提案で存在感を発揮しきれているかというと、まだ磨きしろがある。とはいえ、Microsoftにはその力があるはずだ。ぜひ正面から勝負してほしいと思っている。今後のAI市場における核心的な問いは、「どのモデルが最強か」ではなく、「誰がエージェントを設計し、企業の業務ループに組み込み、継続的に改善し続けられるか」だ。OpenAIの今回の動きは、その問いへの一つの明確な答えである。出典: この記事は OpenAI Launches OpenAI Deployment Company with $4B+ Investment to Help Businesses Deploy AI の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

Windows 11がlibarchive採用でUU・CPIO・XAR・NuGetをネイティブサポート——7-Zip不要の時代へ

Windows 11のFile Explorerが、libarchiveというオープンソースライブラリを採用し、UU・CPIO・XAR・NuGet（.nupkg）という4つのアーカイブ形式のネイティブサポートを追加した。しかもアーカイブを一時フォルダに展開せず「仮想ファイルシステム」としてマウントする実装を採用しており、これまで7-Zip等のサードパーティ製ツールに頼ってきた開発者やIT管理者にとって、見逃せないアップデートだ。 libarchiveとは何か、なぜ今これが重要か libarchiveはLinux・macOS・BSDの世界では長年使われてきたアーカイブ処理の標準ライブラリだ。tar・cpio・zipなど多数の形式を統一的に扱えることから、Linuxのパッケージ管理ツール（pacman、pkgなど）にも採用されている実績ある実装であり、OSS界隈では「枯れた信頼できるライブラリ」として知られている。 Windowsがこのライブラリをシステムレベルで採用したことは、近年のMicrosoftが「自前主義よりもオープンソースの資産を素直に取り込む」という姿勢を続けていることの表れでもある。追加された4形式、それぞれの実用上の意味 UU（UUencode）バイナリをASCIIテキストに変換する古典的な形式。メール添付全盛期の遺物と思いきや、組み込み系やレガシーシステムとのやり取りで今なお生き残っているケースがある。 CPIO RPMパッケージの内部形式や、Linuxのinitramfsイメージに使われる形式だ。Windowsでネイティブに扱えるようになることで、LinuxとWindowsを行き来するクロスプラットフォーム開発者には地味に嬉しい対応。 XAR macOSのインストーラー（.pkg）の内部形式として使われていた形式。XcodeツールチェーンやmacOS向けパッケージを扱うプロジェクトとの連携がある場面で役立つ。 NuGet（.nupkg） .NETの標準パッケージ形式で、Visual Studioを使う開発者にとっては毎日触れるファイル形式だ。パッケージの内部構造確認や、サードパーティパッケージの精査がエクスプローラー上でそのまま行えるのは実用性が高い。仮想FSマウント方式の技術的な意義今回の実装で注目すべき点は「ディスク展開なし」の仮想ファイルシステム方式にある。従来の多くのツールは、アーカイブを開く際に一時フォルダへ実ファイルを展開してから表示していた。今回の実装ではアーカイブをその場でマウントして内部を参照できるため、以下のメリットがある。大容量アーカイブでも待ち時間なくブラウズできる一時ファイルの残骸がストレージに残らない展開→削除という作業フロー自体が不要になる実務への影響開発者向け .nupkgファイルの中身を確認したい場面は思いのほか多い。パッケージが意図した構造になっているかの検証や、サードパーティパッケージの内部精査が、別途ツールを起動せずエクスプローラー上で完結する。 IT管理者・インフラ担当向け Linux系のCPIOやXAR形式のファイルを受け取る場面では、これまでWSL経由か専用ツールのインストールが必要だった。標準機能で開けるようになることで、ツール管理コストが一つ削減できる。セキュリティ観点ファイル展開を伴わないマウント方式は、一時ファイルによる意図しないデータ残存リスクを低減する。細かい話に見えるが、端末上でのデータハンドリングの安全性という観点からは歓迎できる実装だ。エンタープライズ環境でサードパーティツールの管理を減らせることも、攻撃面の縮小につながる。筆者の見解 Windowsを細かく追い続けることに年々意味が薄れているのは正直なところだが、今回のアップデートは少し毛色が違うと感じている。 libarchiveの採用は「オープンソースコミュニティの資産をWindowsに持ち込む」という選択であり、開発ツールとしてのWindowsの地位を地道に高める積み重ねだ。NuGet形式のネイティブ対応は.NET開発者の日常に直接刺さるし、CPIO対応はLinuxとのクロスプラットフォーム作業をわずかながら楽にする。「地味だが確実に役立つ改善」を積み重ねるポテンシャルは、Microsoftには間違いなく備わっている。派手さはなくとも、使う人の手間を一つ一つ減らしていく姿勢には、実際に価値がある。エンタープライズ現場でのツール管理負荷を減らし、標準機能の信頼性を高めていく方向性は、正しい道のりだと思う。こういう「縁の下の充実」を続けることが、長期的なプラットフォームとしての強さにつながるはずだ。出典: この記事は Windows 11 expands built-in archive support to UU, CPIO, XAR, and NuGet formats via libarchive の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

Windows 11がFAT32の30年超えの制限を解除——コマンドラインで最大2TBのフォーマットが可能に

Windows 11の最新Insider Preview（ビルド26220.8165）で、約30年間変わらなかったFAT32フォーマットの上限制限がついに解除された。1996年のWindows 95 OSR2以来ずっと32GBに固定されていたコマンドライン上の上限が、最大2TBまで拡張されたのだ。地味に見えて、実はかなり根の深い話である。 FAT32の32GB制限とは何だったのか FAT32は、FAT16の後継としてWindows 95 OSR2で登場した。当時としては大容量HDDへの対応が主目的だったが、MicrosoftはすでにNTFSを本命として位置づけていた。NTFSはジャーナリング、アクセス権管理、大容量サポートといった機能において圧倒的に優れており、企業ユースにはNTFSを、ポータブルストレージにはのちにexFATを推す方向で動いていた。この32GBという上限は、意図的なデザイン判断だった。技術的にFAT32が32GB超を扱えないわけではなく、他のOSで作成した32GB超のFAT32ボリュームはWindowsでも読み込めた。PowerShellや、サードパーティのフォーマットツールを使えば作成することもできた。Windowsが「作ることを拒否していた」だけなのだ。この人為的な制約が、約30年間ユーザーをNTFSまたはexFATへと誘導し続けた。今回の変更点 2026年4月10日リリースのInsider Preview（Beta Channel: ビルド26220.8165 / KB5083635、Dev Channel: ビルド26300.8170 / KB5083632）で、formatコマンドのFAT32上限が32GBから2TBへ引き上げられた。主な変更点をまとめると：コマンドラインのformatコマンドで最大2TBのFAT32ボリュームを作成可能にディスクプロパティ表示（設定 → システム → ストレージ → 詳細なストレージ設定）のパフォーマンス改善も同梱 GUIのエクスプローラーからは依然として非対応ファイルサイズの4GB上限は変更なし実務への影響——どんな場面で使えるか NTFSでもexFATでもなくFAT32を使う理由が今でもある。それはクロスプラットフォーム互換性だ。Linuxサーバー、組み込みデバイス、古い映像機器、車のカーナビ、家電のUSBポートなど、exFATに対応していない機器では今なおFAT32が「最大公約数」として機能する。 IT管理者・エンジニアへの実践的なヒント：大容量USBメモリやSDカードの運用が変わる可能性：64GB以上のメモリを古い機器に使いたい場合、これまではサードパーティツール頼みだったが、Windowsのネイティブコマンドだけで対応できるようになる（Insider卒業後が前提） GUIでは使えない点に注意：スクリプトや自動化フローに組み込む場合、format /FS:FAT32 /Q X:のようなコマンドラインオペレーションが必要。エクスプローラーからのフォーマットでは旧来の挙動のまま 4GBファイルサイズ制限は健在：動画や仮想ディスクなど大ファイルを扱う用途には依然としてexFATかNTFSを選ぶべき。「2TBフォーマットできる＝大ファイルOK」ではない点を社内に周知しておくと混乱が防げる Insider限定の現状を把握する：現時点でこの機能を使えるのはInsider Programに参加した端末のみ。本番環境への適用は正式リリースを待つのが安全策筆者の見解 FAT32の制限解除は、エンジニアにとっては「やっとか」という感慨を覚える話だ。技術的に可能なことを30年間人為的に制限し続けた背景には、NTFSへの誘導というMicrosoftの明確な意図があったが、現実には「互換性のためにどうしてもFAT32が必要」という場面がずっと残り続けた。その乖離に悩んできた人は少なくないはずだ。 Windowsを毎週細かく追いかける時代ではなくなってきているが、こういった「地味だが長年の痒いところに手が届く」改善は素直に評価したい。ユーザーが実際に困っていたことに向き合い、動かしてくれたのだから。ただ、一点だけ添えておく。GUIでの対応が見送られているのは、UI設計コストか安全面への配慮かは不明だが、「コマンドラインを知らないユーザーには恩恵がない」という意味でもある。Windowsの強みはGUIの使いやすさにあるはずで、この種の機能拡張こそ設定画面にきちんと反映させてほしい。コマンドラインしか対応しない改善をリリースノートのトップに持ってくるのは、ユーザー層のミスマッチが気になる。正面から実装できる実力がある会社なのだから、中途半端に終わらせずに仕上げてほしい。正式リリースでGUIも対応済みになった暁には、改めてしっかり評価したいと思う。出典: この記事は Windows 11 Breaks a 30-Year Barrier: FAT32 Now Supports Up to 2 TB の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

Secure Boot証明書が15年の命脈を終える——2026年6月26日までに対応しないと何が起きるか

2011年に発行されたSecure Boot証明書が、2026年6月26日をもって失効する。Microsoftは5月のPatch Tuesdayからロールオーバー（証明書の更新）を段階的に展開しているが、対応が間に合わないデバイスは翌日からセキュリティ保護が低下した状態で稼働し続けることになる。「今動いているから大丈夫」が通用しない、典型的な事例だ。 Secure Boot証明書とは何か Secure Bootは、PCの起動プロセスにおいてブートローダーやカーネルが信頼できるコードのみを実行することを保証するUEFIの機能だ。この「信頼できるコード」を判断するための署名証明書が、今回失効対象となる。問題は証明書そのものが失効することではなく、更新が行われないデバイスでは「信頼チェーンの起点」が機能しなくなる点にある。攻撃者はこの状態を突いて、署名されていない、または不正な署名のブートローダーを実行できるようになる可能性がある。ロールオーバーの仕組みと注意点 Microsoftは5月のPatch Tuesdayを皮切りに、Windows Updateを通じた証明書ロールオーバーを開始した。多くのデバイスは通常のWindows Updateを適用するだけで新しい証明書が導入される。しかし注意が必要なのは一部のデバイスでOEMファームウェアの更新が別途必要なケースだ。UEFIファームウェアレベルで証明書を管理しているデバイスでは、OSの更新だけでは完結しない。OEMが提供するBIOS/UEFIアップデートを別途適用する必要がある。デバイスの対応可否を確認する主なポイントは次のとおり： Windows Updateの適用状況（最新パッチが当たっているか） OEMメーカーのサポートページで該当機種のUEFIアップデートが出ているか企業内展開ではWSUSやIntune経由での適用追跡ができているか 6月26日を過ぎると何が起きるか 6月26日以降、旧証明書で署名されたブートコンポーネントは信頼されなくなる。最悪のケースでは起動できなくなるデバイスが出る可能性もあるが、より現実的なシナリオは「Secure Bootの保護機能が実質的に機能しなくなる」状態での稼働継続だ。特にエンタープライズ環境では、BitLockerとSecure Bootを組み合わせたブート整合性保護に依存している構成が多い。このチェーンが崩れると、物理アクセスがあれば暗号化ボリュームを迂回できるリスクが高まる。実務への影響——日本のIT管理者がすべきこと今週中に動け、というのが率直なアドバイスだ。資産台帳を引っ張り出す — 管理下のデバイス一覧を確認し、OEMファームウェアの更新が必要な機種を特定する。古い法人PCは特に要注意 Windows Updateの適用状況を確認 — Intune/WSUSのコンプライアンスレポートで5月パッチ適用率を確認し、未適用デバイスがあればリマインドをかける OEM更新情報を収集 — Dell、HP、Lenovo、Fujitsu、NECなど主要OEMのサポートページで対象ファームウェアアップデートをリストアップする展開テストを先行させる — いきなり全台に展開せず、少数台でファームウェア更新後の起動確認を取る BitLocker回復キーの確認 — ファームウェア更新がTPM計測値に影響する場合があるため、作業前に回復キーが手元にあることを必ず確認する筆者の見解 Secure Bootのアーキテクチャは技術的によくできている。15年間、ルートオブトラストとして機能し続けたことはひとつの成果だ。今回のロールオーバーをMicrosoftが丁寧に段階展開しているのも評価できる。ただし今回明らかになるのは「Windows Updateさえ当てていれば終わり」という前提の限界でもある。OEMファームウェアという更新経路が別途存在し、IT管理者はその両方を把握していなければならない。特に中堅・中小企業では「PCはIT担当が管理しているから大丈夫」と思われているが、ファームウェアの更新まで追えている組織はほとんどないのが実態だ。「今動いているから大丈夫」は本当に通用しない。6月27日の朝、突然Secure Bootが機能しなくなっているデバイスが社内に数十台ある——そんな事態は誰も望まない。期限がハッキリしている珍しいセキュリティタスクだからこそ、今すぐカレンダーに「6月26日」を入れて、逆算で動いてほしい。あとは管理者側がOEMの更新まで含めて確実にフォローアップできるかどうかにかかっている。出典: この記事は May 2026 Secure Boot Certificate Rollover: One Restart, Big Firmware Risk の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Azure

Azure Linux環境の深刻脆弱性CVE-2026-43284：IPsec ESPトンネルが平文で読み取られるリスクと今すぐすべき対応

Azureの上でLinuxワークロードを動かしているチームへの緊急情報だ。CVE-2026-43284が正式に公開された。Linuxカーネルのxfrm（トランスフォーム）サブシステムに存在するこの脆弱性は、IPsec ESPトンネルを使用しているAzureのマルチテナント環境において、暗号化されたはずのパケットが共有メモリバッファ経由で平文として読み取れる状態になり得るという、インパクトの大きい内容だ。該当する環境を運用しているなら、今日中に対応を始めてほしい。この脆弱性の技術的な中身 Linuxカーネルのxfrm（IPsec Transformation）サブシステムは、IPsecによるパケットの暗号化・復号処理を担うコアコンポーネントだ。その中でもESP（Encapsulating Security Payload）は「データの機密性」を担保するプロトコルで、通信内容を暗号化してIPパケット全体をカプセル化する役割を持つ。 CVE-2026-43284は、このESP処理の過程でメモリバッファの扱いに問題があることに起因する。Azureのマルチテナント環境では、物理ホストを複数のVMが共有する構造になっているが、ESPパケットの処理中に、暗号化される前のデータ（平文）が特定の共有メモリ領域に一時的に残存する状態が作り出せてしまう。本来であれば暗号化によって外部から読めないはずの通信内容が、共有メモリを通じて平文で見えてしまう可能性がある——これがこの脆弱性の本質だ。影響を受けるのはどの環境か影響を受ける可能性があるのは、以下の条件を満たすAzure環境だ： OSがLinux（WindowsVMは対象外） IPsec ESPトンネルを使用している（VPN接続、サービス間暗号化通信など） Azureのマルチテナント物理ホスト上で稼働している（一般的な仮想マシンはほぼ該当）専有ホスト（Dedicated Host）で完全な物理分離をしている環境はリスクが異なる。ただし「うちはどうだろう」と考える前に、まずパッチを当てるのが最善だ。実務への影響と即時対応ポイントカーネルバージョンの確認と更新まず稼働中のVMのカーネルバージョンを確認する：出典: この記事は CVE-2026-43284: Patch the Linux Kernel xfrm ESP Bug in Microsoft Azure の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Azure

Azure Cloud Shell・DevOpsに同時CVSS 10.0——2026年5月パッチチューズデーは即時対応マスト

2026年5月のパッチチューズデーは、クラウド基盤を狙った深刻な脆弱性が集中した月として記録されるだろう。特に Azure Cloud Shell（CVE-2026-32169）と Azure DevOps（CVE-2026-42826）の2件が、いずれも CVSSスコア 10.0 という最高深刻度の特権昇格（EoP）脆弱性として公開された。現時点で野放し（In-the-Wild）での悪用は確認されていないが、「CVSS 10.0」という数値が示すリスクの高さは、確認を先延ばしにする理由にはならない。今月のパッチチューズデー全体像 Microsoftは今月、自社製品の 137件のCVE に加え、サードパーティ由来の128件を含む265件近い脆弱性に対処した。そのうち 13件が「悪用の可能性が高い（Exploitation More Likely）」に分類されており、事実上の準ゼロデイ群として扱う必要がある。影響範囲は広く、単一製品の問題ではない： Windowsインフラ・ネットワーク層：Netlogon、DNS、Hyper-V、TCP/IP、Remote Desktop、Windows Kernel M365コラボレーション：Teams、SharePoint、Office（Word/Excel/PowerPoint） Azureサービス：Azure DevOps、Logic Apps、Cloud Shell、Machine Learning、Microsoft Entra ID 開発者・管理者ツール：SQL Server、ASP.NET Core、Visual Studio Code、Windows Admin Center CVSS 10.0の2件を最優先で処置せよ CVE-2026-32169 — Azure Cloud Shell 特権昇格 Azure Cloud Shell はブラウザから直接 Azure リソースを操作できる強力なシェル環境だ。この環境で特権昇格が成立すれば、攻撃者はサブスクリプション全体にわたるリソースを掌握できる可能性がある。クラウド管理者が日常的に使うツールだけに、影響の広がりは甚大だ。 CVE-2026-42826 — Azure DevOps 特権昇格 Azure DevOps はCI/CDパイプラインと開発者のコード管理を担うサービス。ここで特権昇格が悪用されれば、ソースコードの改ざんや悪意あるビルドパイプラインの挿入といったサプライチェーン攻撃につながりうる。開発基盤が標的になるという性質上、被害が表面化するまでに時間がかかる点も厄介だ。「悪用の可能性が高い」13件も見逃せない今月注目すべき「Exploitation More Likely」の主要CVE： CVE 対象コンポーネント CVE-2026-33837 Windows TCP/IP ...

Azure

2026年5月パッチチューズデー：120件修正・29件クリティカルRCE、Azure・Copilotまで攻撃面が拡大

2026年5月のパッチチューズデーがリリースされた。今月は120件の脆弱性が修正され、うち29件がリモートコード実行（RCE）のクリティカル評価を受けている。幸いにも今月はゼロデイ（パッチ適用前に悪用が確認された脆弱性）は含まれていないが、DNS・Netlogon・Hyper-V・Office・SharePoint・Copilotと、攻撃対象面の広さは過去最大級だ。「ゼロデイがないから余裕」と判断するのは危険で、今月こそしっかりとした優先度判断と迅速な適用が求められる。脆弱性の全体像今月の修正を種別で整理すると、最も多いのが権限昇格（EoP）の61件で、全体の約半数を占める。続いてRCEが31件、情報漏洩が14件、なりすましが13件、DoSが8件、セキュリティ機能バイパスが6件となっている。数字で語られがちなRCEより、実は権限昇格の件数が突出している点に注目してほしい。RCEは「入口」だが、EoPは「奥に進む手段」だ。攻撃者はRCEで初期侵入し、EoPで権限を拡大し、横展開する。61件というEoPの多さは、侵入後の被害拡大リスクがそれだけ高いことを示している。今月の注目脆弱性 Windows DNS クライアントおよびNetlogon（CVE-2026-41096 / CVE-2026-41089）過去にSigRedやZerologonが引き起こした壊滅的な被害を記憶している方も多いだろう。今月のDNSクライアントおよびNetlogonのRCEは、その類に属する「認証・名前解決スタックへの侵害」が可能な脆弱性だ。ドメイン参加環境では特に優先度を最上位に置くべきである。 Windows Hyper-V（CVE-2026-40402）クリティカル評価の権限昇格。マルチテナント環境やプライベートクラウドでは、ゲストOSからホストOSへのエスケープに使われる可能性がある。影響範囲の広さ（ブラスト半径の大きさ）を考えると、仮想化基盤を運用している企業はすぐに対応してほしい。 Microsoft Office / Word / SharePoint 複数のRCEが含まれる。特にWord文書経由の攻撃は、フィッシングメールと組み合わせることで「メールを受け取った人がファイルを開いただけで侵害される」シナリオが現実になる。日本企業でもWord・Excelは業務の中心にあるだけに、エンドユーザーへの注意喚起もセットで行いたい。 M365 Copilot / GitHub Copilot / Azure Machine Learning 今月の特筆事項のひとつが、AIツール群にも複数の修正が含まれている点だ。M365 Copilot（デスクトップ・Android版）、Visual Studio用GitHub Copilot、Azure Machine Learningノートブックにおいて、なりすましやセキュリティ機能バイパスが修正された。評価はCriticalではなくImportantだが、侮れない。これらのツールはソースコード・社内文書・チャット履歴の近くに常駐しており、攻撃者にとって「情報の宝庫への玄関口」になりうる。 Visual Studio Code VS Codeにも複数の修正（権限昇格・情報漏洩・RCE・セキュリティバイパス）が含まれる。開発者ツールは往々にして企業のセキュリティポリシーの「抜け穴」になりやすい。開発チームへのパッチ適用周知を忘れずに。実務への影響：日本のIT管理者がやるべきこと今週中に対応すべき最優先項目： Windows DNS・Netlogon パッチ——ドメインコントローラーおよびDNSサーバーへの適用を最優先に。ネットワーク境界に露出している環境は特に急ぐ Hyper-V 更新——仮想化基盤を持つ環境ではメンテナンスウィンドウを即日設定する Office / Word パッチ——Microsoft 365 Apps for Enterpriseは自動更新ポリシーを確認。オンプレMSIインストールはWSUSやIntuneで強制配布を SharePoint Server（オンプレ）——クラウドシフトが進んでも残存するオンプレSharePointは見落とされがち。インベントリを確認して中期的に検討すべきこと： EoPが61件という数字は、特権アカウントの常時付与がリスクであることを改めて示している。Just-In-Time（JIT）アクセスの仕組みが整っていない環境では、このタイミングで検討を始めてほしい CopilotやVS Codeの脆弱性修正が常態化してきた。AIツールも通常のITアセットと同様に管理・パッチ適用の対象として扱う体制を整備しておく必要がある筆者の見解今月のパッチ一覧を眺めていて感じるのは、「攻撃対象面の広がりが止まらない」という現実だ。WindowsのDNS・Netlogon・GDIといった古くからの基盤レイヤーから、CopilotやAzure Machine LearningといったAI時代の新しいコンポーネントまで、120件という数字で一括りにされているが、その意味する攻撃面の複雑さはかつてとは比較にならない。とりわけ気になるのがEoPの多さだ。RCEだけを警戒して「入り口を守れば十分」と考える組織はまだ多い。しかし61件のEoPが示すのは、攻撃者がすでに「侵入後の動き方」まで丁寧に研究していることだ。侵入を完全に防ぐことを前提にしたセキュリティ設計——すなわちゼロトラスト的なアーキテクチャと、特権の最小化・JIT付与——を当たり前にしていない組織は、今月の脆弱性のどれかを通じて「侵入後に気づく」未来がすぐそこにある。もう一点。CopilotやVS Codeへの修正が毎月のように含まれるようになってきた。AIツールを業務に組み込むスピードは速いが、それをセキュリティ管理の枠組みに取り込むスピードは追いついているだろうか。「便利だから使う」と「安全に使える仕組みを作る」は車の両輪だ。禁止してもどこかで使われる。それより、正式に管理下に置いて、こういったパッチも漏れなく当たる体制を整える方が、長い目で見て健全だと思う。ゼロデイなしという点は素直に評価したい。一方で120件という件数は、複雑化した現代のエンタープライズITが抱える構造的な課題の現れでもある。毎月のパッチ適用を「作業」として流すのではなく、「今月の脅威ランドスケープの変化」として読む習慣が、担当者の判断力を育てる。 ...

M365

Microsoft 365 2026年5月アップデート：CopilotカレンダーエージェントがAIの「代理行動」時代を切り開く

Microsoft 365の2026年5月アップデートは、AIエージェント機能の実用化という観点でひとつの節目になる月かもしれない。カレンダーを自律管理する新機能を筆頭に、TeamsやSharePointに及ぶ実務直結の改善が一斉展開された。ただし中には「静かに変わっているもの」もあり、IT管理者は今すぐ内容を確認しておきたい。 Copilot Calendar Agent：AIが「代理行動」する時代へ今月最大のトピックは Copilot Calendar Agent の正式展開だ。「ダイレクトレポートとの1on1はすべて承認する」「24時間前を切った招集は辞退する」——こうした自然言語の指示を与えると、Copilotが以降のカレンダー管理を自動で引き受けてくれる。従来のCopilotはあくまで「提案して人間が承認する」流れだった。Calendar Agentはルールに基づいてCopilotが実際にアクションを起こす。これはMicrosoft 365のAIが真の「エージェント」機能を持ち始めたことを意味する。すべての処理は後から確認・修正できるため、突然予定が狂うリスクも自分でコントロールできる。 Outlookでも同月に強化が入っており、長いメールスレッドの要約、フォローアップの提案、会話の全文脈を踏まえた返信草稿生成が追加されている。モバイルの日程調整アシスタントも強化され、スマートフォンから直接会議の提案・仮承認の管理ができるようになった。 Teams：地道だが効く5つの改善 TeamsのMay 2026アップデートは「なぜ今まで動いていなかったのか」という機能が並ぶ。リアルタイム言語翻訳は話者の言語を自動検出してライブキャプションに翻訳を表示する。言語や時差をまたぐチームには即戦力になる機能だ。 DND/フォーカスモードでの通知抑制はWindows 11のDND設定に連動してTeamsの通知を止める。集中作業中にTeamsの通知が割り込む問題はユーザーの長年の不満だったが、ようやく正式対応された。「Transcribe only」オプションは録画を一切作らずに文字起こしだけを取得できる機能だ。映像の保存をコンプライアンス上避けたい企業にとっては待望の機能になる。ほかにも、ミュート会話と会議チャットのサイドバー分離表示、ミニウィンドウ状態でのリアクション操作といった細かいUX改善が含まれる。5月中旬には会議参加前にマイク・スピーカーを事前チェックする機能も追加予定で、「聞こえますか？」確認の時代が終わるかもしれない。 SharePoint：全面リデザインとAI補助ページ作成 UIの刷新とナビゲーション簡素化に加え、ページ作成にCopilotが入った。「こういうページを作りたい」と説明するとCopilotが草稿を生成してくれる。SharePointは長年「使いにくい」と敬遠されがちなプラットフォームだったが、このアプローチは入口の障壁を下げる意味で正しい方向だ。段階的ロールアウト中のため、組織内での展開状況を随時確認しながら社内ドキュメントの更新計画を立てるのがよい。 OneDriveの挙動変更：チームへの周知を急げ 5月初旬から適用されているこの変更は目立たないが影響が大きい。Webブラウザ経由でOneDriveファイルを削除した場合、従来はローカルのゴミ箱にも入っていたが、今後はそうならない。削除したファイルはOneDriveのクラウド側ゴミ箱のみに入る形に変わった。ストレージ消費と同期負荷を削減するための変更ではあるが、「ローカルのゴミ箱から復元できると思っていた」という誤解からデータ紛失が起きやすい。エンドユーザーへの周知を今すぐ行っておきたい。実務への影響 Calendar Agentのルールは最初は限定的に: 「全員からの招集を承認する」のような包括的ルールは予定の詰め込みに繋がりやすい。特定の相手や条件に絞った設定から始めるのが安全だ DND連動はiOS/Android端末での動作を別途確認: Windows 11連動は明記されているが、モバイル端末での挙動は環境によって異なる可能性がある OneDriveの削除ポリシーをヘルプデスク向けに文書化: 問い合わせが増える前に、利用者向けガイドとFAQを更新しておく「Transcribe only」の利用ポリシーを整備: 録画なしの文字起こしが使えるようになると、会議の記録方針を改めて整理する機会になる。組織のコンプライアンス要件と照らして利用ガイドラインを作っておきたい筆者の見解 Copilot Calendar Agentは、ここ数年のCopilotアップデートの中で「使える」と素直に感じた機能のひとつだ。OutlookとCalendarという「毎日必ず触れる場所」にAIを組み込む設計は、Microsoftが持つプラットフォームの強みをきちんと活かしている。こういう方向でのアップデートをぜひ続けてほしい。 MicrosoftはOutlookやTeamsに圧倒的なユーザーベースを持っており、AIが日常業務の中に自然に溶け込む場所として、これほど条件が揃ったプラットフォームは他にない。Calendar Agentはその強みを正確に活かした設計だと感じる。実力は十分にある。その実力が製品の形で届き続けることを期待している。一方で、OneDriveのゴミ箱挙動変更のような「サイレントな破壊的変更」はもったいない。機能価値そのものに問題はなく、変更の意図も理にかなっているだけに、ユーザーへの事前コミュニケーションが薄いのが惜しい。こうした積み重ねが現場の「アップデート不信」に繋がる。変更内容の丁寧な告知体制を整えることは、Microsoftの規模と体制を考えれば十分に実現できるはずだ。 SharePointのリデザインは、長年の課題だった「ちゃんと使われるプラットフォームにする」という方向に踏み込んだ点を評価したい。Copilotによるページ生成はその出発点に過ぎないが、今後の進化に期待したい取り組みだ。出典: この記事は Explore Exciting Enhancements In Microsoft 365 Updates May 2026 の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Surface Pro 12・Surface Laptop 8が5月発表へ——OLED搭載と価格大幅引き上げ、Microsoftの本気度が問われる刷新

海外テクノロジーメディアの NotebookCheck.net が報じたところによると、Microsoftが2026年5月中旬に Surface Pro 12 と Surface Laptop 8 を発表する見通しだ。同報道では、IntelとQualcommの2系統プロセッサーを揃える戦略や、Surface Laptop 8への待望のOLED搭載が伝えられている。一方で、両モデルとも価格が大幅に引き上げられることも報じられており、注目と懸念が入り交じる情報が並んでいる。 IntelとQualcommの2系統戦略 NotebookCheck.netの報道によると、今回のラインナップは Intel Panther Lake と Qualcomm Snapdragon X2 という異なるプロセッサーを軸に構成される見通しだ。Snapdragon X系は昨年のSurface Pro 11・Laptop 7で大々的に採用されたCopilot+ PC対応のARMアーキテクチャ。これに加えてIntel Panther Lakeを段階投入することで、従来のx86アプリ互換性を重視するユーザー層も取り込む狙いがあると見られる。 ARMとx86の両輪体制は、AppleのM系チップ一本化とは対照的なアプローチだ。互換性の幅を広げるメリットがある反面、製品ラインナップが複雑になり、ユーザーが自分に合ったモデルを選びにくくなるリスクも伴う。 Surface Laptop 8に待望のOLEDディスプレイ今回の報道で特に注目されるのが、Surface Laptop 8へのOLED搭載だ。Surface Laptop シリーズはこれまでIPS液晶を採用し続けており、ハイエンドノートPC市場でOLEDが標準化しつつある中、Microsoftの対応は遅れ気味だった。NotebookCheck.netが伝えるOLED搭載が事実であれば、コントラスト比・黒の再現性・消費電力効率の面で大幅な改善が期待される。ただし、OLEDパネルの採用コストは一般的に液晶より高く、これが後述する価格引き上げの一因になっている可能性は高い。価格は大幅引き上げ——両モデルで1,299〜1,499ドルスタート NotebookCheck.netの報道では、Surface Pro 12は 1,299ドル、Surface Laptop 8は 1,499ドルからのスタートと伝えられている。前世代モデルと比較すると、価格帯は明らかに上昇しており、プレミアムセグメントへのシフトが顕著だ。米ドル建ての価格上昇に加え、昨今の為替環境を踏まえると、日本市場での実売価格はさらに割高になる見込みだ。為替レートにもよるが、Surface Laptop 8の最安モデルは22〜25万円前後に達する可能性もある。日本市場での注目点発売・入手時期: Microsoftは例年、米国発表から数週間以内に日本市場へ展開しており、発表が5月中旬であれば6月中の国内発売も視野に入る。ただし、日本向けラインナップの絞り込みには注意が必要で、特定の構成が国内未発売になるケースは過去にも見られる。競合との比較: 価格帯が1,299〜1,499ドル（約19〜22万円以上）となると、Apple MacBook AirのM4モデルや、ASUS・Lenovoのプレミアムラインと直接競合する。OLED搭載が実現すれば差別化の柱になり得るが、Windows on ARM特有のソフトウェア互換性問題がまだ完全に解消していない点は、エンタープライズ用途での選定において引き続き検討事項となる。 Copilot+ PC 認定: Snapdragon X2搭載モデルはNPU要件を満たしCopilot+ PC認定を受ける見込みで、Windows StudioエフェクトやリコールといったオンデバイスAI機能が利用可能になる。Intel Panther LakeモデルについてもNPUを統合しており、認定取得は有力視されている。 ...

生成AI

AIが「聴きながら話す」時代へ——Thinking Machines Labのフルデュプレックスモデルが変える対話体験

AIとの対話が「テキストのやり取り」から「電話の会話」へと変わろうとしている。元OpenAI最高技術責任者（CTO）のMira Murati氏が昨年設立したThinking Machines Labが、2026年5月に「インタラクションモデル（interaction models）」と称する新しいアーキテクチャを発表した。現時点では研究プレビューの段階だが、AIの対話設計に対する根本的な問い直しとして注目に値する。ターンテイキング型AIの根本的な限界現在のすべてのAIモデルは「ターンテイキング」方式で動作する。ユーザーが話す→AIが聞く→AIが応答する→ユーザーが聞く。文章チャットなら許容できるこのリズムも、音声対話では致命的な違和感になる。まるでボイスメールに吹き込んでいるような一方通行感——これは実装の問題ではなく、モデルのアーキテクチャに起因する構造的な制約だ。フルデュプレックスとは何か「フルデュプレックス（full duplex）」は送受信を同時に行う通信方式で、固定電話や携帯電話がその代表例だ。Thinking Machines Labはこの概念をAIモデルに持ち込み、ユーザーの入力を受け取りながら同時にレスポンスの生成を始めるアーキテクチャを構築している。同社が発表したTML-Interaction-Smallは0.40秒での応答を実現しており、人間の自然な会話リズムとほぼ同等の速度とされる。同社の主張では、OpenAIやGoogleの比較可能なモデルより大幅に高速だという。最大の違いは「割り込み」が自然にできることだ。人間同士の会話では相手の発話途中で反応したり相槌を打ったりするが、現在のAIはそれを苦手としている。フルデュプレックスモデルはこの非同期性をアーキテクチャレベルでネイティブサポートする。現時点での位置づけと注意点重要な留意点として、これはあくまでリサーチプレビューであり、一般公開はされていない。今後数ヶ月以内に限定リサーチプレビューが始まり、本年中に広く公開される予定とのことだ。ベンチマーク数値は印象的だが、実際のユーザー体験がそれに見合うかどうかは、一般公開されて初めて評価できる。実務への影響——日本のIT現場では何が変わるか日本でも音声インターフェースへの関心は高まっており、コールセンターの自動化や会議議事録生成、社内ヘルプデスクの音声AIなど、実装が進む分野は多い。フルデュプレックス技術が実用レベルに達した場合、以下のような変化が期待できる。コールセンターAI: ユーザーの発話を遮断せず、自然なやり取りが可能になる。現行システムの「お話が終わりましたら話しかけてください」という不自然な案内が不要になる。会議支援: リアルタイムで「聞きながら」ファクトチェックや議事メモを生成できる。会話の文脈が切れないまま情報補完が進む体験は、現行のポーリング型AIとは質的に異なる。教育・トレーニング: 相槌や間の取り方も含めた、より人間に近い学習体験が実現しやすい。語学学習や営業ロールプレイへの応用が期待できる。なお、日本語の音声認識精度や文化的な「間」の扱いは英語前提モデルとは最適化の方向が異なる。国内での実用化には日本語特有のチューニングが別途必要になる点は意識しておきたい。筆者の見解 AIエージェントの本質的な価値は「自律性」にある。ユーザーが発話するたびに処理を止めて待つ設計は、AIが人間のペースに従属するという前提を前提に組み込んでいる。フルデュプレックスはその制約を技術的に取り除く試みであり、方向性として非常に理にかなっている。自律的なエージェントが判断・実行・検証を繰り返すループを設計する観点から見ると、インタラクションレイヤー自体が「ターンベース」のままでは本来の力を引き出しにくい。今回の発表はその問題に正面から向き合っている点で評価できる。一方で、0.40秒という数値が印象的でも、会話の「文脈理解の深さ」や「割り込みのタイミングの適切さ」は数値には現れない。技術デモとプロダクトの間には常に大きな溝がある。Thinking Machines Labが「研究プレビュー」という段階を経てプロダクト化するアプローチは堅実で、そのプロセスを注視したい。 AIとの対話体験がどう設計されるか——それはエンジニアが考える以上にユーザーの信頼形成に直結する。フルデュプレックスが実用化されたとき、それが「本当に会話している」という感覚をもたらすかどうか、一利用者として楽しみに待っている。出典: この記事は Thinking Machines wants to build an AI that actually listens while it talks の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

Swiftで一から作るLLMトレーニング：Apple Siliconの行列演算をGflop/sからTflop/sへ引き上げる最適化の全貌

Apple Siliconを搭載したMacが広く普及した今、「ローカルでLLMをトレーニングしてみたい」と考えるエンジニアは少なくないはずだ。そんな挑戦に真正面から取り組んだブログ連載記事「Training an LLM in Swift」が、HackerNewsで大きな注目を集めている。ライブラリもフレームワークも使わず、純粋なSwiftコードでGPT-2互換モデルをトレーニングし、行列演算のスループットをGFlop/s（ギガフロップ）からTFlop/s（テラフロップ）——すなわち1000倍以上——へ引き上げた記録だ。機械学習の心臓部：行列乗算とは何か LLMの学習は「フォワードパス（推論）」と「バックワードパス（誤差勾配計算・重み更新）」で構成される。この両フェーズで支配的な計算コストを占めるのが行列乗算（Matrix Multiplication）だ。数十億パラメータを持つ現代のLLMでは、1ステップのトレーニングで膨大な行列積が実行される。行列乗算を速くすることが、そのままLLMトレーニングの高速化に直結する。本連載がベースラインとするのは、Andrej Karpathy氏が公開したllm.c（約1,000行のC言語によるGPT-2互換実装）だ。「Swiftで同じことをやって、C言語より速くしてやろう」という挑戦的なモチベーションが出発点となっている。最適化の4段階：CPU→SIMD→AMX→GPU 記事では行列乗算の最適化を段階的に積み上げていく過程が丁寧に解説されている。 1. ナイーブ実装（GFlop/s台）最初の三重ループによる実装はスカラー演算に依存しており、性能は低い。出発点として計測値を取り、改善幅を可視化するための基準となる。 2. SIMD（Single Instruction, Multiple Data） SwiftはSIMD型を標準サポートしている。一度の命令で複数の浮動小数点数を並列処理することでCPUの演算ユニットを効率的に活用でき、ナイーブ実装から大幅に性能が向上する。 3. AMX（Apple Matrix coprocessor） Apple Siliconに搭載されたAMXは、行列演算に特化した専用ユニットだ。公式ドキュメントはほぼ存在しないが、研究者やエンジニアの逆解析によりその活用法が知られるようになっている。AMXを使いこなすことで、SIMDをさらに大きく超える性能向上が得られる。 4. Metal（GPU）最後の切り札がGPUだ。AppleのGPUプログラミングフレームワークMetalを使ったShaderコードも紹介されており、GPU並列演算によって最終的にTFlop/sという領域に到達する。実務への影響：ローカルLLMの可能性が広がるこの記事が示すのは単なる学術的な実験ではない。Apple Siliconを搭載したMac上で、現実的なコストでローカルLLMをトレーニングできるというポテンシャルだ。日本のエンジニア・IT管理者にとって押さえておきたいポイントを整理する。プライバシー・コンプライアンスへの対応: クラウドAPIへのデータ送信に制約がある業界（医療・金融・法務）では、ローカルでの推論やファインチューニングが重要な選択肢になる。Apple SiliconのMacはそのための現実的なプラットフォームになりうるフレームワークの内側を理解する価値: PyTorchやTensorFlowのような高レベルフレームワークは便利だが、内側で何が起きているかを知らないと性能の壁にぶつかった際に対処できない。「ライブラリなし実装」は学習コストが高いが、深い理解を得る最短ルートでもある Swiftの実力を再評価: iOSアプリ開発の言語というイメージが強いSwiftだが、システムプログラミング領域でもC言語と同等のパフォーマンスを達成できることをこの記事は実証している筆者の見解 AIエージェントや生成AIの実装に深く関わっていると、「結局のところLLMの中で何が動いているか」という問いに向き合う機会が増えてくる。本記事のような「基礎から組み上げる」アプローチは、高レベルAPIを呼び出すだけの実装では得られない本質的な理解をもたらしてくれる。 Karpathyのllm.cが「何も隠さない実装」として広く支持されている理由も同じだ。抽象化のレイヤーを剥がして初めて、なぜ特定の設計判断が性能に効くのかが見えてくる。日本のエンジニアコミュニティで気になるのは、次々と登場する新技術の「情報を追いかける」ことに忙しすぎて、「実際に手を動かして理解を深める」ことが後回しになりやすい傾向だ。本記事のような深掘りコンテンツこそ、積極的に手を動かして試す価値がある。情報の量を増やすよりも、一つの実装を深く理解する経験の方が、今の時代には圧倒的に価値が高いと考えている。ローカルLLM、Apple Silicon最適化、Swiftシステムプログラミング——いずれも今後さらに注目度が上がる領域だ。次回以降の連載でAppleのフレームワーク群（Core ML、Metal Performance Shaders等）との比較評価が行われる予定とのことで、続きも楽しみにしている。出典: この記事は Training an LLM in Swift, Part 1: Taking matrix mult from Gflop/s to Tflop/s の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

AWS統合でAIエージェントが企業に根付く——Claude Platform on AWS一般提供開始の意義

AWS上でClaude Platformが一般提供（GA）を開始した。AWS IAMによる認証、CloudTrailによる監査ログ、AWSの統合請求という「エンタープライズ三点セット」をそのまま活用しながら、AIエージェント開発の最前線機能が使えるようになった。クラウドネイティブな企業にとって、AIエージェント本格導入の最大の壁が一つ取り除かれた形だ。 AWS統合で何が変わるかこれまでAnthropicのAPIを企業で使う場合、IAMとは別の認証情報管理、独立した請求、そして監査ログの分断という課題があった。Claude Platform on AWSはこの課題を正面から解決する。認証: AWS IAMポリシーで制御。既存のロール設計・権限管理がそのまま適用される監査ログ: AWS CloudTrailに記録。セキュリティチームが普段使っているツールで追跡可能請求: AWSの統合請求書に含まれ、既存のコミットメント（Reserved CapacityやSavings Plans等）の消化にも充当これは単なる利便性の話ではない。大企業やパブリックセクターでは、「別のベンダーとの直接契約」「別の認証基盤」「別の監査証跡」というだけで導入が数ヶ月単位で止まることが珍しくない。その壁を取り払うインパクトは想像以上に大きい。使える機能の全体像 Claude Platform on AWSで利用可能な主な機能は以下の通りだ。機能概要 Claude Managed Agents エージェントのビルド・スケール展開（ベータ） Advisor strategy エージェントにアドバイザーモデルを付与してインテリジェンスを強化（ベータ） Web search / Web fetch リアルタイムのWeb情報でコンテキストを補完 Code execution PythonコードをAPIコール内で直接実行・可視化 Files API 会話をまたいだドキュメント参照（ベータ） Skills ベストプラクティスを学習させて一貫した出力を実現（ベータ） MCP connector クライアントコード不要でリモートMCPサーバーに接続（ベータ） Prompt caching 繰り返しコンテキストのコスト・レイテンシ削減 Citations ソース文書に根拠を紐付けたレスポンス生成 Batch processing 大量の非同期ワークロード処理利用可能モデルはClaude Opus 4.7、Sonnet 4.6、Haiku 4.5で、今後の新モデルもリリース当日から使えるという。なお、Amazon Bedrockでも引き続きClaudeは利用可能だが、そちらはAWSがデータプロセッサーとなる構成だ。Claude Platform on AWSはAnthropicのネイティブAPIへのアクセス層がAWSになるという点で性格が異なる。データ処理の責任主体がどこにあるかは、コンプライアンス要件に応じて使い分けが必要になる。 Claude Managed AgentsとAdvisor strategyが示す方向性今回の発表で特に注目したいのがClaude Managed Agentsだ。エージェントをスケールさせて「ビルドして展開する」という設計思想が明確に打ち出されている。 ...

Windows

OfficeのCopilot、サイドバーを卒業　Word・Excel・PowerPoint・Outlookにネイティブ統合UIが登場

MicrosoftがWord、Excel、PowerPoint、OutlookにおけるCopilotのアクセス方法を大きく刷新している。これまでの「サイドバーを開いて対話する」スタイルから、アプリ本体にネイティブ統合された直感的なエントリーポイントへの移行が進められている。UIの改善はCopilot普及の起爆剤になり得るか、注目が集まる。サイドバーからネイティブ統合へ従来のCopilotは画面右側にパネルとして展開するサイドバー方式を採用していた。ユーザーがAI機能を呼び出すたびに作業コンテキストを離れる必要があり、「邪魔」「流れが途切れる」という声は発表当初から絶えなかった。今回のアップデートはこの構造を根本から見直す。Word・Excel・PowerPoint・Outlookそれぞれに「簡略化されたエントリーポイント」を導入し、作業中の文書やデータから離れることなくAI機能を呼び出せる設計へと変わる。Copilotが「添付ツール」ではなく「Officeそのもの」として動作する体験を目指したものだ。なぜこれが重要か AIアシスタントの実効活用率は「呼び出しやすさ」に大きく依存する。いくら機能が優れていても、ユーザーが「使う気になる」UIでなければ定着しない。その意味で、サイドバー方式はAIを日常業務に溶け込ませるという目標と構造的に相性が悪かった。 Microsoftが今回目指しているのは、CopilotをOfficeの「オプション機能」ではなく「もともとそこにあったもの」として感じさせるユーザー体験だ。これはAI機能の統合における成熟度を示す重要なシフトであり、ユーザーの習慣形成にも直結する変化と言える。実務への影響 IT管理者・情報システム担当者向け展開は Microsoft 365 テナントへの段階的ロールアウトが想定される。タイミングは Microsoft 365 管理センターの「メッセージセンター」で随時確認を UIが変わることで「使い方がわからない」という問い合わせが一時的に増える可能性がある。ヘルプデスク向けの簡易ガイドを事前に準備しておくと対応が楽になる Copilot機能の表示範囲は「Microsoft 365 Copilot」ライセンスの有無で異なる。無償ユーザーと有償ユーザーで見えるUIが変わるため、社内の混乱を避けるためにライセンス構成の整理と周知を推奨するエンジニア・パワーユーザー向け Excel での Copilot は数式生成・データ分析補助としてすでに評価されている部分がある。アクセスが簡単になれば日常業務でのトライアルハードルが下がり、ユースケースの発見が加速するはずだ Outlook での統合は英語メールの作成補助や予定調整の効率化に直結する。グローバル対応が多い業務環境では特に恩恵が大きい Word では長文ドキュメントの要約・構成提案をより素早く呼び出せるようになる。議事録・仕様書・提案書の作成フローへの組み込みを試してみる価値がある筆者の見解 Copilotは登場から今日まで、機能の磨き込みとUXの「届かなさ」のギャップがずっとついてまわってきた。今回のネイティブ統合への移行は、そのギャップを埋めようとする方向性としては正しい一歩だと思っている。「サイドバーを開かなければAIが使えない」という体験は、AIをワークフローの中心に置くという思想と真逆の構造だった。それを変えようとしているのは、評価できる判断だ。ただ、一点だけ率直に言わせてほしい。入り口を改善しても、実際の回答品質・精度が日常業務の水準に届かなければ、印象は逆に悪化しかねない。「すぐ目に入る場所に置いたのに使えない」という体験は、遠いサイドバーの中で完結していたときよりも摩擦が大きい。 Microsoftにはこの刷新を機に、UIだけでなく回答品質の底上げも本気で追ってほしい。強固なインフラ、エンタープライズセキュリティ、Office エコシステムとの統合という土台は、他に代えがたい強みを持っている。その強みをCopilotが本来の形で活かせるようになれば、話は大きく変わる。この変化が「Copilotが変わった」と言われる転換点になることを、期待を込めて注視している。出典: この記事は Microsoft streamlines access to Copilot in Word, Excel, PowerPoint and Outlook の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

GitHub Mobileがリポジトリ作成に対応——スマホだけでプロジェクトの第一歩が踏み出せる時代へ

GitHubのモバイルアプリが、開発者にとって待ち望んでいた機能を手に入れた。最新のGitHub Mobileでは、スマートフォンやタブレットから直接新しいリポジトリを作成できるようになった。「アイデアが浮かんだらすぐに形にしたい」という開発者の声に応える、地味だが確実に効く機能強化だ。 GitHub Mobileのリポジトリ作成機能とはこれまでGitHub Mobileでは、既存リポジトリの閲覧やIssueへのコメント、Pull Requestのレビューといった操作は可能だったが、新しいリポジトリをゼロから作成する機能は備わっていなかった。今回のアップデートにより、モバイルアプリから直接リポジトリ名・説明・公開設定（Public/Private）を指定してプロジェクトを立ち上げられるようになった。操作は直感的で、アプリ内のナビゲーションから「新しいリポジトリ」を選択し、必要な情報を入力するだけ。READMEの初期化や.gitignoreテンプレートの選択、ライセンスの設定も画面上で完結する。なぜこれが重要か開発の現場では「PCの前にいるときだけが作業時間」という概念がすでに崩れ始めている。通勤中や外出先でアイデアが降ってきたとき、メモアプリに書き留めて「あとでPCで」となるのが従来のフローだった。 GitHub Mobileがリポジトリ作成に対応したことで、アイデアの着想からプロジェクトの起点作成までがスマホ一台で完結する。特にソロ開発者やフリーランス、副業エンジニアにとって、素早いプロトタイピング文化の醸成に寄与するアップデートと言える。さらに、クラウドIDEやAIコーディングアシスタントとの組み合わせを考えると、「リポジトリを作る→コードを書く→PRを出す」という一連のフローがモバイル環境でも現実的になりつつあることを示している。開発ツールのモバイルファースト化は、もはや流行ではなく着実な潮流だ。実務での活用ポイント素早い「場所取り」から始めるアイデアが浮かんだらすぐにリポジトリを作成し、名前とREADMEだけでも書いておく。「後でPCで作ろう」と思って忘れるより確実に、プロジェクトの存在を記録できる。チーム招集の起点に活用するリポジトリ作成後、すぐにCollaboratorsを招待する操作もモバイルで可能だ。会議やブレインストーミングの場でその場でプロジェクトを立ち上げ、参加者を巻き込む使い方が現実的になった。初期Issueの登録まで一気に流す GitHub ProjectsやIssueもモバイルから操作できるため、リポジトリ作成→初期Issueの登録という流れをその場で完結させられる。「あとでやる」を排除できる。 Organizationリポジトリの権限設定には注意組織（Organization）配下にリポジトリを作成する場合は、公開設定やアクセス権限が意図通りになっているかを必ず確認すること。スマホの小さい画面でも設定ミスは十分起こり得る。Organization管理者はモバイル操作のリスクについてチームに周知しておくと安心だ。筆者の見解こういう「派手ではないが確実に使える」アップデートが、実は一番嬉しい。大型のAI機能発表も大切だが、「あ、これ普通に便利じゃん」と感じさせてくれる改善こそが、日常のワークフローに静かに溶け込んでいく。日本の開発現場では、いまだに「開発環境＝デスクトップPC一択」という感覚が残っているケースも多い。しかし実際には、アイデアの発散や初期設計の議論、軽いコードレビューはすでにモバイルで十分こなせる時代になっている。ツールが整ってきているのに、使う側の習慣が追いついていないとしたら、もったいない話だ。モバイルを「サブ端末」ではなく「並列作業端末」として位置づけ直す。そのための小さくて確かな一歩が、今回のアップデートだと思っている。情報を追いかけるよりも、実際に手を動かしてワークフローに取り入れてみるのが、今の時代の正しい向き合い方だろう。出典: この記事は GitHub Mobile now lets you build new projects on the fly の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

OpenAI「Daybreak」発表——フロンティアAIがサイバーセキュリティワークフローの自動化を加速

OpenAIが新たなサイバーセキュリティ向けAIツール「Daybreak」を発表した。同社のフロンティアモデルとCodexをエージェント実行レイヤーとして組み合わせ、脆弱性の特定・検証・修復を従来より大幅に高速化するという。AIがいよいよセキュリティ運用の中核に踏み込んできた。 Daybreakとは何か Daybreakは、OpenAIのフロンティアAIモデルを基盤とし、コード生成・実行能力を持つCodexをエージェント層として活用するセキュリティ特化型のシステムだ。セキュリティチームがこれまで手作業で行ってきた「脆弱性スキャン → 再現確認 → 修正コード作成 → 検証」という一連のサイクルを、AIエージェントが自律的に実行することを目指している。具体的には以下の3フェーズをAIが担う： Identify（特定） — コードベースやインフラ構成から脆弱性を発見する Validate（検証） — 発見した脆弱性が実際に悪用可能かどうかを確認する Remediate（修復） — 問題のあるコードや設定の修正提案・実行を行うセキュリティ運用の何が変わるか従来のセキュリティ運用では、スキャナーが大量のアラートを吐き出し、アナリストが一件ずつトリアージするという非効率なサイクルが常態化していた。中規模以上の組織では「アラート疲れ（alert fatigue）」が深刻な問題となっており、本当に危険な脆弱性が埋もれてしまうリスクが長年指摘されてきた。 AIエージェントが検証フェーズも担うことで、「実際には悪用不可能な疑陽性（false positive）」を事前に除外し、本当に対処すべきリスクだけを人間のチームに届けられる。これは単なる効率化ではなく、セキュリティの質そのものの向上につながる。また、修復フェーズにおける自動コード生成は、セキュリティエンジニアとアプリ開発チーム間のコミュニケーションコストを大幅に削減する可能性がある。実務への影響——日本のIT現場の視点から日本の多くの企業では、セキュリティ専任チームのリソースが慢性的に不足している。ペネトレーションテストを外注し、報告書が届いても対応しきれずに次の監査を迎える——というパターンは珍しくない。 Daybreakのようなアプローチが普及すれば、以下の変化が期待できる：継続的な脆弱性検証の自動化: 定期的なペンテストの代替・補完として、常時稼働のAIエージェントが監視を担う Non-Human Identity（NHI）管理との連携: サービスアカウントやAPIキーなどのNHIに起因する脆弱性を自動で特定・修正するフローが現実的になるセキュリティ負債の解消加速: 「対応すべき脆弱性は分かっているが、開発リソースが割けない」という課題に対し、修復コードの自動生成が突破口になりうる導入を検討する際には、AIが生成した修復コードの人間によるレビュープロセスを必ず設けること、そしてCI/CDパイプラインへの統合を段階的に進めることが重要だ。AIを「全自動で任せる」のではなく、「人間の判断を加速するアシスタント」として位置づけるのが現時点では堅実なアプローチになる。筆者の見解率直に言えば、セキュリティという分野はどちらかというと不得意なジャンルだ。しかし技術的な興味は別の話で、今回のDaybreak発表は注目に値すると感じている。特に興味深いのは「Validate（検証）」フェーズをAIが担う点だ。脆弱性を見つけるだけなら既存のSAST・DASTツールでもできる。しかし「これは本当に悪用できるのか？」を自動的に確認できれば、セキュリティチームの判断コストが劇的に下がる。アーキテクチャとして筋のよいアプローチだと思う。一方で、AIが「修復した」コードが別の脆弱性を生んでいた、というケースは十分ありうる。認証・認可ロジックのような繊細な領域では、AIの修正提案を鵜呑みにするのは危険だ。「AIが確認したから安全」という過信が、むしろセキュリティの盲点を生むリスクには常に注意が必要になる。ゼロトラストを基本とした多層防御の文脈で使うなら、Daybreakのような自動化ツールは強力な補完になりうる。ただし、ツールを入れれば終わりではない。「仕組みとして継続的に回せる状態」にするための設計と運用プロセスこそが、最終的な差別化要因になる。道具は整ってきた。あとはそれをどう組み合わせて回すか——結局はここに尽きる。出典: この記事は OpenAI announces Daybreak to bring frontier AI into cybersecurity workflows の内容をもとに、筆者の見解を加えて独自に執筆したものです。

ソーシャルニュースの伝説「Digg」が復活——今度はAIニュース特化型アグリゲーターとして再スタート

かつてインターネット上のニュース文化を形作った「Digg」が、またしても新たな姿で帰ってきた。Engadgetが2026年5月12日に報じたところによると、今回Diggが選んだ方向性はAIニュースに特化したアグリゲーターだ。共同創業者のKevin Rose氏がCEOとして復帰し、サービスの再構築を指揮している。なぜ今、AIニュースアグリゲーターなのか「インターネットにはかつてないほどのノイズがある。そのなかからシグナルを拾い出せる人間の価値は、かつてないほど高い」——これがRose氏の言葉だ。 AIを取り巻く情報環境は、現在まさに「最もノイズが多く、最もスピードが速い領域」である。毎日のように新モデルが発表され、プレプリント論文が積み上がり、各社のブログ投稿、X上の熱狂的なスレッドが飛び交う。この濁流のなかで「何が本当に重要な情報か」を判断するコストは、個人の許容範囲を超えつつある。 Diggが提示する解決策は、人間キュレーターの集合知だ。X（旧Twitter）のソーシャルグラフをベースに、AIの研究・投資・メディア分野で直接関与する1,000人をリスト化し、その発信をアグリゲートする。誰をフォローしているのか Engadgetの報道によれば、リストの筆頭にはOpenAIのSam Altman氏が並び、Elon Musk氏、OpenAI創設メンバーのAndrej Karpathy氏、Google DeepMindのChief ScientistaであるJeff Dean氏、AIの先駆者Yann LeCun氏、元Google Cloud AI Chief ScientistのFei-Fei Li氏といった錚々たる顔ぶれが並ぶ。AI業界の「一次情報源」に近い人物たちを網羅しており、単純なRSS収集ではなく人のキュレーションを起点にした設計が特徴だ。サービスは現在 di.gg にてアルファ版として稼働中。将来的にはdigg.comへ移行予定とされているが、時期は未定だ。過去の失敗とボット問題今回は「再々起動」でもある。Diggは2026年1月にオープンベータを開始したが、わずか2か月で閉鎖を余儀なくされた。Engadgetの報道によれば、原因はSEOスパマーによる大規模なボット攻撃だ。当時のCEOであるJustin Mezzell氏は「投票やコメントの信頼性が担保できない状態になった」と認めていた。 Rose氏の最新の発表では、今回どのようにボット対策を講じているかは明かされていない。アルファ版という形での静かな再始動は、前回の失敗を踏まえた慎重なアプローチとも取れる。日本市場での注目点 Diggは現時点では英語圏向けのサービスで、日本語コンテンツへの対応は不明だ。ただし、AI業界の一次情報を英語で追いたい日本のエンジニア・研究者にとっては、有力な情報収集ツールになりうる。競合サービスとしては、HackerNews（Y Combinator系のキュレーションフォーラム）や、各種RSSリーダー＋AIフィルタリングの組み合わせが挙げられるが、「AIコミュニティのKOLに絞ったキュレーション」という切り口は差別化要素になりうる。 AIニュースを自動集約するサービス自体は国内外で乱立しているが、Diggのように人のソーシャルグラフを明示的なシグナルとして使うアプローチは少ない。筆者の見解正直なところ、今のAI業界は「情報を追い続けること」自体がひとつの消耗戦になっている。新しいモデル、新しい発表、新しい論文——それらを全部追いかけても、実際に手を動かして成果を出す時間が削られるだけという本末転倒に陥りやすい。 Diggが目指す「シグナルの抽出」は、この問題に対する一つの答えとして理にかなっている。Sam Altman氏やYann LeCun氏といった「本当に現場にいる人たち」が注目しているものだけを見るという設計は、スマートなノイズカットの方法論だ。ただし、懸念もある。1,000人のリストが「Xのソーシャルグラフ」ベースである以上、そのリストの多様性や偏りは問われるべき問題だ。英語圏・米国中心のAI言説が強化されるリスクがある。また、前回のボット問題をどう克服したかが非開示のままというのは、アルファ版とはいえ再利用を迷わせる要因になる。 Diggは今も「実験中のサービス」だが、情報過多の時代に「人のフィルタリング能力」を再評価しようとする試みは、着目に値する。AI情報を日常的に追っているエンジニアなら、一度 di.gg を試してみる価値はあるだろう。出典: この記事は Digg is back again, this time to aggregate AI news の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

Gemini 3.1 Ultra、200万トークンで業界最高水準へ——超長文脈AIはエンタープライズをどう変えるか

Googleが「Gemini 3.1 Ultra」を発表した。最大200万トークンのコンテキストウィンドウを持ち、テキスト・画像・音声・動画のすべてをネイティブに扱える今年最大規模のモデルリリースだ。エンタープライズ向け長文脈処理において、業界の基準を大きく塗り替える可能性がある。 200万トークンとは何を意味するか 200万トークンという数字はピンと来にくいかもしれないが、実務に当てはめると感覚がつかみやすい。文庫本に換算すると約2,000〜2,500ページ分に相当企業の内部文書なら数百本の報告書を一度のプロンプトに詰め込める 1時間超の会議録音や長編動画も丸ごと1プロンプトで処理できる水準従来のモデルは長い文書を扱う際、「チャンク分割」と呼ばれる分割処理が必要だった。文書をいくつかのブロックに切り出してAIに順番に読ませ、回答を統合する——という手間のかかる前処理が必要だったのだ。200万トークンのコンテキストはその制約を大幅に緩和する。ネイティブマルチモーダルが何を変えるか今回のリリースでもう一つ注目すべき点は、マルチモーダル処理が「ネイティブ」であることだ。これまでの多くのマルチモーダルAIは、音声や画像を一度テキストに変換してからLLM（大規模言語モデル）が処理するパイプライン構造を採っていた。変換のたびに情報が落ちるリスクがあり、遅延も生じる。Gemini 3.1 Ultraはこの中間変換を排除し、テキスト・画像・音声・動画を「同じ土台の上で」処理できる設計になっているという。実務への影響は大きい。たとえば：設計図（画像）＋仕様書（テキスト）＋会議録（音声）を一度にインプットとして扱える動画マニュアルを動画のまま分析し、テキスト手順書と照合できる映像・音声証跡を含む監査業務の自動化が現実的なラインに近づく実務への影響——日本のエンジニア・IT管理者にとっての意味 1. RAG設計の見直しが必要になるかもしれないコンテキストウィンドウが大きくなると、従来のRAG（Retrieval-Augmented Generation）設計が変わる。「必要な部分だけ検索して詰め込む」アーキテクチャは、全文をそのままコンテキストに入れられる場合には過剰設計になりうる。コスト・速度・精度のバランスを再評価するタイミングだ。 2. コスト構造を必ず確認する 200万トークンのコンテキストは強力だが、それだけAPIコストも高くなる。実際に利用する前に1リクエストあたりの単価と業務のトークン使用量を見積もり、ROI計算を済ませてから導入を判断してほしい。大きなコンテキスト＝大きなコスト、という前提で設計すること。 3. 長文処理が得意な業務ユースケースを洗い出す法律・医療・製造業の技術文書、大規模プロジェクトの要件定義書、マルチメディアを含む監査ログ——これらは長文脈モデルの恩恵を受けやすい領域だ。社内でそういった業務の棚卸しをしてみると、活用可能性が見えてくる。 4. セキュリティ・データガバナンスの検討は必須大量の社内文書をそのままクラウドAPIに送る構造になるため、機密情報の取り扱いルールと、どのデータをどのAPIに送ってよいかのガバナンス整備が前提条件になる。先に仕組みを作ってから使い始めること。筆者の見解コンテキストウィンドウの拡大競争は、ここ1〜2年で急速に加速してきた。数ヶ月前に「驚異的」と言われていた数字が、あっという間に当たり前になる。技術の進化ペースとしては正直、ついていくのが大変だ。ただ、今回のGemini 3.1 Ultraについては「数字のインパクト」と「実務での実力」を分けて考える必要があると思っている。200万トークンというコンテキストの大きさは確かに業界最高水準の数字だ。しかし実際の現場で問われるのは、その広大なコンテキストの中から必要な情報を正確に抽出できるかどうか、つまり「Lost in the Middle」問題をどこまで克服しているか、だ。コンテキストが長くなればなるほど、モデルが文書の中盤に書かれた情報を読み落とす傾向があることは複数の研究で示されている。また、ネイティブマルチモーダルの設計思想は評価できる。変換レイヤーを挟まないことで情報損失を減らすというアプローチは、エンジニアリング的に正しい方向性だと思う。エンタープライズの観点では、「コンテキストが大きいAI」の登場は、これまで技術的制約によって諦めていた業務自動化の再検討を促すきっかけになる。特に法律・会計・製造業の複雑なドキュメント処理については、真剣に評価する価値がある。 AIを導入する側の企業に言いたいのは、発表スペックに踊らされず、自社の具体的なユースケースで評価してほしいということだ。モデルの優劣は一般的なベンチマークではなく、自社業務への適合度で決まる。情報を追うより、実際に使って成果を出す経験を積む——それが今のAI活用で最も正しい行動だと、筆者は一貫して考えている。出典: この記事は Google Launches Gemini 3.1 Ultra with 2 Million Token Context Window の内容をもとに、筆者の見解を加えて独自に執筆したものです。

生成AI

ペンタゴンがSpaceX・OpenAI・Googleら7社とAI大型契約締結——「エージェントAI本格運用時代」の幕開けを告げる歴史的転換点

米国防総省（ペンタゴン）が、SpaceX、OpenAI、Google、Nvidia、Microsoft、AWS、そして複数のスタートアップと大規模なAI契約を締結した。軍を「AIファースト戦闘組織」へ変革するという宣言を伴うこの動きは、民間AI企業と防衛省の間で史上最大規模の正式提携となる。単なる政府調達の話ではない——AI産業全体が「実験フェーズ」から「実戦運用フェーズ」へ完全に移行したことを象徴する出来事だ。「エージェントAIへの大転換（Agentic Pivot）」が始まった今回の動きと同時期に開催されたIBM Think 2026カンファレンスのキーワードも「エージェントAI」だった。これは偶然ではない。2026年のAI業界全体で、共通したパラダイムシフトが起きている。これまでのAIの主役は「生成AI」——テキストや画像を作り出すモデルだった。しかし今、産業の関心は「エージェントAI」へ移っている。エージェントAIとは、単に質問に答えるだけでなく、複数のステップからなるビジネスロジックを自律的に計画・実行するシステムだ。ツールを呼び出し、複数のプラットフォームをまたいで処理を完結させる。「副操縦士」ではなく、「自律的に動く実行者」である。ペンタゴンが求めているのもまさにこれだ。戦場での意思決定支援、自律システムへの本格投資——確認ボタンを人間が押し続けるようなシステムでは、軍事的優位性を得られない。「デリバリーギャップ」——AIを本当に価値に変えられている企業は3割だけ IBM Think 2026で示された数字が現実を物語っている。AIを収益成長の重要ドライバーとして位置付けている経営者は多いが、「組織全体で持続的な成果を出せている」と答えたのはわずか32%だ。この「デリバリーギャップ」の原因はモデルの性能ではない。問題はスケール展開の難しさ——パイロットプロジェクトの成功を、組織全体のインパクトに転換できないことだ。 IBMはこれに対してEnterprise Advantage（エンタープライズ・アドバンテージ）というコンサルティングフレームワークを投入した。注目すべきは「Context Studio」と「Process Studio」の二つだ。 Context Studio: 組織固有のデータ構造にAIエージェントを根付かせ、精度と関連性を高める仕組み Process Studio: 何千もの標準業務手順書（SOP）からAIがロジックを抽出し、エージェント対応アーキテクチャに変換するツール実際のクライアント案件では、1,400件の手順書を分析して1,000件以上の改善機会を特定し、18ヶ月で運用コスト25%削減を見込むという結果が出ている。医療分野のProvidence社ではAI採用エージェントの導入で採用ステップの工数が90%削減、求人精度が70%向上。教育のPearson社ではAIによるスキル認定・評価を実用化した。デジタル主権（Digital Sovereignty）という新たな必須要件 2026年のエンタープライズAI議論で急浮上しているのが「デジタル主権」の概念だ。クラウドの恩恵を享受しながら、自社の固有データとモデルウェイトのコントロールを手放さない——このバランスが企業にとって不可欠な条件になっている。 ServiceNowはこの文脈で「AIコントロールタワー」というポジショニングを打ち出した。レガシーシステム、クラウドアプリ、多様なAIエージェントを単一の管理画面から統合オーケストレーションする基盤だ。Accentureとの連携で300以上の事前構築済みAIエージェントスキルを提供し、「実験から事業変革の中核へ」という移行を支援する。日本のエンジニア・IT管理者にとっての意味「米軍の話は自分には関係ない」と思ったなら、少し立ち止まって考えてほしい。今回のペンタゴン契約が重要なのは、AIエージェントの実運用フェーズへの移行が、最も要求水準の高い顧客によって公式に確認されたからだ。実務での活用ポイントを整理する。 1. 「デリバリーギャップ」の問題は他人事ではない「AIを試してみた。なんとなく使えそう。でも全社展開には至っていない」——この状態は今の日本企業にとっても典型的だ。32%しかスケールできていないのは世界共通の課題。差をつけるには「パイロット成功後の展開設計」を最初から考えること。 2. 既存の業務手順書（SOP・マニュアル）は宝の山 Process Studioが示したように、紙や文書に眠っている業務ロジックはエージェントAIの燃料になる。「うちのマニュアルは多すぎて整理できない」という状況こそ、AIエージェントが最も力を発揮する環境だ。 3. デジタル主権の設計を後回しにしないどのデータをどのクラウドに渡すか、モデルウェイトは誰が管理するか——エンタープライズAI展開の前にこの設計を固めておかないと、後から取り返しのつかないリスクが生まれる。 4. 「エージェント間の相互運用性」に注目せよ今まさに「エージェントインターネット」という概念が形になりつつある。複数のAIエージェントが協調して動く世界が標準になったとき、自社のシステムがそこに接続できるかどうかが勝敗を分ける。筆者の見解ペンタゴンがこれだけの規模でAI契約を結んだという事実は、エージェントAIが「まだ実証段階」というフェーズを完全に抜けたことを意味する。世界で最も厳しい要求水準を持つ顧客が「本番投入する」と判断したのだ。私がここ数年ずっと注目しているのが「ハーネスループ」の概念だ——AIエージェントが自律的に判断・実行・検証を繰り返すループを設計すること。単発の指示に応答するだけのAIは、「副操縦士」の域を出ない。本当の価値は、目的を与えれば自分で動き続けるエージェントにある。今回のペンタゴン契約は、まさにその方向性に社会が全力で投資し始めた証拠だ。一方で、日本のIT現場に目を向けると、「AIを使ってみた」から「AIが組織を動かしている」への移行が極めて遅い。大きな原因のひとつは、確認・承認を人間に求め続ける設計のツールでAIに触れてきた経験が多いことだ。そのような体験だけで「AIはこんなものか」と判断してしまうのは、あまりにもったいない。統合プラットフォームで全体最適を取るというIBMやServiceNowのアプローチは、道の正中を歩く正しい方向だと思う。部分最適を積み重ねた先に待っているのは、複雑化したシステムと高騰するコストだ。エージェントAI時代の設計原則は「最初から統合を前提に作ること」——この転換を、今年中に自社の設計思想に組み込んでほしい。 AIが「仕組みを作る少数の人間」と「その仕組みを回すAI」という構造を現実にしつつある。この変化の速度に、日本の組織がいかに乗り遅れず対応できるかが、今後5年の競争力を決める。出典: この記事は Pentagon Signs Landmark AI Agreements with SpaceX, OpenAI, Google, Nvidia and Others の内容をもとに、筆者の見解を加えて独自に執筆したものです。