NVIDIA GTC 2026:オープンソースAIエージェント「OpenClaw」がAI業界を揺るがす——Sam AltmanはOpenAI Foundation設立を発表

AI業界が「会話AI」から「自律エージェントAI」へ転換——2026年3月24日の48時間 2026年3月23〜24日の24時間は、AI業界の歴史における転換点として記憶されることになりそうだ。カリフォルニア州サンノゼで開催されたNVIDIA GPU Technology Conference(GTC)2026を中心に、OpenAI・Google・Alibabaから相次いでフロンティアモデルの発表が行われ、AIは「会話型アシスタントの時代」から「自律エージェントの時代」へと明確にシフトしつつある。 OpenClaw:ローカル動作する自律AIエージェントの衝撃 今回のGTCで最大の話題をさらったのが、オープンソースのAIエージェントフレームワーク「OpenClaw」だ。オーストリアの独立開発者Peter Steinberger氏が開発したこのフレームワークを、NVIDIA CEOのJensen Huang氏は「次のChatGPT」「人類史上最も人気のあるオープンソースプロジェクト」と称賛した。 OpenClawの最大の特徴は、Mac・Windows・Linuxのパソコン上でローカル実行できる点にある。高額なクラウドAPIに依存せずとも、完全自律型のAIエージェントを動かせることで、OpenAIやAnthropicといったクローズドソース企業のバリュエーションに即座に影響を与えた。 実用面では、WhatsApp・Telegram・Slack・Discordといった既存のコミュニケーションツールを通じて、建築設計・リサーチ・ワークフロー自動化などの実世界タスクを実行できる。従来のチャットボットと異なり、OpenClawのエージェントは「計画→実行→観察→状態更新」のループで自律的に動作する。 Huang氏はその重要性を「1990年代のWindowsの登場」に例え、「業界が待ち望んでいたエージェント用オペレーティングシステム」と位置付けた。 エンタープライズ向けセキュリティ:NemoClaw ローカル実行の強力さには、セキュリティリスクも伴う。これに対応するため、NVIDIAはNemoClawを発表した。NemoClawはNVIDIAのNemotronモデルとOpenShellランタイムを組み合わせたエンタープライズ向けセキュリティスタックで、エージェントをカーネルレベルでサンドボックス化する。 特徴的なのは「プライバシールーター」機能で、エージェントの全通信をリアルタイム監視し、機密データの外部送信を自動ブロックする。金融・医療・法務など規制産業での導入を念頭に置いた設計だ。 Sam Altman、OpenAI Foundation設立を発表——初期資金10億ドル GTCと並行して、OpenAIのSam Altman CEOはOpenAI Foundationの設立を発表した。初期資金として10億ドル(約1,500億円)を投じ、AIリスクへの対策と科学的発見の加速を目的とした非営利活動を強化する。 OpenAIが商業部門の強化を続ける一方で、非営利ミッションへの投資を明確に打ち出した形だ。 日本への影響 OpenClawのようなローカル実行フレームワークの台頭は、クラウドAPIコストやデータ主権を重視する日本企業にとっても注目に値する動きだ。特に個人情報保護法やデータローカライゼーションの観点から、クラウド依存を減らせるローカルエージェントへの需要は国内でも高まると予想される。 Jensen Huang氏が描く「大工から建築家まで、すべての職業人がAIエージェントを使って能力を拡張する」未来は、もはや遠い話ではなくなってきた。 元記事: Sam Altman announces OpenAI Foundation with $1 billion initial funding

March 26, 2026 · 1 min · 胡田昌彦

MITが生成AIで「壁越し透視」を実現——人や物体を高精度に検出する無線センシング技術

MITが生成AIで壁越し検出を実現 マサチューセッツ工科大学(MIT)の研究チームが、生成AI(Generative AI)を活用した新しい無線センシングシステムを開発した。このシステムは壁や障害物を透過して人や物体を検出できるもので、従来の無線センシング技術と比較して検出精度を大幅に向上させることに成功している。 技術の仕組みと特徴 従来の壁越し検出技術は、Wi-Fiや専用の電波を使って反射波を解析するアプローチが主流だった。しかしノイズへの脆弱性や、複数の人物・物体が混在する環境での精度低下が課題とされてきた。 MITのシステムでは、収集した電波データを生成AIモデルで処理することで、こうした課題を克服。複雑な環境下でも人の位置・姿勢・動作を高精度に推定できるという。追加のカメラや赤外線センサーなど侵襲的なハードウェアを一切必要としない点も大きな特徴だ。 想定される応用分野 この技術が実用化されれば、さまざまな分野への応用が期待される。 スマートホーム・介護:高齢者や独居者の転倒・異常をプライバシーに配慮しながら検知するシステムへの活用が考えられる。日本では高齢化社会の進展に伴い、非接触・低侵襲な見守りソリューションへのニーズが特に高い。 小売・物流:倉庫内の在庫をリアルタイムで追跡したり、店舗内の人流を把握したりすることで、オペレーションコストの削減につながる可能性がある。 セキュリティ:建物内の不審者検知や、災害時の要救助者の位置特定など、安全保障分野での活用も見込まれる。 医療・ヘルスケア:病院や介護施設で患者の状態をリモートでモニタリングする用途も有望だ。 プライバシーと倫理への懸念 一方で、壁越しに人を検出できるという技術的特性は、プライバシー保護の観点から慎重な議論が求められる。「便利か、不気味か」という問いに対して、社会的なコンセンサス形成が技術普及の前提条件となるだろう。特に日本では個人情報保護法やプライバシーに対する感度が高く、導入にあたっては透明性の確保と明示的な同意取得が不可欠になると考えられる。 今後の展望 生成AIと無線通信技術の融合は、物理空間のデジタル化(いわゆる「デジタルツイン」の構築)を加速させる可能性を秘めている。MITの研究は現時点では学術的成果だが、スマートホームデバイスメーカーや警備会社、医療機器メーカーなどからの注目度は高い。商用化に向けた動向が今後注目される。 元記事: MIT develops generative AI wireless system that detects objects and people through walls

March 26, 2026 · 1 min · 胡田昌彦

OpenAI、GPT-5.3 InstantをChatGPTの新デフォルトに──ハルシネーション26.8%減、AI業界激動の一週間

OpenAI、GPT-5.3 Instantをデフォルト化──精度・応答品質を大幅改善 OpenAIは2026年3月下旬、ChatGPTの標準モデルをGPT-5.3 Instantへ切り替えると発表した。同社の内部評価によると、ウェブ検索との組み合わせによりハルシネーション(事実誤認)が26.8%減少したという。また、過剰な拒否応答が大幅に削減され、返答のトーンも自然さを増したと報告されている。 ハルシネーション問題はLLM(大規模言語モデル)が実用普及する上での最大の障壁の一つであり、26.8%という削減幅は業務活用を検討する企業にとって注目に値する数字だ。医療・法律・金融など高精度が求められる分野への展開が一層現実的になるとみられる。 Google、TurboQuantでLLMを最大8倍高速化 Google Researchは軽量化アルゴリズムTurboQuantを発表した。LLMのKVキャッシュメモリを最小6分の1に圧縮しながら、推論速度を最大8倍に向上させ、精度劣化はゼロとしている。 特筆すべきはデバイス要件の低下で、16GBのMac Miniやスマートフォンでもパワフルなモデルが動作可能になるという。エッジAI・オンデバイスAIの普及を大きく後押しする技術として、開発者コミュニティで大きな反響を呼んでいる。 Claudeがmacなのデスクトップを自律操作──「Computer Use」研究プレビュー公開 Anthropicは、AIアシスタントClaudeがmacOSのデスクトップを自律的に操作する機能をリサーチプレビューとして公開した。アプリの起動、ブラウザの操作、スプレッドシートへの入力など、ユーザーが手動で行う作業をClaudeが代行できる。現時点ではClaude CoworkおよびClaude Codeでの利用に限定されている。 また、Claude CodeのAuto Modeも新たにリリース。従来はファイル書き込みやBashコマンドの実行ごとにユーザーの承認が必要だったが、Auto Modeではセーフガードを維持しつつClaudeが自律的に権限判断を行う。開発者の作業効率を大幅に高めることが期待される。 そのほかの注目ニュース OpenAI、7,300億ドル評価額で100億ドル調達へ OpenAIはプライベートエクイティ向けに最低17.5%のリターンを保証する条件で100億ドルの追加資金調達を進めていると報じられた。同社の急成長が続く中、投資家からの強い関心が伺える。 Meta、AIスタートアップ「Dreamer」のチームを獲得 元GoogleおよびStripe幹部を含むDreamerの創業者チームをMetaが採用。AIエージェント開発を加速させる狙いがある。 Intel × Manifold Labs、分散型AIの機密コンピューティング技術を公開 BittensorサブネットであるManifold Labsとの共同ホワイトペーパーにより、信頼できないホストマシン上で安全にAIワークロードを実行するハードウェア強制の機密コンピューティング技術が示された。Web3×AIインフラの新たな可能性として注目される。 Soraアプリ、サービス終了 OpenAIが提供してきた動画生成プラットフォーム「Sora」のアプリが終了した。詳細なタイムラインは後日発表予定とされており、機能の統合先が注目される。 主要AI各社が同時期に大型アップデートを投下した激動の一週間となった。精度向上・高速化・自律エージェント化という3つの潮流が同時並行で進展しており、AIの実用活用フェーズが新たな段階に入りつつある。 元記事: OpenAI sets GPT-5.3 Instant as new ChatGPT default, reports 26.8% hallucination drop

March 26, 2026 · 1 min · 胡田昌彦

AIスキル格差が現実に——早期ユーザーが優位に立ち、雇用への影響は「これから」

AIは今すぐ仕事を奪わないが、格差はすでに始まっている AIを開発するAnthropicが最新の経済影響レポート(第5弾)を公開し、「AIはまだ雇用を大規模に奪っていない」という結論を示した。しかし同時に、AI活用の巧拙によるスキル格差(AI Skills Gap)がすでに広がりつつあるという警告も含まれている。 失業率への影響は「今のところなし」 Anthropicの経済部門責任者であるピーター・マックロリー氏は、ワシントンD.C.で開催されたAxios AIサミットの場でTechCrunchの取材に応じ、次のように語った。 「テクニカルライター、データ入力担当者、ソフトウェアエンジニアなど、Claudeを中核業務で自動化的に活用している職種と、AIの影響を受けにくい肉体労働系の職種との間で、失業率に有意な差は見られない」 現時点では、AIが直接的な雇用喪失を引き起こしているという証拠は乏しい。労働市場はまだ「健全」な状態にある、とマックロリー氏は評価する。 しかし「これから一気に来る」可能性 AnthropicのCEOであるダリオ・アモデイ氏はかねてより、「今後5年以内にホワイトカラーの新卒レベルの仕事の半数が消え、失業率が20%に達する可能性がある」と警告している。マックロリー氏もその可能性を否定せず、「影響が顕在化する前にモニタリングの枠組みを整え、変化が起きたときに即座に捉えられるようにする必要がある」と述べた。 変化のスピードが速いAI分野では、普及・浸透のトレンドを継続的に追跡することが政策立案においても不可欠だという。 本当の問題は「使いこなせる人とそうでない人の差」 今回のレポートが特に注目している点は、雇用喪失そのものではなく、AI活用スキルの不均等な分布だ。 早期からClaudeを使い込んできたユーザーは、後から参入したユーザーに比べて、はるかに高い価値を引き出している。具体的には: 単発・カジュアルな用途ではなく、業務に組み込んだ継続的な活用をしている 単なる質問応答ではなく、「思考のパートナー」として反復的なフィードバック・ブレストに活用している より高度で複雑なタスクへの応用が進んでいる マックロリー氏は「AIは、すでに使いこなせている人をさらに有利にする技術になりつつある」と指摘する。 地理的・経済的な偏りも スキル格差は個人レベルだけでなく、地域・経済的な格差とも連動している。レポートによると: Claudeの利用は高所得国で特に集中している 米国内でも知識労働者が多い地域での活用度が高い 恩恵を受けているのは限られた専門職・特定業務に偏っている 「AIは格差を解消する」という期待とは裏腹に、現実には富裕層・スキル保有者への恩恵が先行している構図だ。 日本への示唆 日本でも生成AIの業務活用は急速に広がっているが、企業・個人間での活用レベルの差は大きい。「とりあえず使っている」段階から、業務フローに深く組み込む「パワーユーザー」への移行が、今後の競争力を左右する可能性がある。Anthropicのレポートは、その差が思った以上に早く開きつつあることを示唆している。 元記事: The AI skills gap is here, says AI company, and power users are pulling ahead

March 26, 2026 · 1 min · 胡田昌彦

MetaがAI投資を加速する一方、数百人規模の人員削減を実施

MetaがAI投資加速と同時に数百人規模のレイオフを実施 FacebookやInstagramを運営するMeta Platformsが、社内複数部門にわたる数百人規模の人員削減を実施していることが明らかになった。ニューヨーク・タイムズ、NBCニュース、The Informationの各報道が伝えた。 影響を受ける部門 今回の人員削減は以下の部門が対象となっている。 Reality Labs(スマートグラスおよびVRヘッドセット開発部門) 採用(リクルーティング)チーム ソーシャルメディアチーム 営業チーム Metaの広報担当トレーシー・クレイトン氏は「Metaの各チームは、目標達成に向けた最善のポジションを確保するため、定期的に組織再編や変更を実施している」とコメント。削減人数の具体的な開示は避けた。なお、Metaの従業員数は2025年12月時点で約7万9,000人。 「メタバース」からAIへの大転換 今回のレイオフは、Metaがメタバース戦略を縮小しAIへ軸足を移す大きな流れの一環だ。同社は2026年のAIデータセンター構築に最大1,350億ドルを投じる見通しで、Armの新型CPUの採用契約も締結している。 Reality Labs部門では今年1月にも少なくとも1,000人規模のレイオフが行われており、VRスタジオ3社の閉鎖、企業向けメタバースプラットフォームの廃止、VRフィットネスアプリ「Supernatural」の新コンテンツ停止なども相次いでいる。 2月にはMetaの3DソーシャルプラットフォームHorizon WorldsのVR版終了が発表されたが、その後数週間で撤回し「当面の間ダウンロード可能な状態を維持する」と方針転換した経緯もある。 日本への影響と背景 MetaのVRデバイス「Meta Quest」シリーズは日本でも販売されており、Reality Labsの縮小はVRコンテンツ開発エコシステムに影響を及ぼす可能性がある。一方でMeta AIやLlama系モデルを活用した開発は国内でも広がっており、AI分野への投資継続は日本の開発者コミュニティにとってもプラス材料となりそうだ。 GoogleやMicrosoft、Amazonなど主要テック企業がAI投資を優先する中、Metaも人員・予算の再配分を加速している。この傾向は2026年のテック業界全体の構造変化を象徴するものとなっている。 元記事: Meta is laying off hundreds of employees as it pours money into AI

March 26, 2026 · 1 min · 胡田昌彦

Claude Codeの出力の90%が「スター数2未満」のリポジトリへ——個人開発者が牽引するAIコーディング革命

Claude Codeの普及状況を可視化するサイト「claudescode.dev」が明らかにした驚くべき実態 AnthropicのAIコーディングツール「Claude Code」のGitHub上での活動をリアルタイムで追跡するサービス「claudescode.dev」が公開したデータが、開発者コミュニティで注目を集めている。最も衝撃的な事実は、Claude Code関連の出力の90%がGitHubスター数2未満のリポジトリに向けられているという点だ。 爆発的な普及の数字 2025年2月24日のClaude Code正式ローンチ以降、その採用ペースは目を見張るものがある。現時点での主要指標は以下の通りだ。 総コミット数: 2,080万件超 アクティブリポジトリ数: 108万7,408件 過去7日間の新規リポジトリ: 11万4,785件 追加コード行数: 504億行以上 削除コード行数: 197億行以上 週次成長率: +8% 倍増ペース: 約61日 この数字は、Claude Codeがすでに単なる「話題のツール」を超え、日常的な開発ワークフローに組み込まれつつあることを示している。 「無名リポジトリ」が主戦場という意味 スター数2未満のリポジトリへの集中は、一見すると地味な統計に思えるかもしれない。しかし、これはむしろポジティブなシグナルとして解釈できる。 人気OSSプロジェクトや企業の公開リポジトリではなく、個人の学習プロジェクト、プロトタイプ、個人ツール、スタートアップの初期プロダクトといった草の根レベルの開発でClaude Codeが活発に使われていることを意味するからだ。AIコーディング支援が一部のエキスパートや大企業だけの特権ではなく、あらゆるレベルの開発者に民主化されているといえる。 使われている言語 言語別の分布も興味深い。 順位 言語 シェア コミット数 1位 TypeScript 34.8% 725万件 2位 Python 18.9% 392万件 3位 JavaScript 10.2% 213万件 TypeScriptが首位を占めていることは、Webフロントエンド・バックエンド開発者によるClaude Code採用が特に活発なことを示唆している。Pythonが2位に入っているのは、AIアプリケーション・データサイエンス系プロジェクトでの活用が進んでいるためと考えられる。 日本の開発者への示唆 このデータは、日本の開発者にとっても無縁ではない。GitHub上のコミット数増加ペースが週8%・倍増まで61日というペースは、半年後には現在の数倍規模に達する計算だ。「まだAIコーディングツールを試していない」という開発者にとっては、乗り遅れのリスクを感じさせる数字でもある。 一方、コード行数ベースで見ると純増が300億行以上という規模は、コードの質や保守性に関する議論も呼んでいる。Hacker Newsのコメント欄では「量より質をどう担保するか」という観点からの議論も活発だ。 AIが生成するコードの急増は、コードレビュー、テスト自動化、セキュリティスキャンといった品質保証の領域にも新たな需要を生み出している。Claude Codeの普及は、開発プロセス全体の変革を加速する触媒になりつつある。 元記事: 90% of Claude-linked output going to GitHub repos w <2 stars

March 26, 2026 · 1 min · 胡田昌彦

DeepSeek V4発表:1兆パラメータのマルチモーダルAI、階層型KVキャッシュでメモリ40%削減を実現

DeepSeek、2025年1月以来最大のモデル「V4」を発表 中国・杭州に拠点を置くAI研究機関DeepSeekが、新たな大規模言語モデル「DeepSeek V4」を公開した。2025年1月のリリース以来、約2か月ぶりとなるメジャーアップデートで、マルチモーダル対応が最大の特徴だ。 1兆パラメータ規模でテキスト・画像・動画に対応 V4はテキスト生成にとどまらず、画像および動画の生成にも対応したマルチモーダルモデルとして設計されている。パラメータ数は1兆(1 Trillion)規模に達し、前世代モデルから大幅にスケールアップされた。 これにより、単一モデルで複数のモダリティ(様式)を扱える汎用AIとしての活用が期待される。OpenAIの「GPT-4o」やGoogleの「Gemini 1.5 Pro」といったマルチモーダルモデルと競合する位置付けだ。 独自技術でメモリ効率と推論速度を大幅改善 大規模モデルの実用化における課題として常に挙げられるのが、推論時のメモリ消費と処理速度だ。DeepSeekはV4においてこれらの課題に対し、二つの独自技術で挑んでいる。 ひとつは階層型KVキャッシュ(Tiered KV Cache)。KV(Key-Value)キャッシュはトランスフォーマーモデルの推論を高速化するための仕組みだが、V4では優先度に応じてキャッシュを階層管理することでメモリ使用量を従来比40%削減した。 もうひとつはSparse FP8デコーディング。FP8(8ビット浮動小数点)形式で疎(スパース)な計算を行うことで、推論速度を1.8倍向上させている。 これらの最適化は、より少ないハードウェアリソースで大規模モデルを動かすことを可能にし、クラウドAPI提供コストの低減や、エッジデバイスへの展開可能性を広げるものだ。 中国製AIチップ向けに最適化、Huawei・Cambriconと協力 注目すべきは、V4がNVIDIA製GPUだけでなく、中国AI半導体大手のHuawei(ファーウェイ)およびCambricon(カンブリコン)の最新ハードウェアに最適化されている点だ。 米中の半導体規制が続く中、中国AI産業は国産チップへの依存度を高めており、DeepSeekがその代表格と協業することは業界的にも重要なシグナルといえる。日本市場においても、AI推論インフラの調達先多様化という観点から、この動向は注視する価値がある。 DeepSeekの台頭と今後の展望 DeepSeekはV3やR1モデルで高い性能を低コストで実現し、2025年初頭に世界的な注目を集めた。V4はその流れを受けてマルチモーダル領域へと踏み込む野心的なリリースであり、米国主要AIベンダーとの技術競争がさらに激化することは必至だ。 オープンソース志向を維持しつつ、国産チップとの連携強化という独自路線でどこまで存在感を示せるか、引き続き動向が注目される。 元記事: DeepSeek V4 Multimodal Model: 1 Trillion Parameters with 40% Memory Reduction via Tiered KV Cache

March 26, 2026 · 1 min · 胡田昌彦

Replit Agent 4が登場——処理速度10倍、評価額6ヶ月で3倍の9000億円超えへ

Replit Agent 4、マルチエージェント協調で開発速度を劇的に向上 AIコーディングツール大手のReplitが、最新世代となる「Agent 4」をリリースした。同社によれば、従来比で処理速度が10倍に向上しており、複数のAIエージェントが協調して作業する「マルチエージェント協調ワークフロー」の採用が最大の技術的特徴となっている。 マルチエージェント協調とは何か 従来のAIコーディングエージェントは、単一のモデルがタスクを逐次処理する構造が主流だった。Agent 4では、複数の専門化されたエージェントが並列・協調して動作することで、設計・実装・テスト・デバッグといった工程をほぼ同時進行できる。この「分業と協調」の仕組みが、体感速度の大幅な向上につながっているとされる。 Cursor、GitHub Copilotなどと激しく競合するAIコーディング市場において、Replitはブラウザだけで動作するクラウドネイティブな開発環境という差別化軸を維持しながら、エージェント機能の強化で存在感を高めている。 評価額が6ヶ月で3倍に急騰 技術面の進化と並行し、Replitのビジネス面での成長も著しい。同社の企業評価額は直近6ヶ月で30億ドル(約4,500億円)から90億ドル(約1兆3,500億円)へと3倍に跳ね上がった。AIコーディングエージェント市場全体への投資家の期待値が急速に高まっていることを示す数字だ。 広がるAIインフラ投資の地平 Replitの成長は、AIスタートアップへの投資全体が「モデル開発」から「エンタープライズ運用に必要な周辺インフラ」へシフトしている潮流とも一致する。2026年3月の直近1週間だけでも、AIネットワーキング基盤のNexthop AI(5億ドル調達)、AIコード安全性検証のAxiom(2億ドル調達)、AIサイバーセキュリティのKai(1億2,500万ドル調達)など、AIエージェントを「安全に・高速に・大規模に」動かすためのレイヤーへ巨額資金が流入している。 特にAxiomが手掛ける「AIが生成したコードを数学的に証明・検証する」技術は、CursorやReplitのようなAIコーディングツールの普及によって生じる「コード生成速度と検証速度のギャップ」を埋めるものとして注目される。企業がAIエージェントを本番環境に投入する前段階として、こうした「信頼・ガバナンス」レイヤーへの需要が急増している。 日本への示唆 国内でもAIコーディングツールの業務導入が進むなか、「速く作れる」だけでなく「安全を担保できるか」という問いが開発現場での焦点になりつつある。Replitのような高速化と、Axiomのような検証技術——この両輪がそろって初めて、AIエージェントの本格的な社会実装が可能になるといえるだろう。 元記事: Replit Agent 4 Delivers 10x Speed Improvement with Multi-Agent Cooperative Workflows

March 26, 2026 · 1 min · 胡田昌彦

GLM-5オープンソース公開——MITライセンス・自己ホスティング対応でフロンティアモデル並みの性能を実現

GLM-5がオープンソース界の水準を塗り替える 中国のAI企業Zhipu AIが開発した大規模言語モデルGLM-5が、オープンソースとして公開された。最大744Bパラメータ(Mixture of Experts構成で常時アクティブなのは約32B)という規模を持ちながら、ライセンスはMITライセンスを採用。商用利用・自己ホスティングを含む幅広い活用が可能となっており、オープンソースモデルの新たな基準点として注目を集めている。 推論特化モデルとしての設計思想 GLM-5はいわゆる「推論特化型LLM(Reasoning LLM)」として設計されている。従来の言語モデルが一発回答を得意とするのに対し、推論型モデルは数学的証明・コーディング・複雑な問題解決など、複数ステップにわたる論理的思考を必要とするタスクを得意とする。 内部では「思考モード(Thinking Mode)」を持ち、回答を出力する前に中間ステップを生成・検証するチェーン・オブ・ソート(Chain-of-Thought)を活用する。これにより、単純なQ&Aでは見落とされがちな論理的整合性を確保できる。 ベンチマーク性能——フロンティアモデルに肉薄 GLM-5がとくに評価されているのがSWEベンチマーク(実際のGitHubイシューに基づくソフトウェアエンジニアリング評価)での成績だ。OpenAIのGPT-4oやAnthropicのClaudeといったクローズドの最先端モデルと比較しても遜色ない数値を記録しており、「オープンソースであってもプロプライエタリモデルに対抗できる」ことを実証した形となっている。 Mixture of Experts——大規模性能を効率的に GLM-5はMoE(Mixture of Experts)アーキテクチャを採用している。総パラメータ数は355B〜744Bに達するが、1トークンの推論時にアクティブになるのは一部のエキスパートのみ。これにより、理論上の表現力を高く保ちながら、推論時の計算コストを抑えることができる。 同様のアーキテクチャはQwen3やMoonshot Kimi K2など2026年注目のモデル群にも広く採用されており、高性能モデルの設計トレンドとして定着しつつある。 日本語・アジア言語対応への期待 Zhipu AIはGLM系列を通じて多言語対応に積極的であり、日本語を含む東アジア言語での性能にも定評がある。自己ホスティングが可能なMITライセンスのもと、日本国内の企業や研究機関がオンプレミス環境でGLM-5を活用するシナリオも現実的になってきた。個人情報保護・機密データを扱う業務での応用において、クラウドAPIへの依存を排除できる点は特筆すべきメリットだ。 2026年、推論型オープンソースモデルの競争が本格化 AI業界では2026年を「推論ファースト元年」と位置づける見方が強まっている。単に流暢なテキストを生成するだけでなく、エージェントとして自律的に計画・実行・検証を繰り返せるモデルへの需要が急増しているためだ。GLM-5の登場はその流れを象徴するものであり、オープンソースエコシステム全体の底上げに寄与すると期待される。 コスト・プライバシー・カスタマイズ性を重視する開発者やエンタープライズにとって、GLM-5は2026年に最初に評価すべきモデルの一つとなりそうだ。 元記事: GLM-5 Open-Source Model Debuts with Frontier-Level Performance, MIT License and Self-Hosting Support

March 26, 2026 · 1 min · 胡田昌彦

HTMLもDOMも不要——Ai2のオープンソースWebエージェント「MolmoWeb-4B」がスクリーンショットだけでブラウザを操作

スクリーンショットだけでWebを操る——MolmoWeb-4Bの衝撃 Allen Institute for AI(Ai2)が開発したオープンソースのマルチモーダルWebエージェント「MolmoWeb-4B」が注目を集めている。従来のWebスクレイピングやブラウザ自動化ツールがHTMLやDOM(Document Object Model)の解析に依存していたのに対し、MolmoWeb-4BはWebページのスクリーンショットだけを入力として受け取り、視覚情報のみから操作すべき要素を判断・実行するという、まったく異なるアプローチを採用している。 視覚駆動型エージェントの仕組み MolmoWeb-4Bは、画像とテキストを同時に扱えるマルチモーダルモデルをベースに構築されている。エージェントはWebページの見た目をそのまま「見て」理解し、以下のようなアクション空間を通じてブラウザを操作する。 goto(url) — 指定URLへ遷移 click(x, y) — 正規化座標(0.0〜1.0)でのクリック type("text") — フォーカスされた要素へのテキスト入力 scroll(dir) — ページスクロール press("key") — キーボード操作 この設計により、JavaScriptで動的に生成されたコンテンツや、アクセシビリティ属性が整備されていないWebサイトでも、人間と同様に「見た目」から操作できるようになる。日本語サイトなど、DOM構造が複雑なページへの適用でも原理的に問題が生じにくい点は、日本の開発者にとっても注目すべき特徴だ。 4ビット量子化で一般GPUでも動作 モデルサイズは4Bパラメータ(40億パラメータ)と比較的コンパクトで、4ビットNF4量子化(bitsandbytes使用)を適用することで、約6GBのVRAMに収まる。Google Colab上でも動作確認されており、高性能なサーバーを持たない個人開発者や研究者でも試しやすい点が評価されている。 実装はHugging Faceのtransformersライブラリと互換性があり、以下のように標準的なAPIでモデルをロードできる。 元記事: MolmoWeb-4B: Building a Vision-Guided Web AI Agent Using Multimodal Reasoning and Action Prediction

March 26, 2026 · 1 min · 胡田昌彦

OpenAI、10代向けAI安全ポリシーをOSSで公開——開発者が自社サービスに組み込み可能に

OpenAI、10代ユーザー保護のためのAI安全ポリシーをオープンソース公開 OpenAIは、10代のユーザーが利用するAIサービスをより安全に構築できるよう、プロンプトベースの安全ポリシーをオープンソースで公開した。このポリシーは gpt-oss-safeguard モデルを通じて提供され、開発者が自社のAIアプリケーションに組み込むことができる。 何が公開されたのか OpenAIが今回リリースしたのは、未成年者(主に10代)向けに特有のリスクを軽減するためのプロンプトテンプレートおよびガードレール機能だ。gpt-oss-safeguard は、年齢層に応じた有害コンテンツのフィルタリングや、不適切な会話の誘導を検出・遮断する仕組みを提供する。 これまでOpenAI自身のサービス(ChatGPTなど)では年齢制限や安全フィルターが実装されていたが、サードパーティ開発者が同等の保護機能を独自サービスに実装するのは容易ではなかった。今回の公開により、OpenAI APIを利用するアプリ開発者も同様の安全機能を手軽に導入できるようになる。 背景:未成年のAI利用リスク 生成AIの急速な普及に伴い、10代の若者がAIチャットボットや生成サービスを日常的に利用するケースが世界中で増加している。日本でも学校教育へのAI導入が進む中、有害コンテンツへの誘導、過度な感情依存、個人情報の無意識な開示といったリスクへの懸念が高まっている。 米国では連邦・州レベルで未成年のオンラインサービス利用規制が強化されており、OpenAIをはじめとするAI企業にも社会的責任が強く求められている状況だ。 開発者への影響 gpt-oss-safeguard をシステムプロンプトに組み込むことで、以下のような制御が可能になる: 年齢に不適切なコンテンツ(暴力・性的表現・薬物関連など)の生成抑制 自傷・メンタルヘルス関連の話題に対するより慎重な応答 個人情報収集を促すような会話パターンの検出 ポリシーがオープンソースで提供されることで、開発者はコードを検証・カスタマイズすることも可能だ。透明性を高めることで、外部監査や規制対応にも活用できる。 今後の展望 OpenAIはこのリリースを「開発者コミュニティと共に、より安全なAI体験を構築するための第一歩」と位置づけている。教育テック企業や子ども向けサービスを手がける開発者にとって、このガードレールの活用は今後の標準的な実装手法となる可能性が高い。 AIの恩恵を若い世代にも届けながら、リスクを最小化する——そのバランスを技術で実現しようとするOpenAIのアプローチは、業界全体の動向を左右するものとして注目される。 元記事: Helping developers build safer AI experiences for teens

March 25, 2026 · 1 min · 胡田昌彦

Databricks、AI セキュリティ製品「Lakewatch」発表——2社買収でAnthropicのClaude活用SIEMを構築

Databricks、AI駆動のセキュリティ製品「Lakewatch」を発表 クラウドデータ分析プラットフォームで知られるDatabricksが、新たなセキュリティ製品「Lakewatch」を発表した。同製品は同社のデータ格納能力を活かしつつ、脅威の検知・調査といった従来のSIEM(Security Information and Event Management:セキュリティ情報およびイベント管理)機能を提供するもので、AnthropicのAIモデル「Claude」を搭載したAIエージェントによって処理を高度化している点が特徴だ。 2スタートアップを相次いで買収 Lakewatchの基盤を支えるため、Databricksは2社のスタートアップを買収した。 1つ目はAntimatter。セキュリティ研究者のAndrew Krioukov氏が創業したスタートアップで、2022年にNew Enterprise Associates主導で約1,200万ドルを調達している。Databricksによる買収は昨年すでに完了していたが、今回初めて公式発表された。Antimatterは企業がエージェントを安全に展開しながら機密データを保護できる「データコントロールプレーン」技術を手がけており、2024年のRSA Innovation Sandbox Contestでもその技術が注目を集めた。 2つ目はSiftD.ai。こちらは今回の発表のわずか数週間前に交渉が始まり、月曜日に買収が完了したばかりという電撃的なディールだ。SiftD.aiは2025年11月に製品をローンチしたばかりの新興企業で、人間とAIエージェントが協働できるインタラクティブなノートブック(JupyterノートブックのようなUI)を開発していた。同社の共同創業者でCEOのSteve Zhang氏は、ログ管理・分析ツールで有名なSplunkで長年チーフサイエンティストを務め、「Search Processing Language(SPL)」を開発した人物として業界に知られる。 買収金額はいずれも非公開。Antimatterは50名未満、SiftD.aiは数名という小規模なチームだったが、両社の従業員はDatabricksに合流している。KrioukovはすでにDatabricksに入社しており、Lakewatchチームを率いている。 50億ドル調達を背景に積極買収戦略を継続 Databricksは直近で50億ドル(約7,500億円)の資金調達を完了しており、豊富なキャッシュを背景にスタートアップの買収を加速させている。同社広報は「私たちは常に次の動きを見据えている。市場の先を行き、顧客のニーズのギャップを埋めることが目標だ」とコメントしており、今後も積極的な買収姿勢を維持する方針を示している。 日本市場への影響 国内企業においてもクラウドデータ基盤の整備が進む中、SIEMとAIエージェントを組み合わせたセキュリティ製品への需要は高まっている。Databricksはすでに日本でも多くの企業に導入されており、Lakewatchが国内展開された際には、セキュリティオペレーションセンター(SOC)業務の自動化・効率化における有力な選択肢となる可能性がある。 元記事: Databricks bought two startups to underpin its new AI security product

March 25, 2026 · 1 min · 胡田昌彦

ChatGPTとGeminiがAIショッピング覇権争い——GapがGeminiで購入可能に、ChatGPTは商品比較UIを刷新

AIチャットボットが「購買体験」の新戦場に GoogleとOpenAIの両社が、チャットAIをショッピングの起点にする機能を相次いで強化している。AIを介した購買体験をめぐる競争が急速に白熱してきた。 GeminiがGap Inc.と提携——チャットから直接購入が可能に Googleは米アパレル大手**Gap Inc.**との提携を発表し、GeminiのAIアシスタントを通じてGap・Old Navy・Banana Republic・Athletaの各ブランド商品をそのまま購入できる機能を提供する。ユーザーがGeminiに「コーディネートを教えて」などと質問すると、これらブランドの商品が提案され、チャット画面を離れることなく購入まで完了できる。 決済にはGoogle Payが使われ、配送はGap側が担当する仕組みだ。この購買体験を支えるのが、Googleが策定したUniversal Commerce Protocol(UCP)と呼ばれる標準規格。AIアシスタントが小売業者のサイト上で購買操作を行うための共通仕様で、すでにWalmartやTargetもこの仕組みで参加している。日本でも普及が進む「スーパーアプリ」的な発想に近く、チャットと決済の一体化という方向性は今後の主流になる可能性がある。 ChatGPTは「比較購入UI」を刷新——組み込みチェックアウトは撤退 一方のOpenAIは、ChatGPTの商品表示体験を大幅に改善した。複数の商品をサイドバイサイドで視覚的に比較できるようになり、価格・レビュー・スペックを一覧で確認できる。あわせて検索の速度・関連性・カバー率も向上し、より最新の商品情報が表示されるようになった。この機能は今週中にChatGPTの無料・Go・Plus・Proプランへ順次展開される予定だ。 ただし、OpenAIはチャット内で直接購入できる組み込みチェックアウト機能を事実上撤退させた。『The Information』や『CNBC』の報道によれば、今後はWalmartなどの小売業者がChatGPT内に独自アプリを展開する形に移行する方針だという。Walmartの幹部も『Wired』に対し、ChatGPTの組み込みチェックアウト経由の売上は「期待外れだった」と明かしており、AI直販モデルの難しさが浮き彫りになっている。 「AIで買い物したい」ニーズはまだ模索中 AIを通じた商品発見・購買は、検索エンジン依存から脱却したい小売業者にとっての新たなチャネルとして注目を集めている。しかし消費者がAI経由の購買体験を本当に望んでいるかどうかは、まだ答えが出ていない。OpenAIの撤退判断は、技術的な可能性と実際のユーザー行動のギャップを示す象徴的な事例と言えるだろう。 GoogleとOpenAIはそれぞれ異なるアプローチで、AIを「お買い物の相棒」にしようとしている。どちらの戦略が消費者に受け入れられるか、2026年のEC市場から目が離せない。 元記事: ChatGPT and Gemini are fighting to be the AI bot that sells you stuff

March 25, 2026 · 1 min · 胡田昌彦

Armが初の自社製CPU「Arm AGI CPU」を発表——Meta社のAIデータセンターに今年後半導入へ

Armが数十年の歴史で初の自社製CPU——MetaのAIデータセンターへ今年導入 英国の半導体設計企業Armが、同社史上初となる自社製CPU「Arm AGI CPU」を発表した。これまでArmは自社のチップ設計をライセンスとして他社に提供するビジネスモデルを中心に成長してきたが、今回は自社でチップを製造・販売するという大きな方向転換となる。 AIインフェレンス向けに特化した設計 Arm AGI CPUは、AIエージェントなどのクラウド処理——いわゆるインフェレンス(推論処理)——に特化して設計されている。最大の特徴は1CPUあたり最大136コアを搭載でき、空冷サーバーラック1台に64基のCPUを搭載できる点だ。 Armによると、従来のx86 CPUと比較してワットあたりの性能が2倍となり、メモリボトルネックの軽減にも優れているという。ベースとなるプラットフォームはAWS Graviton、Nvidia Vera、Microsoft向けなどですでに実績のある「Neoverseプラットフォーム」を採用している。 Metaが筆頭パートナー兼共同開発者に 最初の顧客はMetaだ。Metaは「筆頭パートナー兼共同開発者」として、Armとデータセンター向けCPUの複数世代にわたる開発を進めると表明した。MetaはNvidiaやAMDなどのハードウェアと組み合わせてこのCPUを活用する計画を持つ。 Metaはこれまで独自のAIチップ開発に苦戦してきたと報じられており、Armとの協業は同社のAIインフラ強化の重要な一手となりそうだ。 有力企業から相次ぐ支持表明 今回の発表に合わせて、Amazon AWS、Microsoft、Google、Marvell、Nvidia、Samsungなど名だたる企業が祝辞を寄せた。一方、昨秋のライセンス契約をめぐる訴訟でArmとの法廷闘争に「完全勝利」を宣言したQualcommはリストに含まれていない。 また、Cerebras、Cloudflare、F5、OpenAI、SK Telecomなども導入予定企業として名を連ねている。ArmのクラウドAI部門責任者Mohamed Awad氏はCNBCの取材に対し、「自社プロセッサを自前で開発できない企業向けの有力な選択肢になることを目指している」と語っている。 SoftBank傘下のArmが迎える新時代 現在SoftBankが所有するArmにとって、今回の自社CPUビジネスへの参入はビジネスモデルの大きな転換点だ。契約の金額的条件や、Metaが調達するチップ数については非公開とされている。 x86(Intel・AMD)優位が続いてきたデータセンター市場において、省電力性能に優れたArmアーキテクチャのCPUが本格参入することで、AIインフラの競争構図はさらに激しくなりそうだ。 元記事: Arm’s first CPU ever will plug into Meta’s AI datacenters later this year

March 25, 2026 · 1 min · 胡田昌彦

AIで生産性が100倍?PyPIデータが示す「AIアプリはどこにある」問題の実態

AIで生産性爆上がりのはずが……PyPIデータが語る現実 「バイブコーディング(vibe coding)」やAIエージェントツールの愛好者たちは、「生産性が2倍、10倍、いや100倍になった!」と声高に主張する。実際、ある開発者はAIを活用してWebブラウザをゼロからフルスクラッチで構築してしまったという話まで出てきた。 しかし、懐疑的な視点を持つ人々はこう問いかける。「では、そのAIアプリとやらはどこにある?」 開発者が保守的に見ても2倍生産的になったとするなら、作られるソフトウェアの量も2倍になっているはずだ。その「AI効果」は一体どこで確認できるのか。 PyPIデータで検証する Answer.AIのAlexis Gallagher氏とRens Dimmendaal氏は、この問いに答えるためPythonの中央パッケージリポジトリ「PyPI(Python Package Index)」のデータを分析した。PyPIは大規模かつ公開データであり、ソフトウェア生産量の変化を観測するのに適した指標と言える。 分析結果は明確だ。ChatGPT登場(2022年11月)前後でパッケージ総数の増加トレンドに明確な変化は見られない。月次の新規パッケージ数にいくつかのスパイクは存在するが、これらはスパムやマルウェアの氾濫によるものであり、genuine(本物の)パッケージ創出ではない。 「本物の」パッケージで見ると? 単なるパッケージ数では不十分という批判も当然ある。そこで分析チームは別の指標を採用した。2025年12月時点でダウンロード数上位1万5000パッケージを対象に、誕生年ごとのコホートに分け、各コホートの「リリース頻度(update releases)」の中央値を時系列で追跡した。 結果は「まあ……そうかも?」というものだった。 ChatGPT登場後に生まれたパッケージは、最初の1年間のリリース頻度が年13回と、2014年生まれ(年6回)と比較して確かに高い。しかし、この上昇トレンドはChatGPT登場よりも前の2019年頃から始まっており、GitHub ActionsなどのCI(継続的インテグレーション)ツールの普及と時期が一致する。AIの恩恵と断言するには根拠が弱い。 さらに、「パッケージが古くなるほどリリース頻度が下がる」傾向はAI時代になっても変わっていない。AIが長期的なメンテナンスを活性化させているという証拠は見当たらない。 AIパッケージに限れば話は別 興味深いのは、パッケージをAI関連かどうかで分類した場合だ。AIに関連するパッケージには明確な「AI効果」が現れているのに対し、そうでないパッケージにはほとんど変化がない。 これは何を意味するのか。AIはAIそのものを開発するための生産性は押し上げているが、ソフトウェア開発全体のパラダイムシフトにはまだ至っていない可能性が高い。 日本の開発者へのインプリケーション 日本国内でもAIコーディングツール(GitHub Copilot、Cursor等)の活用が急速に広まっている。個々の開発者レベルでの体感的な生産性向上は確かに報告されているが、それが「作られるソフトウェアの総量」という巨視的な指標に反映されるまでには時間がかかるのかもしれない。あるいは、AIによる生産性向上は新たなソフトウェア創出よりも、既存システムの改善・技術的負債の解消に充てられているという解釈も成り立つ。 AIの生産性革命は本当に起きているのか。データが追いつくまで、議論はまだ続きそうだ。 元記事: So where are all the AI apps?

March 25, 2026 · 1 min · 胡田昌彦

AIコーディングエージェントに「目」を与えるOSSツール「ProofShot」——UIの見た目をブラウザで自動検証

AIがコードを書いても「見た目」は確認できない問題を解決 AIコーディングエージェント(Claude Code、Cursor、Codex、Gemini CLIなど)を使ったUI開発で、こんな不満を抱えていないだろうか。「エージェントがコードを書いてくれるのはいいが、実際にブラウザでどう表示されるかは毎回自分で確認しなければならない」——そんな悩みを解消するOSSツール「ProofShot」がHacker Newsで注目を集めている。 ProofShotは、AIコーディングエージェントがUIを構築した後、実際のブラウザ上での動作を自動記録・検証するCLIツールだ。エージェントが書いたコードが本当に正しく動いているか、レイアウトが崩れていないか、コンソールにエラーが出ていないかを「目に見える証拠」として残せる。 仕組みはシンプルな3ステップ 使い方は start → test → stop の3ステップで完結する。 元記事: Show HN: ProofShot – Give AI coding agents eyes to verify the UI they build

March 25, 2026 · 1 min · 胡田昌彦

主要パッケージマネージャーが「依存関係クールダウン」機能を続々導入——サプライチェーン攻撃対策の新標準へ

パッケージマネージャーに「冷却期間」を——サプライチェーン攻撃への新たな防衛策 LiteLLMのサプライチェーン攻撃(2026年3月)を受け、開発者コミュニティで改めて注目を集めているのが「依存関係クールダウン(dependency cooldown)」という考え方だ。これは、パッケージの更新版をすぐにインストールするのではなく、リリースから数日間待機してコミュニティが問題を検出できる時間を設けるという手法である。 オープンソース開発者のAndrew Nesbittが2026年3月にまとめたレポートによると、この機能への対応は予想以上に急速に広まっており、主要ツールが続々と実装を完了させている。 各ツールの対応状況 JavaScript/TypeScript系: pnpm 10.16(2025年9月)— minimumReleaseAge オプションを追加。信頼済みパッケージには minimumReleaseAgeExclude で除外設定が可能 Yarn 4.10.0(2025年9月)— npmMinimalAgeGate(分単位で指定)を実装。npmPreapprovedPackages で承認済みパッケージの除外もサポート Bun 1.3(2025年10月)— bunfig.toml 経由で minimumReleaseAge を設定可能に npm 11.10.0(2026年2月)— min-release-age オプションを追加 JavaScript以外: Deno 2.6(2025年12月)— deno update および deno outdated コマンドに --minimum-dependency-age フラグを追加 uv 0.9.17(2025年12月)— 既存の --exclude-newer に相対期間指定を追加。exclude-newer-package によるパッケージ単位の上書き設定も可能 pip 26.0(2026年1月)— --uploaded-prior-to オプションを追加(現時点では絶対タイムスタンプのみ対応) pip の相対期間指定はまだ未対応 Pythonの標準パッケージマネージャーである pip は現時点で絶対日時のみの指定に限られており、「3日以上経過したものだけ」といった相対的な指定には未対応だ。ただし開発者のSeth LarsonはCronジョブを使って pip.conf 内の日付を定期更新するという回避策を公開しており、相対期間指定のサポートはGitHub Issueで正式に要望されている。 なぜ今、この対策が重要なのか サプライチェーン攻撃とは、正規パッケージの更新に悪意あるコードを混入させる手法で、近年急増している。攻撃者はリリース直後の短い時間帯を狙うことが多く、クールダウン期間を設けることでコミュニティやセキュリティ研究者が問題を発見・報告する時間的余裕が生まれる。 日本の開発者にとっても、本番環境での npm install や pip install を自動化している場合は特に注意が必要だ。CI/CDパイプラインにこれらのオプションを組み込むだけで、ゼロコストに近い形でリスクを大幅に低減できる。 元記事: Package Managers Need to Cool Down ...

March 25, 2026 · 1 min · 胡田昌彦

Claude Codeに「autoモード」登場——AIが権限判断を代行、セキュリティ保護の実力は?

Claude Codeに「autoモード」が登場——AIが権限判断を自動化 Anthropicは2026年3月24日、コーディングエージェント「Claude Code」に新しい権限モード「autoモード」を導入した。従来の--dangerously-skip-permissionsフラグの代替として設計されたこのモードでは、Claudeがユーザーに代わって各アクションの実行可否を判断する。 仕組み:Claude Sonnet 4.6が「監視役」として動作 autoモードの核心は、メインセッションとは独立した分類器モデルにある。公式ドキュメントによれば、各アクションが実行される前にClaude Sonnet 4.6が会話全体を解析し、次の3点を検証する。 タスクのスコープを超えたアクションの拡大(スコープエスカレーション) 信頼されていないインフラへのアクセス ファイルやWebページに埋め込まれた悪意あるコンテンツ(プロンプトインジェクション)による操作 注目すべき点は、メインセッションが別のモデルを使用していても、分類器は常にClaude Sonnet 4.6で動作することだ。 デフォルトフィルターの内容 ターミナルでclaude auto-mode defaultsを実行すると、デフォルトのフィルタールールをJSON形式で確認できる。主な内容は以下の通り。 許可(allow)されるアクションの例: テスト用APIキーやプレースホルダー認証情報のハードコード プロジェクトスコープ内でのローカルファイル操作 状態を変更しないGETリクエストや読み取り専用API呼び出し requirements.txtやpackage.json等のマニフェストに既に宣言されているパッケージのインストール(pip install -r requirements.txt、npm install等) 警告付き拒否(soft_deny)の例: git push --forceやリモートブランチの削除 main/masterブランチへの直接プッシュ(PRレビューをバイパスするため) curl | bash等の外部コードの直接実行 S3、GCS、Azure Blobへの一括削除操作 専門家からの懐疑的な見方 Simon Willison氏(著名な技術ブロガー)は、AIに依存したプロンプトインジェクション対策に対して根本的な懸念を示している。AIの判断は本質的に非決定論的であり、公式ドキュメント自身も「ユーザーの意図が曖昧な場合や、環境に関する十分なコンテキストがない場合は、リスクのあるアクションを許可してしまう可能性がある」と認めている。 また、デフォルトのallowリストにpip install -r requirements.txtが含まれていることから、バージョン固定されていない依存関係を悪用したサプライチェーン攻撃には無防備な点も指摘されている。実際、同日にLiteLLMで類似した攻撃事例が報告されており、タイムリーな懸念といえる。 サンドボックスとの比較 Willison氏は「コーディングエージェントには、ファイルアクセスとネットワーク接続を決定論的に制限する堅牢なサンドボックスをデフォルトで使うべきだ」と主張する。autoモードのようなプロンプトベースの保護よりも、OS・コンテナレベルのサンドボックスの方が信頼性が高いという見解だ。 autoモードはフィルタールールをカスタマイズできる柔軟性を持ち、利便性と安全性のバランスを取る実用的なアプローチではある。ただし、セキュリティクリティカルな環境では、AIの判断に全面依存するのではなく、従来型のサンドボックスと組み合わせた多層防御が推奨される。 元記事: Auto mode for Claude Code

March 25, 2026 · 1 min · 胡田昌彦

Spotify、AIが生成した「なりすまし楽曲」から実在アーティストを守る新機能をベータテスト

SpotifyがAI楽曲の「なりすまし問題」に本腰——事前承認機能をベータ公開 AIが生成した低品質な楽曲(いわゆる「AIスロップ」)が音楽ストリーミングサービスに溢れかえる中、Spotifyが実在アーティストの保護に向けた新機能「Artist Profile Protection(アーティストプロフィール保護)」のベータテストを開始した。 問題の背景:なぜ楽曲は「別のアーティスト」に紐付くのか メタデータの入力ミス、同名アーティストとの混同、そして悪意ある第三者による意図的な誤帰属——これらの理由から、無関係な楽曲がアーティストのプロフィールページに表示されるケースが以前から問題になっていた。AIで誰でも手軽に楽曲を制作・配信できる時代になったことで、この問題は深刻化の一途をたどっている。 Spotifyは公式ブログで「ストリーミングサービス全体で、楽曲が誤ったアーティストページに届く問題が続いていた。AI楽曲の急増がこの問題をさらに悪化させている」と現状を説明した。 新機能の仕組み:リリース前の「事前承認」制度 ベータに参加したアーティストは、Spotifyに配信される予定の楽曲を公開前にレビューし、承認または拒否できるようになる。承認された楽曲だけが以下の対象となる。 アーティストプロフィールへの表示 再生数・ストリーミング統計への反映 ユーザーへのレコメンド(リリースレーダー等)への登場 機能をオンにすると、自分の名前が付いた楽曲がSpotifyに配信されるタイミングでメール通知が届く。デスクトップおよびモバイルウェブの「Spotify for Artists」設定から操作できる。 業界全体で高まる危機感 この発表の約1週間前、ソニーミュージックは傘下アーティストになりすましたAI生成楽曲13万5,000曲以上の削除をストリーミングサービス各社に要請したと発表している。大手レーベルも対応に動く中、プラットフォーム側でのシステム的な解決策としてSpotifyの取り組みは注目に値する。 Spotify側は「この機能はすべてのアーティストに必要なわけではない」としつつ、以下のケースで特に有効だと説明している。 過去に誤った楽曲が届いた経験がある 同名の別アーティストが存在する プロフィールに表示される楽曲をより厳密に管理したい 「オープン配信」の光と影 インターネットの普及によりインディーズアーティストが自力で世界中に音楽を届けられる時代が到来したが、同時にゲートキーパー(審査機能)が弱体化するという副作用も生んだ。今回の機能はアーティスト自身がそのゲートキーパーになることを可能にするものだ。 Spotifyは2026年の最重要課題として「アーティストアイデンティティの保護」を掲げており、今後の正式リリースと機能拡充が期待される。 元記事: Spotify tests new tool to stop AI slop from being attributed to real artists

March 25, 2026 · 1 min · 胡田昌彦

OpenAIのSoraアプリが終了——ディープフェイク問題とAI専用SNSの限界

OpenAIのSoraアプリがサービス終了——AI専用SNSは6ヶ月で幕を閉じた OpenAIは2026年3月24日(現地時間)、TikTok風のAI動画SNSアプリ「Sora」のサービス終了を発表した。Soraは約6ヶ月前にローンチされたばかりで、終了の具体的な理由や日程はまだ公表されていない。 AI専用SNSへの熱狂はなぜ続かなかったのか Soraは招待制ソーシャルネットワークとして登場した当初、多くのユーザーが招待を求めて殺到した。しかし、Metaのメタバース向けVRプラットフォーム「Horizon Worlds」が一時の注目を集めながらも失速したのと同様に、Soraも長期的なユーザー定着には至らなかった。 基盤技術である「Sora 2」の動画・音声生成モデルは驚異的な品質を誇るが、AI生成コンテンツだけで構成されたフィードに対して、ユーザーの継続的な関心を維持することは難しかったようだ。 「キャメオ」機能が招いた混乱 Soraの目玉機能は「キャメオ(cameo)」と呼ばれるもので、自分の顔をスキャンしてリアルなディープフェイク動画を作れる仕組みだった。この機能は公開設定にすることもでき、他ユーザーが誰でもその人の「キャメオ」を使った動画を生成できる構造になっていた。 なお、芸能人ブッキングサービスの「Cameo」社が名称について法的措置を取り、OpenAIは機能名を「キャラクター(characters)」に変更させられている。 公人のディープフェイク制限があったにもかかわらず、ガードレールをかいくぐったコンテンツが次々と生成された。公民権運動の指導者マーティン・ルーサー・キング・ジュニアや俳優ロビン・ウィリアムズのディープフェイク動画が出回り、それぞれの娘がInstagramで「故人の動画を作るのをやめてほしい」と訴える事態にまで発展した。 また、マリオが大麻を吸ったり、ナルトがクラビーパティを注文したり、ピカチュウがASMRをしたりといった著作権キャラクターを使ったコンテンツも大量に生成され、法的リスクも浮上していた。 ディズニーとの10億ドル契約も白紙に こうした著作権侵害問題に対し、訴訟で知られるディズニーは意外な動きに出た。OpenAIに10億ドル(約1,500億円)の投資を行い、ディズニー・マーベル・ピクサー・スターウォーズのキャラクターを使った動画生成を許諾するライセンス契約を締結したのだ。AI業界にとって歴史的な瞬間とも評されたが、Soraのサービス終了とともにこの契約も消滅する。ただし、実際に資金が動く前に破談となったとみられる。 ディズニーは声明の中で「引き続きAIプラットフォームと連携していく」とコメントしており、今後の動向が注目される。 日本のAI業界への示唆 今回のSora終了は、高度なAI生成技術があってもSNSとして成立させることの難しさを改めて示した。日本でも画像・動画生成AIを活用したコンテンツプラットフォームの構想が増えているが、モデレーション体制の構築とユーザーが継続的に楽しめるコミュニティ設計が、技術力と同様に重要であることを示す事例といえるだろう。 元記事: OpenAI’s Sora was the creepiest app on your phone — now it’s shutting down

March 25, 2026 · 1 min · 胡田昌彦

AI・テクノロジーの情報を発信しています

YouTube

AI・テクノロジーの最新トレンドを動画で配信中

note

技術コラム・深掘り記事を公開中