Nous Researchが開発したオープンソースAIエージェントフレームワーク「Hermes」が、NVIDIA RTX PCおよびDGX Spark上でのローカル動作に最適化されてリリースされた。公開からわずか3か月足らずでGitHubスター14万超を獲得し、OpenRouterの調査では「世界で最も使われているエージェント」の座に就いている。

Hermesが注目される4つの理由

AIエージェント分野では「動かない」「信頼性が低い」「デバッグが大変」という声が絶えない。Hermesはこの課題に正面から向き合い、信頼性自己改善という2つの軸を設計の中心に置いた。

1. 自己進化するスキルシステム

最も際立った特徴が「Self-Evolving Skills(自己進化スキル)」だ。Hermesは複雑なタスクをこなすたびに、その経験から学習内容をスキルとして構造化して保存し、次回以降の実行に活用する。単なる会話履歴の保持ではなく、「何ができるようになったか」を蓄積していく仕組みであり、使い続けるほど精度が高まる設計になっている。

2. 独立したサブエージェント設計

複雑なタスクは「Contained Sub-Agents(封じ込められたサブエージェント)」として分割される。各サブエージェントは限定されたコンテキストとツールセットを持つ短命な独立プロセスとして動作し、メインエージェントのコンテキストウィンドウを肥大化させない。ローカルモデルの現実的な制約をうまく回避する設計だ。

3. 設計レベルでの信頼性確保

Nous Researchは出荷するすべてのスキル・ツール・プラグインをキュレーションし、ストレステストを実施している。300億パラメータクラスのローカルモデルでも「そのまま動く」ことを目指しており、他フレームワークで発生しがちな常時デバッグ作業からの解放を謳う。

4. 同一モデルでより高い成果を出すオーケストレーション層

同一モデルを使った比較テストで、Hermesは他フレームワークより一貫して良い結果を出している。薄いラッパーではなく「能動的なオーケストレーション層」として機能し、タスクごとの単発実行ではなく永続的な常駐エージェントを実現している点が差別化要因とされる。

Qwen 3.6との組み合わせでローカル推論が飛躍的に向上

Hermes向けの推奨モデルとして注目されるのが、AlibabaのQwen 3.6シリーズだ。

  • Qwen 3.6 35B:約20GBのメモリで動作し、70GB以上必要だった1200億パラメータモデルを超える精度を実現
  • Qwen 3.6 27B:4000億パラメータのQwen 3.5 397Bと同等の精度を16分の1のサイズで達成

NVIDIA RTX GPUのTensor Coreによる推論アクセラレーションと組み合わせることで、マルチステップタスクの実行やスキルの自己改善処理が「分」ではなく「秒」で完了するとされる。

DGX Spark:常時稼働するエージェント専用コンピュータ

NVIDIA DGX Sparkは、Hermesのような「常時稼働型エージェント」のために設計されたコンパクトなAIワークステーションだ。デスクトップサイズながらデータセンター級の推論性能を持ち、クラウドAPIへの依存なしにエージェントを24時間365日ローカルで稼働させられる。

実務への影響

日本のエンジニアやIT管理者にとって、Hermesの登場はいくつかの実践的なインプリケーションを持つ。

ローカルエージェント導入の現実的な選択肢に:これまでローカルエージェントは「重い」「不安定」が定説だったが、Qwen 3.6×RTX GPUの組み合わせにより、RTX 4090クラスのGPUを搭載した開発機でもエンタープライズ水準に近い自律エージェントが動かせる水準に近づきつつある。

クラウドAPIへの依存脱却:HermesはプロバイダーおよびモデルAgnosticな設計だ。外部APIへの従量課金を回避しながら、社内データを外部に出さずに済む点は、セキュリティ要件の厳しい日本企業にとって魅力的な選択肢になりうる。

自己改善サイクルの業務適用:スキルの自動蓄積機能は、繰り返し業務を担うエージェントに特に有効だ。最初は荒削りな動作でも使い続けることで精度が上がるという特性は、社内ワークフロー自動化に活用しやすい。

筆者の見解

AIエージェントの議論で「自己改善」という言葉はしばしば誇大表現として使われてきたが、Hermesのアーキテクチャは概念をかなり具体的な形で実装している。「タスクごとにAPIを叩いて終わり」ではなく、経験を構造化して蓄積し次の実行に活かすというアプローチは、エージェントが「道具」から「仕組み」へと変わり始めていることを示している。

特に興味深いのは、エージェントが自律的にスキルを書き・検証し・保存するループを内部に持つという設計だ。人間が都度確認・承認しなければ動けない構造とは根本的に異なり、判断・実行・学習を自律ループで回し続けるアーキテクチャは、次のフロンティアを形作るものだと考えている。

ローカル動作へのこだわりは、プライバシーとコストの両面で日本企業に響く訴求ポイントになるだろう。ただし「ローカルで完結できる」ことと「実際の業務タスクで使えるレベルの精度が出る」ことは別の話だ。モデルの数字は目を引くが、自分たちの業務タスクでどこまで通用するかは、手を動かして確かめるしかない。情報を追いかけるよりも、実際に動かして体感する——それが今の時代に正しい行動だと思っている。


出典: この記事は Hermes Unlocks Self-Improving AI Agents, Powered by NVIDIA RTX PCs and DGX Spark の内容をもとに、筆者の見解を加えて独自に執筆したものです。