Azure から Azure Stack HCI を監視する

この記事の内容

  • Azure Portal から Azure Stack HCI クラスターの監視を有効化する手順を紹介します
  • 監視データは Log Analytics Workspace に送られ、Azure Monitor で活用されます
  • データ収集開始後、約1時間でポータル上に監視情報が表示されます
  • Log Analytics Workspace 上のログの中身や、KQL クエリの構造も確認します
  • Azure Stack HCI の監視機能(一部プレビュー)の現状と活用の可能性を解説します

Azure Portal から Azure Stack HCI を監視する

Azure Portal では、Azure Arc 経由で Azure Stack HCI クラスターを確認できます。クラスター画面には接続されているサーバーの台数が表示されており、ここから監視機能を有効化することができます。

監視を開始するには、まず有効化の操作が必要です。有効化すると、Azure が Azure Stack HCI クラスターの一連のログ収集を開始します。


Log Analytics Workspace との連携

収集されたログは Log Analytics Workspace と関連付けられ、Azure Monitor に送られます。Azure Monitor 上でそのデータを活用して監視を行う仕組みになっています。

監視の有効化の際には、どの Log Analytics Workspace を使用するかを選択します。データの収集が始まり、情報がワークスペースに蓄積されることで、ポータル上に監視情報が反映されます。


コストについて

監視機能は Azure Monitor を使用するため、Azure Monitor の料金体系が適用されます。従量課金制で、目安として 1GB あたり約 409 円(2023年時点、為替レートにより変動)となっています。


監視の有効化とデータ収集の待機

Log Analytics Workspace を選択して「有効化」を実行すると、データのサンプリングが開始されます。ポータル上には「これには約1時間かかります」と表示されており、データが揃うまで待機が必要です。

約1時間後、監視画面には以下のような情報が表示されます。

  • 正常性アラート: 0個(全て正常)
  • ドライブ: 8個(全て正常)
  • 仮想マシン: 0個(未作成のため)
  • ボリューム: 1個
  • メモリ使用率: 使用中 8.1 GB、空き 119.9 GB
  • ストレージの使用状況: 正常に取得済み

CPU の系列はこのタイミングではまだ表示されていませんでしたが、その他の基本的なリソース情報はきちんと収集されていることが確認できました。


Log Analytics Workspace でのログの確認

Azure Monitor(Log Analytics Workspace)側でもログの中身を直接確認できます。

例として、Windows のイベントログ(Microsoft-Windows-SDDC-Management/Operational など)が収集されており、ドライブの数やボリュームの情報を取得するために使われていました。

ログのエントリには以下のような情報が含まれています。

  • ソース: イベントログ
  • コンピューター: Azure Stack HCI のノード
  • イベント ID: 例)3002(ボリューム一覧の取得)
  • ラベル: ClusterPerformanceHistory
  • パス・サイズ: ボリュームのパスや使用量

XML 形式で格納されたイベントデータをパースすることで、ボリュームのリストやステータスなどを取得しています。ログを確認することで、どのイベント種別を収集するとどのような情報が得られるのかを把握できます。


Azure Monitor からクエリを確認する

Azure Monitor の画面には、Azure Stack HCI(プレビュー) の項目が追加されています。ここでは、監視ダッシュボードで使われている KQL クエリの詳細を確認できます。

例えば、クラスターのボリューム情報を表示する部分には以下のような処理が含まれています。

  1. 時間範囲の絞り込み
  2. クラスター名の取得(XML のパース)
  3. イベントデータの取得と flex 形式へのパース
  4. XML の中から必要な値(クラスター名、パス、サイズなど)を取得
  5. ARM ID の取得や JSON のパースを組み合わせた集計処理

このように、Log Analytics Workspace に蓄積されたログデータを KQL クエリで加工・集計することで、ポータル上の監視ダッシュボードが実現されています。クエリはカスタマイズも可能なため、自分好みの監視ダッシュボードを作成する柔軟性もあります。


現状のプレビュー機能について

執筆時点では、Azure Monitor 上の Azure Stack HCI 監視機能の一部でプレビューが提供されており、クエリのエラー(HealthyCluster 関連など)が発生するケースも見られました。プレビュー段階のため、今後のアップデートで改善されることが期待されます。


まとめ

Azure Portal から Azure Stack HCI の監視を有効化することで、クラスターの正常性・ドライブ・メモリ・ストレージなどの情報をポータル上で一元管理できます。裏側では Log Analytics Workspace にログが蓄積され、KQL クエリによってデータが加工・可視化される仕組みになっています。

一部プレビュー機能ではエラーが出る場面もありますが、クラウドサービスとして継続的に改善されることが見込まれます。KQL クエリを学ぶことで、標準のダッシュボードをカスタマイズしたり独自の監視ビューを作成したりすることも可能です。Azure からすべてを管理するという世界観の中で、Azure Stack HCI の監視もポータルから完結できる環境が整ってきています。