メインコンテンツまでスキップ
バージョン: Next

初めてのダッシュボード

AIBoosterのダッシュボードを使って、システムの性能を観測する方法を学びましょう。 このガイドでは、基本的な操作方法と主要なメトリクスの見方を説明します。

ダッシュボードの基本構造

ログイン後、最初に表示されるのはGrafanaのホーム画面です。

Grafana Dashboard

主要なエリア

  1. 左サイドバー: ナビゲーションメニュー

    • Home: ホーム画面
    • Dashboards: ダッシュボード一覧
    • Explore: ユーザークエリによるデータ分析
    • Configuration: 設定
  2. メインエリア: ダッシュボードとパネル

  3. 上部ツールバー: 時間範囲の選択など

最初のダッシュボードを開く

  1. 左サイドバーの「Dashboards」をクリック
  2. 「Performance Overview」、あるいは「Cost Overview」を選択

「Details」という名前がついたダッシュボードは、Overviewのダッシュボードから遷移することを想定して設計されています。必ず、以下二つのダッシュボードを起点にしてください。

  • 性能観点での分析: Performance Overview
  • コスト観点での分析: Cost Overview

主要なメトリクスの見方

1. GPU Utilization

  • 意味: GPUがどれだけ使用されているか
  • 理想値: 学習時は80-95%
  • 注意点: 50%以下の場合は、GPU以外にボトルネックがある状態

2. GPU SM Activity

  • 意味: GPUコアの実際の計算効率
  • 理想値: 70%以上
  • 注意点: Utilizationが高くてもSM Activityが低い場合には、GPUコアを効率よく使えてない状態

3. CPU Utilization

  • 意味: CPUの使用状況
  • 理想値: バランスよく使用されている状態
  • 注意点: 特定のコアが100%に張り付いている場合は、CPUがボトルネックの可能性あり

4. Memory, Interconnect, Storage Bandwidth

  • 意味: 各種I/Oの実効帯域
  • 理想値: このメトリクスだけでは良し悪しを一概に判断できないため、ほかのメトリクスと合わせて判断する

基本的な操作

時間範囲の変更

右上の時間範囲セレクタで観測期間を変更できます:

Time Range

  • Last 5 minutes: 直近5分間
  • Last 1 hour: 直近1時間
  • Last 24 hours: 直近24時間
  • Custom range: カスタム期間

グラフの拡大・詳細表示

  1. ドラッグで拡大: グラフ上でドラッグして特定期間を拡大
  2. パネルの最大化: パネル右上の3点アイコンからViewボタンをクリック
  3. データの確認: グラフ上にカーソルを合わせて詳細値を表示

💡 よくある疑問と回答

Q: メトリクスが表示されない

A: 以下を確認してください:

  1. セットアップが正しく完了しているか(エラーが出ていないか)
  2. 時間範囲が適切か(データがない期間を見ていないか)
  3. トラブルシューティングを参照

Q: グラフの意味がわからない

A: 各パネルの「i」アイコンにマウスオーバーレイすると説明が表示されます。