初めてのダッシュボード
AIBoosterのダッシュボードを使って、システムの性能を観測する方法を学びましょう。 このガイドでは、基本的な操作方法と主要なメトリクスの見方を説明します。
ダッシュボードの基本構造
ログイン後、最初に表示されるのはGrafanaのホーム画面です。
主要なエリア
-
左サイドバー: ナビゲーションメニュー
- Home: ホーム画面
- Dashboards: ダッシュボード一覧
- Explore: ユーザークエリによるデータ分析
- Configuration: 設定
-
メインエリア: ダッシュボードとパネル
-
上部ツールバー: 時間範囲の選択など
最初のダッシュボードを開く
- 左サイドバーの「Dashboards」をクリック
- 「Performance Overview」、あるいは「Cost Overview」を選択
「Details」という名前がついたダッシュボードは、Overviewのダッシュボードから遷移することを想定して設計されています。必ず、以下二つのダッシュボードを起点にしてください。
- 性能観点での分析: Performance Overview
- コスト観点での分析: Cost Overview
主要なメトリクスの見方
1. GPU Utilization
- 意味: GPUがどれだけ使用されているか
- 理想値: 学習時は80-95%
- 注意点: 50%以下の場合は、GPU以外にボトルネックがある状態
2. GPU SM Activity
- 意味: GPUコアの実際の計算効率
- 理想値: 70%以上
- 注意点: Utilizationが高くてもSM Activityが低い場合には、GPUコアを効率よく使えてない状態
3. CPU Utilization
- 意味: CPUの使用状況
- 理想値: バランスよく使用されている状態
- 注意点: 特定のコアが100%に張り付いている場合は、CPUがボトルネックの可能性あり
4. Memory, Interconnect, Storage Bandwidth
- 意味: 各種I/Oの実効帯域
- 理想値: このメトリクスだけでは良し悪しを一概に判断できないため、ほかのメトリクスと合わせて判断する
基本的な操作
時間範囲の変更
右上の時間範囲セレクタで観測期間を変更できます:
- Last 5 minutes: 直近5分間
- Last 1 hour: 直近1時間
- Last 24 hours: 直近24時間
- Custom range: カスタム期間
グラフの拡大・詳細表示
- ドラッグで拡大: グラフ上でドラッグして特定期間を拡大
- パネルの最大化: パネル右上の3点アイコンからViewボタンをクリック
- データの確認: グラフ上にカーソルを合わせて詳細値を表示
💡 よくある疑問と回答
Q: メトリクスが表示されない
A: 以下を確認してください:
- セットアップが正しく完了しているか(エラーが出ていないか)
- 時間範囲が適切か(データがない期間を見ていないか)
- トラブルシューティングを参照
Q: グラフの意味がわからない
A: 各パネルの「i」アイコンにマウスオーバーレイすると説明が表示されます。