メインコンテンツまでスキップ
バージョン: v2511

AIBoosterとは?

AIBoosterは、AIワークロードの性能を継続的に観測改善するためのパフォーマンスエンジニアリングプラットフォームです。

  • PO: Performance Observability
    • 🔍 可視化: 各種ハードウェアの使用率、効率などを一覧
    • 📊 分析: ソフトウェアボトルネックを特定し、改善点を発見
  • PI: Performance Intelligence
    • 性能向上: 自動チューニングで性能継続的に向上
    • 💰 コスト削減: 非効率なリソース利用を削減しROIを改善

ユーザーは、可視化ダッシュボードを通じてCPU、GPU、インターコネクト、ストレージといった各種ハードウェアリソースの利用効率やソフトウェアのボトルネックを可視化し、AIワークロードの性能特性を分析することができます。 さらに、AIワークロード用にデザインされた最適化フレームワークを適用することで、効率的な性能改善が可能になります。

AIBoosterを活用して、高速かつ低コストなAIの学習や推論を始めましょう!

機能ハイライト

推論モデルのプロファイリング

AcuiRTは推論向けのモデル変換を支援するフレームワークです。 本リリースによって、変換後のモデルの性能プロファイリングを簡単に行うことができるConversionWorkflow機能が搭載されました。 ユーザーは、わずか数行のコードを追加するだけで、変換後のモデルに対する以下のような情報取得することができます。

  • モデルの計算精度(Accuracy)
  • モデルの処理時間(Latency)
  • PyTorch Profilerによるプロファイリング結果

ConversionWorkflowの使い方については、こちらを参照してください。

パフォーマンスパラメータの自律的チューニング

ZenithTuneは、Kubernetes環境において特定の条件を満たすジョブを自動的に発見し、このジョブのハイパーパラメータを自律的に最適化することができます。 この機能を有効にすることで、チューニング用のジョブを手動で実行することなく、性能最適なパラメータを継続的に探し続けることができるようになります。 本リリースでは、チューニングに必要となるコストに対するリターンを最大化するため、チューニング用のジョブをカスタムするための機能が新たに追加されました。

  • ジョブフィルタリング
    • チューニング対象となるジョブの条件を柔軟に指定することができます。
  • ジョブルーティング
    • ジョブの種類や用途に応じて異なるチューニング設定を適用できます。
  • カスタムパッチ
    • チューニング用のジョブの設定をPyTorchJobのマニフェストからオーバライドすることができます。

自律的チューニングの使い方についてはこちらを参照してください。

各種ガイド

クイックスタートガイド

AIBoosterの概要、セットアップ方法と簡単な使い方について学びましょう。


性能観測ガイド

AIワークロードの性能を観測するための可視化ダッシュボードの使い方について学びましょう。


性能改善ガイド

AIワークロードの性能を改善するためのフレームワークの使い方について学びましょう。