科学者やエンジニアは、複雑な、計算負荷の高い問題を解くためにハイパフォーマンス コンピューティング (HPC) を利用しています。HPC アプリケーションには、高いネットワーク パフォーマンス、高速なストレージ、大量のメモリ、非常に高い計算機能が必要です。
Spot は、HPC をクラウドで実行することにより、研究を高速化し、結果が得られるまでの時間を短縮してユーザーを支援します。Spot は、クラウドの余剰キャパシティ ("スポット インスタンス") から CPU、GPU、および FPGA サーバーを使用して、インフラストラクチャーのコストを最大 80% 削減します。また、インフラストラクチャーの管理のオーバーヘッドを減らし、科学者やエンジニアの時間を節約します。
Spot Elastigroup は、HPC スケジューラーのキューを監視するコントローラー (エージェント) をデプロイします。特定のジョブのキューを監視するように Elastigroup を設定できます。Elastigroup は実行が保留されているジョブを見つけて、これらのジョブに必要なリソースの数を計算し、ジョブを実行するために必要な処理を開始します。
ジョブとタスクをサブミットすると、Elastigroup はタスクに必要なリソースおよび処理にかかる時間を判断します。Elastigroup は、オーバーサブスクリプションなしで、高速かつコスト効率に優れた実行が行われるように、この情報を使用してタスクを密にパックします。Elastigroup は、タスク認識 (時間とリソース) と価格および可用性のスポット インスタンス予測を組み合わせて、中断しないようにタスクをスケジュールします。
Elastigroup を使用して管理とオーケストレーションを単純化 – クラウド インフラストラクチャーのプロビジョニングおよび自動スケーリング
Elasitgroup は、予測アルゴリズムを使用して、必要なタスクまたはジョブに適した時間で実行できるスポット インスタンスを見つけます。
ヘテロジニアス クラスターを構成して複数のインスタンス タイプのノードを組み合わせることにより、Elastigroup は最大限の効率を提供します。正しいマシン タイプで適切なジョブを実行して、より優れたデータ処理パフォーマンスを実現できます。
Michael Waltz | 主任 DevOps エンジニア、Demandbase
Elastigroup は、インスタンスのライフサイクルを自動化し、EC2 スポット キャパシティ、可用性および価格設定の傾向に基づいた、EC2 スポット、既存のリザーブド インスタンスとオンデマンド インスタンスの組み合わせを提供します。
ヘテロジニアス クラスターを構成して複数のインスタンス タイプのノードを組み合わせることにより、Elastigroup は最大限の効率を提供します。正しいマシン タイプで適切なジョブを実行して、より優れたデータ処理パフォーマンスを実現できます。
Elastigroup は、EC2 スポット インスタンスを起動、スケーリングおよび終了するときに必要なパフォーマンス、コスト、および SLA 要件のバランスを調整します。EC2 スポットの可用性に Elastigroup の予測アルゴリズムを組み合わせます。
Elastigroup は、既存のタスクをグレースフルに終了してこれらのノードで新しいジョブがスケジュールされるのを防ぐため、クラウド プロバイダーからスポット終了通知が届く約 15 分前にノードを終了します。