Compute Engine インスタンスのプロビジョニング モデル (original) (raw)

Linux Windows

このドキュメントでは、Compute Engine インスタンスのプロビジョニング モデルについて説明します。

インスタンスを作成するときは、リクエストされたリソースを取得するために使用するメソッド(プロビジョニング モデル)を定義する必要があります。各プロビジョニング モデルにより、インスタンスの可用性、ライフサイクル、料金が決まります。これらのモデルを理解することで、ワークロードに最適なオプションを選択できます。

利用可能なプロビジョニング モデル

コンピューティング インスタンスを作成するときに、次のいずれかのプロビジョニング モデルを指定できます。プロビジョニング モデルを指定しない場合、Compute Engine はデフォルトで標準プロビジョニング モデルを使用します。

次の表は、各プロビジョニング モデルのユースケースと料金を比較するのに役立ちます。

標準 Spot Flex Start Reservation-bound
概要 リソースの可用性に基づいて、インスタンスをすぐに作成できます。 インスタンスの停止または削除のタイミングを制御できます。 リソースの可用性に基づいて、インスタンスをすぐに作成できます。 インスタンスの停止または削除のタイミングを制御できます。ただし、容量を再利用するために Compute Engine がインスタンスを任意のタイミングで停止または削除できるようにします。 リソースの可用性に基づいて、指定した待機時間内にインスタンスを作成できます。スタンドアロン インスタンスの場合、最大 2 時間の待機時間を指定できます。MIG のサイズ変更リクエストの場合、待機時間は無期限です。 インスタンスの停止または削除のタイミングを制御できます。ただし、一時停止または再作成はできません。インスタンスは、最小 10 分から最大 7 日間実行されます。インスタンスの実行時間が終了すると、Compute Engine は終了アクションに基づいてインスタンスを停止または削除します。 GPU が割り当てられたインスタンスを作成するために、将来の日付で容量の予約をリクエストできます。 Google Cloud がリクエストを承認すると、Compute Engine は予約を作成します。予約期間の開始時に、予約と一致する GPU インスタンスを作成して予約を消費できます。 承認された予約期間中は、必要に応じてインスタンスを停止、再起動、削除、再作成して予約を使用できます。予約期間が終了すると、Compute Engine は予約を削除し、終了アクションに基づいて予約を消費するインスタンスを停止または削除します。
ユースケース 安定性と継続的な運用が必要なワークロードに適しています。たとえば、次のようなワークロードに最適です。 ウェブサーバー データベース エンタープライズ アプリケーション 開発とテスト 中断を許容できるワークロードに適しています。たとえば、次のようなワークロードに最適です。 バッチ処理 ハイ パフォーマンス コンピューティング(HPC) 継続的インテグレーションと継続的デプロイ(CI / CD) データ分析 メディアのエンコード オンライン推論 安定性が求められ、7 日間以内に実行する必要があるワークロード。たとえば、次のようなワークロードに適しています。 小規模モデルの事前トレーニング モデルのファインチューニング HPC シミュレーション バッチ推論 安定性と特定の実行時間を必要とするワークロードに適しています。たとえば、次のようなワークロードに最適です。 最大 90 日間続くワークロード: モデルの事前トレーニング ジョブ モデルのファインチューニング ジョブ HPC シミュレーション ワークロード 推論ワークロードの短期的な増加の見込み 90 日を超えるワークロード: トレーニング ワークロード 推論ワークロード
料金 インスタンスに対して標準料金が請求されます。VM インスタンスの料金をご覧ください。 インスタンスの作成に使用するメソッドに応じて料金が発生します。 インスタンスをすぐに作成する場合は、従量課金制(PAYG)で支払います。 オンデマンド予約または将来の予約用に自動作成された予約を使用してインスタンスを作成すると、予約が存在する限り課金されます。詳細については、予約の課金をご覧ください。 多くのマシンタイプ、GPU、TPU、ローカル SSD ディスクで最大 91% の割引が適用されます。詳細については、Spot VM の料金をご覧ください。 PAYG。 インスタンスで使用するマシンシリーズに応じて、次のように割引が適用されます。 A4、A3、A2 マシンシリーズの場合、vCPU、メモリ、GPU の割引率は 53% です。 H4D マシンシリーズの場合、vCPU とメモリの割引率は 25% です。 サポートされている他のマシンシリーズは割引の対象外です。詳細については、Dynamic Workload Scheduler(DWS)の料金をご覧ください。 PAYG。 また、インスタンスの作成用に容量を予約する方法に応じて、次のように料金が発生します。 AI Hypercomputer で容量を予約すると、アクセラレータ最適化 VM の料金に基づいて課金されます。1 年以上リソースを予約する場合は、リソースベースのコミットメントを購入して、予約したリソースに関連付ける必要があります。 カレンダー モードで将来の予約を使用して容量を予約すると、Dynamic Workload Scheduler(DWS)の料金に基づいて料金が発生します。 予約期間に対して料金が発生します。詳細については、予約の課金をご覧ください。
割り当て インスタンスを作成すると、標準の割り当てが消費されます。 インスタンスを作成すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。Google Cloud の無料枠クレジットは Spot VM に適用されません。 MIG がグループにインスタンスを追加すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。 割り当ては、予約で制限されたプロビジョニング モデルには適用されません。

インスタンスの可用性とライフサイクル

次の表に、各プロビジョニング モデルのコンピューティング インスタンスの可用性と存続期間を示します。

標準 Spot Flex Start Reservation-bound
作成の前提条件 作成の前提条件はありません。 作成の前提条件はありません。 作成の前提条件はありません。 インスタンスを作成するには、まず次のいずれかの方法で容量を予約する必要があります。 長時間実行されるワークロードの容量を予約するには、AI Hypercomputer の将来の予約を使用します。 最大 90 日間実行されるワークロードの容量を予約するには、カレンダー モードの将来の予約を使用します。 選択した受渡日時に、Compute Engine はリクエストされた容量をプロビジョニングします。その後、インスタンスを作成して容量を消費できます。
サポートされているマシンシリーズ A4X、A4 と A3 Ultra を除く任意のマシンシリーズを使用できます。 A4X、X4、ベアメタルの各インスタンスを除く任意のマシンシリーズを使用できます。 使用できるマシンシリーズは次のとおりです。 A4、A3、A2、G2 の各マシンシリーズ GPU が割り当てられた N1 仮想マシン(VM)インスタンス H4D マシンシリーズ VM を作成するための容量を予約する方法に応じて、次のマシンシリーズのみを使用できます。 AI Hypercomputer で容量を予約する場合は、A4X、A4、または A3 Ultra マシンシリーズのみを使用できます。 カレンダー モードで将来の予約を作成する場合は、8 個の GPU を搭載した A4、A3 Ultra、A3 Mega、または A3 High マシンシリーズのみを使用できます。
インスタンスの可用性 リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。 リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。 次のようにインスタンスを作成できます。 スタンドアロン インスタンスを作成しますMIG のサイズ変更リクエストを作成します。 Compute Engine は、DWS を使用して、リソースの利用状況に応じてリクエストされた容量のプロビジョニングをスケジュールします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。 インスタンスを作成できるのは、将来の日付の容量を予約した後です。リクエストされた日になると、Compute Engine はリクエストされた容量を配信します。この容量を使用してインスタンスを作成できます。カレンダー モードで将来の予約を使用してリソースを予約すると、Compute Engine は DWS を使用してリクエストされた容量をプロビジョニングします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。
容量保証 作成方法に基づく。容量保証は、インスタンスの作成に使用する方法に応じて次のように異なります。 インスタンスをすぐに作成する場合、Compute Engine はリクエストされた容量をプロビジョニングするためにベスト エフォートで試行します。 オンデマンド予約または将来の予約の自動作成された予約を使用してインスタンスを作成する場合、その予約に予約済み容量が使用可能であれば、Compute Engine がリクエストされた容量をプロビジョニングする可能性は非常に高くなります。 ベスト エフォートSpot VM を作成すると、Compute Engine はリクエストされた容量をプロビジョニングするためにベスト エフォートで試行します。 ベスト エフォートMIG のサイズ変更リクエストを作成すると、Compute Engine はリクエストされた容量のプロビジョニングをスケジュールするためにベスト エフォートで試行します。 非常に高い。 Google Cloud が予約リクエストを承認すると、Compute Engine が選択した受渡日時に予約済み容量をプロビジョニングする可能性が非常に高くなります。予約期間中は、予約した容量に排他的にアクセスできます。
インスタンスの存続期間 インスタンスの停止または削除のタイミングを制御できます。ただし、インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。 インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。 Compute Engine は、容量を再利用するためにインスタンスを停止または削除します。このプロセスはプリエンプションと呼ばれます。 インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。 インスタンスが実行時間の終了に達する前に、次の操作を行うことができます。 インスタンスを停止する: スタンドアロン インスタンスとして作成された場合にのみ、いつでもインスタンスを停止できます。 インスタンスを削除する: インスタンスはいつでも削除できます。 インスタンスの実行時間が終了すると、Compute Engine はインスタンスを削除します。 インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。 Compute Engine は、ホスト メンテナンス イベント中にインスタンスを停止します。 リクエストされた容量をプロビジョニングするために自動的に作成された予約に対して、確約された予約期間が終了します。その時点で、Compute Engine は予約を削除し、構成で指定された終了アクションに基づいて、予約を消費するインスタンスを停止または削除します。

高密度デプロイのプロビジョニング モデル

Google Cloudにハイ パフォーマンス コンピューティング(HPC)、AI、ML のワークロードをデプロイするには、ネットワーク ホップを最小限に抑え、レイテンシを最小限にするように最適化するために、コンピューティング リソースを物理的に互いに近い場所に配置する必要があります。Compute Engine には、単一のデータセンター内の高速ネットワーク ファブリックで相互接続された密結合ホストグループを予約できるプロビジョニング方法が用意されています。

高密度デプロイのプロビジョニング方法の詳細については、以下をご覧ください。

次のステップ