Compute Engine インスタンスのプロビジョニングモデル (original) (raw)

Linux Windows

このドキュメントでは、Compute Engine インスタンスのプロビジョニングモデルについて説明します。

インスタンスを作成するときは、リクエストされたリソースを取得するために使用するメソッド（プロビジョニングモデル）を定義する必要があります。各プロビジョニングモデルにより、インスタンスの可用性、ライフサイクル、料金が決まります。これらのモデルを理解することで、ワークロードに最適なオプションを選択できます。

利用可能なプロビジョニングモデル

コンピューティングインスタンスを作成するときに、次のいずれかのプロビジョニングモデルを指定できます。プロビジョニングモデルを指定しない場合、Compute Engine はデフォルトで標準プロビジョニングモデルを使用します。

標準
Spot
Flex Start
Reservation-bound

次の表は、各プロビジョニングモデルのユースケースと料金を比較するのに役立ちます。

標準	Spot	Flex Start	Reservation-bound
概要	リソースの可用性に基づいて、インスタンスをすぐに作成できます。インスタンスの停止または削除のタイミングを制御できます。	リソースの可用性に基づいて、インスタンスをすぐに作成できます。インスタンスの停止または削除のタイミングを制御できます。ただし、容量を再利用するために Compute Engine がインスタンスを任意のタイミングで停止または削除できるようにします。	リソースの可用性に基づいて、指定した待機時間内にインスタンスを作成できます。スタンドアロンインスタンスの場合、最大 2 時間の待機時間を指定できます。MIG のサイズ変更リクエストの場合、待機時間は無期限です。インスタンスの停止または削除のタイミングを制御できます。ただし、一時停止または再作成はできません。インスタンスは、最小 10 分から最大 7 日間実行されます。インスタンスの実行時間が終了すると、Compute Engine は終了アクションに基づいてインスタンスを停止または削除します。	GPU が割り当てられたインスタンスを作成するために、将来の日付で容量の予約をリクエストできます。 Google Cloud がリクエストを承認すると、Compute Engine は予約を作成します。予約期間の開始時に、予約と一致する GPU インスタンスを作成して予約を消費できます。承認された予約期間中は、必要に応じてインスタンスを停止、再起動、削除、再作成して予約を使用できます。予約期間が終了すると、Compute Engine は予約を削除し、終了アクションに基づいて予約を消費するインスタンスを停止または削除します。
ユースケース	安定性と継続的な運用が必要なワークロードに適しています。たとえば、次のようなワークロードに最適です。ウェブサーバーデータベースエンタープライズアプリケーション開発とテスト	中断を許容できるワークロードに適しています。たとえば、次のようなワークロードに最適です。バッチ処理ハイパフォーマンスコンピューティング（HPC）継続的インテグレーションと継続的デプロイ（CI / CD）データ分析メディアのエンコードオンライン推論	安定性が求められ、7 日間以内に実行する必要があるワークロード。たとえば、次のようなワークロードに適しています。小規模モデルの事前トレーニングモデルのファインチューニング HPC シミュレーションバッチ推論	安定性と特定の実行時間を必要とするワークロードに適しています。たとえば、次のようなワークロードに最適です。最大 90 日間続くワークロード: モデルの事前トレーニングジョブモデルのファインチューニングジョブ HPC シミュレーションワークロード推論ワークロードの短期的な増加の見込み 90 日を超えるワークロード: トレーニングワークロード推論ワークロード
料金	インスタンスに対して標準料金が請求されます。VM インスタンスの料金をご覧ください。インスタンスの作成に使用するメソッドに応じて料金が発生します。インスタンスをすぐに作成する場合は、従量課金制（PAYG）で支払います。オンデマンド予約または将来の予約用に自動作成された予約を使用してインスタンスを作成すると、予約が存在する限り課金されます。詳細については、予約の課金をご覧ください。	多くのマシンタイプ、GPU、TPU、ローカル SSD ディスクで最大 91% の割引が適用されます。詳細については、Spot VM の料金をご覧ください。 PAYG。	インスタンスで使用するマシンシリーズに応じて、次のように割引が適用されます。 A4、A3、A2 マシンシリーズの場合、vCPU、メモリ、GPU の割引率は 53% です。 H4D マシンシリーズの場合、vCPU とメモリの割引率は 25% です。サポートされている他のマシンシリーズは割引の対象外です。詳細については、Dynamic Workload Scheduler（DWS）の料金をご覧ください。 PAYG。	また、インスタンスの作成用に容量を予約する方法に応じて、次のように料金が発生します。 AI Hypercomputer で容量を予約すると、アクセラレータ最適化 VM の料金に基づいて課金されます。1 年以上リソースを予約する場合は、リソースベースのコミットメントを購入して、予約したリソースに関連付ける必要があります。カレンダーモードで将来の予約を使用して容量を予約すると、Dynamic Workload Scheduler（DWS）の料金に基づいて料金が発生します。予約期間に対して料金が発生します。詳細については、予約の課金をご覧ください。
割り当て	インスタンスを作成すると、標準の割り当てが消費されます。	インスタンスを作成すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。Google Cloud の無料枠クレジットは Spot VM に適用されません。	MIG がグループにインスタンスを追加すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。	割り当ては、予約で制限されたプロビジョニングモデルには適用されません。

インスタンスの可用性とライフサイクル

次の表に、各プロビジョニングモデルのコンピューティングインスタンスの可用性と存続期間を示します。

標準	Spot	Flex Start	Reservation-bound
作成の前提条件	作成の前提条件はありません。	作成の前提条件はありません。	作成の前提条件はありません。	インスタンスを作成するには、まず次のいずれかの方法で容量を予約する必要があります。長時間実行されるワークロードの容量を予約するには、AI Hypercomputer の将来の予約を使用します。最大 90 日間実行されるワークロードの容量を予約するには、カレンダーモードの将来の予約を使用します。選択した受渡日時に、Compute Engine はリクエストされた容量をプロビジョニングします。その後、インスタンスを作成して容量を消費できます。
サポートされているマシンシリーズ	A4X、A4 と A3 Ultra を除く任意のマシンシリーズを使用できます。	A4X、X4、ベアメタルの各インスタンスを除く任意のマシンシリーズを使用できます。	使用できるマシンシリーズは次のとおりです。 A4、A3、A2、G2 の各マシンシリーズ GPU が割り当てられた N1 仮想マシン（VM）インスタンス H4D マシンシリーズ	VM を作成するための容量を予約する方法に応じて、次のマシンシリーズのみを使用できます。 AI Hypercomputer で容量を予約する場合は、A4X、A4、または A3 Ultra マシンシリーズのみを使用できます。カレンダーモードで将来の予約を作成する場合は、8 個の GPU を搭載した A4、A3 Ultra、A3 Mega、または A3 High マシンシリーズのみを使用できます。
インスタンスの可用性	リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。	リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。	次のようにインスタンスを作成できます。スタンドアロンインスタンスを作成します。 MIG のサイズ変更リクエストを作成します。 Compute Engine は、DWS を使用して、リソースの利用状況に応じてリクエストされた容量のプロビジョニングをスケジュールします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。	インスタンスを作成できるのは、将来の日付の容量を予約した後です。リクエストされた日になると、Compute Engine はリクエストされた容量を配信します。この容量を使用してインスタンスを作成できます。カレンダーモードで将来の予約を使用してリソースを予約すると、Compute Engine は DWS を使用してリクエストされた容量をプロビジョニングします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。
容量保証	作成方法に基づく。容量保証は、インスタンスの作成に使用する方法に応じて次のように異なります。インスタンスをすぐに作成する場合、Compute Engine はリクエストされた容量をプロビジョニングするためにベストエフォートで試行します。オンデマンド予約または将来の予約の自動作成された予約を使用してインスタンスを作成する場合、その予約に予約済み容量が使用可能であれば、Compute Engine がリクエストされた容量をプロビジョニングする可能性は非常に高くなります。	ベストエフォートSpot VM を作成すると、Compute Engine はリクエストされた容量をプロビジョニングするためにベストエフォートで試行します。	ベストエフォートMIG のサイズ変更リクエストを作成すると、Compute Engine はリクエストされた容量のプロビジョニングをスケジュールするためにベストエフォートで試行します。	非常に高い。 Google Cloud が予約リクエストを承認すると、Compute Engine が選択した受渡日時に予約済み容量をプロビジョニングする可能性が非常に高くなります。予約期間中は、予約した容量に排他的にアクセスできます。
インスタンスの存続期間	インスタンスの停止または削除のタイミングを制御できます。ただし、インスタンスが使用するマシンタイプがライブマイグレーションをサポートしていない場合、Compute Engine はホストメンテナンスイベント中にインスタンスを停止します。	インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。 Compute Engine は、容量を再利用するためにインスタンスを停止または削除します。このプロセスはプリエンプションと呼ばれます。インスタンスが使用するマシンタイプがライブマイグレーションをサポートしていない場合、Compute Engine はホストメンテナンスイベント中にインスタンスを停止します。	インスタンスが実行時間の終了に達する前に、次の操作を行うことができます。インスタンスを停止する: スタンドアロンインスタンスとして作成された場合にのみ、いつでもインスタンスを停止できます。インスタンスを削除する: インスタンスはいつでも削除できます。インスタンスの実行時間が終了すると、Compute Engine はインスタンスを削除します。	インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。 Compute Engine は、ホストメンテナンスイベント中にインスタンスを停止します。リクエストされた容量をプロビジョニングするために自動的に作成された予約に対して、確約された予約期間が終了します。その時点で、Compute Engine は予約を削除し、構成で指定された終了アクションに基づいて、予約を消費するインスタンスを停止または削除します。

高密度デプロイのプロビジョニングモデル

Google Cloudにハイパフォーマンスコンピューティング（HPC）、AI、ML のワークロードをデプロイするには、ネットワークホップを最小限に抑え、レイテンシを最小限にするように最適化するために、コンピューティングリソースを物理的に互いに近い場所に配置する必要があります。Compute Engine には、単一のデータセンター内の高速ネットワークファブリックで相互接続された密結合ホストグループを予約できるプロビジョニング方法が用意されています。

高密度デプロイのプロビジョニング方法の詳細については、以下をご覧ください。

H4D インスタンス: HPC クラスタの作成の概要
GPU インスタンス: AI Hypercomputer のドキュメントの容量の概要。

次のステップ

Compute Engine インスタンスの作成の概要を確認する。
Spot VM の詳細を確認する。
Flex Start VM の詳細を確認する。
予約にバインドされたプロビジョニングモデルを使用する VM の詳細を確認する。

Compute Engine インスタンスのプロビジョニング モデル (original) (raw)

利用可能なプロビジョニング モデル

インスタンスの可用性とライフサイクル

高密度デプロイのプロビジョニング モデル

次のステップ

Compute Engine インスタンスのプロビジョニングモデル (original) (raw)

利用可能なプロビジョニングモデル

高密度デプロイのプロビジョニングモデル