加速器优化机器家族 (original) (raw)

本文档介绍了加速器优化机器家族,该机器家族可为您提供预先挂接了 NVIDIA GPU 的虚拟机 (VM) 实例。这些实例专为人工智能 (AI)、机器学习 (ML)、高性能计算 (HPC) 和图形密集型应用而设计。

加速器优化机器家族适用于以下机器系列:A4X、A4、A3、A2、G4 和 G2。一系列中的每个机器类型都有一个特定模型和挂接的 NVIDIA GPU 数量。您还可以将一些 GPU 模型挂接到 N1 通用机器类型。

按工作负载类型建议的机器系列

以下部分根据您的 GPU 工作负载介绍了建议的机器系列:

工作负载类型 建议的机器类型
预训练模型 A4X、A4、A3 Ultra、A3 Mega、A3 High 和 A2 如需确定最适合的机器类型或系列,请参阅 AI Hypercomputer 文档中的有关预训练模型的建议
微调模型 A4X、A4、A3 Ultra、A3 Mega、A3 High、A2 和 G4 如需确定最适合的机器类型或系列,请参阅 AI Hypercomputer 文档中的有关微调模型的建议
服务推理 A4X、A4、A3 Ultra、A3 Mega、A3 High、A3 Edge、A2 和 G4如需确定最适合的机器类型或系列,请参阅 AI Hypercomputer 文档中的有关服务推理的建议
图形密集型工作负载 G4、G2 和 N1+T4
高性能计算 对于高性能计算工作负载,任何加速器优化机器系列都适合。最适合的机器类型或系列取决于必须分流到 GPU 的计算量。如需了解详情,请参阅 AI Hypercomputer 文档中的有关 HPC 的建议

价格和使用选项

使用选项是指获取和使用计算资源的方式。Google Cloud 会针对加速器优化机器类型收取费用,费用包括挂接的 GPU、预定义 vCPU、内存和捆绑的本地 SSD(如果适用)。加速器优化实例的折扣因您所用的使用选项而异。如需详细了解加速器优化实例的价格信息,请参阅虚拟机实例价格页面上的加速器优化机器类型家族部分。

加速器优化实例的折扣因您选择的使用选项而异:

使用选项可用性(按机器类型)

下表总结了每种使用选项的可用性(按机器类型)。如需详细了解如何选择使用选项,请参阅 AI Hypercomputer 文档中的选择使用模式

机器类型 按需 Spot 灵活启动 按需预留 未来预留 日历模式下的未来预留(预览版) AI Hypercomputer 中的未来预留

A4X 机器系列

A4X 机器系列在基于 NVIDIA GB200 NVL72 机架级架构的艾级平台上运行,最多具有 140 个 vCPU 和 884 GB 内存。此机器系列针对计算和内存密集型、网络绑定机器学习训练和 HPC 工作负载进行了优化。A4X 机器系列提供一种机器类型。

使用 A4X 机器类型创建的虚拟机实例具有以下特性:

A4X 机器类型

A4X 加速器优化型机器类型使用 NVIDIA GB200 Grace Blackwell 超级芯片 (nvidia-gb200),非常适合基础模型训练和部署。

A4X 是基于 NVIDIA GB200 NVL72 的艾级平台。每台机器都有两个搭载了 Arm Neoverse V2 核心的 NVIDIA Grace CPU 插槽。这些 CPU 通过快速芯片间 (NVLink-C2C) 通信连接到四个 NVIDIA B200 Blackwell GPU。

挂接了 NVIDIA GB200 Grace Blackwell 超级芯片
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 物理 NIC 数量 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM3e)
a4x-highgpu-4g 140 884 12,000 6 2,000 4 744

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A4X 限制

A4X 实例支持的磁盘类型

A4X 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme 挂接了本地 SSD
a4x-highgpu-4g 128 128 不适用 不适用 8 32

磁盘和容量限制

您可以将不同类型的 Hyperdisk 混合挂接到实例,但所有磁盘类型的磁盘总容量上限(以 TiB 为单位)不能超过 512 TiB(对于所有 Hyperdisk)。

如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制

A4 机器系列

A4 机器系列提供配备多达 224 个 vCPU 和 3,968 GB 内存的机器类型。对于大多数 GPU 加速工作负载,A4 实例提供的性能是先前的 GPU 实例类型的 3 倍。建议将 A4 用于机器学习训练工作负载,尤其是在大规模场景(例如使用数百或数千个 GPU)。A4 机器系列提供一种机器类型。

使用 A4 机器类型创建的虚拟机实例具有以下特性:

A4 机器类型

A4 加速器优化型机器类型挂接了 NVIDIA B200 Blackwell GPU (nvidia-b200),非常适合基础模型训练和部署。

挂接的 NVIDIA B200 Blackwell GPU
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 物理 NIC 数量 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM3e)
a4-highgpu-8g 224 3,968 12,000 10 3600 8 1,440

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A4 限制

A4 实例支持的磁盘类型

A4 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme 挂接了本地 SSD
a4-highgpu-8g 128 128 不适用 不适用 8 32

磁盘和容量限制

您可以将不同类型的 Hyperdisk 混合挂接到实例,但所有磁盘类型的磁盘总容量上限(以 TiB 为单位)不能超过 512 TiB(对于所有 Hyperdisk)。

如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制

A3 机器系列

A3 机器系列最多配有 224 个 vCPU 和 2,944 GB 内存。此机器系列针对计算和内存密集型、网络绑定机器学习训练和 HPC 工作负载进行了优化。 A3 机器系列提供 A3 Ultra、A3 Mega、A3 High 和 A3 Edge 机器类型。

使用 A3 机器类型创建的虚拟机实例具有以下特性:

功能 A3 Ultra A3 Mega、A3 High、A3 Edge
GPU 加速 挂接了 NVIDIA H200 SXM GPU,每个 GPU 提供 141 GB GPU 内存,并提供更大、更快的内存,可支持大型语言模型和 HPC 工作负载。 挂接了 NVIDIA H100 SXM GPU,每个 GPU 提供 80 GB GPU 内存,非常适合基于 Transformer 的大语言模型、数据库和 HPC。
Intel Xeon 可扩缩处理器 第 5 代 Intel Xeon 可扩展处理器 (Emerald Rapids),可提供高达 4.0 GHz 的持续单核最大 Turbo 频率。如需详细了解此处理器,请参阅 CPU 平台 第 4 代 Intel Xeon 可扩缩处理器 (Sapphire Rapids),可提供高达 3.3 GHz 的持续单核最大 Turbo 频率。如需详细了解此处理器,请参阅 CPU 平台
业界领先的 NVLink 可伸缩性 NVIDIA H200 GPU 提供单向 900 GB/s 的峰值 GPU NVLink 带宽。 得益于系统中的 8 个 GPU 之间采用全连接 NVLink 拓扑,总 NVLink 带宽可高达 7.2 TB/s。 NVIDIA H100 GPU 提供单向 450 GB/s 的峰值 GPU NVLink 带宽。 得益于系统中的 8 个 GPU 之间采用全连接 NVLink 拓扑,总 NVLink 带宽可高达 7.2 TB/s。
增强了网络性能 对于此机器类型,RDMA over Converged Ethernet (RoCE) 通过将 NVIDIA ConnectX-7 网络接口卡 (NIC) 与我们的数据中心级四向轨道对齐网络相结合,可提高网络性能。与其他 A3 机器类型相比,通过利用 RDMA over Converged Ethernet (RoCE),a3-ultragpu-8g 机器类型可在集群中的实例之间实现更高的吞吐量。 对于 A3 Mega 机器类型,GPUDirect-TCPXO 通过将 TCP 协议分流,可进一步改进 GPUDirect-TCPX。通过利用 GPUDirect-TCPXO,a3-megagpu-8g 机器类型的网络带宽是 A3 High 和 A3 Edge 机器类型的两倍。 对于 A3 Edge (a3-edgegpu-8g) 和 A3 High (a3-highgpu-8g) 机器类型,GPUDirect-TCPX 可让数据包载荷直接从 GPU 内存传输到网络接口,从而提高网络性能。与 A2 或 G2 加速器优化机器类型相比,通过利用 GPUDirect-TCPX,这些机器类型可在集群中的实例之间实现更高的吞吐量。
提升了网络速度 网络速度是上一代 A2 机器系列的 4 倍。 如需详细了解网络,请参阅网络带宽和 GPU 网络速度是上一代 A2 机器系列的 2.5 倍。 如需详细了解网络,请参阅网络带宽和 GPU
虚拟化优化 A3 实例的外设组件互连高速总线 (PCIe) 拓扑可提供更准确的位置信息,工作负载可使用这些信息来优化数据传输。 GPU 还公开了功能级重置 (FLR),可从故障中正常恢复,并在某些情况下提供原子操作支持,可实现并发改进。
本地 SSD、永久性磁盘和 Hyperdisk 支持 本地 SSD 可用于快速 scratch 磁盘或用于将数据输送到 GPU 中,同时防止 I/O 瓶颈。本地 SSD 按以下方式挂接: 12,000 GiB 的本地 SSD 会自动添加到 A3 Ultra 实例。 6,000 GiB 的本地 SSD 会自动添加到 A3 Mega、A3 High 和 A3 Edge 实例。 对于需要更高存储性能的应用,您还可以为这些系列中的机器类型挂接高达 512 TiB 的永久性磁盘和 Hyperdisk。 对于部分机器类型,还支持高达 257 TiB 的永久性磁盘。
紧凑布置政策支持 可让您更好地控制实例在数据中心内的物理布置。 这样可以在单个可用区中为实例布置提供低延迟和更高的带宽。 如需了解详情,请参阅紧凑布置政策简介

A3 Ultra 机器类型

A3 Ultra 机器类型挂接了 NVIDIA H200 SXM GPU (nvidia-h200-141gb),是 A3 系列中能够提供最高网络性能的机器类型。A3 Ultra 机器类型非常适合基础模型训练和部署。

挂接了 NVIDIA H200 GPU
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 物理 NIC 数量 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM3e)
a3-ultragpu-8g 224 2,952 12,000 10 3600 8 1128

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A3 Ultra 限制

A3 Mega 机器类型

A3 Mega 机器类型配备 NVIDIA H100 SXM GPU,非常适合大型模型训练和多主机推理。

挂接了 NVIDIA H100 GPU
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 物理 NIC 数量 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM3)
a3-megagpu-8g 208 1,872 6000 9 1800 8 640

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A3 Mega 限制

A3 High 机器类型

A3 High 机器类型配备 NVIDIA H100 SXM GPU,非常适合大型模型推理和模型微调。

挂接了 NVIDIA H100 GPU
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 物理 NIC 数量 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM3)
a3-highgpu-1g 26 234 750 1 25 1 80
a3-highgpu-2g 52 468 1,500 1 50 2 160
a3-highgpu-4g 104 936 3000 1 100 4 320
a3-highgpu-8g 208 1,872 6000 5 1000 8 640

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A3 High 限制

A3 Edge 机器类型

A3 Edge 机器类型配备 NVIDIA H100 SXM GPU,专为部署而设计,在部分区域提供。

挂接了 NVIDIA H100 GPU
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 物理 NIC 数量 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM3)
a3-edgegpu-8g 208 1,872 6000 5 800:适用于 asia-south1 和 northamerica-northeast2 400:适用于所有其他 A3 Edge 区域 8 640

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A3 Edge 限制

A3 实例支持的磁盘类型

A3 Ultra

A3 Ultra 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Balanced High Availability Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme 挂接了本地 SSD磁盘
a3-ultragpu-8g 128 128 128 不适用 不适用 8 32

A3 Mega

A3 Mega 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Balanced High Availability Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme 挂接了本地 SSD磁盘
a3-megagpu-8g 128 32 32 64 64 8 16

A3 High

A3 High 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Balanced High Availability Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme 挂接了本地 SSD磁盘
a3-highgpu-1g 128 32 32 64 64 不适用 2
a3-highgpu-2g 128 32 32 64 64 不适用 4
a3-highgpu-4g 128 32 32 64 64 8 8
a3-highgpu-8g 128 32 32 64 64 8 16

A3 Edge

A3 Edge 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Balanced High Availability Hyperdisk Throughput Hyperdisk ML Hyperdisk Extreme 挂接了本地 SSD
a3-edgegpu-8g 128 32 32 64 64 8 16

磁盘和容量限制

如果机器类型支持,您可以同时将 Hyperdisk 卷和永久性磁盘卷挂接到实例,但存在以下限制:

如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限

A2 机器系列

A2 机器系列提供 A2 Standard 和 A2 Ultra 机器类型。这些机器类型具有 12 个到 96 个 vCPU 和高达 1,360 GB 的内存。

使用 A2 机器类型创建的虚拟机实例具有以下特性:

A2 机器系列提供以下机器类型。

A2 Ultra 机器类型

这些机器类型具有固定数量的 A100 80GB GPU。本地 SSD 会自动挂接到使用 A2 Ultra 机器类型创建的实例。

挂接了 NVIDIA A100 80GB GPU
机器类型 vCPU 数量1 实例内存 (GB) 已挂接的本地 SSD (GiB) 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM2e)
a2-ultragpu-1g 12 170 375 24 1 80
a2-ultragpu-2g 24 340 750 32 2 160
a2-ultragpu-4g 48 680 1500 50 4 320
a2-ultragpu-8g 96 1,360 3000 100 8 640

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A2 Ultra 限制

A2 标准机器类型

这些机器类型具有固定数量的 A100 40GB GPU。 您还可以在创建 A2 Standard 实例时添加本地 SSD 磁盘。如需了解可挂接的磁盘数量,请参阅需要您选择本地 SSD 磁盘数量的机器类型

挂接了 NVIDIA A100 40GB GPU
机器类型 vCPU 数量1 实例内存 (GB) 支持本地 SSD 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB HBM2)
a2-highgpu-1g 12 85 24 1 40
a2-highgpu-2g 24 170 32 2 80
a2-highgpu-4g 48 340 50 4 160
a2-highgpu-8g 96 680 100 8 320
a2-megagpu-16g 96 1,360 100 16 640

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

A2 Standard 限制

A2 实例支持的磁盘类型

A2 实例可以使用以下块存储类型:

A2 Ultra

每个实例的磁盘数量上限1
机器类型 所有磁盘 2 Hyperdisk ML 挂接了本地 SSD
a2-ultragpu-1g 128 32 1
a2-ultragpu-2g 128 48 2
a2-ultragpu-4g 128 64 4
a2-ultragpu-8g 128 64 8

A2 标准

每个实例的磁盘数量上限1
机器类型 所有磁盘 2 Hyperdisk ML 本地 SSD
a2-highgpu-1g 128 32 8
a2-highgpu-2g 128 48 8
a2-highgpu-4g 128 64 8
a2-highgpu-8g 128 64 8
a2-megagpu-16g 128 64 8

如果机器类型支持,您可以同时将 Hyperdisk 卷和永久性磁盘卷挂接到实例,但存在以下限制:

如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限

G4 机器系列

G4 机器系列使用 AMD EPYC Turin CPU 平台,并配备 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU。与上一代 G2 机器系列相比,此机器系列在 GPU 内存、GPU 内存带宽和网络带宽方面都有显著改进。

G4 实例最多可以挂接 384 个 vCPU、1,440 GB 内存和 12 TiB 的 Titanium SSD 磁盘。G4 实例还提供高达 400 Gbps 的标准网络性能。

此机器系列特别适用于 NVIDIA Omniverse 模拟工作负载、图形密集型应用、视频转码和虚拟桌面等工作负载。与 A 系列机器类型相比,G4 机器系列还提供了一种低成本解决方案来执行单主机推理和模型调优。

使用 G4 机器类型的实例具有以下特性:

G4 机器类型

G4 加速器优化型机器类型使用 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU (nvidia-rtx-pro-6000),适用于 NVIDIA Omniverse 模拟工作负载、图形密集型应用、视频转码和虚拟桌面。与 A 系列机器类型相比,G4 机器类型还提供了一种低成本解决方案来执行单主机推理和模型调优。

挂接了 NVIDIA RTX PRO 6000 GPU
机器类型 vCPU 数量1 实例内存 (GB) 支持的最大 Titanium SSD (GiB)2 物理 NIC 数量 网络带宽上限 (Gbps)3 GPU 数量 GPU 内存4 (GB GDDR7)
g4-standard-48 48 180 1,500 1 50 1 96
g4-standard-96 96 360 3000 1 100 2 192
g4-standard-192 192 720 6000 1 200 4 384
g4-standard-384 384 1,440 12,000 2 400 8 768

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2您可以在创建 G4 实例时添加 Titanium SSD 磁盘。如需了解可挂接的磁盘数量,请参阅需要您选择本地 SSD 磁盘数量的机器类型
3出站带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。请参阅网络带宽
4GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

G4 限制

G4 实例支持的磁盘类型

G4 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有 Hyperdisk Hyperdisk Balanced Hyperdisk Balanced High Availability Hyperdisk Extreme Hyperdisk Throughput Titanium SSD
g4-standard-48 32 32 32 0 32 4
g4-standard-96 32 32 32 8 32 8
g4-standard-192 64 64 64 8 64 16
g4-standard-384 128 128 128 8 128 32

您可以将不同类型的 Hyperdisk 混合挂接到实例,但所有磁盘类型的磁盘总容量上限(以 TiB 为单位)不能超过 512 TiB(对于所有 Hyperdisk)。

如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制

G4 点对点 (P2P) 通信

G4 实例使用直接 GPU 点对点 (P2P) 通信来提升多 GPU 工作负载性能。此功能使挂接到同一 G4 实例的 GPU 可以直接通过 PCIe 总线交换数据,而无需通过 CPU 的主内存传输数据。此直接路径可缩短延迟时间、降低 CPU 利用率并提高 GPU 之间的有效带宽。P2P 通信可显著加速机器学习 (ML) 训练和高性能计算 (HPC) 等多 GPU 应用。

此功能通常不需要修改应用代码。您只需配置 NCCL 即可使用 P2P。如需配置 NCCL,请在运行工作负载之前,根据机器类型在 G4 实例上设置 NCCL_P2P_LEVEL 环境变量

使用以下任一选项设置环境变量:

主要优势和性能

G2 机器系列

G2 机器系列提供标准机器类型,具有 4 到 96 个 vCPU 和高达 432 GB 的内存。此机器系列针对推断和图形工作负载进行了优化。 G2 机器系列提供一种标准机器类型,但有多种配置可供选择。

使用 G2 机器类型创建的实例具有以下特性:

G2 机器类型

G2 加速器优化机器类型挂接了 NVIDIA L4 GPU,非常适合注重成本效益的推理、图形密集型和高性能计算工作负载。

每种 G2 机器类型还具有默认内存和自定义内存范围。自定义内存范围定义了您可以为每种机器类型分配的实例内存量。您还可以在创建 G2 实例时添加本地 SSD 磁盘。如需了解可挂接的磁盘数量,请参阅需要您选择本地 SSD 磁盘数量的机器类型

挂接了 NVIDIA L4 GPU
机器类型 vCPU 数量1 默认实例内存 (GB) 自定义实例内存范围 (GB) 支持的最大本地 SSD (GiB) 网络带宽上限 (Gbps)2 GPU 数量 GPU 内存3 (GB GDDR6)
g2-standard-4 4 16 16 - 32 375 10 1 24
g2-standard-8 8 32 32 - 54 375 16 1 24
g2-standard-12 12 48 48 - 54 375 16 1 24
g2-standard-16 16 64 54 - 64 375 32 1 24
g2-standard-24 24 96 96 - 108 750 32 2 48
g2-standard-32 32 128 96 - 128 375 32 1 24
g2-standard-48 48 192 192 - 216 1500 50 4 96
g2-standard-96 96 384 384 - 432 3000 100 8 192

1每个 vCPU 是在其中一个可用的 CPU 平台上以单个硬件超线程的形式实现的。
2 出站流量带宽上限不能超过给定的数量。实际的出站带宽取决于目的地 IP 地址和其他因素。如需详细了解网络带宽,请参阅网络带宽
3GPU 内存是 GPU 设备上的内存,可用于临时存储数据。它与实例的内存分开,专门用于处理图形密集型工作负载的更高带宽需求。

G2 限制

G2 实例支持的磁盘类型

G2 实例可以使用以下块存储类型:

每个实例的磁盘数量上限1
机器类型 所有磁盘 2 Hyperdisk ML Hyperdisk Throughput 本地 SSD
g2-standard-4 128 24 24 1
g2-standard-8 128 32 32 1
g2-standard-12 128 32 32 1
g2-standard-16 128 48 48 1
g2-standard-24 128 48 48 2
g2-standard-32 128 64 64 1
g2-standard-48 128 64 64 4
g2-standard-96 128 64 64 8

如果机器类型支持,您可以同时将 Hyperdisk 卷和永久性磁盘卷挂接到实例,但存在以下限制:

如需详细了解容量限制,请参阅 Hyperdisk 大小和连接限制以及 Persistent Disk 容量上限

后续步骤