Disponibilité et durabilité des données (original) (raw)

Cette page traite des concepts liés à la disponibilité et à la durabilité des données dans Cloud Storage, y compris la manière dont Cloud Storage stocke les données de manière redondante, le comportement de réplication par défaut pour les emplacements birégionaux et multirégionaux, la fonctionnalité de réplication turbo pour les emplacements birégionaux et la fonctionnalité de réplication entre buckets.

Concepts clés

Redondance entre les régions

Là où les modèles de stockage traditionnels s'appuient souvent sur une approche active-passive avec des emplacements géographiques "principaux" et "secondaires", les emplacements multirégionaux et birégionaux Cloud Storage fournissent une architecture en mode actif/actif basée sur un bucket unique avec redondance entre les régions. Cela simplifie le processus de reprise après sinistre en éliminant la nécessité de faire répliquer les données d'un bucket à un autre par les utilisateurs ou de basculer manuellement vers le bucket secondaire en cas de temps d'arrêt de la région principale.

Cloud Storage comprend toujours l'état actuel d'un bucket et diffuse de manière transparente les objets d'une région disponible selon les besoins. Par conséquent, les buckets birégionaux et multirégionaux sont conçus pour avoir un objectif de temps de récupération de zéro et les défaillances régionales temporaires sont normalement invisibles pour utilisateurs. En cas de panne régionale, les buckets birégionaux continuent de diffuser automatiquement toutes les données ayant été répliquées entre les régions.

Cependant, la redondance entre les régions se produit de manière asynchrone. Par conséquent, toutes les données dont la réplication entre les régions n'est pas achevée avant l'indisponibilité d'une région sont inaccessibles jusqu'à ce que la région en panne soit de nouveau en ligne. Des données risquent d'être perdues dans le cas très peu probable de destruction physique de la région.

La réplication par défaut dans Cloud Storage est conçue pour assurer une redondance entre les régions pour 99,9 % des objets nouvellement écrits dans un délai d'une heure et pour 100 % des objets nouvellement écrits dans un délai de 12 heures. Les nouveaux objets incluent les importations, les réécritures, les copies et les compositions.

Cloud Storage propose également une fonctionnalité de réplication entre buckets qui peut être utilisée pour répliquer des données entre des buckets indépendants afin de répondre à des besoins de réplication de données supplémentaires qui ne sont pas satisfaits par les emplacements birégionaux ou multirégionaux.

Réplication turbo

La réplication turbo permet d'accélérer la redondance entre les régions pour les données de vos buckets birégionaux, ce qui réduit le risque d'exposition aux pertes de données et permet d'assurer la continuité des services à la suite d'une panne régionale. Lorsqu'elle est activée, la réplication turbo est conçue pour répliquer 100 % des objets nouvellement écrits dans les deux régions qui constituent l'emplacement birégional dans l'objectif de reprise après sinistre de 15 minutes, quelle que soit la taille de l'objet.

Notez que même pour la réplication par défaut, la réplication de la plupart des objets se termine en quelques minutes.

Tandis que la redondance entre régions et la réplication turbo contribuent à assurer la continuité des activités et la reprise après sinistre (BCDR), les administrateurs doivent planifier et mettre en œuvre une architecture BCDR complète qui est adaptée à leur charge de travail.

Pour en savoir plus, consultez le guide par étapes sur la conception de la reprise après sinistre pour les applications dans Google Cloud.

Limites

Réplication entre buckets

Dans certains cas, vous pouvez souhaiter conserver une copie de vos données dans un deuxième bucket. La réplication entre buckets copie de manière asynchrone les objets nouveaux et mis à jour d'un bucket source vers un bucket de destination.

La réplication entre buckets diffère de la réplication par défaut et de la réplication turbo, car vos données existent dans deux buckets indépendants, chacun avec sa propre configuration (emplacement de stockage, chiffrement, accès et classe de stockage, par exemple). Elle est particulièrement adaptée aux cas suivants :

La réplication entre buckets utilise le service de transfert de stockage pour répliquer les objets et Pub/Sub pour recevoir des alertes en cas de modification des buckets source et de destination. Vous pouvez activer la réplication entre buckets sur les nouveaux buckets que vous créez et sur les buckets existants.

Pour les buckets dont le taux de modification des objets est inférieur à 3 000 par seconde et dont les objets sont inférieurs à 1 Gio, la réplication entre buckets prend généralement quelques minutes à quelques dizaines de minutes, mais aucune limite supérieure spécifique n'est acceptée. De plus, les buckets dont les taux de modification sont plus élevés ou qui contiennent des objets plus volumineux peuvent s'attendre à des délais de réplication plus longs.

Pour savoir comment utiliser la réplication entre buckets, consultez la section Utiliser la réplication entre buckets.

Limites

Surveillance des performances

Cloud Storage surveille les objets non répliqués les plus anciens dans les buckets birégionaux et multirégionaux à l'aide de la réplication par défaut ou de la réplication turbo. Si un objet reste non répliqué plus longtemps que la durée de son objectif de reprise après sinistre, il est considéré comme étant en dehors de l'objectif de reprise après sinistre. Chaque minute au cours de laquelle un ou plusieurs objets sont en dehors de l'objectif de reprise après sinistre est comptabilisée comme une minute de comportement défaillant.

Par exemple, si un objet a généré 20 minutes de comportement défaillant de 9 h à 9 h 20 et qu'un autre objet a généré 10 minutes de comportement défaillant de 9 h 15 à 9 h 25, on considère que deux objets sont en dehors de l'objectif de reprise après sinistre pour le mois en question. Le nombre total de minutes de comportement défaillant pour le mois est de 25 minutes car de 9 h à 9 h 25, au moins un objet était en dehors de l'objectif de reprise après sinistre.

Dans la console Google Cloud , le graphique Pourcentage de minutes en dehors de l'objectif de reprise après sinistre vous permet de surveiller le pourcentage de minutes de comportement défaillant au cours des 30 derniers jours pour votre bucket lorsque vous utilisez la réplication par défaut ou la réplication turbo dans des buckets birégionaux ou multirégionaux. Cet indicateur de niveau de service permet de surveiller la conformité du temps de réplication mensuel du bucket. De même, le graphique Pourcentage d'objets hors cible suit les réplications d'objets qui n'ont pas eu lieu dans l'objectif de reprise après sinistre. Cet indicateur de niveau de service permet de surveiller la conformité du volume de réplication mensuel du bucket. Pour en savoir plus, consultez les pages Surveillance Cloud Storage et Contrat de niveau de service Cloud Storage.

Étapes suivantes