Passer au contenu principal

[Cloud] Guide Méthodologique

S
Écrit par Support

Pourquoi prendre en compte les émissions liées au Cloud?
Les services cloud désignent l'ensemble des services informatiques fournis via Internet, incluant le stockage, les serveurs, les bases de données, les réseaux, les logiciels et les outils d'analyse.
Les infrastructures de réseau et de cloud représentent 15 % de la consommation énergétique totale liée au numérique, et cette part est encore plus élevée à l'échelle d'une entreprise. Pourtant, les géants du secteur qui gèrent les plus grands centres de données — tels qu'Amazon (AWS), Google (GCP) ou Microsoft (Azure) — restent très opaques quant à leur impact carbone et leur consommation d'électricité (voir à ce sujet l'article de Carbone 4).


Puisque les clients exigent de connaître l'impact précis de leurs activités numériques, nous avons développé des modèles basés sur un ensemble d'hypothèses et d'ingénierie inverse (retro-engineering). Ces modèles permettent d'évaluer l'électricité consommée ainsi que l'impact lié à l'amortissement des serveurs utilisés. Chaque fournisseur ayant ses spécificités, nous avons conçu un modèle dédié pour chacun des acteurs majeurs.

Bien que les fournisseurs de cloud développent actuellement leurs propres outils de reporting carbone, seuls OVH et AWS sont aujourd'hui jugés suffisamment fiables pour que leurs données soient intégrées directement dans nos bilans. GCP s'en rapproche et Azure progresse, mais ce dernier manque encore cruellement d'informations sur la partie relative à l'électricité.

Différences vs. On-Prem/Datacenters externes

Déploiement:-Services Cloud: Fournis et gérés par des prestataires tiers et accessibles en ligne. Vous payez généralement ce que vous consommez (à l'heure de serveur, au Go de stockage utilisé, etc.).

  • On-Prem: Déployés au sein des propres locaux de l'organisation et gérés en interne (datacenter on-premise), ou via un prestataire louant des salles de serveurs (datacenter externe). Vous achetez généralement le matériel physique ou le louez pour une certaine durée (1 mois, 1 an). Dans ce cas, les clients sont généralement en mesure de collecter leur consommation d'énergie et l'inventaire de leurs équipements.

  • Généralement, plus le datacenter est grand, plus la consommation d'énergie est optimisée. Il y a également des avantages liés à la capacité de partager la même machine entre différents utilisateurs.
    Évolutivité (Scalability):-Services Cloud: Facilement évolutifs avec des ressources à la demande qui peuvent être arrêtées à tout moment ou remplacées par des machines plus efficaces (modèle de paiement à l'usage).

  • On-Prem: L'évolutivité est limitée par l'infrastructure physique et nécessite des mises à niveau matérielles. Cela demande plus de prévisions et de gestion des infrastructures.Coût:-Services Cloud: Fonctionnent sur un modèle d'abonnement ou de paiement à l'usage, réduisant les coûts initiaux.

  • On-Prem: Impliquent un investissement initial important dans le matériel et des dépenses de maintenance continuelles. Cette solution peut néanmoins s'avérer moins chère sur le long terme.Gestion:-Services Cloud: La gestion, les mises à jour et la maintenance sont prises en charge par le fournisseur de cloud.

  • On-Prem: L'organisation est responsable de tous les aspects de la gestion, des mises à jour et de la maintenance.
    Bien que l'objectif entre les services cloud et les datacenters on-premise soit le même, ce choix change beaucoup de choses pour les entreprises.
    Les fournisseurs de cloud sont souvent qualifiés de « boîtes noires » pour les raisons suivantes:

  • Manque de transparence: Les utilisateurs ont une visibilité limitée sur le fonctionnement interne, les infrastructures et les pratiques de gestion du fournisseur de cloud.

  • Contrôle: Les utilisateurs ne peuvent pas accéder directement ni modifier les configurations matérielles et logicielles sous-jacentes.

  • Technologies propriétaires: Les fournisseurs utilisent des technologies et des méthodes exclusives qui ne sont pas divulguées aux clients.
    Cela peut rendre difficile pour les utilisateurs de comprendre pleinement comment leurs données sont traitées et comment les services sont gérés. Les fournisseurs de cloud mettent à disposition des tableaux de bord (gratuits ou payants), mais restreignent l'accès aux informations jugées non nécessaires, comme le taux de charge moyen (average workload, soit le travail réel par rapport au travail maximum qu'un serveur peut accomplir) des machines que vous utilisez.

Type de données brutes

Les types d'émissions de GES des fournisseurs de cloud sont similaires à ceux des centres de données on-premise et comprennent:

  • Consommation d'électricité: Émissions issues de la production de l'électricité utilisée pour alimenter les serveurs et faire fonctionner les centres de données.

  • Amortissement du matériel: Émissions liées à la fabrication, au transport et à la fin de vie du matériel informatique.

  • Refroidissement: Émissions dues aux fuites de fluides frigorigènes (l'électricité utilisée pour le refroidissement est quant à elle incluse dans la première catégorie).

  • Autres émissions indirectes: Émissions liées à l'amortissement des bâtiments et aux déplacements domicile-travail des employés.
    Cette dernière catégorie n'est pas prise en compte dans les modèles cloud, car ces données sont difficiles à quantifier et représentent une part minime des émissions globales.

Comment procédons-nous?

La méthodologie Greenly s'appuie sur les fichiers de facturation de coûts et d'utilisation (cost & usage) pour en extraire des données physiques. Il s'agit en effet d'une étude physique qui suit la consommation d'électricité, l'amortissement du matériel et l'utilisation des fluides frigorigènes.
Elle distingue également les émissions liées au calcul (compute), au stockage des données (storage) et au transfert des données (data transfer). C'est donc une méthodologie rigoureuse et complète qui permet de mesurer au mieux ces émissions et de les comprendre pour mieux les réduire. C'est notamment le meilleur moyen d'obtenir une représentation des émissions du cloud par service et par pays.
Cette approche permet aussi de cartographier les pays dans lesquels les opérations cloud sont exécutées, ainsi que l'intensité carbone de l'électricité qui y est associée.

Traitement entre les référentiels
La méthodologie reste la même entre le GHG Protocol et le BEGES.
Nous utilisons systématiquement l'approche location-based (basée sur le réseau de distribution local) pour l'électricité, même si les fournisseurs de cloud souscrivent de nombreux contrats d'énergie renouvelable. Cette approche est plus représentative de l'impact physique réel sur le réseau et garantit une cohérence parfaite avec le reste de nos facteurs d'émission, qui s'appuient également sur la méthode location-based.

Types de facteurs d'émission-Électricité: Facteurs d'émission de l'AIE (IEA - International Energy Agency).

  • Amortissement du matériel: Basé sur l'Analyse de Cycle de Vie (ACV) du serveur Dell R740 pour la partie calcul (compute), et sur une étude de l'Université de Louisville pour la partie stockage.

  • Fuites de fluides frigorigènes: Utilisation des données émises en g/MWh issues de l'étude conjointe ADEME x ARCEP, avec le gaz R-134a comme fluide de référence.

  • Transfert de données: Seule la consommation d'électricité du réseau est prise en compte. Pour convertir les Go transférés en kWh nous appliquons les chiffres de cette même étude ADEME x ARCEP.

Comment calculons-nous les émissions?

Dans le cadre de notre analyse du cloud, les émissions sont réparties entre 4 grandes familles de services distinctes.
Voici un exemple des données utilisées pour réaliser le calcul:


Ces données intègrent: la date, le nom des services(qui permet de les associer à la bonne catégorie et d'obtenir des informations sur la localisation ainsi que sur le type de serveur ou de processeur utilisé), la quantité(dont l'unité varie selon la catégorie du service) et le prix.

Calcul

Il s'agit de l'utilisation de serveurs de calcul et de processeurs (= puissance de calcul) pour faire fonctionner des applications, des sites web ou des processus.
La puissance de calcul consommée est mesurée en heures de vCPU (virtual Central Processing Unit), ce qui correspond à l'utilisation d'une fraction d'un processeur pendant une heure. Pour simplifier, chaque type de processeur possède un nombre de cœurs (cores) physiques. Si un processeur dispose de 4 cœurs, il est théoriquement capable d'exécuter 4 calculs en simultané. Chaque cœur peut ensuite être divisé en deux canaux d'exécution appelés threads, un thread formant un vCPU.
Chaque heure de vCPU utilisée ne consomme pas la même quantité d'énergie, car cela dépend du type de processeur sous-jacent. Pour estimer cette consommation d'énergie, nous utilisons l'indicateur TDP (Thermal Design Power — enveloppe thermique du processeur) associé à un taux de charge moyen estimé à 40 %.

⚠️ Note importante: La consommation électrique d'un processeur reste élevée même lorsqu'il est inactif (idle). Par conséquent, il est énergétiquement plus efficace de faire fonctionner un seul processeur à 100 % de sa capacité plutôt que deux processeurs à 50 %.


Nous calculons également l'impact de l'amortissement des serveurs en nous basant sur les données de l'Analyse de Cycle de Vie (ACV) du serveur Dell R740. Pour cela, nous comparons le nombre de vCPU mobilisés par le service acheté par rapport au nombre total de vCPU disponibles sur la machine physique.
Enfin, nous déterminons l'impact du refroidissement à l'aide d'un indicateur de corrélation (proxy) appliqué à la consommation d'électricité, combiné aux conclusions d'une étude de l'ADEME x ARCEP portant sur les centres de données européens.

Stockage

Le stockage est mesuré en Go.mois (GB.month en anglais, sachant que 1 Go = 8 Gb). Ainsi, stocker 1 Go de données pendant une année complète équivaut à une consommation de 12 Go.mois.
Pour calculer l'impact du stockage lié à l'électricité et à l'amortissement, nous nous appuyons sur des études académiques combinées aux données d'ACV du serveur Dell R740 spécifiques à l'impact des disques de stockage.
L'impact lié au refroidissement est quant à lui calculé selon la même méthode que celle utilisée pour la partie calcul (compute).

Transfert
Le transfert de données est mesuré en Go (GB). Il représente la quantité de données transférées soit entre le centre de données du prestataire et les utilisateurs finaux, soit en interne entre différents serveurs et zones géographiques (pour la réplication ou la sauvegarde de données, par exemple).
Nous distinguons 3 types de transferts de données:
Internet: Concerne les flux transitant par le réseau internet public vers le « monde extérieur ». C'est le type de transfert le plus énergivore (environ 40 fois plus de consommation électrique que l'inter-région) car il est moins optimisé et transite par de nombreux points de terminaison (end-points).
Inter-région: Concerne les transferts entre différents pays mais qui empruntent le réseau interne et privé du fournisseur de cloud, ce qui le rend très optimisé.
Intra-région: Concerne les flux de données entre deux serveurs situés au sein d'un même centre de données.
L'amortissement lié à la construction des infrastructures réseau n'est pas pris en compte ici, car les sources de données actuelles restent hautement incertaines.
###Autres services


Pour tous les services que nous ne pouvons pas associer aux 3 premières catégories (supervision/monitoring, support technique, sécurité, journaux d'activité/logs, adresses IP, etc.), nous utilisons cette catégorie générique. Elle est évaluée selon une approche monétaire (basée sur les dépenses), en appliquant le ratio carbone/monétaire calculé spécifiquement sur les 3 premières catégories.

Ordres de grandeur des émissions du Cloud-Intensité carbone monétaire: Elle se situe généralement entre 0, 02 et 0, 2 kgCO2e/€

  • Principales sources d'émissions: La consommation d'électricité et l'amortissement du matériel informatique constituent l'essentiel de l'impact.

  • Sur un mix électrique bas-carbone: l'amortissement du matériel représente environ 60 % de l'impact, contre 40 % pour l'électricité.

  • Sur un mix électrique fortement carboné: la consommation d'électricité grimpe à environ 80 % de l'impact, reléguant l'amortissement du matériel à 20 %.

Quels sont les résultats obtenus?

Les résultats globaux fournis sont les émissions ventilées par type d'impact (électricité, amortissement, fluides frigorigènes) ainsi que par grande famille de services (Calcul, Stockage, Transfert):


Il est également possible d'obtenir un niveau de granularité supérieur en analysant l'impact par localisation (zone géographique / pays):


Et enfin, la répartition de l'impact mois par mois:


Pour la partie calcul (compute), nous sommes en mesure de fournir les résultats détaillés en heures de vCPU consommées par type de processeur, ce qui permet de comparer directement l'efficacité énergétique des différents services utilisés:


Et pour la partie transfert, l'impact est ventilé par type de transfert (Internet, Inter-région, Intra-région):

Avez-vous trouvé la réponse à votre question ?