Un héritage d'innovation : Une longueur d'avance sur le refroidissement avancé pour l'IA et le HPC
Réflexions sur 2023 et perspectives pour 2024
By Chris Sharp, Chief Technology Officer, Digital Realty
La fin de l'année est le moment idéal pour regarder en arrière et réfléchir aux réalisations et aux leçons apprises, ainsi qu'à la manière dont nous nous appuyons sur le passé pour planifier l'avenir.
L'intelligence artificielle (IA) et le calcul de haute performance (HPC) sont apparus comme des domaines clés pour l'innovation et la transformation de l'entreprise.
Le défi pour les responsables informatiques est de permettre ces workloads High-Density avec la bonne infrastructure informatique, et les technologies de refroidissement avancées, comme le refroidissement liquide, sont de plus en plus discutées au sein de la profession.
Alors que le refroidissement : Direct Liquid Cooling (DLC) est déployé dans les data centers aujourd'hui plus que jamais, seriez-vous surpris d'apprendre que nous le déployons dans nos conceptions de data centers chez Digital Realty depuis 2015 ? Saviez-vous également que le refroidissement liquide n'est pas toujours le bon choix pour chaque charge de travail AI ou HPC High-Density ?
Dans cet article, j'aborderai les bases des besoins en refroidissement des data centers pour les workloads High-Density comme l'IA et le HPC, et comment l'héritage de Digital Realty en matière d'innovation nous a préparé à soutenir l'accélération de la demande de techniques de refroidissement avancées de toutes sortes, y compris le refroidissement liquide.
Je partagerai également des études de cas de notre parcours novateur qui démontrent que pour favoriser l'innovation, il faut avoir la bonne stratégie et les bons partenaires, plutôt que d'adopter une approche unique.
Besoins en refroidissement des workloads High-Density
Le déploiement d'un système d'intelligence artificielle ou de calcul intensif détermine les besoins de refroidissement qui lui sont propres. Les exigences en matière de densité de puissance pour l'IA et le HPC peuvent être 5 à 10 fois plus élevées que pour d'autres cas d'utilisation des data centers. Les workloads traditionnels ont tendance à se situer dans une fourchette de 5 à 8 kW par rack.
En 2024, il est probable que certains matériels informatiques permettent des densités de puissance supérieures à 100 kW/rack et la densité maximale dans le data center pourrait atteindre 150 kW/rack au cours des deux prochaines années. Les densités de workloads traditionnels peuvent être refroidis à l'air, mais, d'une manière générale, la plupart des workflows AI et HPC nécessitent un refroidissement spécialisé tel que le refroidissement Direct Liquid Cooling (DLC), le refroidissement par liquide assisté par air (AALC) ou un échangeur de chaleur à porte arrière.
Toutes les workloads d'IA et de HPC ne nécessitent pas de refroidissement liquide
Les exigences en matière de refroidissement liquide varient selon le fournisseur de matériel, le matériel lui-même et le type de workloads. Le refroidissement liquide n'est pas adapté à tous les matériels ni à tous les scénarios.
Même à l'ère de l'IA, tous les racks ne consommeront pas 100 kW et ne nécessiteront peut-être même pas un refroidissement avancé spécialisé.
Par exemple, les déploiements d'inférence ont tendance à être moins gourmands en énergie que les déploiements de trainings et peuvent être refroidis avec des techniques traditionnelles de refroidissement par air. L'apprentissage automatique nécessite moins de ressources, tandis que l'apprentissage profond et l'IA générative requièrent des environnements massifs en raison de leur complexité.
Il est important que les responsables informatiques comprennent que les différentes workloads d'IA et de HPC ont des besoins de refroidissement différents et que tous les partenaires des data centers n'auront pas les connaissances spécialisées ou les capacités d'infrastructure nécessaires pour mettre en œuvre la technologie.
Les exigences de chaque déploiement varient, il est donc important de travailler avec un partenaire qui concevra une solution personnalisée et ne dépendra pas d'une approche unique. C'est pourquoi l'héritage de Digital Realty en matière d'expertise de conception de data centers avec refroidissement avancé fait la différence pour nos clients.
Stratégies d'innovation
La plateforme mondiale de data centers de Digital Realty, PlatformDIGITAL®, a été choisie pour accueillir de nombreuses workloads révolutionnaires en matière d'IA et de HPC. Nous avons appris que pour favoriser l'innovation, quelques stratégies clés nous aident non seulement à suivre le rythme de la technologie, mais aussi à garder une longueur d'avance.
Les stratégies informatiques destinées à prendre en charge les workflows d'IA et de HPC doivent permettre :
- D'être agile
- De scaler
- D'avoir une croissance éco-responsable
Ces études de cas tirées de notre propre parcours d'innovation au cours de la dernière décennie mettent en évidence ces stratégies en action. Elles montrent également comment notre expertise et notre stratégie d'innovation nous aident à identifier la bonne solution pour la situation plutôt que de s'appuyer sur une approche unique.
Études de cas sur l'innovation
Enable scale : un système de trading high capacity avec refroidissement liquide
2015 a été une année de transformation pour nous chez Digital Realty ; c'était aussi ma première année au sein de l'entreprise. Nous nous sommes lancés dans un projet ambitieux visant à bâtir les fondations d'une entreprise mondiale de services financiers spécialisée dans le trading algorithmique à haute fréquence.
Un élément important de ce projet a été le passage stratégique d'un refroidissement par air traditionnel à un refroidissement liquide avancé jusqu'au niveau de la puce pour prendre en charge les clusters HPC. Cette prouesse technique a non seulement amélioré l'efficacité du système de refroidissement, mais nous a également permis de faire évoluer notre technologie pour continuer à soutenir notre client lorsque son déploiement a atteint près de 6 MW.
Investir dans une technologie de refroidissement liquide de nouvelle génération était une décision dont nous savions qu'elle permettrait à notre client d'aller au-delà de ses besoins immédiats et d'établir une capacité axée sur l'évolutivité et la durabilité à long terme.
Permettre une croissance durable : supercalculateur avec une conception adaptable
Récemment, nous avons collaboré avec un client européen pour développer un environnement de supercalculateur sophistiqué qui comprenait jusqu'à 70 kW par rack dans un environnement mixte. Le client avait besoin de se déployer rapidement tout en se conformant aux nouvelles réglementations en matière de développement durable.
Attendre 3 à 5 ans pour construire un nouveau data center n'était pas envisageable, c'est pourquoi notre capacité à rénover des installations existantes permet aux clients d'être opérationnels plus rapidement. En prenant une installation économe en énergie que nous avons construite en 2013, nous avons été en mesure de répondre à leurs exigences en matière de densité de puissance et de connectivité avec un minimum de changements dans notre installation. Cela a permis un déploiement 400 % plus rapide.1
Notre client a prévu une amélioration de 30 % de l'efficacité énergétique en passant au refroidissement liquide.1 Il a également bénéficié du système de refroidissement ATES (aquifer thermal energy storage) de Digital Realty et de sources d'énergie entièrement renouvelables pour atteindre les objectifs de CO2 fixés par les réglementations locales en matière de développement durable.
Notre capacité à développer des conceptions de modernisation montre notre engagement en faveur d'une conception à la fois avant-gardiste et souple qui permet une croissance durable et opportune. Nos principes de conception garantissent que notre infrastructure répondra non seulement aux besoins actuels, mais aussi aux exigences des décennies à venir.
Favoriser l'agilité : un déploiement d'IA générative flexible et à l'épreuve du temps
Aujourd'hui, nous jouons un rôle clé dans l'avancement de l'IA générative (GenAI). Nous travaillons avec un client qui intègre plus de 30 000 GPU parmi les plus avancés dans une plateforme massive.
Pour permettre des performances de calcul avancées, le déploiement exige que chaque GPU soit connecté dans un seul cluster de calcul. Le client avait besoin d'un fournisseur de plateforme de data centers capable de l'aider à se déployer rapidement pour commencer à tirer parti de son investissement dans les GPU, ce qui était d'autant plus difficile à réaliser que les exigences de conception étaient spécifiques.
Notre stratégie d'investissement vise à anticiper la demande future, ce qui nous a permis de leur proposer une installation prête à l'emploi avec des conceptions prêtes à l'emploi. Notre approche agile et modulaire de la conception nous a permis de résoudre leurs problèmes de conception complexes tout en conservant 99 % de la conception d'origine, ce qui nous a permis de commencer à construire plus tôt.
Les exigences de nos clients évoluent rapidement, tout comme la technologie et les solutions pour y répondre - c'est pourquoi l'agilité doit être une stratégie de base pour favoriser l'innovation.
Même s'il s'agit de la définition d'une charge de travail d'IA avancée, le refroidissement liquide direct n'était pas le meilleur choix pour le refroidissement. C'est un bon exemple de la raison pour laquelle une approche unique du refroidissement des workloads high-density ne fonctionne pas.
Au-delà de l'infrastructure : favoriser une culture de l'innovation
Pour mettre en œuvre ces stratégies d'innovation, un autre élément clé est votre équipe. Pour tous les responsables informatiques, il est important de se rappeler que nos réalisations ne se limitent pas à l'infrastructure : elles sont liées à la culture de l'innovation que nous avons cultivée. Chez Digital Realty, nos équipes talentueuses apportent un héritage d'innovation et d'ingénierie pour lequel nous avons reçu de nombreuses récompenses en tant que pionniers dans le domaine des data centers. Notre culture de l'innovation chez Digital Realty permet de s'aligner sur nos clients, ce qui garantit à nos partenaires qu'ils pourront se développer avec Digital Realty à l'avenir.
Une vision pour l'avenir
Mon rôle en tant que Chief Technology Officer chez Digital Realty est de comprendre les besoins technologiques de nos clients et de veiller à ce que Digital Realty puisse répondre à ces besoins, non seulement aujourd'hui, mais aussi demain.
En regardant vers l'avenir, nous restons déterminés à ne pas nous contenter de participer au paysage technologique, mais à le façonner activement. Notre mission est de permettre à nos clients d'innover en leur donnant de l'agilité, de l'envergure et une croissance durable. L'éco-responsabilité est particulièrement importante pour nous. Nous continuons à étendre notre couverture de sources d'énergie renouvelables et sans carbone pour répondre à la demande de nos clients - nous avons plus d'un gigawatt d'énergie solaire et éolienne sous contrat - et nous avons commencé à utiliser des solutions d'énergie secondaire à base de combustibles alternatifs pour réduire davantage l'empreinte carbone de nos centres de données tout au long de leur cycle de vie.
Nous nous attacherons à appliquer la meilleure technologie en temps voulu pour répondre aux besoins de nos clients, plutôt que de déployer en gros le statu quo et d'obliger les clients de demain à accepter les limites d'hier. C'est cette approche qui a permis à Digital Realty de répondre aux exemples présentés dans ce billet, ainsi qu'à toutes sortes d'autres besoins des clients dans le monde entier. Notre capacité d'adaptation, notre esprit d'innovation et notre riche héritage font de nous une entreprise unique et responsable dans le monde en constante évolution de la technologie.
Construire un héritage d'innovation ne se fait pas du jour au lendemain, mais chez Digital Realty, nous avons appris que nous allons toujours dans la bonne direction lorsque nous sommes fidèles à nos valeurs et que nous nous concentrons sur la façon dont nous pouvons répondre au mieux aux besoins de nos clients.
Rejoignez-nous chez Digital Realty pour continuer à définir l'avenir de la technologie. Restez innovant, contactez-nous et déployons l'IA et le HPC de manière à transformer votre entreprise.
En savoir plus sur l'infrastructure de data center prête pour l'IA :
- Exploiter le potentiel de l'IA et naviguer dans la disruption avec Digital Realty.
- Les data centers sont-ils obsolètes à l'heure de l'IA ? Pas selon nous !
- Conception des data centers à l'ère de l'IA : intégration de l'IA dans l'infrastructure existante