Conception de Data Center à l'ère de l'IA : intégrer l'IA à l'infrastructure existante
Chris Sharp , directeur de la technologie, Digital Realty
Il s'agit de la troisième partie de notre série de blogs en trois parties sur l'intelligence artificielle (IA) et l'infrastructure des data center prête pour l'IA.
- Lire la première partie : Exploitez le potentiel de l'IA et évitez les perturbations grâce à Digital Realty
- Lire la partie 2 : Les Data Centers sont-ils obsolètes à l'ère de l'IA ? Pas sous notre surveillance
- Continuez à lire pour la partie 3
À l’ère de l’intelligence artificielle (IA), comment les entreprises peuvent-elles évaluer si la conception de leur data center existant peut pleinement répondre aux exigences modernes nécessaires à l’exécution de l’IA ? Des considérations majeures doivent être prises en compte lorsque les responsables informatiques développent leurs stratégies d'IA et évaluent le paysage de leur infrastructure.
Ce blog examine :
- Qu’est-ce qui est considéré comme une Infrastructure IT existante ?
- Comment intégrer de nouveaux équipements d'IA à l'infrastructure existante.
- Évaluation de la conception du data center et de l'infrastructure existante.
- L'art de la rénovation du data center .
Bien que les flux de travail de l'IA soulèvent de nouveaux défis et questions concernant les besoins uniques en matière d'alimentation et de refroidissement, les responsables informatiques devraient évaluer l'état de la conception de leur data center pour répondre aux besoins modernes émergents et évolutifs.
Qu’est-ce qu’une Infrastructure IT existante ?
L’identification des infrastructures existantes relève à la fois de l’intuition et de l’expérience. Du point de vue de l’équipement informatique, nous pourrions supposer que tout ce qui n’est pas à la pointe de la technologie est un héritage. Cependant, cela est souvent faux.
De nombreux systèmes informatiques dans le monde ne fonctionnent pas sur le matériel le plus récent et le plus performant. Cela continuera en raison des cycles typiques de mise à jour du budget, des dépenses et des équipements de tous, du cloud hyperscale aux petites entreprises.
Même à l’ère de l’IA, tous les racks ne consommeront pas 100 kW ou n’auront pas besoin d’un refroidissement liquide. Les racks remplis d'appareils de réseau, d'agrégation de mémoire ou de stockage peuvent toujours avoir une puissance inférieure à 15 kW chacun et dépendre du refroidissement par air.
Il devient difficile de classer Infrastructure IT comme étant héritée ou non en se basant uniquement sur sa consommation électrique. Diverses références industrielles montrent que les nouvelles générations d'unités centrales de traitement (CPU), d'unités de traitement graphique (GPU), d'équipements réseau et d'autres actifs Infrastructure IT sont nettement plus rapides que leurs prédécesseurs, mais cela ne suffit souvent pas à lui seul pour désigner les équipements existants comme hérités. Infrastructure.
Le meilleur test consiste à déterminer si l'infrastructure actuelle freine le développement et les activités opérationnelles de l'organisation d'une manière que les nouvelles générations d'équipements ne le feraient pas.
Si tel est le cas, elle doit être classée comme infrastructure héritée.
Intégrer l'IA à Infrastructure IT existante
Dans le cas des équipements informatiques, nous pouvons envisager d’intégrer l’IA soit en utilisant les serveurs existants et leurs équipements de support pour exécuter de nouvelles fonctions d’IA, soit en augmentant le matériel déployé avec de nouveaux équipements spécifiques à l’IA pour exécuter de nouvelles fonctions d’IA.
Un exemple de ce dernier cas consiste à prendre un rack existant de serveurs basés sur CPU et à ajouter deux nouveaux serveurs basés sur GPU pour fournir plus de puissance informatique parallèle pour lancer un chatbot aux utilisateurs internes d'une entreprise.
Cela peut sembler plus facile que de s’adapter à un nouveau déploiement d’IA haute densité, mais cela comporte trois séries de défis :
- L'ajout de serveurs basés sur GPU dans une allée à faible densité de racks peut créer des points chauds que le système de refroidissement du bâtiment n'a pas été conçu à l'origine pour gérer.
- Cela peut créer des charges électriques inégales dans l’ensemble de l’installation et nécessiter une réaffectation des ressources d’alimentation de secours.
- Cela peut entraîner une congestion du réseau car les nouveaux équipements multiplient les données transférées par rack.
Ces facteurs peuvent entraîner une nouvelle pression sur le data center , que vous devez considérer comme faisant partie de votre pile informatique elle-même.
Évaluation de la conception du data center et de l'infrastructure existante
Le data center fait autant partie de votre Infrastructure IT que les serveurs que vous y déployez. Nous devons donc réfléchir à la manière dont ce concept d'infrastructure existante s'applique également aux installations du data center .
En termes technologiques, l’industrie des data center n’est pas une poule aux œufs d’or. Digital Realty prend en charge à lui seul environ 2,4 gigawatts d'équipements informatiques clients dans le monde, et cela ne s'est pas produit du jour au lendemain.
Depuis notre création en 2004, nous avons progressivement augmenté la capacité de notre data center mondial chaque année, et tous les équipements clients de ces installations ne disparaissent pas. De nombreuses organisations remplacent tous leurs serveurs tous les trois à cinq ans, mais certains serveurs peuvent être déployés pendant huit ans. Lorsque les équipements sont remplacés, cela se fait par phases, afin que les applications de l'organisation fonctionnent sans réel temps d'arrêt.
Cela signifie que le data center est toujours allumé. Un opérateur de data center ne peut pas simplement retirer tous les équipements informatiques de ses clients, effectuer une mise à niveau globale de l'installation, puis tout remettre en place. Au fil du temps, la combinaison d'équipements clients dans le data center contiendra généralement certains des équipements hérités et certains équipements non hérités.
De plus, à mesure que les installations du data center vieillissent, certaines de leurs caractéristiques, telles que la conception du flux d'air, la construction du sol et la prise en charge du refroidissement liquide, peuvent ne pas être parfaitement adaptées à tous les équipements que les clients souhaitent déployer.
Par exemple, de nombreuses installations de data center utilisent une conception à plancher surélevé : les équipements d'IA génèrent des densités de racks plus élevées, non seulement en termes de consommation électrique, mais également en raison de leur poids. Dans certains cas, ces racks peuvent nécessiter un sol en dalle de béton solide.
Cela signifie que pour certains cas d'utilisation, certains data centers peuvent correspondre à notre définition de l'infrastructure existante.
Cependant, un data center bien conçu est bien plus flexible en termes de mises à niveau au fil du temps qu'un serveur ou un ensemble d'équipements informatiques répartis sur plusieurs racks. Un data center peut durer plus de 15 à 20 ans, selon la façon dont l'opérateur le conçoit, le modernise et le modularise au fil du temps.
L'IA a provoqué un changement radical dans la densité des racks et d'autres exigences qui ont un impact sur le data center. Souvent, l'opérateur du data center peut mettre à niveau certaines parties de l'installation pour répondre à ces nouveaux besoins.
L'art de la rénovation de la conception d'un data center
Ce processus est connu sous le nom de mise à niveau, et l'art de la mise à niveau est un élément clé de l'efficacité avec laquelle l'opérateur du data center peut concevoir des data centers pour les générations actuelles et futures de serveurs et autres Infrastructure IT. Imaginez une ancienne installation de data center conçue à l'origine pour 10 kW par rack en moyenne. Avec l’émergence de l’IA, on peut s’attendre à ce que cette même installation prenne en charge 100 kW par rack sans le luxe d’un arrêt total et d’une refonte complète.
La flexibilité nécessaire pour prendre en charge ces types de modifications du data center au fil du temps est un élément clé de la façon dont nous concevons et exploitons nos data centers. Par exemple:
- Lorsqu’un plancher surélevé n’est plus nécessaire, il peut être comblé.
- Lorsqu'un refroidissement liquide est requis, nous pouvons faire passer la tuyauterie depuis une nouvelle unité de refroidissement et un nouveau réservoir jusqu'au rack.
- Lorsque de nouvelles capacités réseau sont requises, nous pouvons apporter une connectivité supplémentaire et optimiser tous les actifs réseau à l’intérieur de l’installation elle-même.
Aujourd'hui, le data center est aussi flexible, modulaire et parfaitement adapté pour évoluer avec les besoins de ses clients que n'importe quelle autre partie de votre pile informatique. Les exigences liées à la prise en charge de l'IA dans les data center sont certainement difficiles, et nous analysons tous nos data centers à l'échelle mondiale pour rester au courant de la manière de faire évoluer notre conception et nos opérations pour répondre aux exigences croissantes de l'IA.
Renforcez votre stratégie informatique avec une infrastructure évolutive et prête pour l’IA. Téléchargez notre livre blanc sur l'IA pour les responsables informatiques .
Il s'agit de la troisième partie de notre série de blogs en trois parties sur l'intelligence artificielle (IA) et l'infrastructure des data center prête pour l'IA.
- Partie 1 : Exploitez le potentiel de l'IA et évitez les perturbations grâce à Digital Realty
- Partie 2 : Les Data Centers sont-ils obsolètes à l’ère de l’IA ? Pas sous notre surveillance
- Partie 3 : Conception de Data Center à l'ère de l'IA : intégration de l'IA avec l'infrastructure existante