Quelles sont les prochaines évolutions de l'IA et du HPC pour les responsables IT de l'infrastructure numérique ?
Cette année, nous assistons à une évolution massive des nouvelles technologies d’intelligence artificielle (IA) qui arrivent sur le marché, ce qui va dynamiser la demande en IA d’entreprise. Ces nouveaux développements vont radicalement changer notre façon de concevoir les environnements informatiques d’entreprise.
Trois des plus grands experts de Digital Realty ont répondu aux questions les plus pressantes du secteur sur l'avenir de l'IA, du HPC et des données qui les animent. Vous trouverez ci-dessous leurs réactions à trois prévisions IDC FutureScape : Worldwide. Future of Digital Infrastructure 2024 * qui s'appliquent à l'IA cette année.
Remarque : les réponses aux entretiens ont été modifiées pour des raisons de longueur et de clarté.
Prédiction 1 : Les infrastructures informatiques interconnectées vont augmenter
Selon l'IDC FutureScape, « avec GenAI comme catalyseur, d'ici 2027, 40 % des entreprises dépendront d'architectures IT interconnectées entre le cloud, le core et l'edge pour soutenir des flux de travail dynamiques et indépendants de la localisation. »
Où se situent les opportunités pour les responsables IT afin de gérer efficacement une demande croissante en IA et en HPC dans les entreprises ?
Patrick Lastennet, Director, Entreprise
L'inférence, où un modèle d'IA formé est déployé pour faire des prédictions sur des données inédites, sera davantage adoptée en 2024. Nous verrons plus de clusters d'inférence de GenAI déployés en colocation, interconnectés aux réseaux étendus d'entreprise (WAN).
Les grandes entreprises adopteront
L'inférence, où un modèle d'IA formé est déployé pour faire des prédictions sur des données inédites, sera davantage adoptée en 2024. Nous verrons plus de clusters d'inférence de GenAI déployés en colocation, interconnectés aux réseaux étendus d'entreprise (WAN).
Les grandes entreprises adopteront des cas d'usage d'inférence GenAI comme la protection contre la fraude et la prédiction des prix, basés sur la reconnaissance de modèles. L'inférence GenAI aidera dans le codage, le résumé de documents et les chatbots.
Bénéficier de l'inférence GenAI repose davantage sur un WAN solide que sur le cloud. Tirer parti de l'inférence GenAI élargit l'accès à la propriété intellectuelle de l'entreprise. Cette visibilité aide les entreprises à combler les lacunes dans la compréhension de leurs offres. Pour maximiser cette opportunité, les entreprises utiliseront des données propres et précises pour exploiter ce type d'IA.
Les entreprises commenceront à déployer des clusters de GPU pour l'inférence AI à proximité de leurs hubs de données en colocation.
d'inférence GenAI comme la protection contre la fraude et la prédiction des prix, basés sur la reconnaissance de modèles. L'inférence GenAI aidera dans le codage, le résumé de documents et les chatbots.
Bénéficier de l'inférence GenAI repose davantage sur un WAN solide que sur le cloud. Tirer parti de l'inférence GenAI élargit l'accès à la propriété intellectuelle de l'entreprise. Cette visibilité aide les entreprises à combler les lacunes dans la compréhension de leurs offres. Pour maximiser cette opportunité, les entreprises utiliseront des données propres et précises pour exploiter ce type d'IA.
Les entreprises commenceront à déployer des clusters de GPU pour l'inférence AI à proximité de leurs hubs de données en colocation.
Daniel Ong – Director, Solutions Architect, APAC
Le « nirvana » de l'IA pour les entreprises ? En 2024, nous verrons les entreprises construire des systèmes de GenAI de type ChatGPT pour leurs propres ressources d'information internes. Comme les données de nombreuses entreprises sont cloisonnées, il existe une réelle opportunité de gérer la demande en IA, de développer l'expertise en IA et de favoriser la collaboration inter-départements.
Cet accès aux données comporte un risque de sécurité existentiel qui pourrait porter atteinte à la propriété intellectuelle de l'entreprise. C'est pourquoi, en 2024, les entreprises tournées vers l'avenir utiliseront l'IA pour des mesures robustes de sécurité et de confidentialité des données, afin que la propriété intellectuelle ne soit pas exposée sur Internet.
Elles réduiront également les risques internes de sécurité en affinant leur gestion des menaces. Cela comprend le développement de réglementations internes pour garantir que les informations sensibles ne soient pas divulguées à des groupes et individus internes non autorisés.
C’est une ligne difficile entre ouverture et sécurité des données. Les entreprises qui la maîtrisent bien sont les mieux placées pour exploiter des assistants vocaux, des chatbots basés sur la connaissance et la détection de menaces en cybersécurité.
En Amérique du Nord, quel changement avons-nous observé chez nos clients, et comment priorisent-ils l'architecture de leur infrastructure pour gérer l'augmentation de la demande en IA ?
Steve Smith, Managing Director, Head of Americas
Pour l'IA et les autres technologies émergentes, l'objectif est d'optimiser et d'anticiper pour pérenniser l'entreprise.
Nous observons de nombreuses entreprises nord-américaines utiliser l'IA comme un outil et un levier pour prendre de meilleures décisions, optimiser leurs opérations, et mieux fournir leurs services et produits.
Bien que beaucoup de nos clients en soient encore aux premières étapes pour comprendre comment optimiser l’IA, les premiers résultats montrent des capacités prometteuses qui permettent d’augmenter de manière significative l’efficacité.
Depuis l'identification des clients sur le front-end, jusqu'à la construction de la chaîne d'approvisionnement en passant par l'optimisation des services, l'IA fournit des perspectives sur les performances de nos clients et l'amélioration de leurs opérations.
Les clients qui s'associent à Digital Realty examinent comment accéder à ces grandes capacités d'apprentissage pour une efficacité opérationnelle. Les entreprises qui réussissent commencent de manière simple et exigent un niveau de service supérieur de leurs partenaires, notamment : une meilleure compréhension du fonctionnement de l’entreprise et une application des perspectives tirées de l’IA.
Prédiction 2 : Mettre en avant l’as-a-service pour les workloads critiques
D’après IDC FutureScape, « D'ici 2028, 80 % des acheteurs IT prioriseront une consommation as-a-service pour les workloads clés nécessitant de la flexibilité afin d'optimiser les dépenses IT, renforcer les compétences en ITOps, et atteindre des objectifs d'éco-responsabilité. »
Quelles sont les meilleures méthodes pour gérer le déploiement global des initiatives IA ?
Patrick Lastennet, Director, Enterprise La première étape pour les leaders d'entreprise est d'identifier les workloads critiques et de déterminer ceux à gérer en priorité. La confidentialité des données (problèmes de souveraineté) et l’expérience utilisateur (latence) dicteront la localisation des workloads critiques.
Ensuite, ils voudront envisager de collaborer et de se connecter avec des partenaires capables d’offrir une orchestration mondiale de l'infrastructure supportant l'IA, tels que :
- DevOps : l'objectif est ici l'orchestration du développement via une gestion centralisée.
- NetOps : une solide approche NetOps assure que les workflows fonctionnent même dans un environnement fragmenté. L'orchestration mondiale de l'infrastructure en arrière-plan est essentielle (ServiceFabric™ est un bon point de départ pour accéder à un large réseau de partenaires en IA).
Les options pour un placement intelligent des workloads incluent :
IA dans le cloud : utiliser le cloud pour les premières étapes en IA offre de l'agilité et de l'élasticité. Cependant, à mesure que vous intensifiez l'entraînement, vous perdez cette élasticité ou la capacité de croître ou de réduire la capacité en CPU, stockage, mémoire et bande passante, ce qui rend le coût total de possession (TCO) essentiel.
Scaler on-prem : se tourner vers des fournisseurs de solutions managées pour accéder à des GPU-as-a-Service afin de gérer les GPU hors du cloud, tout en offrant une gestion des coûts et des outils similaires à ceux du cloud.
Daniel Ong – Director, Solutions Architect
À ce stade précoce des initiatives en IA, les entreprises dépendent des fournisseurs de technologie et de leurs partenaires pour des conseils et un soutien dans le déploiement mondial des initiatives IA.
En Asie-Pacifique, la priorité est de construire, déployer et entraîner les clusters IA appropriés. Un cas d'usage important est la détection des menaces en cybersécurité, d'où l'importance de travailler avec les fournisseurs de technologie de cybersécurité concernés.
Les grandes entreprises collaborent avec leurs fournisseurs de systèmes de calcul existants, en utilisant des GPU additionnels. Lenovo, Dell, et HPE offrent cette assistance.
Comment les entreprises nord-américaines tirent-elles parti des partenariats et de l’écosystème ouvert de Digital Realty ?
Steve Smith, Managing Director, Head of Americas
Les entreprises peuvent exploiter l'écosystème ouvert de Digital Realty, qui leur permet de se connecter stratégiquement à leur fournisseur prioritaire de AI-as-a-Service et de choisir les services adaptés à leurs besoins.
Les entreprises devraient également considérer :
- Qui peut répondre aux exigences d’un environnement à haute capacité de calcul pour les workloads IA ?
- Comment les partenaires de facilitation de l’IA peuvent-ils accéder à notre environnement de calcul ?
- Comment les entreprises commencent-elles à utiliser les services ?
Les entreprises trouvent des réponses à ces questions dans des campus data center très connectés, tels que ceux détenus et opérés par Digital Realty. Ces campus sont des points centraux pour canaliser les flux de données IA à travers un réseau de partenaires, via ServiceFabric™.
Prédiction 3 : Adoption accrue de la classification des données lors de l’ingestion
Selon IDC FutureScape, « D'ici 2028, 60 % des organisations IT adopteront des moteurs de classification des données lors de l'ingestion pour améliorer les efforts logistiques de données, renforcer la gouvernance, la prévention des pertes de données (DLP) et l'analytique des données pour un avantage compétitif. »
Comment les leaders IT devraient-ils aborder les données distribuées en préparation à la demande accrue de ressources de calcul ?
Patrick Lastennet, Director, Enterprise Une approche solide des données distribuées repose sur la gravité des tenseurs. Pour optimiser l’ingestion de données, les leaders IT doivent accorder davantage d’attention à la provenance des données. Pensez à l'endroit où vous finirez lorsque vous industrialiserez votre workflow IA. Demandez-vous où seront toutes les zones d’ingestion, puis amenez le calcul vers les données plutôt que l'inverse.
Daniel Ong – Director, Solutions Architect
La localisation des données affecte l'efficacité de vos workflows IA. Elle influence l'accessibilité, la sécurité et la latence tout au long du pipeline IA.
Quelques avantages de rapprocher le calcul des données incluent :
- Réduction de la latence et précision accrue : les données plus proches des clusters IA améliorent les résultats, permettant des prédictions et une prise de décision plus rapides.
- Économies sur les coûts réseau et énergie : l'emplacement des données et les coûts réseaux associés affecteront les économies d'énergie et, en fin de compte, le TCO.
- Conformité en matière de confidentialité et sécurité des données : les entreprises mondiales utilisent des capacités de calcul pour la collecte de données spécifiques à chaque région afin de suivre un paysage en constante évolution de réglementations et mesures de sécurité des données.
Comment les leaders IT en Amérique du Nord abordent-ils les données distribuées pour répondre à une demande accrue de ressources de calcul ? Comment Digital Realty se positionne-t-elle pour répondre à ces workloads intensifs en calcul en Amérique du Nord ?
Steve Smith, Managing Director, Head of Americas
Dans le passé, l’IA consistait en de grands blocs de calcul, traitant d’énormes quantités de données, sur lesquelles les entreprises exécutaient des modèles pour tirer des conclusions et itérer à partir de ces données.
Désormais, les entreprises intègrent les données distribuées de manière plus rapprochée pour prendre des décisions en temps réel. Dans un paysage hyper-compétitif, le facteur différenciant sera les organisations capables de sécuriser, vérifier, et utiliser les données dans un large modèle de langage ou bloc de données pour prendre des décisions plus éclairées que la concurrence.
Les partenariats transforment les capacités en valeur
Quelles perspectives pouvons-nous tirer d'une vue d'ensemble des trois prédictions abordées ici ?
Steve Smith, Managing Director, Head of Americas
La course pour activer les gains d'efficacité en IA se résume à la façon dont les entreprises exploitent des partenaires capables de transformer les capacités en valeur. Si l’on considère l’ampleur et les capacités de Digital Realty, nous offrons un avantage concurrentiel supérieur. De notre portée mondiale à l'étendue de notre plateforme, en passant par notre connectivité et nos principales métropoles à travers le monde, nous réunissons les personnes, les entreprises et les données pour améliorer l'efficacité.
Nous réalisons des progrès considérables dans la manière dont nous concevons, refroidissons et fournissons des solutions d'interconnexion, pour nous assurer que nous ne sommes pas seulement pertinents aujourd'hui, mais que nous permettons aux entreprises d’être pérennes dans les années à venir.
Pour en savoir plus sur la façon de pérenniser votre stratégie IA, téléchargez notre dernier livre blanc : *AI for IT Leaders*.
*IDC FutureScape: Worldwide Digital Infrastructure 2024 Predictions, doc #US50401023, octobre 2023*