L'offre intègre les derniers accélérateurs d'IA, notamment les puces NVIDIA AI computing et Trainium, avec un réseau haut débit, un stockage hautes performances, des bases de données et une infrastructure économe en énergie, ainsi que des services d'IA tels qu'Amazon Bedrock et Amazon SageMaker pour permettre le développement et le déploiement rapides d'applications d'IA à grande échelle.
L'offre intègre les derniers accélérateurs d'IA, notamment les puces NVIDIA AI computing et Trainium, avec un réseau haut débit, un stockage hautes performances, des bases de données et une infrastructure économe en énergie, ainsi que des services d'IA tels qu'Amazon Bedrock et Amazon SageMaker pour permettre le développement et le déploiement rapides d'applications d'IA à grande échelle.
Alors que les gouvernements et les grandes organisations cherchent à étendre leurs projets d’IA, nombreux sont ceux qui se tournent vers le concept d’« usine à IA » pour répondre à des exigences uniques en matière de souveraineté et de conformité. Construire une usine d’IA hautes performances nécessite cependant une combinaison complexe de services de gestion, de bases de données, de stockage et de sécurité – des défis que la plupart des organisations préfèrent ne pas relever elles-mêmes. Pour résoudre ce problème, AWS a lancé AWS AI Factories, fournissant aux entreprises et aux gouvernements une infrastructure d'IA dédiée déployée directement dans leurs propres centres de données. L'offre intègre les derniers accélérateurs d'IA, notamment les puces NVIDIA AI computing et Trainium, avec un réseau haut débit, un stockage hautes performances, des bases de données et une infrastructure économe en énergie, ainsi que des services d'IA tels qu'Amazon Bedrock et Amazon SageMaker pour permettre le développement et le déploiement rapides d'applications d'IA à grande échelle.
Les organisations des secteurs réglementés et du secteur public sont confrontées à des obstacles importants lors du déploiement d’initiatives d’IA à grande échelle. La création de capacités d'IA en interne nécessite des investissements substantiels en GPU, centres de données et alimentation, en plus de naviguer dans les cycles d'approvisionnement, de sélectionner des modèles d'IA appropriés et de gérer les licences de plusieurs fournisseurs d'IA. Ces défis se traduisent souvent par des délais pluriannuels et une complexité opérationnelle, détournant l’attention des objectifs commerciaux fondamentaux. AWS AI Factories surmonte ces obstacles en proposant une infrastructure d'IA dédiée exploitée exclusivement pour les clients, fonctionnant comme une région AWS privée qui garantit un accès sécurisé et à faible latence aux services de calcul, de stockage, de bases de données et d'IA. Cette approche permet aux organisations d'exploiter l'espace et la puissance des centres de données existants tout en accédant à l'infrastructure AWS AI et aux services gérés, tout en répondant aux exigences strictes en matière de sécurité, de souveraineté des données et de réglementation.
La collaboration entre AWS et NVIDIA, qui s'étend sur 15 ans, renforce le déploiement d'une infrastructure d'IA avancée. L'intégration permet aux clients d'exécuter de grands modèles de langage de manière plus efficace, sécurisée et à grande échelle au sein de leurs propres centres de données. AWS AI Factories offre un accès transparent aux plates-formes informatiques accélérées NVIDIA, aux logiciels d'IA full-stack et aux applications accélérées par GPU pour améliorer les performances et l'évolutivité. L'infrastructure prend en charge les plates-formes NVIDIA Grace Blackwell et Vera Rubin, avec une prise en charge future prévue pour les interconnexions NVIDIA NVLink Fusion dans les puces Trainium4 et Graviton. Cette combinaison accélère la mise sur le marché des solutions d’IA tout en optimisant les performances du centre de données.
AWS AI Factories est également conçue pour soutenir l'adoption de l'IA par le secteur public en répondant à des normes de sécurité strictes sur plusieurs niveaux de classification. L'infrastructure offre aux gouvernements du monde entier la fiabilité, le contrôle et l'évolutivité nécessaires pour exploiter les technologies d'IA au service de la croissance économique et technologique. En partenariat avec HUMAIN en Arabie Saoudite, AWS construit une « zone IA » dédiée abritant jusqu'à 150 000 puces IA, une infrastructure dédiée et des services IA au sein d'un centre de données spécialement conçu. Cette initiative vise à répondre à la demande locale et mondiale de calcul d’IA tout en favorisant un écosystème évolutif pour l’innovation en IA.