Le déploiement permet aux entreprises, aux chercheurs et aux développeurs d'exécuter les modèles sur un choix de principales plateformes de silicium avec des capacités souverain, évolutives et hautes performances.
Le déploiement permet aux entreprises, aux chercheurs et aux développeurs d'exécuter les modèles sur un choix de principales plateformes de silicium avec des capacités souverain, évolutives et hautes performances.
Core42 une entreprise G42 spécialisée dans les infrastructures souverains du cloud et de l'IA, a annoncé la disponibilité des derniers modèles d'IA à poids ouvert d'OpenAI, y compris GPT-OSS-20B et GPT-ASS-120B, sur la plate-forme CORE42 AI Cloud, accessible instantanément via l'API Core42 Compass. Le déploiement permet aux entreprises, aux chercheurs et aux développeurs d'exécuter les modèles sur un choix de principales plateformes de silicium avec des capacités souverain, évolutives et hautes performances.
Intégré dans API Compass avec la flexibilité pour accéder à un large éventail de plates-formes de calcul haute performance, Core42 offre des vitesses d'inférence de pointe jusqu'à 3 000 jetons par seconde par utilisateur, permettant une IA en temps réel à l'échelle mondiale tout en alignant les charges de travail avec l'infrastructure optimale pour la performance du prix et l'évolutivité. Ce déploiement offre des performances sur mesure pour les charges de travail et les applications à faible latence, renforçant l'engagement de Core42 à sécuriser et optimiser l'infrastructure d'IA compatible souverain.
«Core42 AI Cloud, propulsé par l'infrastructure en silicium, offre la flexibilité et les performances nécessaires pour les charges de travail AI d'aujourd'hui. Grâce à l'API Compass, les organisations peuvent accéder aux derniers modèles d'IA de poids ouvert et choisir la plate-forme optimale pour l'échelle de transformation, optimiser les performances et les coûts et générer des progrès sur les marchés mondiaux.»
– Kiril Evtimov, PDG, Core42 et groupe CTO, G42
Avantages clés du déploiement de poids ouvert de Core42:
- Performance à l'échelle de l'entreprise – Exécutez les charges de travail les plus rapides et les plus exigeantes à l'échelle mondiale, permettant une automatisation avancée, une prise de décision et des expériences d'IA en temps réel.
- Évolutivité souverain prête à l'emploi – Déployer l'IA de haute performance dans le pays avec des contrôles souverains complets, soutenant les opérations sécurisées dans des secteurs réglementés tels que les soins de santé, la finance et la sécurité nationale.
- Optimisé pour les environnements engagés – Offrez une IA rapide et évolutive dans le pays avec des contrôles souverains pour les organisations opérant dans le cadre des accords d'infrastructure engagés, garantissant des coûts et des performances prévisibles.
- AI agentique rentable – Exécutez des charges de travail agentiques au coût le plus bas possible tout en maintenant le déploiement dans le pays et les contrôles souverains, ce qui rend l'IA avancé accessible aux cas d'utilisation sensibles aux coûts.
Disponibles maintenant via API Compass, ces modèles permettent aux organisations d'exécuter et d'adapter l'IA localement ou dans le cloud, avec une transparence complète, un réglage fin et des options de déploiement souveraine. Les clients peuvent aligner les performances, les coûts et la conformité à leurs besoins.
Cette version marque un mouvement central vers l'autonomie de l'IA d'entreprise. Avec un accès ouvert, les entreprises peuvent façonner l'IA à leurs besoins uniques et débloquer de nouvelles possibilités d'innovation à grande échelle.
Cette annonce s'appuie sur les récentes étapes de G42, notamment le dévoilement d'un campus 5GW US-UAE AI et le lancement de l'installation 1GW des EAU des EAU en tant que phase 1 du projet, ainsi qu'un investissement de 1,5 milliard de dollars de Microsoft en 2024, renforçant le rôle des Émirats arabes unis en tant que hub mondial.