Microsoft sort une nouvelle puce IA pour concurrencer Nvidia et Google

Microsoft sort une nouvelle puce IA pour concurrencer Nvidia et Google

Microsoft  logo

Microsoft a annoncé le lancement d’une nouvelle puce dédiée à l’intelligence artificielle, marquant un tournant dans sa stratégie matérielle pour supporter ses services cloud et ses modèles IA. Cette initiative vise à offrir une alternative performante aux processeurs spécialisés existants, dominés actuellement par NVIDIA (GPU) et les puces Tensor de Google.

La nouvelle puce, conçue en interne par Microsoft, a été développée pour répondre à des besoins spécifiques liés à l’IA : traitement de modèles de grande taille, inférences rapides, efficacité énergétique et exécution de calculs massifs à grande échelle. Elle s’inscrit dans l’expansion rapide de Microsoft dans le domaine des infrastructures IA cloud, notamment pour soutenir des services tels que Azure AI, Copilot et les modèles déployés via Microsoft 365 et GitHub Copilot.

Comme l’explique Microsoft, l’objectif n’est pas seulement d’héberger des modèles tiers, mais aussi d’optimiser l’exécution des modèles propriétaires ou co-développés avec des partenaires en fournissant une architecture matérielle qui maximise à la fois la performance par watt et la scalabilité.

Selon les informations disponibles, la puce IA de Microsoft est pensée pour :

  • Accélérer les inférences de modèles de langage et multimodaux.

  • Réduire les coûts opérationnels liés à l’usage intensif des GPU classiques.

  • Supporter des applications d’IA en temps réel.

  • Être intégrée dans des environnements cloud hybrides.

  • Servir de base pour des fonctions internes et des solutions commerciales.

Cette puce a également été pensée pour rester compétitive en matière de consommation énergétique, ce qui est devenu un critère essentiel pour les data centers et les services cloud faisant fonctionner des réseaux de neurones très gourmands en calcul.

Depuis plusieurs années, l’industrie de l’intelligence artificielle est dominée par des acteurs spécialisés en matériel :

  • NVIDIA, avec ses GPU largement adoptés pour l’entraînement des modèles et l’inférence.

  • Google, avec ses puces TPU (Tensor Processing Units) intégrées à son infrastructure cloud.

Autres acteurs comme AMD ou Intel qui cherchent à proposer des alternatives.

En développant sa propre puce IA, Microsoft cherche à limiter sa dépendance aux fabricants externes, à maîtriser davantage sa stack logicielle et matérielle et à optimiser ses coûts à long terme tout en offrant des capacités matérielles adaptées à ses propres charges d’IA. Cela lui permet également d’intégrer plus profondément ces composants dans ses environnements Azure, Windows et ses services d’IA.

 

Pour aller plus loin sur le sujet, voici une sélection d’articles et de sources à consulter : 

Sources 

Image de https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQ9JgVNGjSwKwUbToWNXIUvDvEePlxi2xQA6w&s 

https://www.latribune.fr/article/tech/informatique/2541681109552314/microsoft-sort-une-nouvelle-puce-ia-pour-concurrencer-nvidia-et-google 

https://www.clubic.com/actualite-586379-microsoft-s-attaque-au-monopole-de-nvidia-sur-les-puces-ia-grace-a-une-trouvaille-astucieuse.html 

https://www.usine-digitale.fr/big-tech/microsoft/intelligence-artificielle-microsoft-defie-nvidia-avec-maia-200-sa-puce-specialisee-pour-linference.5LLYJ244QNC4LPZ3ONQLKM463U.html 

Author

IAredac