
qui a ébranlé Wall Street avec son modèle R1
Les prouesses techniques de la startup chinoise DeepSeek ont forcé Microsoft à repenser son approche en matière d'IA. DeepSeek a montré qu'il est possible de développer des modèles d'IA de pointe à faible coût. Microsoft en a tiré des leçons et le PDG Satya Nadella a récemment déclaré que DeepSeek est le nouveau « critère de réussite » de la firme de Redmond en matière d'IA. Satya Nadella a été impressionné par la manière dont une équipe de 200 personnes seulement a construit un produit d'IA qui est devenu l'application numéro un de l'App Store. L'approche de DeepSeek remet en cause les habitudes du secteur et menace de faire éclater la bulle de l'IA.
Satya Nadella érige en modèle l'approche de la startup chinoise DeepSeek
DeepSeek est une startup chinoise spécialisée dans l'IA et fondée en 2023 sous l'impulsion du fonds spéculatif chinois High-Flyer. DeepSeek était un acteur relativement discret sur le marché de l'IA jusqu'à la publication en janvier 2025 de son modèle axé sur le raisonnement DeepSeek-R1. Ce dernier a égalé les performances du modèle phare o1 d'OpenAI, avec un coût inférieur de 95 %. L'annonce de DeepSeek-R1 a provoqué une hécatombe à Wall Street.
Le succès de DeepSeek provient d'un travail acharné sur les systèmes de bas niveau pour optimiser la technologie CUDA de Nvidia. La startup chinoise a notamment apporté un certain nombre de changements d'architecture qui ont permis à ses modèles d'IA d'être plus efficaces en matière de calcul. L'efficacité, l'utilisation de modèles préentraînés et la petite équipe nécessaire pour y parvenir ont attiré l'attention de l'industrie, en particulier de Satya Nadella.
Satya Nadella s'est empressé de déployer DeepSeek-R1 sur la plateforme Azure de Microsoft en janvier. Et lors d'une réunion récente avec le personnel de Microsoft, Satya Nadella a déclaré aux participants que le succès de DeepSeek en matière d'IA établit une nouvelle norme pour l'avenir de Microsoft :

Microsoft s'appuie sur les derniers modèles les plus avancés de son partenaire OpenAI et un marketing agressif pour propulser Copilot. Mais alors que ChatGPT est régulièrement dans le top des applications gratuites dans les boutiques d'applications, Copilot est souvent en dehors du top 100 des applications. Satya Nadella compte désormais sur les propres travaux de Microsoft en matière d'IA, et pas seulement sur ceux d'OpenAI, pour améliorer sa position.
Le mois dernier, Microsoft a dévoilé son propre modèle Muse, qui a été entraîné sur le jeu Xbox Bleeding Edge pour générer du gameplay. Microsoft pense que Muse aidera les développeurs Xbox à créer des prototypes de jeux, voire à préserver les jeux et à les optimiser pour le matériel moderne.
Construire de nouveaux centres de données malgré les risques d'une bulle
Microsoft investit 80 milliards de dollars dans les centres de données pour alimenter les charges de travail d'IA au cours de l'exercice fiscal. Un employé a voulu savoir pourquoi Microsoft pense qu'il s'agit d'un bon investissement et comment l'entreprise s'assure qu'il est réalisé de manière durable. Le PDG estime qu'il s'agit d'un investissement clé, d'autant plus que Microsoft remodèle ses équipes d'ingénieurs pour se concentrer sur une pile d'applications d'IA.
Cependant, certains employés se sont inquiétés de l'impact de ces infrastructures voraces en énergie sur l'environnement. À l'origine, Microsoft prévoyait d'être neutre en carbone d'ici à 2030, mais les besoins énergétiques de l'IA ont rendu cet objectif beaucoup plus difficile à atteindre. « L'IA générative a multiplié par quatre notre objectif de neutralité carbone, mais nous redoublons d'efforts », a déclaré Brad Smith, vice-président et président de Microsoft.
Pour les observateurs, l'objectif d'absence de carbone semble aujourd'hui irréaliste compte tenu de la poussée de l'entreprise en matière d'IA. Brad Smith pense que Microsoft prouvera que les sceptiques ont tort. « Je reste très optimiste et pense que nous allons surprendre le monde en 2030 et lui montrer à quel point nous avons accompli quelque chose d'extraordinaire », a déclaré Brad Smith. Mais cette déclaration est largement controversée sur la toile.
En outre, les experts mettent en garde contre une bulle potentielle dans la construction de centres de données, où l'offre pourrait dépasser la demande en matière d'IA. Le président d'Alibaba, Joe Tsai, a déclaré récemment que les conséquences de l'éclatement de la bulle pourraient être dévastatrices.
C'est un risque important pour Microsoft. « Ce que nous voulons, c'est nous assurer que les 80 milliards de dollars comptent pour nos clients, et s'ils obtiennent une valeur réelle, je vous assure que nous serons heureux d'avoir dépensé 80 milliards de dollars. S'ils n'obtiennent pas de valeur réelle, ou si d'autres nous devancent en matière d'innovation, nous ne serons pas non plus satisfaits », a déclaré Amy Hood, directrice financière de Microsoft.
L'engouement du marché chinois pour l'IA serait en train de faiblir. Selon un rapport du MIT Technology Review, il y a quelques mois à peine, la construction de centres de données était en plein essor sous l'impulsion d'investisseurs publics et privés. Cependant, de nombreuses installations nouvellement construites sont aujourd'hui vides. Des sources locales affirment que la plupart des entreprises qui gèrent ces centres de données luttent pour rester à flot.
Les médias chinois Jiazi Guangnian et 36Kr affirment que « jusqu'à 80 % des infrastructures informatiques nouvellement construites en Chine restent inutilisées ». Il s'agit en effet d'un tableau particulièrement décevant et inquiétant si l'on considère toutes les promesses qui ont été faites par les entreprises d'IA.
Un risque élevé que les investissements massifs ne soient pas rentabilisés
Selon le China Communications Industry Association Data Center Committee, une association industrielle affiliée à l'État, au moins 150 des centres de données nouvellement construits étaient terminés et opérationnels à la fin de 2024. Les entreprises d'État, les sociétés cotées en bourse et les fonds affiliés à l'État ont fait la queue pour investir dans ces centres, dans l'espoir de se positionner en tant que précurseurs de l'IA. Mais où en est-on aujourd'hui ?
En 2023, des entrepreneurs chinois sont parvenus à obtenir des GPU Nvidia, essentiels à l'entraînement des modèles d'IA, malgré les restrictions strictes des États-Unis. Les GPU Nvidia ont été acheminés en Chine par des voies détournées et leur vente rapportait énormément d'argent aux marchands. Selon le rapport, au plus fort de la demande, une seule puce Nvidia H100 pouvait se vendre jusqu'à 200 000 yuans (soit 28 000 dollars) sur le marché noir.
Aujourd'hui, les prix sont redescendus sur terre. Entre-temps, des projets de centres de données peinent à obtenir des financements supplémentaires de la part d'investisseurs qui anticipent de faibles rendements, ce qui oblige les responsables des projets à vendre les GPU excédentaires. « Il semble que tout le monde vende, mais que peu achètent », a déclaré au média l'entrepreneur immobilier Xiao Li, devenu chef de projet dans un centre de données.
Fin 2024, l'enthousiasme qui avait entouré le boom des centres de données en Chine s'est transformé en déception. De nombreuses installations se sont retrouvées sous-utilisées ou abandonnées. La raison en est simple : la location de GPU n'est plus une activité particulièrement lucrative.
« C'est paradoxal : la Chine doit faire face aux coûts d'acquisition les plus élevés pour les puces Nvidia, alors que les prix de location des GPU sont extraordinairement bas », explique M. Li. Il y a une offre excédentaire de puissance de calcul, mais en même temps, il y a une pénurie de puces de pointe.
Et vous ?


Voir aussi



Vous avez lu gratuitement 3 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.