Les prix des HBM poussent 5 géants de la tech à concevoir des puces allégées en mémoire

Qualcomm, Nvidia, Apple, Cerebras et Google développent des architectures de puces et des algorithmes conçus pour réduire la dépendance à la mémoire à large bande passante (HBM), alors que la tension persistante sur l'offre fait grimper les coûts dans toute la chaîne d'approvisionnement de l'IA.

« L'offre de HBM est tendue, elle coûte cher, et nous ne l'utilisons pas », a déclaré Andrew Feldman, PDG de Cerebras, lors de la première conférence téléphonique post-bénéfices de l'entreprise depuis son introduction en bourse, présentant la conception sans HBM du fabricant de puces à l'échelle du wafer comme un avantage concurrentiel.

Micron Technology a indiqué la semaine dernière que l'offre s'était encore resserrée par rapport à il y a trois mois, signant 15 nouveaux accords à long terme — dont la plupart s'étendent sur cinq ans avec des prix planchers — et prolongeant ses perspectives de pénurie au-delà de 2027. Les ventes mondiales de mémoire ont bondi de 79 % en 2024 pour atteindre 165 milliards de dollars et devraient dépasser 223 milliards de dollars en 2025, selon les données du secteur. SK Hynix, le principal producteur de HBM, a vendu la totalité de sa production 2026 et n'accepte plus de nouvelles commandes pour les principaux produits mémoire.

Cette dynamique crée un paradoxe pour les fabricants de mémoire : le même pouvoir de fixation des prix qui génère une rentabilité sans précédent finance une vague d'innovations menées par les clients visant à réduire la dépendance au HBM. En cas de succès, ces efforts pourraient plafonner la trajectoire de croissance à long terme d'un marché devenu central pour l'infrastructure de l'IA.

Le pari de Qualcomm sur une architecture mémoire différente

Qualcomm a dévoilé lors de sa Journée Investisseur de juin 2026 une plateforme de centre de données appelée Dragonfly, construite autour de ce qu'elle appelle le calcul à large bande passante (HBC). Plutôt que d'associer un processeur à des empilements de HBM connectés via un interposeur en silicium coûteux — l'approche standard utilisée par les H100 et B200 de Nvidia — Qualcomm place ses cœurs de traitement directement sous un empilement de DRAM, réduisant ainsi la distance que les données doivent parcourir. L'entreprise affirme que cette solution offre jusqu'à huit fois plus de tokens par watt que les configurations GPU traditionnelles et six fois plus de bande passante mémoire par watt que les concurrents basés sur le HBM, tout en éliminant entièrement l'interposeur.

Cette architecture arrive alors que le HBM est devenu l'un des composants les plus contraints de la chaîne d'approvisionnement de l'IA. Les nouvelles installations de fabrication de mémoire nécessitent entre 15 et 20 milliards de dollars d'investissement et plusieurs années pour devenir opérationnelles, ce qui signifie que les pénuries pourraient persister au moins jusqu'en 2027, selon les prévisions du secteur. Qualcomm a déclaré avoir déjà sécurisé les wafers et la mémoire nécessaires pour atteindre son objectif de chiffre d'affaires de 5 milliards de dollars dans les ventes de centres de données pour l'exercice 2027.

Nvidia et Google adoptent la voie logicielle

Nvidia, le plus grand consommateur de HBM pour ses accélérateurs d'IA, explore également des moyens de réduire la demande de mémoire. L'entreprise ajuste certains éléments de sa prochaine plateforme Vera Rubin pour réduire les besoins globaux en mémoire, selon des rapports. L'architecture Grace CPU et Vera de Nvidia représente une tentative d'optimiser l'équilibre entre calcul et mémoire dans des systèmes où le HBM représente désormais une part croissante du coût total des composants.

Google a publié en mars des recherches sur TurboQuant, une méthode de compression de modèles qui réduit considérablement l'empreinte mémoire des modèles d'IA avec un impact minimal sur les performances. Cette annonce a provoqué une forte chute des actions Micron, qui ont baissé de près d'un tiers en une seule séance avant de rebondir de plus du double alors que le marché réévaluait le calendrier de telles techniques pour affecter significativement la demande de HBM. Cet épisode a illustré la sensibilité des valorisations des actions mémoire à toute technologie menaçant le rôle du HBM dans l'inférence IA.

Le calcul d'investissement

Pour les fabricants de mémoire, les perspectives à court terme restent exceptionnellement solides. Les nouveaux accords à long terme de Micron verrouillent des prix supérieurs aux pics historiques des cycles précédents, même à leurs minimums contractuels, selon Rolf Bulk, analyste chez Futurum. Les prévisions de l'entreprise impliquent un bénéfice d'exploitation trimestriel dépassant son meilleur chiffre d'affaires annuel des cycles précédents.

Mais le risque structurel s'accumule. Apple a augmenté cette semaine les prix de plusieurs modèles de Mac et iPad entre les cycles de produits, citant explicitement la hausse des coûts des puces mémoire — une décision qui signale que la tolérance des utilisateurs finaux pour des prix plus élevés a des limites. Lorsque les plus grandes entreprises technologiques du monde signent des accords d'approvisionnement de cinq ans avec des prix planchers, elles engagent simultanément des capitaux dans des équipes d'ingénierie chargées de rendre ces accords moins pertinents avec le temps.

Les actions Qualcomm se négocient à environ 18 fois les bénéfices à terme, une décote par rapport aux 35 fois de Nvidia, reflétant le scepticisme du marché quant à sa capacité à pénétrer des centres de données dominés par des acteurs établis. Si son architecture HBC tient ses promesses d'efficacité, les économies réalisées sur l'approvisionnement en mémoire pourraient à elles seules justifier une réévaluation. Pour Micron, le risque est que le pouvoir de fixation des prix d'aujourd'hui sème les germes de la destruction de la demande de demain — un schéma que l'industrie de la mémoire a déjà connu, mais jamais porté par une ampleur d'investissement en ingénierie côté client de cette magnitude.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.