« Dans la vraie vie, quand on fait une boulette, on efface et on recommence. Dans un labo de puces chez AWS, on sort la meuleuse et on commande une pizza. » Bon, je n’ai pas la prétention d’égaler Steve Jobs côté punchlines, mais au pays des giga-investissements et des nano-transistors, c’est le genre d’ambiance que j’ai respirée lors de ma visite privée du légendaire chip lab d’AWS à Austin, Texas. Spoiler : il y a moins de blouses blanches et de gadgets high-tech lustrés que de boîtes à pizza et d’ingénieurs déchaînés.
Depuis que le boss d’Amazon Andy Jassy a lâché un accord tonitruant de 50 milliards de dollars avec OpenAI (« qui veut la plus grosse IA ? »), la planète tech a les yeux rivés sur Trainium, la puce maison d’Amazon, censée enfin chatouiller le règne sans partage de Nvidia. Imaginez : si le Trainium tenait vraiment ses promesses de puissance et de prix, les data centers pourraient tousser… ou exulter.
Mais ce n’est pas si simple. Dans les entrailles du laboratoire, le duo Mark Carroll (Directeur ingénierie) et Kristopher King (Monsieur le boss du lab), et leur équipe, ne semblent pas encore avoir eu le temps de célébrer leur partenariat avec OpenAI à grands coups de confettis. Leur quotidien ? Répondre aux besoins d’Anthropic (le cousin AI d’Amazon), faire carburer le service Bedrock, et surtout : réussir chaque « bring-up » – ce moment où l’on allume une puce fraîchement fabriquée, croisant les doigts pour qu’elle ne fasse ni étincelle, ni griller la nuit pizza.
Trainium veut révolutionner l’IA, mais même une révolution commence souvent par un bug à la con et un coup de lime.
Derrière les trophées et la communication léchée, il y a une armée d’ingénieurs en jeans qui soudent à la loupe, ajustent au grinder, et veillent sur cette « bring-up » mythique – le rodéo nocturne qui décide si la puce passera le BAC option Claude (le modèle d’Anthropic) ou terminera à la casse. Même Apple, d’habitude aussi bavard qu’un coffre-fort suisse, a publiquement salué leurs Graviton et Trainium lors d’une rare confession sur les bienfaits des puces Amazon.
Le laboratoire ressemble à un croisement entre une classe de techno et le set du prochain film Marvel, mais ici, pas de super-héros : juste des cerveaux branchés sur 3000 volts et une étagère garnie de “sleds”, ces plateaux où s’entassent les générations successives de puces Graviton, Trainium, et compagnie. L’enjeu ? Permettre à AWS de jongler entre performances de folie, consommation électrique économe (vive le refroidissement liquide !), et prix serrés, histoire de couper l’herbe sous le pied du monstre Nvidia.
Mais changer de fournisseur de puces, c’est presque comme passer d’iOS à Android : faut tout réécrire, tout réapprendre. Bonne nouvelle cependant : Trainium drague désormais PyTorch, le framework IA préféré des devs, avec une promesse de migration “à une ligne de code près” (si, si). Ajoutez à ça un partenariat avec Cerebras pour booster l’inférence, et on commence à comprendre pourquoi Jassy bombe le torse sur X.com, façon papa fier.
Au final, sous les sunlights des deals fracassants entre OpenAI et Amazon ou Microsoft, c’est surtout à Austin, dans la moiteur des serveurs et le vacarme des systèmes de refroidissement, que la guerre des puces se gagne à l’huile de coude : grind, soudure, nuit blanche et pizza. La prochaine fois que vous testez une IA révolutionnaire, ayez une pensée pour ceux qui, pour faire fonctionner le cerveau de la bête, ont aussi dû se battre contre un radiateur mal vissé à 3h du mat’.
Alors, à tous les fans de jeux de mots technos, sachez-le : chez Amazon, quand ça surchauffe, ils Trainium pour que ça refroidisse !
Source : Techcrunch




