« La vie est comme un ordinateur : parfois, ça bogue, mais la meilleure partie vient quand tout fonctionne. » C’est ce que pourrait penser Stefano Ermon, professeur en informatique à Stanford, qui a décidé de mélanger deux mondes pour en créer un troisième encore plus performant. Inception, son dernier bijou, promet de chambouler les règles du jeu avec un modèle d’intelligence artificielle basé sur une technologie de « diffusion ». Qui aurait cru que la science-fiction rejoindrait aussi vite la réalité ?
Les stars actuelles de l’IA, ce sont les modèles de langage large (LLM) et les modèles de diffusion. Les premiers, construits sur l’architecture des transformateurs, se concentrent sur la génération de texte. Les seconds, quant à eux, règnent sur la création d’images et de vidéos. Mais que se passe-t-il quand on mélange les deux ? Une fête technologique ! Inception a relevé le défi d’éradiquer la lenteur des LLMs grâce à la rapidité des modèles de diffusion.
Inception allie la vitesse supersonique des modèles de diffusion à l’efficacité des LLM, pour une nouvelle ère d’ingéniosité textuelle.
Stefano Ermon, jamais à court d’idées, avait un rêve : permettre aux modèles de diffusion de parler. Oui, vous avez bien lu ! Pourquoi se contenter de GIFs et de bandes sonores quand on peut générer du texte à la vitesse de la lumière ? Après moult essais et échecs, une percée s’est enfin produite dans son laboratoire de Stanford. Avec un étudiant, ils ont créé un modèle capable de braver les traditions et les lenteurs des processus séquentiels typiques des LLMs.
Lorsque Ermon et son équipe ont partagé leurs résultats dans un article de recherche, l’histoire s’est acceleré et Inception est né, l’été dernier. Bien sûr, tout cela n’aurait pas été possible sans une poignée de génies ambitieux comme Aditya Grover et Volodymyr Kuleshov à ses côtés. Et bien que les détails financiers soient bien cachés, le nom de la Mayfield Fund flotte subtilement dans l’air.
Les lignes de code new gen d’Inception intéressent déjà les grandes enseignes de renommée mondiale, qui sont prêtes à miser gros pour surfer sur cette vague futuriste. Moins de latence et un éventail de fonctionnalités qui feraient rougir Siri. Cerise sur le gâteau : le modèle d’Inception peut fonctionner jusqu’à 10 fois plus vite et à moindre coût. Oui, vous avez bien entendu, 10 fois !
Il n’est plus question de briller uniquement sur papier, mais de révolutionner l’industrie de l’IA avec une efficacité redoutable. Et comme dirait un optimiste : « Il n’y a pas de limite à l’Inception, sauf peut-être l’imagination. » Pour ceux qui aiment plaisanter, disons qu’avec cette invention, nos vieux processeurs vont vite grincer des dents!
Source : Techcrunch