« Pourquoi faire simple quand on peut faire compliqué ? », demanda un jour un ingénieur avant de réaliser que sa question s’appliquait parfaitement au monde de l’IA. Alors que les coûts d’exploitation de l’intelligence artificielle atteignent des sommets, avoisinant les 7 milliards de dollars pour OpenAI, la ruée vers des solutions plus économiques est lancée.
Certes, on pourrait croire que l’IA prendrait enfin le chemin de la simplicité et de l’économique, mais c’est sans compter sur le talent de certains chercheurs pour complexifier ce qui semblait être déjà compliqué. Tandis que certains se concentrent sur l’optimisation des architectures de modèles actuels, d’autres, comme Karan Goel avec sa startup Cartesia, travaillent sur des architectures inédites qu’ils estiment plus efficaces et économiquement viables.
Dans l’univers des nouveaux modèles IA, Goel propose les modèles d’espace d’état (SSM). Plus qu’une simple innovation, il s’agit d’une architecture révolutionnaire pouvant traiter en gros volumes textes et images simultanément, rendant les opérations onéreuses beaucoup plus abordables.
Le monde des IA cherche à simplifier les complexités sans en sacrifier la complexité.
Pour Goel, la clé du succès réside dans des architectures inédites. Forte de ses racines académiques à Stanford, où il a collaboré avec des sommités du domaine, Goel n’hésite pas à commercialiser ses recherches aux côtés de ses anciens camarades de Stanford. Et voilà comment Cartesia, fondée par Goel et ses frères d’armes, déploie les projets Mamba et Sonic, redéfinissant ce que l’IA « facile » signifie réellement.
Les secrets des SSM parlent de compressions astucieuses et de mémoires efficaces, contrastant avec les inefficacités des architectures transformateurs, aujourd’hui omniprésentes. Les économies de calcul sont salutaires, encore faut-il que les pratiques éthiques suivent le même chemin d’efficience.
Si Cartesia brille par son innovation, elle trébuche sur des embûches d’ordre éthique communes aux créateurs de modèles IA. Notons que certaines formations SSM exploitent The Pile, un data set qui, bien qu’open source, a son lot de questions juridiques.
Dupliquant les voix avec une précision redoutable, Cartesia se heurte aussi à des interrogations sur la sécurité et l’usage que l’on pourrait faire de Sonic, le dernier modèle à l’affiche, pointé pour ses garde-fous quelque peu flous. Mais tout espoir n’est pas perdu, Goel promet des améliorations côté vérification de voix et preuves dans le temps, avec comme leitmotiv la sécurité utilisateur.
Malgré tout, l’enthousiasme commercial ne tarit pas : des clients se bousculent pour accéder à l’API de Sonic, en témoignent les tarifs élevés qui n’effarouchent pas les entreprises désireuses d’allier avancée technologique et optimisation de coût.
Cependant, la route de Cartesia n’est pas si rectiligne. Il lui faudra continuer d’impacter le monde de l’IA en séduisant des clients potentiels avec des preuves d’efficacité tangible. Le tout, en se positionnant parmi des concurrents qui eux aussi expérimentent des alternatives audacieuses aux transformateurs.
Avec une récente levée de fonds de 22 millions, Cartesia semble prête à naviguer dans les eaux tempétueuses de l’innovation IA. Parce que soyons honnêtes, la véritable performance d’une IA est de convaincre qu’elle n’est pas seulement un coût, mais une économie à long terme!
En fin de compte, l’avenir semble radieux pour Cartesia, qui devra continuer à prouver que parfois, générer du neuf avec de l’ancien… c’est de bonne foi!
Cartesia, la course à l’économise
AI costs
Source : Techcrunch