woman in black long sleeve shirt using black laptop computer

Credits image : Kelly Sikkema / Unsplash

Intelligence ArtificielleSmartphonesTechnologie
0

Stability AI peut-elle vraiment révolutionner la création musicale en la mettant dans la poche de chacun ?

Est-il possible que l’IA générative de musique devienne réellement accessible à tous, jusque dans le creux de notre main ? Cette question, autrefois réservée aux prospectivistes, revient à la une alors que Stability AI – société déjà célèbre pour son modèle Stable Diffusion – s’allie avec Arm afin de lancer Stable Audio Open Small. Ce petit modèle, présenté comme le plus rapide du marché, peut fonctionner sur un simple smartphone. Mais derrière cette prouesse technique, que cachent réellement les promesses affichées ?

Le monde de la génération audio par IA est jusqu’ici dominé par des acteurs comme Suno ou Udio, dont les solutions sont performantes mais majoritairement dépendantes du cloud. Or, l’approche de Stability AI se distingue : Stable Audio Open Small ne nécessite aucune connexion internet et repose sur les processeurs Arm, déjà omniprésents dans nos téléphones et tablettes. Pourquoi ce parti pris de l’embarqué ? L’entreprise parie-t-elle sur un futur où chacun pourra créer des sons sans jamais quitter le mode avion ?

Un autre argument clé mis en avant par Stability concerne l’entraînement éthique de son modèle : toute la musique utilisée provient de bases libres de droits, comme Free Music Archive et Freesound. À l’heure où de nombreux concurrents se retrouvent empêtrés dans des affaires de violation de propriété intellectuelle, peut-on vraiment croire à un modèle 100% “clean” ? L’absence de contenu protégé suffira-t-elle à gagner la confiance des détenteurs de droits et des artistes ?

Stable Audio Open Small promet rapidité et éthique, mais sa simplicité technique masque-t-elle d’autres enjeux pour la création musicale ?

En y regardant de plus près, le modèle présente néanmoins ses propres limites : d’abord, il ne comprend que les sollicitations en anglais, et reste incapable de générer des voix réalistes ou des morceaux complets. Sa bibliothèque de sons, influencée par l’Occident, risque-t-elle de marginaliser certains styles musicaux ? Et que dire de la qualité sonore, qui varie selon les genres ? Jusqu’où la promesse de l’universalité peut-elle tenir face aux biais techniques et culturels ?

Côté business, Stability mise sur la gratuité pour les chercheurs, les hobbyistes, ou les jeunes pousses gagnant moins d’un million de dollars par an. Mais que se passera-t-il pour les start-up qui réussiront ? Un modèle économique basé sur la restriction d’usage pourra-t-il vraiment s’imposer dans un secteur où la concurrence est féroce ? N’assiste-t-on pas finalement à une nouvelle course à l’enclosure, chaque acteur tentant de verrouiller l’accès à ses outils ?

Derrière la virtuosité technique de cette nouvelle IA, Stability AI doit aussi composer avec ses propres démons. L’entreprise, fragilisée par des erreurs de management et le départ de son charismatique co-fondateur Emad Mostaque, tente de se réinventer sous la direction d’un nouveau CEO et avec l’appui inattendu de James Cameron au conseil d’administration. Est-ce le signe d’une renaissance, ou les derniers soubresauts d’une firme tentant de survivre à sa propre croissance ?

En multipliant les annonces – nouveaux modèles d’images, nouvelle gouvernance –, Stability espère se réinscrire dans la course à l’innovation. Mais l’arrivée de Stable Audio Open Small suffira-t-elle à redonner confiance à ses équipes, à rassurer les investisseurs, et à imposer enfin l’IA générative audio dans le quotidien du grand public ?

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.