« Ce qui se conçoit bien s’énonce clairement… mais encore faut-il avoir la bonne voix pour le dire ! » Voilà qui résume bien le dernier coup de tonnerre dans le monde de l’IA vocale : ElevenLabs, la startup qui veut nous faire parler à nos machines, vient d’empocher (roulements de tambour) un demi-milliard de dollars lors de sa levée de fonds la plus récente. Une performance qui, à ce rythme, risquerait de rendre un perroquet jaloux.
Trois fois plus valorisée qu’en janvier dernier, ElevenLabs affiche à présent un épatant 11 milliards de dollars au compteur. De quoi envisager l’avenir avec la voix grave et le port altier ! Les mastodontes du capital-risque sont au rendez-vous, sous la houlette de Sequoia Capital, immédiatement suivi de ses acolytes a16z et Iconiq — qui n’ont d’ailleurs pas hésité à rallonger la mise, histoire d’être sûrs d’avoir leur mot à dire lors de la prochaine révolution audio.
Le chœur des soutiens inclut également des noms déjà fidèles comme BroadLight ou Valor Capital, tandis que de nouveaux chefs d’orchestre s’invitent à la partition. Mais attention, ElevenLabs garde un ou deux as cachés dans sa manche, et promet de révéler bientôt l’identité de certains investisseurs « stratégiques ». Le suspense façon télé-crochet, avec peut-être à la clef un featuring sensationnel pour aller conquérir le monde… ou au moins l’Inde, le Japon et le Brésil !
L’IA, c’est parfois une question de rythme… et ElevenLabs semble avoir trouvé la bonne octave.
L’ambition de la jeune pousse ? Bousculer tous nos modes d’expression numérique, grâce à une R&D qui ne s’arrête pas à la voix : on chuchote déjà dans les couloirs que la vidéo pourrait bientôt rejoindre le bal des innovations. En janvier, ElevenLabs a d’ailleurs annoncé une collaboration avec LTX pour transformer le son en images animées : bientôt, nos podcasts préférés pourraient bien avoir droit à leur version « karaoké vidéo »… avec moins de fausses notes, espère-t-on !
Pour Mati Staniszewski, co-fondateur et chef d’orchestre, tout est une question d’alliage entre recherche et produit concret. Traduction : l’équipe ne veut pas que la technologie se contente de rester dans les labos. Avec cette nouvelle manne financière, elle promet d’étendre sa gamme « créative », aidant les artistes et entreprises à concevoir des agents toujours plus bluffants, capables non seulement de parler… mais aussi de taper, d’agir et (bientôt ?) de philosopher sur l’existence de leur propre voix intérieure.
Côté chiffres, c’est crescendo : ElevenLabs clôturée 2024 avec un impressionnant 330 millions de dollars en revenus annuels récurrents (ARR). Pour l’anecdote, il n’a fallu que cinq petits mois à la société pour grimper de 200 à 300 millions d’ARR — autant dire que la croissance a le souffle long, et la voix bien posée.
La concurrence, elle aussi, donne de la voix : pendant que Deepgram, autre as de la parole artificielle, séduisait les investisseurs avec 130 millions de dollars levés, Google préférait carrément débaucher tout le gratin de Hume AI, notamment son CEO. Comme quoi, dans la grande chorale de l’IA vocale, mieux vaut ne pas être aphone… ou rester sur le banc de touche pendant que les autres chantent.
En somme, ElevenLabs réussit un triple salto vocal : lever des montagnes de fonds, snober la monotonie, et promettre de transformer notre façon d’interagir — voire de bavarder — avec la technologie. Reste à espérer qu’à force de parler d’avenir, personne ne perde la voix… sinon, ce serait « mal entendu » !
Source : Techcrunch




