black microphone

Credits image : Brian Suman / Unsplash

HardwareIntelligence ArtificielleTechnologie
0

Voix sur écoute : quand l’IA coupe court au brouhaha

« Parler, c’est bien. Se faire entendre dans un Starbucks plein à craquer, c’est mieux. » Voilà le défi qui hante l’ère de l’IA vocale : capter nos doux mots, même quand l’espresso pétille autour. Dans la Silicon Valley, Subtle Computing lance un pavé dans la mare du bruit ambiant en sortant sa baguette magique de l’isolation vocale. Leur mission ? Permettre à vos assistants AI préférés de décrypter ce que vous racontez, même dans un open-space transformé en concert de maracas.

Pour ceux qui suivent la tech de près (ou de très près si vous lisez cet article), le marché de l’IA vocale est en pleine effervescence. Meeting note-takers dopés à l’IA comme Granola, Fireflies, Fathom et Read AI font la coqueluche des investisseurs. Les mastodontes comme OpenAI ou Notion s’incrustent aussi dans la partie avec la transcription vocale. Même le hardware se joint à la fête, de la bague connectée qui prend vos notes à la dictée orchestrée par l’IA. Mais que valent tous ces gadgets si, dès que la bouilloire siffle, tout ce que votre assistant entend c’est « blblbl café » ?

Entrent en scène Tyler Chen et ses comparses (fans de hacking et de café probablement), diplômés de Stanford, qui décident de créer Subtle Computing pour débloquer un niveau inédit d’intelligence vocale. Au lieu de généraliser, ils personnalisent : chaque modèle est formé pour reconnaître la voix de l’utilisateur et s’adapter à ses appareils spécifiques (en tenant compte de leur écho ou de leur timbre très… micro-ondes). Résultat, leurs algorithmes comprendraient mieux vos secrets murmurés qu’un serveur d’espionnage russe un peu fatigué. L’avantage : plus besoin d’envoyer tous vos mots doux dans le cloud, on garde ça local pour éviter les bugs et les délais. La confidentialité et la rapidité, combo gagnant.

Loin de tout blabla générique, Subtle Computing veut que chaque voix compte – même dans la tempête.

Mais attention, sous le capot, l’innovation ne ronronne pas juste pour la beauté du geste. Le modèle de séparation vocale ne fait que quelques mégaoctets et avale le bruit en 100 millisecondes top chrono. Et cherry on the microphone : la techno de Subtle est déjà compatible avec les puces Qualcomm, ce qui promet une invasion silencieuse dans nos appareils du quotidien, des casques audio aux tableaux de bord de voitures (que vous soyez en train de crier sur un embouteillage ou de chuchoter à Siri en mode « voiture piégée »).

Subtle Computing n’est plus si discrète côté finance. Avec 6 millions de dollars levés auprès de fonds réputés et de stars comme Biz Stone (Twitter), Evan Sharp (Pinterest), et Johnny Ho (Perplexity), la startup est portée par des grands noms et des grands rêves. Même Karen Roter Davis d’Entrada Ventures, qui trouve le marché « bruyant », salue la différence avec cet accent sur l’isolation contextuelle qui, selon elle, va changer la donne (et pas qu’à la belote).

Déjà en partenariat – mystère et boule de gomme – avec une marque consumer et une marque auto, Subtle annonce aussi une surprise pour l’an prochain. Un produit grand public réunissant hardware et software… Mais alors, assistant vocal, dictaphone de l’extrême ou grille-pain qui parle ? Les paris sont ouverts et la startup garde ses secrets mieux que votre ex son code Netflix.

Alors, la prochaine fois que votre équipe vous reprochera de ne pas avoir suivi la réunion parce que « il y avait du bruit », vous pourrez répondre que grâce à l’IA, même dans le vacarme, votre voix portera toujours… subtilement ! Après tout, avec Subtle Computing, on arrête de crier – c’est au tour de l’IA de faire tout un foin autour de votre voix. 

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.