« Parler à une machine, c’est comme essayer d’enseigner l’opéra à un micro-ondes : ça a l’air absurde, jusqu’à ce que ça fonctionne ! » Aujourd’hui, les assistants vocaux, robots de cuisine, et même les caisses automatiques se mettent à l’écoute, prêts à transformer nos plaintes quotidiennes en actions instantanées. Et devinez qui vient bousculer la chorale des intelligences artificielles bavardes ? Notre French Touch nationale : Mistral !
Mistral, la fine équipe française de l’IA, vient de souffler le show avec Voxtral, son tout nouveau modèle audio, ouvert et résolument prêt à piquer un solo devant les géants américains du secteur. Attention, ici on ne parle pas d’un bidule open source qui entend « bonjour » et répond « confiture » : Mistral promet une intelligence vocale « vraiment utilisable » en production. Fini le dilemme : jusqu’à présent, il fallait choisir entre une solution ouverte qui comprenait une phrase sur cinq, ou bien une option payante, fermée, et qui vidait votre porte-monnaie plus vite qu’un mauvais opérateur téléphonique.
Voxtral sonne donc l’arrivée d’un système abordable (moins de la moitié du prix des concurrents, clame Mistral avec une voix de marchand de tapis high-tech) et plus puissant qu’un café serré. Grâce à la magie de son modèle LLM, il peut transcrire jusqu’à 40 minutes de blabla, répondre à nos questions existentielles sur ce qu’il vient d’entendre, résumer des discours interminables, ou automatiser des tâches en temps réel, tout ça dans huit langues, dont le français, évidemment. Qui a dit que la baguette ne servait qu’à faire du pain ?
Avec Voxtral, Mistral prouve qu’en IA, il ne suffit plus d’avoir la voix : il faut que tout le monde puisse la mettre au diapason.
Côté technique, la partition se divise en deux versions : Voxtral Small, la grande star taillée pour les déploiements de masse (24 milliards de paramètres, et oui, c’est plus que le QI cumulé de votre salle de réunion), et Voxtral Mini, pour les projets qui aiment la discrétion, le local, et l’edge. Évidemment, cerise sur le croissant : il existe aussi une version Mini encore plus effilée, la « Mini Transcribe », qui fait de la transcription pure et promet d’enterrer Whisper d’OpenAI… à prix plancher !
Les curieux, geeks et autres apprentis sorciers peuvent se lancer gratuitement via Hugging Face ou Le Chat (le chatbot maison de Mistral, mi-chat, mi-génie). Pour les pros qui veulent brancher Voxtral sur leurs applis, l’addition démarre à 0,001$ la minute. De quoi donner envie de parler… beaucoup, pour pas cher !
Ce lancement s’inscrit dans une stratégie toute fraîche, puisque Mistral venait déjà de sortir sa famille de modèles « Magistral » pour raisonner avec brio. En fond de scène, les investisseurs se pressent pour financer le concert : Mistral pourrait lever jusqu’à un milliard de dollars prochainement. Voilà qui devrait leur permettre de garder la main (et la voix) haute dans le concerto mondial de l’IA.
Alors, la prochaine fois que votre grille-pain commence à philosopher sur le sens de la vie en français impeccable, vous saurez qui remercier. Après tout, chez Mistral, il semble bien que la voix du peuple… soit open source !
Source : Techcrunch




