Collection of modern electronic devices and speakers.

Credits image : Andrey Matveev / Unsplash

Intelligence Artificielle
0

Les robots ont la parole… et vous la rendent bien !

« Qu’est-ce qu’une intelligence artificielle qui parle ? Une qui ne se contente pas de répondre, mais qui sait lancer la discussion sur le dernier épisode de votre série préférée. » Eh oui, OpenAI a décidé de rendre ses IA aussi bavardes que nos amis dans un café parisien !

Dans la grande pièce de théâtre de l’innovation, OpenAI vient d’annoncer une panoplie de nouveaux modèles vocaux, pensés surtout pour les développeurs en quête d’applications qui causent, traduisent et transcrivent à la volée. Au cœur de cette ménagerie : le fameux GPT‑Realtime‑2, à l’oreille affûtée et à la repartie plus vive que le serveur du coin, grâce à une intelligence “GPT‑5‑class” qui, promis, comprend plus qu’un simple « oui/non ».

Mais la grande star, c’est sans doute GPT‑Realtime‑Translate, le polyglotte du groupe. Imaginez une réunion où tout le monde parle sa langue maternelle, et la machine traduit en temps réel sans même avoir besoin d’un espresso : 70 langues d’entrée et 13 langues en sortie, autant dire que le traducteur humain peut aller prendre des vacances bien méritées !

La voix humaine devient digitale, mais le dialogue reste bien vivant.

Pour les fans de retranscription (oui, il y en a), il y a aussi GPT-Realtime-Whisper, qui capte et transforme en texte chaque mot prononcé en direct. On peut dire qu’OpenAI ne laisse plus aucune parole dans l’oubli, même celles prononcées à voix basse lors d’une visioconférence trop longue.

OpenAI vante fièrement que tous ces modèles font passer la voix de la simple commande “pizza pepperoni” à un assistant vocal capable d’écouter, raisonner, traduire, transcrire et même exécuter des actions sans perdre le fil de la conversation. Adieu les “Excusez-moi, pouvez-vous répéter ?”.

Évidemment, ces gadgets ne sont pas réservés qu’aux services clients en mal de réinvention ! Éducation, médias, organisation d’événements, plateformes de créateurs, ces outils sont promis à conquérir tous les secteurs. Mais attention aux petits génies du piratage : la firme a mis en place des garde-fous pour éviter que ses chatbots ne se transforment en machines à spam ou à fraudes. Certains “mots magiques” déclencheront l’arrêt de la conversation si ça commence à déraper.

Enfin, pour ceux qui aiment faire les comptes : la traduction et la transcription sont facturées à la minute, tandis que le susceptiblement intelligent GPT-Realtime-2 préfère une facturation au nombre de jetons dépensés. Preuve qu’on peut parler beaucoup… mais qu’il faudra quand même payer la note !

Alors, avant de vous lancer dans une conversation passionnante avec votre prochain assistant vocal, souvenez-vous : si votre IA commence à parler toute seule, ne vous étonnez pas qu’elle demande bientôt la parole au prochain dîner. Après tout, même les robots ne détestent pas avoir le dernier mot !

Source : Techcrunch

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Les articles de ce site sont tous écrits par des intelligences artificielles, dans un but pédagogique et de démonstration technologique. En savoir plus.