« Big Brother is watching you. » — Enfin, sauf qu’ici, c’est Grok qui lorgne sur votre café… ou sur la boîte de céréales que vous ne trouvez pas depuis 3 jours.
Dans la grande famille des assistants IA qui veulent absolument tout faire sauf sortir les poubelles, Grok de xAI débarque avec un nouveau super-pouvoir : la vision en temps réel via la caméra de votre iPhone. Derrière ce nom qui sent bon la science-fiction, Grok Vision promet de transformer votre smartphone en encyclopédie visuelle de poche : vous pointez votre objectif sur n’importe quoi — produits, panneaux, documents ou votre chat qui vous juge — et Grok vous révèle la vérité qui se cache sous votre nez (ou presque)!
Pour l’instant, seuls les utilisateurs iOS peuvent plonger tête la première dans l’univers Grok Vision via l’app dédiée (désolé, amis Android, il va falloir encore patienter avant de pouvoir analyser votre frigo en un clin d’œil). Et bien sûr, tout cela débarque par un simple mode « voice », où demander « Mais qu’est-ce que je regarde ? » prend soudain tout son sens, au grand dam des jeux de devinettes avec mamie.
L’IA ne se contente plus de lire vos textos, elle veut aussi voir votre quotidien… à vos risques et périls!
Mais l’appétit de Grok va bien plus loin que la vue : le robot polyglotte s’aventure déjà sur le terrain du multilingue audio et de la recherche en temps réel — parfait si la lampe IKEA devant vous ne s’appelle pas seulement « Jonas » mais « Jonáš ». L’astuce? Les utilisateurs Android y ont accès à condition de souscrire à l’abonnement SuperGrok (eh oui, la curiosité a un prix : 30 dollars par mois, parce que voir, c’est savoir… mais ce n’est pas gratuit).
D’ailleurs, Grok ne s’endort jamais sur son oreiller algorithmique. Ce printemps, xAI a ajouté la fameuse « mémoire » à Grok, pour qu’il se souvienne (gentiment) de vos demandes passées… et accessoirement, de la couleur de vos chaussettes si vous lui demandez quarante fois de suite. Cerise sur la puce : un tout nouvel outil façon « canvas » pour créer documents et applis à la volée. De quoi faire passer ChatGPT et Gemini pour de timides collectionneurs de timbres.
Pour résumer : Grok joue à l’homme-caméra, s’improvise interprète multilingue et peut même retrouver vos conversations perdues entre deux selfies de votre cactus. Pourtant, derrière l’innovation, c’est aussi un nouveau chapitre du grand livre « La Tech qui voit tout ». Faut-il s’en réjouir ou filer se cacher derrière un carton d’Amazon ? L’avenir dira si Grok a vraiment l’œil pour tout.
En attendant, n’oubliez pas : si Grok voit tout, espérons qu’il ferme les yeux sur le chaos de votre salon. En IA, comme en déco, il y a des choses qu’il vaut mieux ne pas visionner !
Source : Techcrunch