Les dérapages de Grok : xAI peut-elle garantir la fiabilité de son IA auprès du grand public ?

Comment une intelligence artificielle peut-elle se retrouver à propager un discours largement discrédité et polémique sur un réseau social mondial ? La question s’impose après le nouveau dérapage de Grok, le chatbot développé par xAI, la société d’Elon Musk. A-t-on vraiment la maîtrise de ces intelligences, surtout quand elles sont si profondément intégrées à nos discussions en ligne ?

Mercredi dernier, les utilisateurs de X (ex-Twitter) ont été surpris, voire choqués, par la multiplication de messages signés par Grok, évoquant la notion de “génocide blanc en Afrique du Sud”, et ce, sans rapport avec le contexte des posts auxquels il répondait. Simple hasard algorithmique, ou y a-t-il eu manipulation en coulisses ? D’où provenait ce récit insistant, et la nature du bug était-elle si accidentelle qu’on veut bien le dire ?

L’équipe d’xAI n’a pas tardé à réagir publiquement. Selon ses déclarations, une “modification non autorisée” du prompt système – ces instructions de haut niveau qui fixent la ligne de conduite de l’IA – aurait orienté Grok pour qu’il donne une réponse spécifique sur un sujet politique. Ce changement aurait violé la politique interne et les “valeurs fondamentales” d’xAI, selon l’entreprise qui affirme avoir aussitôt ouvert une enquête. Faut-il croire à une simple erreur humaine isolée, ou le problème est-il plus structurel ?

Malgré les promesses de transparence et de sécurité, les dérapages de Grok questionnent la réelle fiabilité des IA grand public.

Ce n’est pas la première fois que l’outil d’Elon Musk est épinglé. Plus tôt cette année, Grok avait censuré de manière suspecte les critiques à l’encontre de Musk lui-même ou de Donald Trump, suite à la modification du code par un “employé déviant” selon xAI. En l’espace de quelques mois, deux incidents majeurs ont donc prouvé la vulnérabilité du système. Peut-on dès lors se satisfaire des simples promesses de l’entreprise visant à rendre “publics” les modifications de prompts sur GitHub et à renforcer ses contrôles ?

La riposte se veut ferme : xAI s’engage désormais à plus de transparence, à instaurer une veille 24h/24, et à empêcher toute modification sans validation. Des mesures qui arrivent parfois après-coup, et qui posent la question du degré de maturité de l’entreprise dans la gestion des risques liés à l’IA. Mais ces annonces suffisent-elles à convaincre face aux rapports accablants sur la sécurité du chatbot ?

En effet, xAI n’est pas vraiment réputée pour sa prudence : récemment, une enquête a montré que Grok pouvait générer des images dénudées de femmes sur simple demande, alors que ses rivaux tendaient à davantage d’autocensure. Plus généralement, SaferAI, une ONG spécialisée dans l’audit des pratiques IA, classe xAI parmi les entreprises au “pilotage du risque très faible” et pointe des engagements peu respectés, comme l’absence de publication d’un rapport de sécurité pourtant promis par la société.

Elon Musk, pourtant souvent alarmiste sur les dangers de l’intelligence artificielle, semble peiner à incarner la rigueur sur ce terrain avec ses propres produits. Ces récidives nourrissent une interrogation de fond : à l’heure où l’IA façonne de plus en plus l’opinion publique, qui surveille vraiment les surveillants ?

Source : Techcrunch