Pourquoi les grands réseaux sociaux ferment-ils désormais la porte à l’intelligence artificielle, notamment lorsqu’elle est pilotée par des entreprises rivales ? Depuis l’arrivée fracassante des IA génératives, les géants du web semblent resserrer l’accès à leurs trésors de données. Mais à qui profitent vraiment ces restrictions, et sont-elles là pour durer ?
Chez X, ex-Twitter, le ton s’est durci : « Vous n’êtes pas autorisé à utiliser l’API ou le contenu X pour entraîner un modèle d’IA, fondation ou frontier model », annonce désormais leur convention développeur. Cette phrase, anodine en apparence, pourrait bien changer la donne. Est-ce le résultat direct de l’acquisition de X par xAI, la société d’Elon Musk active dans l’IA ? Peut-on parler de protection légitime ou d’une volonté de verrouiller l’innovation ?
Jusque-là, X n’avait pas hésité à faire évoluer en silence sa politique de confidentialité pour pouvoir utiliser à sa guise les publications de ses utilisateurs dans l’entraînement de ses propres modèles d’IA. L’année dernière, la plateforme a même offert la possibilité à des tiers de former leur IA sur son contenu public. Pourquoi ce virage soudain ? Serait-ce la peur de voir d’autres sociétés bénéficier d’une ressource stratégique sans contrepartie financière ?
La bataille des données entre plateformes et IA trace aujourd’hui de nouvelles frontières dans la guerre des intelligences.
X n’est pas le seul acteur à serrer la vis. Reddit, autre géant des discussions en ligne, multiplie aussi les barrières contre les robots rallongeant leur appétit de données. Faut-il y voir la réaction à une frénésie d’aspiration orchestrée par les IA qui menacent l’économie des plateformes ? Ou simplement la volonté de monétiser cet accès, après avoir longtemps offert leurs archives numériques en libre-service?
Certaines entreprises tech vont même jusqu’à inscrire dans leurs conditions générales d’utilisation l’interdiction explicite de toute extraction de données à des fins de machine learning. La Browser Company, avec la clause de son navigateur Dia, fait écho à cette tendance grandissante. À l’heure où l’on parle de « data is the new oil », ces clauses sont-elles en train de dessiner un nouvel eldorado réglementaire ou, au contraire, une forteresse numérique ?
Face à ces mouvements de défense tous azimuts, un enjeu essentiel fait surface : l’accès inéquitable à la matière première des IA risque-t-il de creuser un fossé entre les géants détenant les données et les outsiders de la tech, limitant dès lors l’innovation ouverte ?
Au bout du compte, est-ce un simple jeu de pouvoir entre mastodontes technologiques, ou bien la première étape vers une refonte profonde des règles du web et de l’intelligence artificielle ? La question reste entière : à qui appartiennent vraiment nos données à l’ère de l’IA ?
Source : Techcrunch