Est-ce que vous saviez que des milliers de livres ont été numérisés sans consentement pour alimenter une énorme base de données ? Un lundi matin, nombreux furent les écrivains surpris de découvrir que leurs ouvrages avaient été utilisés par Prosecraft, un projet de Shaxpir, processeur de texte basé sur le cloud. Avons-nous une idée du nombre de livres concernés? A travers cet acte, Prosecraft a compilé plus de 27 000 ouvrages afin de les analyser et les comparer en fonction de leur « vividité ».
Face à cet abus, nombre d’auteurs se sont fait entendre. De la puissance de la littérature Young Adult Maureen Johnson à Celeste Ng, auteure de « Little Fires Everywhere », nombreux sont ceux qui dénoncent l’utilisation de leurs œuvres sans consentement préalable. Peut-on imaginer que même des livres publiés moins d’un mois auparavant aient déjà été téléchargés?
« L’arrivée de l’IA sur la scène a été entachée d’utilisations précoces qui permettent à quiconque de créer des imitations sans effort d’artistes, en privant ces créateurs de leur propre processus créatif. »
Suite à la virulente réaction des internautes, le créateur de Prosecraft, Benji Smith, a retiré son site web, qui existait depuis 2017. Malgré des milliers d’heures passées à travailler sur le projet, des textes nettoyés et annotés, des choses organisées et ajustées, il reconnaît que l’arrivée de l’IA dans le paysage a été ternie par des utilisations abusives. Ces dernières permettent de créer des imitations sans effort d’artistes, supprimant ces créateurs de leur propre processus créatif. Est-ce la fin justifie les moyens en ce qui concerne l’utilisation des technologies AI pour la littérature ?
Bien que le Prosecraft de Smith ne soit pas un outil AI générateur, les auteurs craignaient qu’il ne le devienne un jour. Smith avait en effet accumulé une base de données de pas moins d’un quart de milliard de mots issues de livres publiés, qu’il avait trouvés en parcourant Internet.
L’outil de Smith montrait deux paragraphes d’un livre, l’un étant le « plus passif » et l’autre le « plus vif ». Les livres étaient ensuite classés en fonction de leur vivacité, de leur longueur ou de leur passivité. Ces critères sont-ils pertinents pour évaluer la qualité d’un livre?
En effet, selon l’auteure Ilana Masad, « si vous êtes écrivain de métier, c’est maddening, en partie parce que le style n’est pas la même chose qu’écrire un foutu whitepaper pour une entreprise qui a besoin d’être en voix active ou quoi que ce soit. Le style, c’est le style! » Quelle est donc la réelle valeur ajoutée d’un tel outil ?
Source : Techcrunch