Cyberéthique et libertés numériques

Actualités générées par IA : notre extension signale plus de 4 000 sites !


Jean-Marc a-t-il découvert un puit sans fond ?

Actualités générées par IA : notre extension signale plus de 4 000 sites !

Ce qui n’était au début qu’une petite liste de sites sur un bout de tableur se transforme en phénomène massif : notre base de données de sites GenAI en dénombre désormais plus de 4 000 ! Pour être alerté lorsque vous naviguez sur l’un d’entre eux, nous avons développé une extension pour Chrome et Firefox. À installer sans modération.

Depuis le début de notre enquête sur les sites d’actualités utilisant l’intelligence artificielle pour générer tout ou partie de leurs contenus, la liste ne fait que grossir à vue d’œil. Après les premières détections par Jean-Marc, elle est passée de quelques sites à des centaines puis des milliers, en l’espace de quelques mois.

Afin de vous permettre de suivre l’ensemble de notre enquête, nous avons publié une actualité de récap’, mise à jour au fil de nos publications sur le sujet.

Fin janvier, nous avions identifié un peu plus de 1 000 sites, révélant qu’il ne s’agissait pas d’un épiphénomène dans les sites d’infos. C’est d’autant plus inquiétant que les actualités générées par IA pullulent dans Google News et Discover, avec des contenus mis en avant par le moteur de recherche auprès de ses utilisateurs.

De 1 000 à 4 000 : « that escalated quickly »

Notre méthodologie s’est affinée, et améliorée, et notre base de données est passée à 1 500 sites GenAI mi février, 3 000 en mars et maintenant plus de 4 000. Une extension que nous avons développée (avec l’aide d’une IA générative, pour la petite histoire) permet d‘être automatiquement alerté lorsqu’on visite l’un des sites y figurant. Elle est disponible pour les navigateurs utilisant une base Chrome (dont Edge) et Firefox.

Si la plupart des volets de notre enquête sont réservées à nos abonnés, cette extension est librement accessible à tous, sans restriction et avec une base de données automatiquement mise à jour. Un choix assumé par la rédaction : il est important pour nous que chacun puisse savoir à quoi s’en tenir.

Ce travail n’en reste pas moins financé par les lecteurs qui nous soutiennent ; ils représentent notre seule source de revenus. Abonnez-vous à Next pour nous soutenir !

Une base de données obfusquée, avec un filtre Bloom

Nous avons néanmoins décidé de ne pas publier « en clair » cette base de sites utilisant l’intelligence artificielle générative pour écrire tout ou partie de leurs articles. Plusieurs raisons à cela, notamment le fait que nous ne voulons déjà pas qu’elle puisse aider ceux qui voudraient améliorer leurs générateurs d’articles automatisés. Avec l’aide d’un développeur de moji – Hasnaine – nous l’avons donc obfusquée avec un filtre de Bloom.

Il est ainsi impossible de retrouver la liste des sites à partir des données disponibles, tout en évitant les faux négatifs. Il y a néanmoins un risque de faux positifs, d’où la présence d’une liste d’exception et la possibilité pour tout un chacun d’en ajouter manuellement.

Red Flag Domains, AMF et signalements : les autres fonctionnalités

Au fil des versions, l’extension s’est améliorée et dispose désormais d’un système de signalement permettant à ses utilisateurs de nous faire remonter les sites GenAI qu’ils auraient identifiés, et de deux autres listes d’alerte : celle de Red Flag Domains et celle de l’AMF. Elles sont automatiquement mises à jour (une fois par jour), mais vous pouvez aussi forcer manuellement les mises à jour.

Très prochainement, nous publierons une mise à jour prenant en compte certains de vos retours. Déjà, moins de messages dans la console. Ensuite, un compteur permettant de suivre le nombre d’alertes, et peut-être d’autres surprises. Nous mettrons à jour le code sur GitHub au passage.

Si ce n’est pas déjà fait, n’hésitez pas à laisser un commentaire et une note sur les boutiques des navigateurs 😉

Auteur : Sébastien Gavois

Aller à la source

Artia13

Bonjour ! Je m'appelle Cédric, auteur et éditeur basé à Arles. J'écris et publie des ouvrages sur la désinformation, la sécurité numérique et les enjeux sociétaux, mais aussi des romans d'aventure qui invitent à l'évasion et à la réflexion. Mon objectif : informer, captiver et éveiller les consciences à travers mes écrits.

Artia13 has 3227 posts and counting. See all posts by Artia13