Cyberéthique et libertés numériques

Deezer affirme être capable de détecter et étiqueter la musique générée par IA


Long Live

Deezer affirme être capable de détecter et étiqueter la musique générée par IA

Deezer a annoncé vendredi le lancement de son outil de détection et d’étiquetage automatique des contenus musicaux produits à 100% par des modèles d’intelligence artificielle générative. La plateforme revendique une première mondiale, qualifiée d’indispensable pour lutter contre le phénomène des streams frauduleux.

« Certains morceaux de cet album peuvent avoir été créés à l’aide de l’intelligence artificielle », indiquent désormais certaines fiches Deezer. Le service a en effet annoncé, vendredi 20 juin, la mise en service d’un outil d’étiquetage des morceaux générés par IA sur sa plateforme d’écoute de musique en ligne.

Pour ce faire, il exploite une technologie de détection automatisée, développée par ses soins, qui aurait donné lieu au dépôt de deux brevets, et aurait surtout permis à Deezer de mesurer l’explosion de la publication de musique générée par IA.

En avril dernier, la société affirmait ainsi que « 18% des nouvelles musiques publiées chaque jour sur sa plateforme sont entièrement générés par intelligence artificielle ». Elle évoquait alors un volume doublé en seulement trois mois.

0,5% des écoutes, mais 70% de fraude

Beaucoup de morceaux, mais peu d’écoutes : la musique générée par IA ne représenterait que 0,5% des streams de la plateforme. Elle servirait cependant un autre phénomène : celui des écoutes frauduleuses, c’est-à-dire des comportements d’internautes simulés sur la plateforme, utilisés pour gonfler artificiellement l’audience et donc les revenus de certains artistes. « Aujourd’hui, jusqu’à 70 % des écoutes de titres entièrement générés par IA sont considérées comme frauduleuses », affirme Deezer, sans détailler les modalités de ce calcul.

En réponse, la plateforme s’est donc lancée dans le développement d’un algorithme de détection « capable d’identifier la musique 100 % générée par les modèles génératifs les plus avancés – comme Suno ou Udio – avec la possibilité d’ajouter de nouveaux outils, à condition de disposer des données nécessaires ».

Deezer affirme ainsi être capable de détecter, directement dans le signal audio, des marqueurs associés à l’outil qui a servi à la génération, du moins s’il s’agit de Suno ou Udio, considérés comme les leaders du marché. « Quand les algorithmes d’IA génèrent de la nouvelle chanson, ils ont des espèces de petits bruits qui les identifient, propres à eux (…) qu’on va pouvoir retrouver. Ce n’est pas audible à l’oreille mais c’est visible dans le signal audio », décrit auprès de l’AFP Alexis Lanternier, directeur général de Deezer. L’outil serait, d’après lui, « fiable à 98% ».

« Concrètement, tu sauras enfin si ce que tu écoutes a été créé par un humain… ou pas », présente encore Deezer sur l’une des pages de son forum. La plateforme précise que les morceaux générés par IA ne seront plus mis en avant dans ses listes de lecture éditorialisées ou dans les recommandations algorithmiques.

Comment gérer ces productions générées par IA ?

Pourquoi ne pas purement et simplement les supprimer ? « Ou même encore mieux, pourquoi ne pas les bloquer à l’entrée en les soumettant à ce test de détection avant publication, afin d’éviter qu’ils envahissent inutilement la plateforme ? », s’interroge un utilisateur. En dehors des cas de plagiat ou de violation des droits d’auteur, la question n’est pas triviale : quid des faux positifs, ou des morceaux qui ne seraient que partiellement générés par IA ?

À défaut d’un blocage a priori, Deezer a déjà montré qu’il était possible de faire le ménage : en avril 2024, la société avait indiqué avoir supprimé sur six mois quelque 26 millions de titres (l’équivalent de 13% de son catalogue), « dont du contenu non artistique, des bruits et des doublons », grâce à ses outils de détection automatisés.

blank
Certains des 20 albums publiés en huit mois par cet artiste sont étiquetés « contenu généré par IA »

Jusqu’où les outils automatisés de Deezer se montreront-ils efficaces, surtout si de nouveaux modèles de génération de musique font leur apparition ? Dans le domaine du texte ou de l’image, les modèles de détection sont souvent pointés du doigt pour leur piètre efficacité, et nos propres travaux sur la prolifération des sites d’actualité générés par IA concluent à la nécessité d’une analyse manuelle.

La plateforme française n’est pas la seule à étudier cette approche automatisée. YouTube a ainsi annoncé en septembre dernier qu’il travaillait à la détection des éléments visuels ou sonores générés par IA au sein de sa technologie de lutte contre les infractions au droit d’auteur, Content ID.

Au-delà de l’efficacité technique, Deezer adopte surtout une posture de contrôle et d’encadrement des pratiques liées à l’IA, là où son grand rival Spotify est soupçonné d’avoir, au contraire, volontairement diffusé des morceaux créés par de faux artistes au sein de certaines listes de lecture thématisées.

Auteur : Alexandre Laurent

Aller à la source

Artia13

Bonjour ! Je m'appelle Cédric, auteur et éditeur basé à Arles. J'écris et publie des ouvrages sur la désinformation, la sécurité numérique et les enjeux sociétaux, mais aussi des romans d'aventure qui invitent à l'évasion et à la réflexion. Mon objectif : informer, captiver et éveiller les consciences à travers mes écrits.

Artia13 has 3720 posts and counting. See all posts by Artia13