Tech & Music Note

Tech, musique, cinéma, séries, édition... tout change et se mélange !

image_author_Brice_Homs
Par Brice Homs
1 juil. · 5 mn à lire
Partager cet article :

I.A et musique.

Frankenstein versus le sourire de la Joconde ?

Si vous êtes parisiens, ou de passage à Paris, et que vous vous êtes attablés, le soir, à une terrasse de Saint-Germain des prés, vous avez sans doute rencontré Ali, le dernier vendeur de journaux à la criée qui passe tous les soirs en lançant avec gouaille la même entonne : « Ça y est, c’est fait ! », vous invitant à acheter le journal pour savoir quoi !

Il aurait pu cette semaine lancer son célèbre gimmick en faisant référence aux intelligences artificielles génératives de musique.

Car ça y est, c’est fait ! Les trois plus grosses « majors », Sony, Universal et Warner, soutenues par la RIAA (Record Industry Association of America) ont assigné en justice les services d’intelligence artificielle générative Suno et Udio :

https://variety.com/2024/music/news/record-labels-sue-ai-music-services-suno-and-udio-copyright-infringement-1236045366/

Voici les points principaux des plaintes, tels que répertoriés par Ed Newton-Rex de Fairly trained, un organisme de certification des IA :

  • Les plaignants accusent Suni et Udio de « violation délibérée du copyright d’une ampleur presque inimaginable »

  • Les majors avancent des preuves que les deux compagnies ont entrainé leurs algorithmes sur des œuvres dont ils détiennent les droits, y compris des « outputs » qui ressemblent de façon très proche à leurs enregistrements (ABBA, Michael Jackson, Green Day, James Brown pour n’en citer que quelques-uns).

  • Elles expliquent pourquoi ce n’est pas du « droit de fouille ».

  • Elles pointent que le vol généralisé d’enregistrements couverts par le copyright met en péril l’écosystème entier de la musique et tous les gens qu’il emploie.

https://www.fairlytrained.org/

Mais la chose la plus intéressante est que ces majors demandent un « jury trial ». C’est à dire une décision rendue par des jurés et non pas par un juge statuant seul, contrairement aux précédentes actions, comme celle initiée auparavant par Universal contre le robot Claude 2 d’Anthropic dont j’avais déjà parlé ici.

Cette requête n’est pas anodine et elle m’inspire les deux réflexions (intuitions) suivantes.

Demander la convocation d’un jury populaire, c’est faire appel à deux notions clé :  l’interprétation commune, c’est à dire ce que l’on pourrait qualifier de « bon sens », et le consensus ou a minima une forme de majorité.

Mais aussi et surtout au jugement des auditeurs, des amateurs, les fans, bref ceux qui écoutent de la musique, aiment des chansons, des artistes, et qui (re)connaissent des gens derrière et dans la musique.

Des gens.

Elles invitent aussi, au-delà du droit d’auteur, et cela est clairement énoncé, à s’impliquer à défendre, au-delà des œuvres, les créateurs, les artistes mais aussi, et on l’oublie souvent, toutes celles et ceux qui composent l’écosystème musical :  des centaines de milliers de personnes qui vivent de la musique et la font vivre.

Certains observateurs comme le producteur-YouTubeur Rick Beato ne se privent toutefois pas de faire remarquer que les majors ne visent pas seulement à protéger leurs artistes par une telle action mais entendent bien utiliser l’I.A à leur propre profit.

https://youtu.be/1bZ0OSEViyo?si=l8ie5mCdfC0n8-rm

A preuve, il cite l’annonce par Universal d’un partenariat avec SoundLabs (société d’IA générative) pour développer des clones vocaux de ses artistes.

La même semaine, un article du Financial Times révèle que les trois majors sont en négociations avec YouTube pour développer des outils d’I.A utilisant leur répertoire. 

Comme disait Stephen Colbert, « Ça s’appelle show-business, pas show friendship ! ».  

Dans le même temps, Suno annonce sur son blog, par la voix d’un de ses co-fondateurs, Keenan Freyberg, que la plateforme va rémunérer les « créateurs »  (c’est moi qui ajoute des guillemets) qui l’utilisent en fonction du classement des titres qui y seront proposés, ce classement sera établi par une côte de popularité combinant les « plays, les likes et les shares ». Selon la grille de répartition suivante :

 source - Suno's blogsource - Suno's blog

https://suno.com/blog/sos

 

Un million de dollars serait engagé d’ici la fin de l’année. Le paiement sera uniquement fait par Paypal. Façon d’attirer et d’encourager les usagers pour positionner la plateforme davantage comme une communauté que comme un simple outil génératif, comme l’explique cet article de Music Business Worlwide en date du 17 Juin 2024.

https://www.musicbusinessworldwide.com/after-raising-125m-ai-music-generator-suno-is-now-paying-its-most-popular-creators/

Vous l’avez bien compris, il s’agit bien ici de rémunérer l’output. C’est à dire les contenus “créés” avec le programme, pas les oeuvres qui l’ont nourri. En gros : les demandes faites à la machine. En invitant les utilisateurs à les partager et les promouvoir.

D’autres acteurs se positionnent avec une ambition plus vertueuse. Dans un article de Music Business Worlwide en date du 21 Juin 2024, Shara Senderoff, co-fondatrice et CEO de JEN affirme que son robot text to music JEN-1, « ne vole aucune musique » s’en prenant sans ménagement aux plateformes visées ci-dessus :

« We all had hoped that the days of stealing music were long gone, but the rise of generative music has ushered in a whole new gang of bad actors ».

Sa promesse est celle d’une rétribution des oeuvres utilisées pour entraîner:

« We architected a training doctrine and licensing framework that was unabashedly committed to transparency, compensation and copyright identification », affirme-t-elle.

https://www.musicbusinessworldwide.com/the-music-business-has-a-stealing-problem-again123/

On peut la consulter sur leur site:

https://www.jenmusic.ai/about

On demande à voir, et surtout quelles modalités seront proposées.

Une avancée, en tout cas, pour résoudre les litiges avec les sociétés détentrices des copyrights et notamment les majors et les fonds d’investissement qui ont massivement investi ces dernières années dans le rachat de catalogues.

Mais une fois réglé le problème des licences légales et de la rétribution des œuvres préexistantes utilisées par ces logiciels pour fonctionner, cela ne changera en rien le problème de l’utilisation de ces « contenus », ensuite, à la place d’œuvres créées par des artistes humains.

Je vous invite à écouter ce court podcast des Echos animé par Joséphine Boone, où Patrick Sigwalt actuel président du conseil d’administration de la SACEM résume bien, exemple à l’appui, le fonctionnement de ces I.A mais aussi leur champ d’application, et leurs menaces, notamment sur les musiques dites fonctionnelles.

https://www.lesechos.fr/tech-medias/hightech/lia-la-nouvelle-star-de-la-musique-2102954

Si vous me lisez régulièrement, mieux, si vous êtes abonnés à cette newsletter – c’est gratuit ! – vous savez que j’aime illustrer mes réflexions de films ou de romans.

Vous vous souvenez de « La rose Pourpre du Caire » ou du « Magicien d’Oz » dans de précédentes éditions ?

Alors je vais vous parler aujourd’hui de Frankenstein.

Pour celles et ceux qui n’ont pas vu le film ni lu le livre de Mary Shelley, je vous fais le pitch :

Un savant fabrique un monstre à partir de morceaux humains. Au final le truc ressemble à un humain, un humain bricolé avec des bouts d’humains. Un humain censé être mieux. C’est ça l’idée. Sauf que personne ne l’aime alors il décide, comme il est intelligent, de tuer tout le monde.

 En gros vous avez là, la méthodologie, le résultat et les peurs qu’inspirent les intelligences artificielles génératives dans le monde de la musique.

Donc le monstre de Frankenstein est fait de bout de corps assemblés dans le bon ordre pour que ça ressemble à un corps humain. Avec la tête au bon endroit (des yeux, des oreilles, une bouche, un nez et même des cheveux), les bras, les jambes, les doigts et les ongles, même les détails sont là… C’est quand même épatant, et c’est quand même vachement bien fait.

Normal c’est un monstre. Au sens étymologique du mot : quelque chose que l’on montre (du latin monstrare).

On pourrait appliquer la même appréciation à un morceau de musique générée par l‘intelligence artificielle générative. Car monstre est aussi par extension dérivé du latin monere (modifier).

C’est fait avec des bouts piochés à droite à gauche, c’est épatant, c’est même vachement bien fait. Tout est au bon endroit. Tout est comme on l’a demandé. Vite fait. C’est ça l’idée.

Vite fait.

Le compositeur Laurent Couson a très bien analysé tout cela, du classique à la pop ou au jazz, dans une vidéo devenue rapidement virale. Je vous recommande de prendre quelques minutes pour la regarder :

https://youtu.be/VNptz2CfSy8?si=OJ3R_ALBMQpmLx1Z

Quelle que soit la demande, ça marche super bien, tous ces petits bouts, ces mouvements, ces rythmes, ces timbres, ces fragments de mélodies… et dans tous les styles. Vous pouvez en quelques secondes générer autant de petites créatures de Frankenstein musicales que vous voulez. C’est bluffant.

J’avais coutume de dire, quand j’animais des ateliers d’écriture de chanson dans les années 2000 au studio des variétés ou aux rencontres d’Astaffort, aux jeunes artistes qui venaient échanger avec moi, que la chanson n’est pas un tout égal à la somme de ses parties.

L’intelligence artificielle fonctionne sur le postulat du contraire. Et c’est sa limite. Comme je l’avais traité dans une newsletter précédente :

Au bout du compte, qu’est-ce qui fait que quelque chose nous touche, nous émeut, nous connecte ? Sa complexité ? Sa ressemblance ? Son assemblage ? Ou le fait qu’il y ait quelqu’un derrière, avec des émotions humaines ?

Pourquoi aime-t-on autant un(e) artiste pour ses bonnes que ses moins bonnes chansons, pour ses défauts de voix, ses imprécisions de texte, ses erreurs d’accords, ses failles et ses imperfections, le pas parfait, le pas tout à fait beau ?

En admettant, comme me le soutenait encore hier un spécialiste crédible, que l’intelligence artificielle arrive à fabriquer une chanson complète, juste, indétectable à l’écoute, avec une voix au timbre parfaitement imité, est-ce qu’elle me touchera pour autant ?

 Ce qui nous amène au sourire de la Joconde.

On est d’accord, c’est pas Beyoncé ! Et c’est pas un smiley. C’est même pas complètement un vrai grand sourire. Pourtant, c’est le sourire le plus célèbre du monde. Le standard absolu, le « My way » des sourires !

« Beauty is in the eye of the beholder », dit un proverbe anglais. J’avais retranscrit ça il y a quelques années dans un poème par : « La beauté, c’est pas ce que tu vois, c’est ce que ça te fais… ».

Alors ce qu’on entend ?

Ce sera peut-être la réponse à tous nos questionnements sur les « contenus » générés par les intelligences artificielles de musique.

Après s’être posé la question de ce qu’elles font, il faudra sans doute se poser celle de ce que ça nous fait.

Au fait, elle chantait comment la Joconde ?

Et n’hésitez pas à donner votre avis ou vos réactions ci-dessous.