Tech & Music Note

Tech, musique, cinéma, séries, édition... tout change et se mélange !

image_author_Brice_Homs
Par Brice Homs
7 juin · 6 mn à lire
Partager cet article :

I.A et musique

Somewhere over the rainbow ?

Somewhere over the rainbow, chantait Judy Garland dans « Le magicien d’Oz ».

Cela pourrait-il situer la hauteur des promesses de l’I.A, ou en tout cas ce que l’on nous en promet :  une innovation « plus profonde que le feu ou l’électricité » selon Google, que je citais dans une précédente Newsletter. 

A bien y regarder, j’ai trouvé dans ce vieux film (1939) de Victor Fleming de troublantes similitudes avec les débats qui nous animent actuellement, nous créateurs de musique, à propos de l’intelligence artificielle générative.

Statut relationnel : c’est compliqué !

Avant toute chose, il nous faut nous rappeler des personnages du film.

La jeune Dorothy (incarnée par Judy Garland) est en route (dans un rêve) vers le pays d’Oz, sur la fameuse Yellow brick road. Elle va y rencontrer trois acolytes qui vont se joindre à elle dans sa quête :  un épouvantail à qui il manque un cerveau, un pantin en fer blanc à qui il manque un cœur et un lion qui manque de courage.

On n’est pas loin avec cette métaphore de ce que la spécialiste des intelligences artificielles, professeure à Sciences-Po, Polytechnique et Columbia, et animatrice du podcast Cyber Pouvoirs sur France inter, Asma Mhalla, nomme très justement « ce qu’il y a d’homme dans l’homme ».

Revenons au film musical de 1939. « If I only had a brain » chante le personnage de l’épouvantail. Le premier élément recherché, est donc un cerveau. Bon, on fait comment ?

L’intelligence artificielle. Voilà la solution qu’aurait pu proposer le magicien d’Oz, s’il l’avait connue. N’étant qu’un vulgaire humain se cachant derrière une machinerie de pacotille, il doit se résoudre à convaincre le pauvre épouvantail que même sans cerveau, il a déjà en lui de quoi en tenir place : de l’astuce.

Les nouveaux magiciens d’Oz, dans leur cité d’émeraude, pardon leur Silicon Valley, ont rêvé mieux, des algorithmes capables de rivaliser avec le cerveau humain, et même de le dépasser. Capacité de stockage, vitesse d’ingestion de données, rapidité de traitement, le modèle lancé par Alan Turing, s’inspirant du fonctionnement des réseaux de neurones, fonctionne plutôt bien.

machine de Turing

Alors ?

Vous avez peut-être vu ce « même » qui tourne sur les réseaux sociaux : un homme vend un aspirateur d’occasion dans un vide-grenier et l’acheteur potentiel lui demande s’il marche. Le vendeur, roublard, lui répond « Je ne dirai pas qu’il marche, mais il fonctionne ». On ne saura pas si l’aspirateur aspire ou si son moteur tourne à vide.

Donc comme dirait l’autre : ça fonctionne, mais est-ce que ça marche ?

Comme l’exprime Ed Newton-Rex, spécialiste des I.A et fondateur de Fairly Trained, une entité de certification des Intelligences génératives, dans sa newsletter « Missing fundamentals » sur Substack : « Les systèmes texte vers musique semblent magiques la première fois que vous les utilisez, alors un tas de gens veulent les essayer. Mais ils y trouvent pour l’instant peu de raisons d’y retourner – l’indéniable magie de générer une première chanson peine à se transformer en usage répété ».

https://open.substack.com/pub/ednewtonrex/p/what-sunos-125m-round-means-for-ai?r=1rko0w&utm_campaign=post&utm_medium=web

J’en ai déjà parlé dans une précédente newsletter. Si Suno peut revendiquer que « plus de 10 millions de personnes qui ont utilisé leur produit » en quelques semaines… Rien ne dit que ces utilisateurs sont revenus ensuite, ni même qu’ils ont continué à écouter ce qu’ils ont prompté « pour voir ».

On est d’abord bluffé par la « qualité » sonore de l’assemblage. Vous avez commandé une chanson pour votre poisson rouge, votre déjeuner, votre dentiste (liste de thèmes proposés par l’appli), des ritournelles « à la manière de »… et en quelques secondes seulement vous écoutez le résultat.

Ça fonctionne oui, mais est-ce que ça marche ?

C’est peut-être qu’il ne suffit pas d’avoir un réseau de neurones connectés et une capacité de stockage surmultipliée.

C’est ce que nous invite à penser le deuxième personnage rencontré par Dorothy sur la Yellow brick road : Tin Man. Le pantin en fer blanc. Essentiellement composé de gamelles et bidons, il sonne creux.

Ce qui lui manque, c’est un cœur.

Il y a un magnifique texte de la chanteuse country Miranda Lambert sur ce personnage, Tin man. Elle voit les choses autrement :

Every time you're feelin' empty
Better thank your lucky stars
'Cause if you ever felt one breakin'
You'd never want a heart

A chaque fois que tu te sens vide/ Tu devrais remercier ta bonne étoile/ Parce que si tu savais ce que c’est d’en sentir un se briser/ Tu voudrais jamais un cœur.

https://youtu.be/62mEFlE4EPE?si=iamLKOA4AH4uE6_q

Un cœur ça se brise. Nous voilà dans la tristesse et l’émotion, bien humaine, que la machine ne ressentira jamais. Elle peut la commenter, la verbaliser, la copier, la suggérer, mais pas la ressentir.

A nouveau, comme disait l’autre, ça fonctionne, mais est-ce que ça marche ?

Passons enfin au dernier des acolytes de Dorothy sur la Yellow brick road. Le lion peureux. Est-ce qu’avec du courage, qualité humaine qui pour Aristote garantit toutes les autres, ce lion redeviendrait un lion pour les hommes ?

On a beaucoup parlé d’un algorithme qui avait menacé de mort un journaliste s’amusant à l’insulter. Révolte de la machine ? Non c’est juste que le programme, entrainé sur des « chats », avait ingéré ces phrases qu’il recrachait à une occurrence qui lui semblait correspondre à la plus fréquente réponse aux insultes identifiées.

La machine pense-t-elle ce qu’elle dit ? Certainement pas. Elle répète comme les fameux « perroquets stochastiques » dont elle est issue. (Chat GPT fonctionne sur ce modèle de « langage learning »).

C’est même une des méthodes utilisées en « reverse » pour déceler si une intelligence artificielle a été sollicitée dans un texte.

Des phrases mises bout à bout qui traitent de l’émotion ou vous traitent de tous les noms, certainement. Mais qui le font avec une intention, une conscience de le faire, certainement pas.

Le lion de l’intelligence artificielle est donc un perroquet.

Un perroquet confus, car selon Ralph Waldo Emerson, il y a plusieurs courages. « Celui du tigre et celui du cheval ». Je vous laisse voir avec votre horoscope chinois favori pour la compatibilité.

Voilà pour le bestiaire de l’intelligence artificielle. Et nous avons en fin de Magicien d’Oz établi qu’imitations ou animaux rien ne saurait complètement se substituer à ce qu’il y a d’homme dans l’homme. D’ailleurs quand la jeune Dorothy se réveille * attention divulgachage * les trois personnages du rêve sont bel et bien des adultes qui l’entourent dans la vraie vie. Des humains donc.

Vous l’avez compris, nous en arrivons maintenant au moment où l’on se dit : en fait la machine n’est qu’un outil.

La machine EST un outil. Un outil formidable qui va nous permettre de créer davantage, mieux, plus vite.

L’homme avec ce qu’il a d’humain va s’en servir comme d’un outil. Et l’artiste, le créateur, au premier chef (qui veut dire tête) avec son habilité à faire des choix, à adresser, à jauger, juger, ressentir, exprimer, restituer, inventer, s’inquiéter, penser, aimer, détester, s’émouvoir, comme tout humain.

Mais aussi avec talent et maitrise de son art, développés pendant des années, ce que les artistes sont censés avoir plus que d’autres. Le talent. Le talent sera donc ce qui sépare un artiste d’un autre, un autre des autres, le bon grain de l’ivraie, et l’œuvre humaine du « contenu » généré par les intelligences artificielles.

Les promoteurs des intelligences artificielles génératives en sont convaincus et opposent à leurs critiques que les artistes bénéficieront de cet engouement, qui justement valorisera la différence qu’ils apportent.

Dans une récente interview au magazine américain Rolling Stone, Mikey Shulman, l’un des fondateurs de SUNO, issu d’Harvard, déclare : « Nous voyons les choses différemment et souhaitons amener un milliard de gens à s’impliquer dans la musique. Si plus de gens s’intéressent à la musique, au processus de création, c’est bon pour les artistes. Nous ne visons pas à remplacer les artistes. »

https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/

Pour rester dans le bestiaire : Comme dans la ferme d’Orwell où les animaux sont tous égaux mais certains sont plus égaux que les autres… tout le monde pourrait devenir artiste, mais les artistes le seraient toujours plus que les autres.

Peut-être bien, mais…

L’outil proposé par les intelligences artificielles génératives n’est pas un magnétophone avec une bande vierge. C’est une mémoire contenant des milliers d’œuvres ingérées dans lesquelles il va aller puiser pour accéder à chaque commande, chaque « prompt ».

Dans un article publié par Music Business Worldwide, Ed Newton-Rex arrive très vite, en testant Suno avec d’habiles prompt, à faire sortir des répliques quasi identiques de tubes de Eminem, Abba, Ed Sheeran (démontrant par là-même que le programme a bien utilisé ces chansons sans autorisation) ou par exemple ci-dessous du groupe britannique Oasis :

https://www.musicbusinessworldwide.com/suno-is-a-music-ai-company-aiming-to-generate-120-billion-per-year-newton-rex/

Le programme surfe sur le succès de ces artistes et s’applique à satisfaire les goûts des fans en se rapprochant au plus près de ce qu’ils aiment ou connaissent déjà, comme tout bon algorithme de recommandation. 

Il convient donc pour chaque prompt lancé et chaque résultat (output) livré de rémunérer les créateurs des œuvres qui ont servi de modèle en amont (input). Les œuvres au pluriel, car l’IA a déjà ingéré - sans autorisation - la quasi-totalité de ce qui est disponible, soit des millions de titres protégés.

L’industrie musicale et les sociétés d’auteur réclament donc une redevance répartie (pour l‘instant) par analogie aux créateurs. En exerçant son droit d’opt-out, la SACEM protège ses sociétaires et se positionne dans cette négociation déjà amorcée par le récent IA Act.

Reste que la génération massive de contenus musicaux par les I.A - Suno annonce 400.000 prompt par jour - quelque-soit leur « valeur artistique », va occuper des pans entiers du paysage musical. Oui. Partout où de la musique est présente. Et la musique est présente partout. Et bien entendu en premier lieu dans le domaine de la musique à l’image.

L’appétit gargantuesque des intelligences artificielles doit nous ramener à la maxime de Rabelais : « Science sans conscience n’est que ruine de l’âme ». L’humain sera-t-il trop humain pour les machines ? Des employés de grandes sociétés comme Open AI tirent déjà la sonnette d’alarme et alertent sur le besoin impérieux d’une régulation, comme en témoigne cet article paru récemment dans “Les echos” .

https://lesechos.fr/tech-medias/intelligence-artificielle/des-salaries-de-geants-de-lia-estiment-que-leur-employeur-nest-pas-equipe-pour-se-premunir-des-risques-2099380

Si l’on s’inspire de la définition de Victor Hugo, « la musique c’est du bruit qui pense », l’intelligence artificielle va, aux deux sens de l’expression, faire beaucoup de bruit.

Du bruit qui ne pense pas. Et beaucoup de dégâts. Les créateurs seront alors cantonnés à ce que ne peut pas générer la machine. A ce qui pense et qui est pensé.

Comme en témoigne l’artiste Australien Nick Cave dans une récente interview au Guardian « je suis engagé en ce moment dans le processus d’écriture d’un nouvel album, c’est une affaire de tripes et de sang, cela requiert toute mon humanité ».

Il faudra bien distinguer le bruit qui pense du bruit. L’œuvre du contenu. Et les créations hybrides.

Le bruit qui pense, c’est bien celui-là qu’il faudra rémunérer. Quand il sera joué et mais aussi quand il sera stocké et recraché par les algorithmes d’IA, ou réutilisé par d’autres créateurs.

Je vous avais prévenus. Statut relationnel : c’est compliqué !

Et à la fois très simple, il suffit de respecter le code de la propriété intellectuelle. Chaque nouvelle disruption s’autorise à s’affranchir des « anciennes règles » à son propre profit bien-sûr. On connaît le motto de Mark Zuckerberg, fondateur de Meta, « Move fast and break things ».

Le modèle du streaming, qui a émergé en réaction au pillage des œuvres par le Peer to Peer (voir l’excellente série « The playlist » sur Netflix, retraçant la création de Spotify), n’avait pas prévu leur rémunération et peine à trouver un modèle économique qui le permette. Nous sommes très loin des recettes qui devraient être perçues par les sociétés d’auteur pour rémunérer correctement les créateurs « de tripes et de sang », dont la classe moyenne se paupérise de plus en plus.

Nous avons laissé passer ce train-là, et nous courrons aujourd’hui après ses wagons. Ne ratons pas le prochain.

Au-dessus de l’arc en ciel, le ciel n’en sera que plus bleu.