Tech & Music Note

Tech, musique, cinéma, séries, édition... tout change et se mélange !

image_author_Brice_Homs
Par Brice Homs
24 mai · 4 mn à lire
Partager cet article :

La hype de l'IA

Le début de la fin ou la fin du début ?

Après avoir monopolisé toutes les attentions (et un intérêt légitime) la hype sur les intelligences artificielles génératives serait-elle en train de retomber, voire même de s’effondrer ?

C’est ce que de nombreux analystes et pas des moindres sont en train de suggérer.

Explication.

D’abord qu’est-ce qu’une hype, et en l’occurrence une hype de Gartner, puisque c’est à ce mouvement bien identifié et décrit par le cabinet Gartner, que font référence les analystes.

En gros, ce mécanisme se décrit en cinq phases. 1) le lancement de la technologie 2) un pic des attentes exagérées 3) la désillusion (consécutive à ces attentes trop fortes) 4) la pente (raisonnable cette fois) découlant des véritables avantages de la technologie 5) le plateau de productivité, quand la technologie a trouvé sa place et son marché réel.

Voilà ce que l’on constate à l’arrivée de chaque nouvelle application. Plus la hype est rapide, plus le choc va être fort. La descente de cette montagne russe sera à la hauteur vertigineuse de sa montée. Vous connaissiez le manège ? Bienvenue dans l’économie.

A ce propos vous savez comment on dit montagne russe en Russe ? Montagne américaine (vrai). Comme quoi le sens de la pente dépend de l’endroit d’où on la regarde.

Alors cette pente, on est de quel côté, là ?

Le journal « Le monde » titrait récemment : « La hype autour de l’intelligence artificielle risque de créer des déceptions ». C’est en effet le principe de la hype. Sa phase trois. Décevoir.

Et c’est maintenant.

Il faut dire que, avides de fonds, les entreprises de la tech n’y sont pas allées avec réserve, décrivant cette innovation comme « plus profonde que le feu ou l’électricité » (Google) ou renvoyant Gutenberg au rôle de petit joueur.

L’éditorialiste du Financial Times Rana Foroohar qui connaît son Gartner sur le bout des doigts, relativise : « Même si vous croyez que l’IA est l’équivalent de l’électricité ou d’internet, nous ne sommes qu’au début d’une transformation hautement complexe qui durera plusieurs décennies et est loin d’être jouée d’avance. »

Lui emboîtant le pas, le spécialiste du numérique Cory Doctorow affirme dans Locus Magazine que « L’IA est une bulle », rejoint dans cette analyse par John Naughton du Guardian qui écrit que « se poser la question est comme se demander si le pape est catholique ! »

https://locusmag.com/2023/12/commentary-cory-doctorow-what-kind-of-bubble-is-ai/

Certains évoquent déjà le crash des télécoms des années 2000, une bulle qui va éclater. Pourtant on annonce chaque jour de nouveaux investissements records ! 

Dans la première édition de sa newsletter « Missing fundamentals » publiée cette semaine sur Substack, Ed Newton-Rex, fondateur de Fairly Trained, une entité de certification des IA respectant la propriété intellectuelle, pointe la levée de fond que vient d’opérer l’application Suno, saluée par le très influent site « Water and music » comme étant « l’investissement le plus important jamais réalisé dans une appli d’IA générative de la musique » : 125 millions de dollars.

https://open.substack.com/pub/ednewtonrex/p/what-sunos-125m-round-means-for-ai?r=1rko0w&utm_campaign=post&utm_medium=web

Ed replace cet évènement dans son contexte et met en garde contre les effets secondaires de telles levées de fonds. Les signaux qu’elles nous envoient ne sont pas bons.

Pourquoi ?

Avant d’en arriver aux points négatifs, il évoque d’abord les raisons de ces tours de table spectaculaires. Pour lui, le motif premier est ce qu’on appelle le FOMO (Fear of missing out) autrement dit la peur de rater le train (la vague si on est surfer). Et l’appât du gain. Etre dans les premiers investisseurs d’une nouvelle technologie, c’est parier, si elle marche, sur des profits records en retour.

Source - ToricheksSource - Toricheks

Le problème est que… Il semble hautement probable (même si rien ne permet pour l’instant de le prouver) que Suno, comme d’autres IA génératives, ait été entraînée sans licence légale sur des œuvres protégées.

On arrive vite en la testant à remarquer de sérieuses ressemblances avec des titres de ABBA, Queen, Ed Sheeran ou Eminem dénonçait déjà l’analyste dans un récent article sur Music Business Worldwide.

Un des investisseurs de Suno s’en ouvre même dans un récent article de Rolling Stone magazine, admettant qu’ils s’attendent à être poursuivis en justice pour ça. Ce qui ne les a pas pour autant dissuadé d’investir massivement dans cette application.

https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/

Un mauvais signal en effet. Car les autres vont sans vergogne leur emboîter le pas. On sait déjà que le grand rival Udio va faire une annonce similaire dans les jours qui viennent.

Ed Newton-Rex désigne ces compagnies comme étant des QDP, acronyme de Questionnable Data practices companies, leur pratique des datas posant question.

Certaines d’entre elles clament à tort qu’entrainer leurs algorithmes sur des œuvres protégées relève du « fair use », le fameux « droit de fouilles » autorisé pour les études universitaires. Elles prennent le risque de sanctions. Pire, elles s’en moquent.

Elles refusent de révéler leurs sources ou évitent de le faire, sûres que les profits seront plus élevés que les sommes à verser et que le nombre d’utilisateurs qu’ils auront acquis les placera en position de force pour en négocier les termes. Elles comptent ainsi influer sur l’opinion publique et à travers elle sur les régulations réclamées par les créateurs, dit-il.

C’est là où Ed voit brillamment une première faille. Ces levées de fonds spectaculaires se concluent sur un argument massue (restons dans le langage brutal, car ça l’est), le succès.

Suno revendique par exemple « plus de 10 millions de personnes qui ont utilisé leur produit » en quelques semaines…

https://suno.com

Mais la question n’est pas tant celle du nombre de gens qui ont utilisé l’application que celle des utilisateurs qui continuent à le faire. Et là, le nombre perd quelques zéros. La promesse se dégonfle sérieusement.

« Les systèmes texte vers musique semblent magiques la première fois que vous les utilisez, alors un tas de gens veulent les essayer. Mais ils y trouvent pour l’instant peu de raisons d’y retourner – l’indéniable magie de générer une première chanson peine à se transformer en usage répété », écrit Ed Newton-Rex.

On est d’abord bluffé par la « qualité » sonore de l’assemblage. Vous avez commandé une chanson pour votre poisson rouge, votre déjeuner, votre dentiste (liste de thèmes proposés par l’appli), des ritournelles « à la manière de »…

… Mais après on en fait quoi ?

J’ai essayé mais surtout interrogé plusieurs compositeurs. Partir de « bouts » ainsi générés ne les a pas amenés à les continuer, à les retravailler, rien n’en n’est sorti d’exploitable artistiquement.

Est-ce que c’était amusant ? Oui. Est-ce que c’était surprenant ? Oui. Est-ce que c’était inspirant ? Non. Est-ce que c’était bon ? Encore moins.

https://www.udio.com

Pourtant, l’inspiration se provoque. Se travaille. Il existe des méthodes de démarrage, de recherches pour compositeurs, notamment de musiques de films, issues des mathématiques. Comme par exemple la « Set music theory » (technique de l’hexacorde, en français) importée des Etats-Unis où de nombreux compositeurs professionnels l’utilisent, et enseignée en France par le compositeur Jean-Louis Hennequin.  

« On utilise un mode à 6 notes (hexacorde), plutôt que les relations de tonalités habituelles avec des changements de degrés » explique le compositeur dans sa vidéo de présentation.

https://youtu.be/Pkvtx2QeLCc?si=CHyyifo_D8TgS8Mo

Des notes choisies selon une intention. Une humeur de départ. Toute la composition se fera à partir de ces 6 notes en créant des intervalles à la manière d’un contrepoint. Et en cheminant à partir de ses émotions.

L’émotion.

Le mot est enfin prononcé.

Vous me donnerez votre retour d’expérience, mais moi, ce qui peut me faire écrire une bonne chanson. Une que je mettrais en partage. C’est d’écouter quelqu’un qui chante une chanson sensible, intelligente, généreuse, qui me touche.

Ce qu’elle me laisse en creux me porte à écrire autre chose à partir de ce qu’elle m’a transmis, d’humain à humain.  

Une expérience de vie.

Ted Gioia and Rick Beato Ted Gioia and Rick Beato

https://youtu.be/ibMd_Jx9daw?si=nlgpX4C6f_xYsjzP

Alors face au risque de submersion annoncé par l’arrivée massive de titres générés par les IA génératives (on parle déjà de 400.000 titres par jour qui seraient bientôt uploadés sur les plateformes) et en attendant la nécessaire régulation des pratiques des QDP telles qu’énoncées (et dénoncées) par Ed-Newton Rex, comme le disait récemment l’historien de la musique Ted Gioia dans un passionnant entretien “ AI Threat to music” avec le producteur Youtubeur Rick Beato :

Seuls les gens créatifs pourront nous sauver !

Pas mieux.