Intelligence artificielle 2025

De nouveaux dangers ?

Tech & Music Note
6 min ⋅ 27/01/2025

L’année commence très fort sur le front de l’Intelligence Artificielle avec une entrée fracassante. Celle d’un nouvel acteur, gratuit, en open-source, que personne n’avait vu venir : Deepseek.

Un programme… chinois, que personne, mais alors PERSONNE, n’attendait ! Et surtout pas les poids lourds de la Silicon Valley.

L’ancien CEO de Google, Eric Schmidt déclarait encore il y a quelques mois à Bloomberg que concernant l’IA la Chine était deux à trois ans derrière les USA, précisant « dans notre monde de la tech, c’est une éternité ». .

L’éternité s’est réduite en quelques semaines.

Sur la chaîne américaine CNBC, Deirdre Bosa, qui présente une des émissions phare de la tech, consacre une longue édition à la déflagration causée par l’arrivée de ce nouvel entrant pour le moins inattendu.

https://youtu.be/WEBiebbeNCA?si=s-MFpo-gdA2s5rI1

Car, autre surprise, Deepseek surpasse et de loin dans quasiment toutes les catégories Llama 3.1 de Meta, Chat-GPT 4o d’Open IA, et Claude Sonnet 3 d’Anthropic, les fleurons de l’intelligence artificielle californienne. Le benchmark est écrasant.

Et ce n’est même pas le pire. Car le programme a été, selon son manifeste, conçu en seulement deux mois et avec moins de 6 millions de dollars (à titre de comparaison Open AI consacre plus de 5.4 milliards de dollars par an au développement de son outil et Microsoft vient de mettre 13 milliards de dollars sur la table).

Alors comment ont-ils fait ?

Une des réponses est donnée sur le plateau de CNBC par le CEO de Perplexity, Aravind Srinivas. « Necessity is the mother of invention ».  N’y voyez pas une référence enthousiaste au génie musical de Frank Zappa et de son groupe, les Mothers of invention, dans les années 70, mais plutôt une référence au principe très simple qui a présidé à l’accomplissement de cette prouesse.

Du fait des restrictions américaines sur les composants électroniques à destination de la Chine, les concepteurs de Deepseek, n’étaient pas en possession des dernières puces NVidia surpuissantes, indispensables à faire tourner des programmes aussi lourds. Alors ils ont travaillé avec des versions antérieures, en analysant les modèles d’IA qui tournaient sur ces puces obsolètes et en les…optimisant.

Selon les concepteurs eux-mêmes (une société chinoise commerciale qui n’est même pas une entreprise d’IA), ils se sont appuyés pour ça sur une équipe de jeunes surdoués. Leur méthode pourrait s’apparenter à la façon dont Lawrence Durrell décrivait les principes de la philosophie Taoiste : « On peut tout manger à condition que ça soit coupé assez petit ».

L’exemple cité avec humour par l’écrivain anglais était un vélo. Les programmateurs chinois viennent d’en faire la démonstration avec un algorithme d’IA.

En gros, il s’agit de diviser en petites taches successives et progressives un processus qui jusque-là mobilisait l’algorithme en entier d’un seul coup. En se corrigeant au fil des requêtes, le programme rectifie, « apprend » et devient plus fiable. C’est ce qu’on appelle le « reinforcement learning ».

Je laisse les spécialistes apporter des détails à cette description. Pour ceux qui voudront creuser un peu, Alex, jeune ingénieur en deep learning vous en explique le fonctionnement sur sa chaine YouTube IA with Alex :

source  - Deepseek R explained to your grandma – AI with Alex

https://youtu.be/kv8frWeKoeo?si=D5Yl0QeYocJSFhTk

Alex expose le fonctionnement de Deepseek avec des équations mais aussi une analogie simple, le programme apprend à marcher comme un enfant fait ses premiers pas. Il tangue, trébuche, se recale et prend de l’équilibre, de l’assurance.

Faire mieux que les concurrents installés, si vite et avec si peu, pose question et créé la sensation autant que l’inquiétude. Aussi, des centaines d’articles, de post et de vidéos ont envahi la toile et les médias depuis cette annonce.

En France, deux excellents articles sont parus ce week-end. Sur le site Les numériques du 26 Janvier 2025, on trouve une description très précise de Deepseek sous le plume d’Antonin Leeno.

https://www.lesnumeriques.com/intelligence-artificielle/qu-est-ce-que-deepseek-la-reponse-chinoise-a-chatgpt-a231842.html

Sur un mode plus critique, Julien Lausson et Hugo Bernard de Numerama (dans un article du 24 Janvier) ont pour leur part, relevé qu’un internaute s’étonnait sur un forum de la réponse de Deepseek à une question posée sur Tien an Men. Alors les deux journalistes sont allés poser les mêmes questions (qui fâchent) à Deep-Seek et à Chat GPT 4o, sur Tien An men, les Ouïgours, le covid-19, le Tibet, Taiwan…

Vous verrez dans leur article que les réponses sont très différentes, et qu’il y a un biais dans Deepseek qui les aligne de façon univoque et sans élément contradictoire sur les positions officielles du gouvernement chinois.

source - Numerama

https://www.numerama.co/tech/1890424-on-a-pose-des-questions-genantes-a-deepseek-le-chatgpt-chinois.html

On aura compris à la lumière de tous ces éléments, que l’annonce de la mise à disposition de ce programme le jour même de l’investiture aux USA du nouveau président Donald Trump, soutenu par les grands noms de la Silicon Valley, n’est peut-être pas un hasard…

Et bien sûr on se doute tout autant que la transparence sur les œuvres utilisées pour entraîner ce programme, disponible dans toutes les langues, n’est pas au rendez-vous.

Bon, mais, et la musique dans tout ça ?

On y vient. Car un autre événement a, cette fois dans le domaine de l’IA musicale, secoué la toile ces derniers jours :  l’interview quasi surréaliste que le CEO de Suno, Mikey Shulman a donné sur la chaîne YouTube 20VC du podcasteur économique Harry Stabbings.

source - 20VC YouTube

https://youtu.be/E0YL83U5VWk?si=r2BiN6IDHOfFRDKZ

Je vous épargne une heure et vous en fait un petit digest. Décor tech, plusieurs caméras, belles lumières. Mikey Shulman est votre gars de la tech habituel, avec sa chemise grise et sa candeur post-ado surjouée. Stabbings, votre podcasteur cool de la finance a sorti un T-shirt blanc et un minishort bleu qui lui permettra main dans les poches pendant toute la fin de l’interview (sic) de nous la jouer bro’ entre deux séances de surf, et de se déclarer dès la première phrase fan de l’application.

Ok, voyons ça…

Mikey Shulman met moins d’une minute à nous offrir son argument publicitaire numéro 1 : « J’aime à dire que nous ne faisons pas de la musique, nous faisons des musiciens ».

Son deuxième mantra, répété à longueur de plateaux, est à peu près le même « Les consommateurs de musique deviennent les créateurs ».

source - No priors Podcast

On notera au passage qu’il parle bien de consommateurs (on aurait pu penser auditeurs ou amateurs), et l’emploi de l’article défini « les ». Les créateurs, pas « des » créateurs.

Tout de suite ça fait moins cool. Il aurait pu finir sa phrase par « à la place des créateurs », mais bon… comme le dit le T-shirt de ce professeur d’université, on a compris …

Donc, dans cette heure d’interview, assez bien menée, je dois l’avouer, par l’homme au minishort bleu-klein, Mikey Shulman dévoile la philosophie de son appli ou plutôt son modèle : les jeux vidéos.

« Video games are interactive, they’re engaging, they’re rich experiences, they’re fun with yourself, they’re more fun with your friends. When I think of what music should be for me, It should be all of those things. » avant de conclure « In that sense I want to make music more like a video game»

La première partie de la tirade partait bien. Oui la musique est interactive, oui c’est une expérience riche, oui c’est amusant pour soi-même, oui, encore plus amusant avec d’autres (on appelle ça un groupe ou un orchestre, non ?). Alors que manque-t-il à Mikey Shulman ?

La réponse est dans la phrase suivante :

« If you make music more interactive and more engaging, people will pay for music like they pay for videogames ! ».

Ah voilà. Les jeux vidéo rapportent plus.

Le co-fondateur de Suno poursuit  « I don’t need to tell you that the video game industry is so much bigger than the music industry. To me it’s crazy that music should not be as engaging a Fortnite ».

On pourrait en déduire que Suno aspire à être une sorte de jeu vidéo où l’on peut interagir avec des œuvres pour les utiliser en interne. Non. Car M. Shulman va plus loin et place ses outputs en concurrence avec le matériel source jusque sur les plateformes.

Pour lui il est absurde de séparer la musique générée par AI de celle composée par des humains (il dit « normal music ») car « elle s’adresse aux mêmes consommateurs ».

Et de viser après les jeux vidéos, un autre modèle maintenant, celui d’Instagram. « The same platform lets me DM you something silly and lets me consume content of a true professionnal who spends all day agonizing over this post. Why won’t music be the same way ? »

source - Forbes

Arrivent ensuite quelques questions légales. Mikey Shulman là encore a réponse à tout.

L’utilisation d’œuvres copyrightées pour entraîner les modèles ? : « It’s stock standard for the industry, it’s what every company does ! ». C’est tout ? Oui c’est tout !

Les procès faits par les maisons de disques et les ayants-droits de ces oeuvres ? Le CEO trouve ça « déprimant ». « There’s an etude considering how many engineers and how many lawyers in a country. The conclusions is : more engineers equal more growth, more lawyers equal less growth. ». Les juristes apprécieront.

Pour lui, comme tout bon disrupteur, le « vieux modèle » est dépassé, seul compte celui qui va l’enrichir lui.

source - Suno

D’ailleurs quand il parle des talents ainsi bridés, il parle bien sûr de celui des ingénieurs, pas des artistes. Il continue ensuite à dérouler son petit bréviaire libertarien.

Il veut démocratiser la musique. « We didn’t want to make a company that makes the current crop of creators 10% faster or make it 10% easyer to make music. If you want to make something that impact the way one billion people experience music, you have to build something for one billion people. »

Et il a une bonne raison pour cela : « It’s not really enjoyable to make music now. It takes a lot of time, it takes a lot of practice, You need to be very good at an instrument, or really good at a piece of software, the majority of people don’t enjoy the majority of time they spend making music. »

Les réponses n’ont pas manqué sur la toile comme par exemple celle de l’avocate spécialisée en droit de la musique, blogueuse et elle-même musicienne, Miss Krystle (de la chaîne YouTube Top music attorney), qui pointe les contradictions, contre-vérités et points litigieux du discours de Suno, évacuant systématiquement les ayant-droits.

source - Top Music Attorney - YouTube

https://youtu.be/PeKZvUcr0-M?si=Sz1lDACIUSc4dbGE

« Waoww ! So disrespectful ! » s’exclame-t-elle, se demandant ce qu’il fait des auteurs, compositeurs, musiciens, éditeurs, producteurs… des professionnels qui travaillent avec passion à donner le meilleur d’eux-mêmes. 

« You can tell he is not a creator, the very few moments we all have to really get into a creating vibe and make a song, these are the best moments that keep us all going. Everything that comes after that to distribute and promote your music, a pain in the B*tt, a 100%…  speaking as an artist, making the creative thing is the best part »

Mikey Shulman, de Suno, se fait une autre idée de la création. Il l’a annoncé dès le début de son interview. Et il a même une définition toute prête pour ça : « I have good taste, I can’t play guitar, I can’t play piano, but I’m really good at picking the Suno music and making it sound like I want to ear, and that makes me a creator. ».

Pour 300 dollars par mois d’abonnement, bien sûr.

Tech & Music Note

Tech & Music Note

Par Brice Homs

Ecrivain, scénariste, parolier, Brice Homs est un auteur tout terrain. Expert à la commisssion des nouveaux médias du CNC puis membre du conseil d’administration de la SACEM et premier président de son Conseil Stratégie et Innovation, il siège actuellement au conseil d’administration de la SDRM et à la commission de l’audiovisuel SACEM.