« La bonne musique au bon moment. » Ce mantra est devenu l’objectif principal de Deezer, Spotify, Apple Music ou YouTube, qui utilisent pour cela des algorithmes de recommandation toujours plus performants. Tous les services de streaming musical ou presque peuvent aujourd’hui vous profiler, vous proposer des découvertes dont vous ne vous passerez plus et des publicités aussi ciblées que possible. Plongée dans ces programmes miracles qui nous rendent accros à nos playlists.
Après une longue journée de boulot, Constance rentre chez elle. Écouteurs dans les oreilles, elle lance son application de streaming préférée, « Madame Irma ». Constance n’utilise qu’elle, car Madame Irma la connaît mieux que sa meilleure amie : elle la suit partout et sait ce que Constance ressent en permanence. Elle peut déterminer ce qu’elle veut écouter dès qu’elle le souhaite. Aujourd’hui, via ses rendez-vous passés et à venir, les personnes qu’elle a appelées et son humeur actuelle, elle lui a sélectionné des groupes de garage rock des quatre coins du monde. Aucun que Constance ne connaissait avant.
Ça donne envie, non ? L’utopique playlist parfaite, celle qui comprend vos désirs, vos émotions du moment, celle qui évolue à votre rythme, qui s’adapte à vos morceaux préférés, tout en vous proposant de nouvelles têtes que vous aimerez à coup sûr… Madame Irma n’est pas si loin, c’est l’objectif que souhaite atteindre rapidement la plupart des « streamers ». Ce qui fait qu’Internet et les algorithmes de suggestion ont définitivement ringardisé le format album.
Ecouter un disque de façon consciente et ininterrompue, c’est devenu un truc de vieux. Aujourd’hui, on pioche à droite à gauche, dans les playlists à thème créées par les curateurs (des personnes employées pour, entre autres, en produire), les morceaux qu’on échange avec nos amis, ceux entendus à la radio, etc. « Même sur les 50 titres de nos playlists, on va tourner autour de 13, 14 morceaux écoutés », constate Frédéric Antelme, head of content chez Deezer.
Rien qu’en l’espace de 20 ans, la découverte musicale a vécu la plus grande révolution de son histoire. Du bouche-à-oreilles de connaisseurs et autres magazines ou radios prodiguant le bon mot sur un disque, on est passé au « tout auto » : le genre, le label, l’artiste, l’album ou le morceau, tout vous est proposé grâce à de complexes lignes de codes. « L’algorithme représente quasiment le seul moyen de pouvoir filtrer toute cette information correctement » considère Anne-Marie Kermarrec, ex-directrice de recherches à l’INRIA et actuelle PDG d’une start-up d’algorithmes de recommandation dans l’e-commerce, Mediego. Après tout, il faut bien avouer que trouver nos prochains coups de cœur dans plus de 50 millions de morceaux sans aucune recommandation paraît compliqué.
Et c’est loin d’être fini. Vincent Favrat, PDG de Musimap, une société belge spécialisée dans la création d’algorithmes de recommandation, est formel : « on est aux balbutiements d’une nouvelle qualité de service. » Si l’on en oublie la récolte massive de données, les risques d’uniformisation des goûts ou de la production artistique, c’est sûr.
[Chapitre 1]
L’algorithme de recommandation :
un ami qui vous veut du bien
Qu’est-ce qu’un algorithme ? Une suite d’étapes. Vous la connaissez : une recette de cuisine est un algorithme. Allez, la suite.
Un secteur lucratif qui n’est que très récent
Dans le milieu, deux choix s’offrent aux « streamers » : les sous-traiter à des entreprises comme Musimap, Moodagent ou Musicmetric, ou les créer soi-même. Chez Deezer, depuis trois ans, tout est fait maison et mis à jour en interne. Benoît Mathieu, à la tête de son équipe « data science » de 12 personnes, l’affirme : « on pense que c’est stratégique de maîtriser l’intelligence des algorithmes plutôt que de dépendre d’une boîte externe. » YouTube, eux, les gèrent en interne, au niveau monde. Qobuz, qui misaient tout sur l’éditorial, n’avaient pendant longtemps pas eu recours aux algorithmes. Pourtant, ils signent cette année un contrat avec Musimap, pour des applications successives dès début 2017. Enfin, Spotify, plutôt que de s’encanailler à choisir entre l’internalisation ou l’externalisation, a fait d’une pierre deux coups : en 2014, le streamer suédois rachète The Echo Nest, société d’algorithmes de recommandation américaine qui compte à l’époque parmi ses clients la BBC, MTV, Twitter, Coca-Cola ou Vevo. Fini le partage de connaissances, le deal est scellé pour une somme estimée entre 50 et 100 millions de dollars.
« Une étape historique » selon Vincent Favrat. « Les gens ont vu qu’ils pouvaient faire de l’argent dans ce secteur-là. » Car oui, la technologie est une manne qui est vite devenue indispensable pour le secteur musical, et risque bien de lui faire prendre de l’ampleur. Pour s’offrir les services de Moodagent, une société danoise d’algorithmes qui travaille aussi dans la facilitation de la découverte musicale, il faut compter entre 20 000 et 100 000 dollars par an, dépendant de la taille du client et de ses usages. Pour Musimap, la fourchette est entre 50 000 et 500 000 euros. Des clients qui peuvent venir du secteur de la musique, mais pas que : l’automobile, les smarthomes, la publicité ou le cinéma, tous cherchent à tirer le meilleur de ces technologies.
Comment en est-on arrivé à se servir de logiciels pour savoir quoi écouter ? On peut remercier les ingénieurs qui, dès les années 90, prévoient la sur-abondance de contenu musical qu’Internet a engendré. C’est le cas du fraîchement doctorant Pierre Lebecque, fondateur de Musimap, ou de Will Glaser et Tim Westergren, initiateurs du Music Genome Project, utilisé par le service de streaming américain Pandora.
Filtrage et “crowdsourcing”
Musimap et le Music Genome Project affinent leurs technologies depuis les années 2000, en expertisant respectivement 1 et 2 millions de morceaux, tagués à la main. L’entreprise belge a depuis automatisé ce processus, pour atteindre les 50 millions de titres. Si elles restent des exceptions sur cette manière de faire, on retrouve de grandes étapes que la plupart des sociétés d’algorithmes utilisent :
Le principe le plus brut est l’analyse de signal, qui s’occupera de traiter le son pour en tirer ses caractéristiques musicologiques principales (tempo, accords, timbres de voix…) et quelques humeurs. Le collaborative filtering (filtrage collaboratif) est aussi un procédé basique, mis notamment en pratique par Amazon : si Kevin aime Beyoncé, que Louise aime aussi Beyoncé et a adoré Adele, alors Kevin devrait aimer Adele. Il y a aussi le principe de crowdsourcing (agrégation sociale), qui permet d’analyser la connaissance de sites spécialisés et de la retranscrire dans un vocabulaire commun. Pour vous faire une idée, The Echo Nest analysait en 2013 10 millions de pages liées à la musique par jour, et les sources de Musimap vont de Wikipédia à l’Encyclopaedia Metallum.
On peut aussi citer le filtrage content based (basé sur le contenu) – oui, dans la technologie, on parle beaucoup anglais – utilisée par Deezer. D’un côté, il y a votre profil utilisateur créé par le service de streaming que vous utilisez : un agrégat de tags est produit via vos écoutes (quels genres ou artistes vous écoutez le plus…) et votre comportement (quelles chansons vous passez, quels artistes sont récurrents pour vous à un moment donné…). De l’autre, il y a une description de chaque morceau présent sur le catalogue d’un streamer : d’abord des éléments musicologiques, cités plus haut, puis des humeurs, plus ou moins poussés en fonction des algorithmes (de “triste” à “joyeux avec une pointe d’amertume”). Le nombre de mots-clés rattaché à un titre dépend encore une fois des algorithmes utilisés : une quinzaine chez Deezer, 99 pour Musimap ou 40 chez Moodagent. Une fois que le profil utilisateur et celui des 50 millions de morceaux sont dressés, prenez-en des deux parts, essayez de faire matcher ceux qui correspondent et de nombreuses idylles naîtront. Enfin, on parle aussi de deep learning (apprentissage profond). Pour faire simple, l’ordinateur automatisera toutes les méthodes précédemment citées, les entraînera en permanence et s’appuiera sur ses propres résultats pour évoluer.
Tous ces procédés sont à la base de nos Madame Irma actuelles, à savoir Deezer, Spotify, Apple Radio ou YouTube. « Un algorithme de recommandation n’est pas non plus magique, on n’a pas de garantie que ça va marcher à tous les coups » avance Anne-Marie Kermarrec. Sauf s’il sait tout de nous.
« On est aux balbutiements d’une nouvelle qualité de service. » Vincent Favrat, PDG de Musimap, société d’algorithmes de recommandation belge.
[Chapitre 2]
Retombées des algorithmes de recommandation
Le souci avec Madame Irma, c’est qu’elle risque vite de devenir omniprésente.
Le “big data” comme religion
Comme vous l’aurez compris, Madame Irma n’est pas une vraie voyante. Elle aura besoin d’une montagne d’informations sur vous : votre historique d’écoutes, votre répertoire de contacts, le lieu dans lequel vous vous trouvez, votre vitesse de déplacement, vos photos, la commande vocale de votre téléphone… En août 2015, Spotify modifiait discrètement ses Conditions Générales d’Utilisation pour pouvoir accéder à toutes ces données, et les partager avec ses partenaires commerciaux. On pourrait innocemment croire que ces collectes servent uniquement à affiner les recommandations, mais Frederike Kaltheuner, chercheuse à l’Université d’Amsterdam et membre de DATACTIVE, nous remet les pieds sur terre : « n’importe quelle société qui collecte massivement des données sur vous a un business model ’’data driven’’ [guidée par les données, ndlr]. » Si vous en doutez, jetez un œil à Preact, dernier achat en date de Spotify. C’est une société d’analyse de data qui vise à réduire la résiliation d’abonnements, conquérir plus de marché et élargir sa base d’utilisateur. Philippe Vion-Dury, journaliste et auteur de La Nouvelle Servitude Volontaire (éditions Fyp), un essai sur l’influence grandissante des algorithmes sur nos habitudes de consommations, tranche : « ça a beau être des entreprises de nouvelles technologies, ça reste des entreprises capitalistes. »
Frederike Kaltheuner renchérit : « est-ce que ces entreprises vendent nos données à des sociétés d’assurances, de finance ? Est-ce que ça améliore la publicité ciblée ? L’algorithme n’est pas le problème, les données sont le réel enjeu. » À cette dernière question, Spotify – décidément – y répond par des publicités lancées en fonction du genre de playlist (sport, chill, fête…) que vous choisissez. Benoit Mathieu de Deezer rapporte que « le genre principal écouté par l’utilisateur est une info que notre régie publicitaire a à sa disposition pour cibler des campagnes. » Même chose si on se balade du côté des Conditions Générales d’Utilisation de Tidal. Ceci étant, la prochaine fois que vous entendrez une publicité entre deux morceaux, vous saurez d’où ça vient.
Bien au chaud dans sa bulle
Pire que de casser l’enchaînement que vous mettez des mois à façonner, il y a une chose que vous pourriez avoir du mal à ressentir : l’enfermement dans une bulle filtrante. Philippe Vion-Dury en parle : « ça a été théorisé par Eli Pariser. Il la rattachait à Facebook, mais le principe est le même dans la culture : elle t’enveloppe dans un confort où tout se répète. » Résultat, on ne vous propose que des choses sans risque, des morceaux qui vont à priori vous plaire, et vous aurez du mal à en sortir. Sauf si votre culture est assez large pour que l’algorithme puisse piocher dans les différents genres musicaux que vous écoutez. Avec la curation statistique, on constate aussi une autre limite, l’effet miroir. Prenez la page des Beatles de n’importe quel service de streaming. Dans la partie des artistes similaires, vous aurez le même résultat : John Lennon, Ringo Starr ou George Harrison. Merci pour la découverte, algorithme.
« Il est évident que si l’on expose les gens à des choses similaires, ils vont se ressembler de plus en plus. Ce n’est même pas un problème philosophique, c’est simplement une conséquence algorithmique » souligne Anne-Marie Kermarrec. Et d’ajouter à juste titre : « c’est seulement vrai si tout est entièrement personnalisé, ce qui est très rare. Et le cas échéant, il existe évidemment des solutions. » Mais dans un monde où l’on s’en rapproche rapidement, comment faire pour éviter que les utilisateurs deviennent un troupeau aux oreilles similaires ? Chez Deezer, « on essaye d’introduire un peu d’aléatoire, car c’est en cherchant à proposer la chose la plus précise possible qu’on observe un effet de bulle très fort » rapporte Benoit Mathieu. Une autre combine consiste à ne pas considérer qu’un utilisateur écoute un seul genre : « on en trouve généralement entre 5 et 15 différents par personne », et de continuer : « de toute manière, si l’on enferme trop l’utilisateur dans certains genres, il se lasse et ne revient pas sur le service. » Comme un groupe qui se découragerait de faire la même musique album après album. Mais ça c’est pour un autre article à rallonge.
« On pense que c’est stratégique de maîtriser l’intelligence des algorithmes plutôt que de dépendre d’une boîte externe. » Benoit Mathieu, responsable de l’équipe « data science » de Deezer
Quand l’algorithme influence la création artistique…
Pour Peter Berg Stenffenson, président de Moodagent, « il est difficile d’imaginer un processus créatif impartial. » Signe que les algorithmes de recommandation eux-mêmes peuvent avoir un impact direct sur la production musicale. « On a eu des discussions intéressantes avec le manager d’une grande chanteuse » se souvient Vincent Favrat, « car on peut déterminer les couleurs émotionnelles de ses titres, savoir dans quelles directions ses fans réagissent, et comment on pourrait créer un genre de constellation émotionnelle pour que l’album marche mieux commercialement. » Où comment créer un hit calqué sur la demande. Elle est loin, la vision naïve de la musique comme reflet de l’âme. Il le reconnaît : « des outils puissants entre les mains de producteurs musicaux et d’éditeurs pourraient contraindre les artistes à respecter des schémas. » Pas besoin d’attendre les outils, c’est peut-être déjà le cas. Selon Morgan, l’attention est plus que jamais portée sur les singles. Exit les morceaux de plus de 3min30, les « radio edit » sont dorénavant privilégiés en streaming.
Dans son livre, Philippe Vion-Dury aborde « l’effet Shazam », emprunté à The Atlantic. Pour l’expliquer, mise en contexte, imagination : Patrick est producteur. La masterisation du disque des Free To Be, « un nouveau groupe qui va percer », sur lequel il a travaillé, est terminé. Il prend son courage à deux mains, envoie le disque à des radios, des streamers : personne n’en veut. Patrick, déboussolé, pense à une « astuce » qu’on lui a un jour donné, aller voir les statistiques de Shazam. Il voit alors ce que les utilisateurs écoutent, et peut modéliser leurs désirs grâce aux similarités établies entre les morceaux les plus « shazamés ». Grâce à ces informations, Patrick fait partir le groupe sur d’autres pistes créatives, proches (voire totalement similaires) de celles du Top Shazam. Le disque sort, c’est un carton commercial. Pour les artistes et producteurs les plus véreux, c’est une mine d’or.
Comme pour valider ce théorème, Radha Subramanyam, vice-présidente de la recherche à iHeartMedia, le plus grand propriétaire de radios des États-Unis, lance à The Atlantic : « l’idée que des DJs programmateurs choisissent des morceaux seulement parce qu’ils les aime est tellement dépassée. » Mais ne tombons pas des nues, cette pratique existait déjà avec les ondes FM. Cependant, les algorithmes changent l’échelle. Par la même occasion, est-ce qu’ils ne rationaliseraient pas la pratique ? « Je suis persuadé que non », conteste Vincent Favrat. Pour les personnes plus intègres, il imagine même une aide à la composition grâce à un moteur de recherche puissant : l’Académie de Musique Contemporaine de Londres était notamment prête à mettre cette application en place, preuve que de nouvelles voies peuvent être explorées grâce aux algorithmes.
… et la création artistique veut influencer l’algorithme
En radio, le principe qu’un label paye un programmateur de radio pour quelques rotations de ces artistes sur les ondes a toujours existé. Cette pratique a évolué avec les playlists des curateurs de sites de musiques en ligne : Billboard avait enquêté sur le sujet l’année dernière, Pascal Nègre, ancien président d’Universal Music France, en parlait même comme la continuité du travail du service marketing. Alors pourquoi ne pas investir le terrain des algorithmes ?
Le risque est grand de cacher des échanges pécuniaires derrière une obscure recommandation algorithmique. Pour Philippe Vion-Dury, « ça va forcément arriver. Sauf que si c’est fait trop brutalement, ça va choquer. » « Il y a déjà des mentions dans les contrats entre majors et streamers de mettre en avant tel artiste dans les playlists », concède Morgan. Mais aujourd’hui, tous se disent totalement vertueux. Ainsi, Matthew Ogle, l’homme derrière le Discover Weekly de Spotify, certifiait à Quartz que malgré de nombreuses demandes d’artistes et de labels, leurs services devraient être protégés de ce genre de pratique. Idem chez Qobuz, et Deezer : « nos recommandations ne sont pas parfaites mais à aucun moment on a de morceaux mis en avant par des labels qui payent », rétorque Benoit Mathieu.
« Est-ce que mon rapport à la musique, c’est qu’une entreprise capitaliste se basant sur des schémas de donnés me propose ce que je veux écouter ? » Philippe Vion-Dury, auteur de La Nouvelle Servitude Volontaire (éditions Fyp)
La face cachée des algorithmes, une réalité ?
Invérifiable, selon Philippe Vion-Dury : « tu ne sais pas ce que tu ne vois pas. » C’est un fait : impossible de déterminer si certaines maisons de disques sont mal référencées. « Une cause de guerre commerciale, un conflit, et hop, on baisse les recommandations du catalogue d’un label. » Alors pourquoi ce monde est-il si opaque ? Le journaliste y voit deux niveaux : le premier tient de la propriété intellectuelle et du secret industriel, comparé par le journaliste à la « recette du Coca-Cola. »
Le deuxième, plus surprenant, dépend des ingénieurs : « la plupart ne comprennent même plus leurs algorithmes. » Ici, les avis divergent. C’est une réalité, ou presque, répond Anne-Marie Kermarrec. « Dire qu’on ‘ne les comprend plus’ ajoute une forme de magie, ce n’est pas vraiment ça. En effet, les modèles continuent de s’entraîner, d’évoluer, sans qu’on sache exactement pourquoi ils évoluent dans ce sens là. » C’est le fameux deep learning. Ça n’en rendra pas le processus moins intéressant, on ne saura seulement pas expliquer pourquoi tel morceau se joue plutôt qu’un autre. Benoit Mathieu concède qu’il est difficile pour un seul ingénieur d’avoir une compréhension parfaite de chaque détail du produit, mais il se défend : « nous construisons à la fois des algorithmes de recommandation et des outils pour explorer et visualiser les données produites à chaque étape de l’algorithme. » La qualité des algorithmes est également mise à mal par des tests récurrents, pour proposer le meilleur panel de contenus recommandés possible.
[Chapitre 3]
Les défis de l’algorithmie en musique
Améliorer sans cesse ces algorithmes pour atteindre la playlist parfaite, jusqu’à surpasser l’homme ?
Assiste-t-on à l’avènement des algorithmes ?
Oui et non. Certains parlent de déshumanisation de la musique, ce à quoi Vincent Favrat répond par la technologie comme instrument d’un nouveau paradigme : « que la machine nous aide à nous retrouver dans cette masse, pour moi c’est très humain. Plus que de faire confiance à la distribution physique de disques, avec des budgets marketing terrifiants. » La vision de « l’homme contre la machine » est dépassée, même si Vincent Favrat admet « qu’il peut y avoir conflit. » Quand bien même, toutes les personnes interrogées s’accordent à dire que les machines n’arriveront jamais à écouter la musique comme un humain le fait. Les programmateurs de radio ou curateurs pourraient même tirer parti de la suggestion algorithmique, « grâce à des outils qui permettraient d’avoir un rôle plus ciblé » soutient Vincent Favrat.
Derrière la recommandation musicale, un but politique ?
La recommandation permettrait aussi d’étendre l’appropriation de la culture. Selon Anne-Marie Kermarrec, « on est passé d’un mode ‘broadcast’ où les goûts étaient guidés par une élite (maisons de disques, médias, émissions de radio, télévision…), à quelque chose de plus guidé par les gens. » Même avis du côté de Musimap : « si l’on peut faire son propre trajet dans la culture de façon autonome et individuelle [via les algorithmes, ndr], ça l’ouvre à énormément de gens qui n’y auraient pas accès en temps normal. » Un pas en avant pour l’accès à la musique qui reste encore trop pyramidale. On ne peut alors espérer qu’une chose : que les réfractaires de chaque genre musical se penchent sans a priori sur ce qu’ils croient ne pas aimer.
Vers la connaissance, ou l’assouvissement des désirs ?
Fini le temps des disques piochés au fin fond d’un bac juste parce que leurs pochettes intriguaient l’œil ? Fini les groupes-coup-de-cœur découverts dans des concerts à l’improviste ? Cette possibilité de se « faire son propre trajet » de manière totalement guidée et automatisée dans la musique pose une question d’ordre philosophique : que cherche-t-on ? « Est-ce que mon rapport à la musique, c’est qu’une entreprise capitaliste se basant sur des schémas de donnés me propose ce que je veux écouter ? » s’interroge Philippe Vion-Dury. Plus largement, est-ce que notre consommation de musique tient de la culture et de la connaissance, ou de la notion de pur plaisir qui doit être « satisfait au moment où on le désire ? »
Vincent Favrat reconnaît que la question mérite d’être posée, mais objecte que « c’est une illusion de penser que chaque personne a le temps de passer deux ou trois heures par jour à lire des magazines spécialisés pour trouver les artistes qui lui plaisent. Cela dit, je pense que la recommandation va stimuler la curiosité. » Il en tient donc de l’investissement que l’utilisateur est prêt à mettre dans la musique. En gros, vous êtes plutôt passion ou passe-temps ?
Il établit un parallèle avec une application de suggestion d’hôtels : « personne ne t’oblige à l’utiliser. Par contre, si tu te perds, que tu ne sais pas comment gérer la complexité du nombre d’hôtels et que tu veux une certaine gamme de prix, tu as un assistant numérique pour le faire. Je considère que c’est la même chose pour la musique. » À cela, Philippe Vion-Dury répond par le « monopole radical » – ne fuyez pas, c’est bientôt fini-, notion décrite par Ivan Illich. Aux débuts de la voiture, on pouvait choisir entre en avoir une ou non. Quand cette technologie est devenue système, que la société s’en est vraiment imprégnée, le choix était devenu « Peugeot ou Renault. Aujourd’hui, si tu n’as pas de voiture, tu le subis tous les jours. » L’algorithme de recommandation, inévitable ?
La suggestion partout, tout le temps ?
Comme le note la Commission Nationale de l’Informatique et des Libertés (CNIL) dans son Cahier Innovations et Prospectives n°3, on peut déjà imaginer les principales orientations à venir des industries culturelles, et du streaming musical dans notre cas. On prévoit d’abord une personnalisation encore plus poussée, grâce à la compréhension du contexte dans lequel on évolue. Vous courez ? Le streamer vous proposera simplement d’appuyer sur play pour lancer une playlist adaptée à votre rythme et goûts. Ensuite, vos humeurs, émotions et sentiments seront analysés à longueur de temps car captés par des objets connectés – de votre smartphone à votre maison, en passant évidemment par votre voiture. Si vous conduisez en urgence, votre femme enceinte à la maternité et que vous aimez le classique tous les deux, nul doute que votre smartcar jouera La Chevauchée des Valkyries de Wagner. Voiture qui remplacerait à terme un Spotify ou Deezer, selon Vincent Favrat : « Alexa d’Amazon, Siri d’Apple, nos moyens de transports, tous seraient des assistants cognitifs qui pourraient être nos fournisseurs de musique du futur. » Avec des bases de données toujours plus grandes, tout se ferait via commande vocale, fini les interfaces de streaming. Alors, vous vous sentez prêts ?
Très bon article, très intéressant ! Merci
PUISSANT !
Big Brother is earing you…
J’ai pris beaucoup de plaisir a lire cet article. C’est très instructif et très interressant. Merci
Super article qui m’éclaire vraiment sur les recommandations/ playlists pur écrire mon mémoire.
Cependant je ne sais toujours le « secret » de ces algorithmes …
Bonjour,
Très intéressé par l’article et le thème dans sa globalité, est-il possible d’avoir accès à la lecture de votre mémoire ? Merci par avance pour votre réponse
Excellentissime article !!!