déclare Thomas Bouabça (directeur Data Science chez Deezer) dans cette table ronde riche en informations sur les métadonnées et les données d’usage.
Table ronde modérée par Robin Charbonnier (chercheur), avec la participation de :
● Thomas Bouabça, Directeur Data Science, Deezer
● Julie Knibbe, Fondatrice, Music Tomorrow
● Sylvain Morton, Directeur Distribution, IDOL
● Némésis Srour, VP Product, Spideo
La FÉLIN vous en propose quelques extraits, ci-dessous.
Julie Knibbe : “Par définition, une métadonnée est une donnée qui vient décrire une autre donnée […] Dans le contexte de la musique, on parle souvent de métadonnées sur les fichiers audio, donc sur une chanson. Il existe des métadonnées descriptives, celles que vous remplissez au moment de la distribution : le titre de la chanson, la liste des artistes, etc. Il existe aussi les métadonnées de propriété qui vont décrire les ayants droit, les contributeurs des titres, et qui ont pour vocation de faciliter la distribution des revenus. Puis, d’autres métadonnées vont dépendre des plateformes sur lesquelles ce fichier Wave va voyager et vont être potentiellement calculées : données de mood, de genre, de BPM.”
Sylvain Morton : Chez IDOL, on a développé une interface technique qui permet à nos partenaires de nous envoyer leurs données et métadonnées.
Celles-ci sont envoyées aux plateformes par des flux d’échanges de données automatisés, type DDEX. Ces flux de livraison permettent d’envoyer l’information aux différentes DSP ou autres.
Thomas Bouabça : Cette donnée pose énormément de difficultés [à Deezer] de par son format un petit peu brut et du fait qu’il n’y ait pas de standardisation des données. […] De ce fait, nous les enrichissons de plusieurs manières différentes. […] Nos experts sont capables d’extraire des informations du signal audio, en particulier des données relatives aux mood, BPM, etc. Les équipes éditoriales de Deezer créent et annotent manuellement les playlists éditoriales et utilisent également des providers de métadonnées.
Némésis Srour : Nos algorithmes sont uniquement basés sur les métadonnées et sur la description de contenu. Chez Spideo, c’est le catalogue du client que nous recevons, par exemple ceux de Canal + ou France TV, en amont de la diffusion sur la plateforme. C’est à ce moment-là que nous enrichissons les contenus en métadonnées.
Alors, quelles sont les bonnes métadonnées pour faire une bonne recommandation ? Afin de créer une expérience de recommandation humaine dans le monde du digital, nous avons créé notre propre taxonomie qui est notre propriété intellectuelle. Elle permet de décrire les films et, plus largement, les contenus audiovisuels.
Thomas Bouabça : Chaque jour, ce sont 10 000 titres/nouveautés qui nous sont livrés.
Julie Knibbe : Chez Music Tomorrow, quand un artiste est recommandé, nous analysons à quels autres artistes il est associé (dans une playlist). C’est ce qui permet aux labels de déclencher des actions qui améliorent la découvrabilité. Une fois la chanson à disposition sur la plateforme […], nous analysons les playlists générées par Spotify ou par Deezer et déterminons ainsi des actions pour influencer les algorithmes, entre autres la pertinence d’association de certains artistes.
Thomas Bouabça : sur Deezer, un tiers des écoutes se font par les algorithmes. C’est important, mais ça veut aussi dire que 70% des écoutes ne se font pas via les algorithmes. Il y a encore énormément de liberté de nos utilisateurs. Nous considérons l’algorithme comme un outil, une aide, mais n’avons pas vocation – et ce n’est même pas notre but – à ce que tout le monde l’utilise tout le temps.
Globalement, sur ces 70% restants, la moitié des écoutes proviennent de la propre librairie de l’utilisateur. Le tiers restant des écoutes se fait via le moteur de recherche : l’utilisateur tape ce qu’il souhaite écouter dans la barre de recherche. La découverte se passe en dehors de notre plateforme : partout, le contexte extérieur, TikTok en particulier, Netflix, etc. Les aspects de marketing, de présence sur les réseaux extérieurs sont aussi […] importants et qu’il ne faut pas tout miser sur l’algorithme.
Sylvain Morton : Il y a une partie de métadonnées qui facilite la répartition des revenus, des droits, notamment l’ISRC. C’est une information absolument clé pour tracer… Il faut être consciencieux dans la manière dont vous renseignez vos métadonnées pour vous garantir un maximum d’optimisation dans la répartition.
Thomas Bouabça : Il n’y a pas d’identifiant universel d’un artiste ce qui pose un problème pour les homonymes. Nous (chez Deezer), nous recevons le contenu tel quel et fléchons vers la bonne page artiste, quelle discographie…
Sylvain Morton : Chaque DSP a un niveau d’exigence qui varie. Certaines plateformes ont mis en place un contrôle qualité sur les métadonnées et sur les livraisons de manière générale pour faciliter la vie aux bons acteurs. Nous (IDOL), comme certains autres distributeurs, en faisons partie. Nous soutenons cette démarche-là ; c’est très important de le faire.
Thomas Bouabça : Il y a deux approches : une approche de recommandation basée sur le contenu, donc sur les métadonnées, et une approche qui repose sur ces données sociales, que je préfère appeler d’usage. Aujourd’hui, on utilise ces deux grandes classes de recommandation, pas l’une sans l’autre. Chez Deezer, nous observons les principalement les données d’usage qui indiquent les cooccurrences d’écoute. […] Elles permettent de créer des informations (tel utilisateur aime tel artiste & tel artiste…) pour générer des espaces musicaux où les chansons sont classées par proximité, retravaillées par des experts de genres musicaux. […] Nous travaillons à ce que ces espaces musicaux soient d’une qualité qui permette la découverte plutôt fine, en tout cas efficace.
Quand il y a peu de données, quand les artistes sont émergents, il n’y a pas assez de données d’usage donc les métadonnées sont pertinentes et permettent d’enrichir les espaces musicaux.
Julie Knibbe : L’objectif premier est de s’assurer qu’on est recommandé aux bonnes audiences. Être visible auprès de tout le monde n’est pas forcément un objectif en soi, parce que votre production artistique n’est pas censée nécessairement plaire à tout le monde. Elle est censée plaire à un groupe de personnes qui va ensuite suivre, aller à des concerts, etc. […] Chez Music Tomorrow, on les aide à s’assurer que le positionnement est le bon, en identifiant, par exemple, les groupes d’artistes auxquels ils sont associés. […]
Il faut bien faire son marketing, s’assurer qu’on est visible auprès des bonnes audiences, que ces audiences-là répondent en étant engagées.
Sylvain Morton : Nous, en tant que distributeurs digital, nous regardons énormément la donnée de consommation organique. En gros, ce que Thomas vient d’écrire. Parce que c’est l’argument imparable qui permet à nos équipes commerciales d’aller repitcher, repousser un titre auprès des équipes éditoriales.
©AgenceTHRIVE Mentions légales