

47
HADOPI > Rapport d’activité 2012-2013
sentation potentielle de certaines vidéos
« suggérées », de la limitation aux vidéos
publiques, de la non-localisation des conte-
nus et de son influence sur leur popularité,
et enfin de leur catégorisation manuelle.
Sur la plateforme YouTube, les travaux de
recherche mettent en exergue une présence
notable de contenus culturels, dont la popu-
larité est particulièrement importante.
On relève notamment que les clips musi-
caux représentent 13 % de l’ensemble des
contenus. Un quart d’entre eux (25,47 %)
sont « officiels » c’est-à-dire mis à disposi-
tion par les comptes officiels des artistes,
des sociétés, des maisons de production,
des organismes de diffusion, etc. Les trois
quarts restants sont notamment des ver-
sions originales, ou des versions dont les
bandes son ou l’image ont été modifiées,
n’ayant pas été postées par des comptes
officiels. Les clips musicaux dans l’en-
semble sont de loin les contenus les plus
populaires de la plateforme. Ils totalisent
en moyenne 40 000 vues par jour. Parmi
ces clips, ce sont les versions « officielles »
qui totalisent le plus d’audience (plus de
110 000 vues en moyenne par jour). Le
reste de l’audience se partage principale-
ment entre les versions non officielles, dont
celles dont la bande-son ou la vidéo sup-
port ont été modifiées. Parmi les contenus
non officiels, on relève que 36,68 % des
pages présentent des liens vers une plate-
forme permettant d’acheter l’œuvre relative
à la vidéo.
•
Les contenus relatifs aux films ou aux
séries sous forme de parties organisées
pour permettre le visionnage complet ou
en intégralité constituent environ 9,65 %
des vidéos présentes. Les extraits repré-
sentent 2,66 % des vidéos (les bandes
annonces sont intégrées dans la catégo-
rie « publicités »). La catégorie regroupant
les parties de films organisées pour per-
mettre le visionnage complet est la deu-
xième catégorie la plus populaire. Ses
vidéos font l’objet d’environ 12 000 vues
en moyenne chaque jour.
•
Enfin les « médias », extraits ou intégralité
de programmes audiovisuels initialement
faits, il est en effet difficile d’en avoir une
vision précise. Pourtant, il s’agit de sup-
ports très populaires, dont la place dans
les usages est importante.
Le protocole consiste à réaliser un échan-
tillonnage par
random walk
des vidéos
publiques des plateformes. Cette méthode
est utilisée pour déterminer les caractéris-
tiques d’un graphe lorsqu’il est impossible
de réaliser un échantillonnage aléatoire sur
ce graphe (
i.e.
de sélectionner de façon
aléatoire un nœud du graphe parmi l’en-
semble des nœuds). Pour schématiser, cela
correspond à une navigation classique d’un
utilisateur qui circulerait un grand nombre
de fois au hasard d’une vidéo à une autre
parmi celles qui sont suggérées sur la page
qu’il consulte.
L’échantillon (environ 3000 vidéos) est ana-
lysé pour induire les caractéristiques des
vidéos hébergées. Les vidéos sont classées
selon une première série de catégories
ad
hoc
permettant d’en préciser le contenu
(clips musicaux, tutoriels, par exemple).
Les catégories dont la diversité le permet-
tait ont fait l’objet d’une sous-catégorisa-
tion plus détaillée : clips musicaux, films,
séries et média. Quelques précautions sont
nécessaires à la bonne lecture de ces tra-
vaux afin de tenir compte de la surrepré-
d’observation mis en place à l’occasion
du séminaire annuel de recherche de ce
groupement.
L’utilisation effective des œuvres
Ce premier poste de développement prend
l’œuvre elle-même pour objet, pour carac-
tériser les contenus en ligne. L’objectif est
d’obtenir des résultats précis et factuels sur
la réalité des contenus culturels dématériali-
sés, puis de les traiter à la lumière d’études
sur les pratiques telles que déclarées par
les utilisateurs. Les premiers des travaux
prévus sur ce poste sont les qualifications
et quantifications des contenus présents
sur les plateformes de streaming. Les pre-
miers cas traités à ce titre sont les plate-
formes YouTube et Dailymotion.
Les supports ont été sélectionnés sur la
base de leur popularité. Les travaux de
recherche en informatique et mathéma-
tiques appliquées présentés ici visent à
apporter des éléments de compréhension
précis et factuels des contenus publics pré-
sents et consommés sur les principales pla-
teformes de streaming en France, YouTube
et Dailymotion. Compte tenu de la quantité
des contenus présents sur ces plateformes
et de la diversité des usages qui en sont