Échelle EVENT (Échelle de Viralité Et de Notoriété sur Twitter)

Mesurer la médiatisation d’événements sur Twitter

À mesure que Twitter s’est imposé comme un média social central pour le débat public, l’analyse qualitative et quantitative des messages qui y sont produits est devenue une partie intégrante du travail de veille informationnelle. Pour autant, les données de base que produit une telle analyse – nombre de tweets, d’occurrences de hashtag … – ne sont pas directement et intuitivement compréhensibles par des non-experts, à la différence, par exemple, d’un score d’audience télévisuelle.

Le Service d’Information du Gouvernement, qui a parmi ses missions principales la veille d’information, a donc souhaité se munir d’un outil permettant à la fois de construire une mémoire des événements sur Twitter, de les classer les uns relativement aux autres selon leur intensité, et enfin de les associer à un référentiel clair et compréhensible du plus grand nombre.

C’est à cette fin qu’a été produite l’échelle ouverte EVENT, qui mesure l'intensité d’un événement sur Twitter au moment où il produit le plus de tweets. Chacun de ses barreaux correspond à une quantité de tweets et est associé à un événement marquant, permettant de se faire une image plus précise et intuitive de la traduction, en termes d’intensité de "buzz", de ce niveau de l’échelle.

L’échelle EVENT sera désormais utilisée par le Service d’Information du Gouvernement pour qualifier et normaliser les veilles Twitter qu’il produit et diffuse.

EVENT a été pensé comme un outil de compréhension et d’appropriation, d’abord pour la sphère gouvernementale, mais sans exclusive – nous en présentons donc ici le raisonnement et la méthodologie, pour que d’autres puissent s’en saisir. Il ne prétend pas traduire une vérité scientifique, ni éviter tous les biais que peuvent comporter ce type d’analyse, mais offrir une intelligence opérationnelle et empirique de l’intensité "twittesque" d’un événement.

Comment a été constituée l'échelle EVENT

Après avoir construit une base de données d'événements Twitter durant une année, nous avons observé des phénomènes de regroupement des différents items et constaté des agrégations quantitatives autour de plusieurs niveaux selon les typologies des événements (tragédies, catastrophes naturelles, rencontres sportives, disparitions de célébrité, etc.). Nous avons par convention retenu ces niveaux d'agrégation "naturelle" comme barreaux de l'échelle. Ce qui nous a conduits à élaborer l’Échelle sur 9 niveaux qui constituent chacun un palier d’intensité compris entre 10.000 (niveau 1) et plus de 6.5 millions de tweets (niveau 9).

 

 

Méthodologie de la base de données

Quand une séquence médiatique d’intérêt politique a été identifiée, pour l’introduire dans la base de données :

  • Il convient, dans un premier temps, de définir une requête permettant de mesurer le nombre de tweets la concernant. Cette requête est composée de mots-clés (hashtags, expressions, nom d’une personnalité politique ou d’une réforme, etc.). Si sa construction est par nature empirique et ne saurait épuiser l’intégralité des tweets concernés, ni éviter de capter du "bruit", l’utilisation pérenne des mêmes principes d’élaboration permet d’assurer une justesse relative des résultats de requête, les uns par rapport aux autres. La mesure est ensuite effectuée actuellement via l’outil "Quick Trends" de Visibrain, qui comptabilise le volume de tweets correspondant à la requête, avec un accès à l’intégralité des messages de Twitter (Firehose).
  • Il s’agit ensuite de définir la période temporelle la plus adéquate (ex : une journée pour une interview, quelques jours pour une catastrophe naturelle, plusieurs semaines pour les événements massifs type attentats). Lorsque l’événement s’inscrit dans la durée, il peut être judicieux de le mesurer par tranche hebdomadaire, du lundi au dimanche inclus, afin d’effectuer un suivi sur le long terme (ex. d’événement : crise des réfugiés à Calais). A noter, la liste des événements n'est pas exhaustive, notamment en ce qui concerne les interviews politiques.

Sont alors intégrés à la base :

  • Le volume global de tweets sur la période choisie, afin d’avoir une appréciation globale du phénomène. L'unité minimum est un jour complet.
  • Le volume de tweets sur la journée durant laquelle le phénomène a été le plus visible, afin de mesurer l’intensité de l’activité un jour donné. Pour cela, la journée ayant eu le plus de tweets est identifiée, puis le nombre de tweets sur cette journée est divisé par 12 (facteur conventionnel, correspondant au nombre d’heures globales d’activité moyenne sur Twitter par jour). Est ainsi obtenue une moyenne de tweets par heure le jour le plus important de la médiatisation. Est également disponible le nombre de tweets sur l’heure de pic la plus importante, afin de mesurer l'intensité record.
  • Dans le cas d’une interview politique, le volume global sur les 4 heures suivant l’interview.

Une autre section du fichier est consacrée aux mobilisations en ligne. L’objectif est de mesurer le volume exact de tweets autour d’un ou plusieurs hashtags spécifiques, utilisés parfois massivement sur Twitter par les internautes pour défendre ou dénoncer une cause, une personne, une mesure (#RéformeOrthographe), voire pour rendre hommage (#PrayForParis). Le processus d’alimentation est le même que pour la première page : travail de requêtage, définition de la période, indication du volume global de tweets sur cette période, du volume de tweets sur la journée de pic, de la moyenne de tweets par heure sur la journée de pic, du volume de tweets sur l’heure de pic de cette journée.

 

Comment sont constituées les requêtes de la base de données des événements Twitter ?

La base de données sur laquelle s’appuie l’échelle EVENT constitue davantage un indicateur relatif qu’un outil de mesure scientifiquement exact. Les requêtes ne peuvent en effet prétendre capter l'exhaustivité des tweets consacrés à un sujet, en raison notamment des possibles erreurs des twittos dans les hashtags et d’éventuels oublis résiduels. Inversement des "faux-positifs" sont également possibles. Les volumétries obtenues sont néanmoins représentatives des flux et des échanges des twittos et fournissent des indications d'ordres de grandeur.

Différentes étapes rythment la constitution de la requête :

  • Repérage des principaux hashtags en circulation,
  • Observation des angles et expressions utilisées par médias et twittos sur le sujet,
  • Déclinaison des réponses possibles aux interrogations portant sur : "qui ?" (protagonistes), "quoi ?" (déclarations ou événements) et "où ?" (lieux où l’évènement se déroule),
  • Renseignement de la requête dans Quick Trends de Visibrain, logiciel de veille qui possède un accès fiable et exhaustif au firehose de Twitter. Contraintes : limitation sur la taille de la requête (30 mots) et son antériorité (limitée à 30 jours).

Principes du requêtage :

  • Tweets francophones uniquement (utiliser systématiquement lang:fr),
  • Dans un premier temps, repérer les hashtags spécifiques à l’événement, les plus utilisés, et circonscrits dans le temps,
  • En complément, créer des requêtes plus élaborées qui déclinent le "qui, quoi, où",
  • Limiter et identifier le « bruit » hors-sujet, pour affiner la requête,
  • Sélectionner la période adéquate de la mesure (date de début, date de fin, jour de pic).

 

Exemple de requête :

Événement : Annonces du Premier ministre pour la jeunesse

Hashtags spécifiques : (PrioritéJeunesse OR PrioriteJeunesse) lang:fr

Qui / où : (Valls OR manuelvalls OR gouvernement OR gouvernementFR OR Matignon) quoi : (jeunes OR jeunesse OR organisation OR organisations OR syndicat OR syndicats OR unef OR fage OR lycéens OR étudiants OR lycéennes OR étudiantes) lang:fr

29 juillet 2016 / Études
Portrait de Département Médias et Réseaux Sociaux
Département Médias et Réseaux Sociaux