Note aux lecteurs :
Cet article sera publié dans Jean-Marie Lagnel, Manuel de Datavisualisation, Seconde édition enrichie, à paraitre en septembre 2020 aux Editions Dunod

 

 

Fin 2019, l’Organisation mondiale de la santé (ONU) est alertée de cas de pneumonie dans la ville de Wuhan, dans la province de Hubei, en Chine. Une semaine plus tard, le 7 janvier 2020, la Chine confirme qu’elle a identifié un nouveau virus. On le baptisera “COVID-19”. C’est un coronavirus. C’est le début d’une pandémie mondiale dont l’ampleur n’est pas connue au moment de l’écriture de ces lignes.

Chacun des acteurs (étatiques, internationaux, non-gouvernementaux…) produit ses propres comptes, quotidiens, des personnes affectées, décédées ou guéries avec sa méthodologie et une propension à ouvrir plus ou moins les données ainsi compilées. Quelle est la situation en France par rapport à celle qu’a connu l’Italie ? Est-ce que la Chine connaît un recul du virus ? sont autant de questions auxquelles les réponses mobilisent des données non comparables.

Le Center for Systems Science and Engineering (CSSE) de l’Université Johns-Hopkins publie dès le 22 janvier des données agrégées et comparables, via un tableau de bord en ligne. Après les avoir récupérées depuis le compte GitHub dédié au format texte .CSV celles-ci peuvent être manipulées et visualisées avec un outil en ligne de cartographie statistique comme Khartis.

Khartis est un outil libre de cartographie thématique en ligne proposé par l’Atelier de cartographie de Sciences Po depuis 2016. Son ergonomie, ses fonctions et sa gratuité le rapprochent d’outils de datavisualisation en ligne comme RAWGraphs ou Magrit. Les trois grandes étapes de réalisation mènent rapidement et pas à pas son utilisateur-trice vers une image-résultat.

A la fin du mois de mars 2020, le site du CSSE ne montrait que 2 cartes : les cas confirmés cumulés d’une part et la situation des cas confirmés de l’autre. Khartis permet d’explorer autrement plus graphiquement les données, sur au moins deux plans.

Tableau de bord du Center for Systems Science and Engineering (CSSE) de l’Université Johns-Hopkins

Synchronie. Le compte GitHub met à disposition, à partir du 14 février 2020, la situation mondiale quotidienne des cas confirmés (positifs présumés), des décès, guéris ou encore des sujets actifs (confirmés moins les guéris moins les décès).
Après avoir choisi un fond de carte (Monde) proposé par Khartis, le panneau se développe vers le bas, donne un aperçu du fond de carte et de la table d’attributs (le tableau de données associé à ce fond) et affiche une fenêtre de dépôt du jeu de données. Par exemple le fichier 03-31-2020.csv, récupéré du dépôt GitHub, peut être directement glissé à cet endroit. Les données comportent, entre autres champs, une colonne latitude et une autre longitude : ces deux informations vont être très utiles à Khartis pour générer et bien localiser des points (selon les cas, des centroïdes de pays, de régions/provinces ou des villes).
Attention à bien s’assurer, à ce stade, que les données latitude et longitude sont bien reconnues comme telles. Corriger le cas échéant. Et sélectionner Lat/Long comme colonne de référence. L’image suivante apparaît après validation.

Affichage des couples de coordonnées dans Khartis

Il est alors possible de cartographier l’un des types (cas confirmés, décès, personnes guéries ou encore des sujets actifs) grâce à l’une des 8 visualisations proposées. L’Atelier de cartographie a volontairement limité les possibilités offertes aux plus courantes et basiques. Ici, des disques rouges sont proportionnels aux cas confirmés (les points rouges sur le site du CSSE). Le panneau des réglages permet à ce stade d’optimiser la taille des points par rapport à l’échelle de la carte et de personnaliser leur affichage.

Réglages d’une carte dans Khartis avec des symboles proportionnels

Diachronie : le dossier csse_covid_19_time_series propose quant-à lui, et pour chaque type de cas, des données quotidiennes à partir du 14 février et harmonisées depuis le début de la pandémie. Elles donnent la possibilité de figurer sur la même carte, par exemple, le nombre de cas confirmés à 2 dates différentes donnant ainsi une évolution de la situation par des doubles symboles proportionnels. L’exemple de l’image ci-dessous donne à voir les cas confirmés au 15 et au 30 mars 2020. Les données sont comparables entre-elles : l’option “légende commune” affiche alors des points strictement comparables entre-eux.

Réglages d’une carte diachronique dans Khartis avec doubles symboles proportionnels aux valeurs et comparables entre eux (échelle commune)

Khartis ne permet cependant pas de faire des calculs ou des requêtes. L’utilisateur-trice prendra soin de les faire au préalable dans un tableur (Excel ou GoogleSheet) avant de coller ses données dans l’outil.

Au final Khartis apporte une solution simple à la cartographie de données statistiques à un public-acteur (épidémiologistes mais aussi graphistes, journalistes…). Il accepte des données référencées par des couples de coordonnées, comme dans le cas du CSSE, ou plus généralement géoréférencées selon une unité géographique (pays, région…). Khartis servira de laboratoire d’analyse exploratoire mais aussi d’outil pour produire ses propres cartes et les diffuser.

Patrice Mitrano, 31 mars 2020

Pour aller plus loin :

Photo de une : jesadaphorn/Shutterstock