Outils recommandés
Cette liste commentée réunit différents outils qui permettent de réaliser ses propres visualisations de données.
Manipuler des données
Calculer/structurer/nettoyer
Google Sheets ou d’autres tableurs tels que LibreOffice Calc ou Microsoft Excel.
Google Sheets présente les avantages de fonctionner dans un navigateur web, avec une interface simplifiée et la possibilité de partager ou contribuer à plusieurs. Contrairement à Excel, l’export en csv est « propre », c’est-à-dire directement exploitable dans des applications de visualisations.
OpenRefine permet de nettoyer et de structurer des jeux de données.
Malgré une interface plutôt complexe, l’outil est efficace. L’outil bénéficie d’une documentation riche, alimentée par une communauté d’utilisateurs active.
RStudio utilise le langage de programmation R, puissant et très indiqué puisque conçu pour les données.
Bien que l’outil fournisse une interface qui permet de lire, manipuler et visualiser des données, sa prise en main nécessite un minimum d’aisance avec le code. La communauté d’utilisateurs de R s’accroît et la documentation est vaste.
ObservableHQ est une plateforme collaborative dédiée à la data visualisation sous forme de carnet interactif et collaboratif.
Une grande communauté et de nombreux exemples permettent de se lancer rapidement.
Joindre (assembler deux jeux de données)
L’opération de « jointure » permet d’enrichir un jeu de données par un autre. Cette opération est fréquente en cartographie, elle permet par exemple d’ajouter un code ISO à 3 caractères à une liste de pays. Pour que cela réussisse, chaque jeu de données doit présenter une colonne commune (celle sur laquelle se fera la jointure justement).
(Geo) DataMerger
En ligne mais sécurisé, il propose une interface bien pensée et pédagogique. Il permet notamment d’exporter le résultat dans plusieurs formats.
Géocoder (attribuer des coordonnées géographiques à un lieu)
Il est parfois nécessaire ou utile d’avoir les coordonnées géographiques des objets pour les cartographier. Des outils permettent de récupérer automatiquement de telles informations. Parmi les opérations de géocodage les plus courantes figurent l’obtention des latitudes et longitudes à partir d’adresses ou celles des centroïdes d’entités administratives.
Attention cependant ! Avant le géocodage, mieux vaut préciser la zone, en indiquant par exemple le pays dans le cas d’une ville (et ainsi éviter d’obtenir Paris au Texas au lieu de la capitale française). Après le géocodage, il faut toujours vérifier le résultat à l’aide d’une carte pour détecter d’éventuelles incohérences.
Geocode by Awesome Table est une extension de Google Sheet qui permet d’obtenir des coordonnées géographiques à partir d’adresses.
Ce module complémentaire est gratuit. À partir d’adresses précises (adresse, ville, région ou pays) ou même de noms de lieux, l’outil attribue des longitudes et des latitudes dans des colonnes séparées. La base Google Maps sert de référence.
Géocodeur de la Base Adresse Nationale française.
Le géocodeur du site officiel adresse.data.gouv utilise le référentiel de la Base Adresse Nationale (BAN). En plus des longitudes et latitudes, le géocodage récupère les autres informations de la base, dont un score d’exactitude de la géolocalisation.
Convertir (modifier le format ou la structure d’un fichier de données)
Le format standard de fichiers pour les outils de visualisation de données est le csv (pour Comma Separated Values), exploitable dans un tableur. En revanche, certains outils exigent des formats ou des structures spécifiques, c’est notamment le cas de l’information géographique. Ces formats sont nombreux (Shapefile, geojson, geopackage, kml, gpx, etc.), propriétaires comme libres, et il faut parfois basculer de l’un à l’autre.
FME Easy Translator
Sobre mais efficace, ce convertisseur accepte la plupart des formats standards propres à l’information géographique.
PGC Coordinate Converter
L’outil permet de convertir des coordonnées géographiques en degrés sexagésimaux (ou degrés minutes secondes) vers des degrés décimaux – cette seconde notation étant celle exploitable par les outils de cartographie.
Extraire des données
Les données identifiées ne sont pas toujours disponibles dans un format standard ou lisible par les outils de visualisation. Il faut alors les extraire, d’un pdf ou d’un site web par exemple. Les outils grand public qui permettent de faire ce « scrapping » restent malheureusement peu nombreux.
Tabula extrait des tableaux à partir de pdf.
L’outil permet d’éviter une saisie manuelle des informations. Attention, cela ne fonctionne pas avec des images (des scans en pdf par exemple), le résultat n’est pas toujours optimal (un nettoyage est souvent nécessaire) et, enfin, il faut toujours vérifier le résultat obtenu.
Online OCR extrait le texte contenu dans une image à l’aide de la reconnaissance optique de caractères.
Visualiser des données
Cartographier
Khartis est l’outil conçu par l’Atelier de cartographie.
Il s’adresse à un public néophyte : il est donc rapide à utiliser, simple à découvrir, notamment grâce à une ergonomie intuitive. Khartis réduit les éventuels blocages que l’on rencontre dans les outils plus experts… tout en proposant des fonctions puissantes, des conseils sur les visualisations éprouvées et des paramètres fins sur des points fondamentaux en cartographie. La documentation fournit de précieux conseils.
Magrit est un outil de cartographie thématique, plus sophistiqué.
Il emprunte autant à la cartographie statistique qu’aux systèmes d’information géographique (SIG). Magrit propose des paramètres nombreux tout en se montrant soucieux de la bonne application des « règles » de la sémiologie graphique. L’outil intègre toutes les étapes du processus cartographique : import du fond de carte puis des données, jointure entre les deux, choix de la projection cartographique, paramétrage des représentations, habillage complet et export de l’image finale.
Mapshaper lit et traite des données géographiques.
Austère d’apparence, cet outil est pourtant très efficace pour voir la géométrie des objets (et les données attachées) ou effectuer du « géotraitement » (c’est-à-dire découper, réunir, agréger, nettoyer ou simplifier les objets du fond de carte) via de courtes commandes, bien documentées. Parmi ces dernières, la généralisation de fonds de carte (simplification des tracés) est remarquable.
Datawrapper est un outil de cartographie, accessible et très bien conçu.
Bien qu’il ne propose que les 3 types de carte les plus courantes, l’outil se distingue par l’ergonomie de son interface, l’accompagnement au cours de la création ou encore la qualité des paramétrages.
QGIS est le logiciel open source de système d’information géographique (SIG) le plus répandu.
Il bénéficie d’une vaste communauté d’utilisateurs. QGIS est très puissant mais de nombreux prérequis sont nécessaires à son utilisation : formats de fichiers géographiques, systèmes de projections, opérations de géotraitement, types de visualisations, etc.
Felt permet de réaliser des cartes en collaboration avec d’autres utilisateurs.
Proche du fonctionnement d’un SIG mais avec des possibilités moindres, Felt se montre très intuitif et peut visualiser des volumes de données assez conséquents.
Projection Wizard permet de trouver une projection cartographique adaptée à une zone choisie.
EPSG.io est le catalogue officiel des projections cartographiques pour chaque pays ou région.
Réaliser un graphique/une datavisualisation
Datawrapper fait aussi des graphiques !
Il en propose d’ailleurs une large variété, paramétrables avec précision voire personnalisables (annotations dans les graphiques, titres, sources, commentaires, etc.). Datawrapper est utilisé par de grands médias, notamment en raison des possibilités de graphiques interactifs.
RAW Graphs est un outil de visualisation de données intéressant pour expérimenter différentes configurations graphiques.
Il propose certains types de graphiques assez peu répandus ou souvent produits par ceux qui maîtrisent le code. La logique de l’outil est astucieuse : manipuler des « dimensions » visuelles (hiérarchie, taille, couleur, étiquettes) et leur affecter les variables du jeu de données.
Chartbuilder est un outil facile pour créer des graphiques.
Par simple copier/coller des données, il propose seulement des graphiques en barres ou en courbes mais il est un des rares capable de structurer en séries (collections) des graphiques en échelle commune (et éviter les barres empilées, difficiles à lire).
Observable Plot est un langage de programmation fondé sur le principe des variables visuelles.
Il autorise ainsi une grande variété de graphiques à partir de quelques instructions de code seulement. Une documentation fournie et de nombreux exemples aident à sa prise en main.
Gephi est un outil de visualisation de réseau qui intègre une large gamme d’algorithmes de la théorie des graphes.
Choisir des couleurs
ColorBrewer propose des palettes de couleurs présélectionnées pour la cartographie. En plus des paramètres essentiels, que l’on peut choisir, l’application montre une carte en aplats pour se faire une idée du résultat.
Chroma.js génère des palettes de couleurs ordonnées (un dégradé de nuances donc), y compris divergentes.
L’outil permet d’interpoler entre plusieurs couleurs en conservant un écart similaire entre chacune d’elles
I want hue génère des palettes de couleurs différentes.
L’outil utilise les propriétés de l’espace de couleurs HCL (teinte, saturation et luminosité) pour maximiser les différences entre chaque couleur.
Mettre en page
Modifier une visualisation ou composer texte et image
Le fichier brut exporté des outils de visualisation nécessite souvent d’être modifié, amélioré, affiné, voire intégré à dans un document ou adapté à un support.
Adobe Illustrator est un logiciel professionnel de dessin vectoriel.
Il est nécessaire pour modifier les visualisations de données (graphiques, cartes, posters, etc.).
Figma est à la base un outil de design d’interface mais se montre finalement très polyvalent.
L’outil permet de dessiner librement et d’éditer des images vectorielles, y compris en collaboration avec d’autres utilisateurs.
Adobe InDesign est un logiciel professionnel de mise en page.
Il est utile pour composer du texte et des images (rapports, posters, atlas, etc.).
Microsoft PowerPoint est un logiciel multi-fonctions connu pour les présentations.
Il peut s’avérer utile en visualisation de données car il utilise des objets vectoriels et son fonctionnement est similaire aux autres logiciels de Microsoft Office.
D’autres logiciels libres existent, tels qu’Inkscape ou LibreOffice Draw.
Utiliser des pictogrammes
Noun Project est une base de pictogrammes (png ou svg).