Explorer quelques comparaisons – présidentielles 2017, 1er tour, 3/3

Sixième article profitant de l’actualité électorale pour distiller quelques tuyaux cartographiques. Après avoir précédemment considéré les fructueuses déformations que proposent les cartogrammes, revenons à des représentations plus traditionnelles afin d’expérimenter quelques pistes dans Khartis. On propose maintenant de dépasser la seule visualisation brute des résultats d’un candidat en opérant quelques calculs et combinaisons simples.

D’abord, toujours rappeler le niveau

Avant de calculer et de représenter des évolutions, il est opportun d’indiquer au préalable un ordre de grandeur ou un niveau. On peut prendre l’image bien connue du PIB : avant de comparer la « croissance » entre pays, il vaut mieux montrer les volumes respectifs. Il en est de même en géographie électorale : un candidat peut voir son score multiplié par 10 d’une élection à l’autre, si, au niveau national, il ne rassemble que quelques centaines de milliers de voix, son score restera inférieur à un candidat qui stagne à plusieurs millions de voix.

L’évolution dans le temps : ratio ou solde ?

L’option de comparer deux cartes, en échelle commune, à des dates différentes est souvent efficace mais les changements sont parfois subtils et deviennent invisibles par la seule comparaison de deux images. Il faut donc aller au delà et calculer ; ce que quelques opérations simples dans un tableur permettent généralement.

Deux grandes options se présentent : calculer un ratio (c’est à dire un % d’évolution entre deux dates, aussi équivalent à un coefficient multiplicateur) ou calculer un solde (c’est à dire une différence entre deux dates). La première opération est une division qui produit une quantité dite « relative » (relative aux deux autres), la seconde est une soustraction qui aboutit à une quantité dite « absolue » (un effectif). Par exemple, la balance commerciale d’un pays est un solde : excédentaire ou déficitaire, elle demeure une quantité. Attention, il est périlleux de calculer un solde à partir de %, dans ce cas mieux vaut utiliser un ratio. 

Ces deux types d’évolutions appellent des visualisations spécifiques. Les ratios peuvent idéalement être agrégés en classes et représentés par un dégradé de couleur (la valeur varie). Les soldes peuvent être montrés à l’aide de symboles proportionnels (la taille varie) en même temps que le candidat vers lequel cet effectif tend serait différencié par des teintes (la couleur varie).

L’exemple ci-après porte sur le vote pour Marine Le Pen en 2012 et 2017 en Île-de-France. La première vignette rappelle la géographie de ce vote en 2017 : en part des voix exprimées car le nombre absolu montre une image trop peu contrastée (revoir à ce sujet le second article de la série précédente). Les deux vignettes suivantes illustrent une évolution en % (sur la part du vote exprimé) et un solde (de voix) ainsi que leur systèmes de légende respectifs. Ce sont des extraits, la légende peut couvrir un spectre de valeurs plus large que ne le montre la zone.

Attention, ces deux types d’évolutions (ratio ou solde) n’amènent pas la même interprétation. Les ratios indiquent un rapport entre deux dates, et ce indépendamment du score obtenu. Un « petit » candidat peut voir son nombre de voix tripler mais rester inférieur à 5 %. Les soldes montrent un nombre de voix gagnées ou perdues, ici entre deux élections. Ainsi, un candidat peut maintenir un nombre de voix élevé, il stagne donc le solde est proche de zéro, ils sera alors presque invisible sur la carte (avec des points très petits).

>> Projet khartis (kh) dont sont extraits les vignettes précédentes.

>>Tableau (xls) des données 2012-2017 (1ers tours) avec quelques calculs d’évolutions (abstention, votes Le Pen, Sarkozy-Fillon et Mélenchon).

Ratios entre candidats

On peut suivre la même logique de calculs simples pour comparer deux candidats. Le classement au niveau national montre que, grosso modo, les quatre premiers candidats se suivent deux par deux. Testons ces ratios.

Il s’agit de diviser le nombre de voix d’un candidat par celui d’un autre, ici Macron/ Le Pen et Fillon/Mélenchon. L’équilibre entre les deux candidats correspond à la valeur 1, le changement de couleur montrant la bascule. Ainsi, dans la première carte, plus l’écart relatif entre Emmanuel Macron et Marine Le Pen est au profit du premier plus le vert est foncé ; et à l’inverse, plus le nombre de voix est en faveur de la candidate d’extrême droite, plus le violet est foncé. La logique est similaire dans la seconde carte, avec un double dégradé vers le bleu (favorable à François Fillon) ou vers le rouge (pour Jean-Luc Mélenchon).

>> Projet khartis (kh) comprenant les deux cartes.

La « forme » des cartes – présidentielles 2017, 1er tour, 2/3

Après avoir envisagé quelques options de tris du résultat national du premier tour, revenons dans ce cinquième article sur la « forme » des cartes. On distingue là celles qui utilisent un fond de carte euclidien classique des cartogrammes, ces images déformées – voire difformes selon les cas. Elles s’avèrent très intéressantes pour montrer des résultats électoraux.

Déformer selon les données

On observe une production grandissante des cartogrammes depuis les années 2000, notamment grâce aux travaux féconds de Jacques Lévy, grand promoteur de ces images. Plusieurs logiciels et applications proposent désormais de telles représentations, la référence (libre) demeure Scapetoad.

Sur la forme, les cartogrammes sont spectaculaires : les unités géographiques se voient « gonflées » ou « dégonflées » en fonction des données. Les valeurs fortes donnent l’impression de régions obèses, prêtes à éclater, quand d’autres apparaissent décharnées.

Ce qui compte, c’est donc la proportionnalité des entités géographiques elles-mêmes (la taille varie). Voici une première planche qui montre une géographie des communes françaises selon le nombre de voix obtenues par les quatre premiers candidats et l’abstention, au premier tour de la présidentielle de 2017.

 

Atouts des cartogrammes

En déformant le fond de carte selon une variable choisie, le cartogramme permet de se détacher de la contrainte de l’espace géographique, notamment des superficies des unités géographiques. De la sorte, la colonne de données sélectionnée « devient » le fond de carte. Un grand classique consiste à déformer selon la population.

Cela présente un atout considérable en matière de cartographie électorale. Il est en effet bien plus pertinent de raisonner à partir des individus (ceux qui votent) que des territoires administratifs (circonscriptions, communes, départements, etc.). Le cartogramme montre alors les acteurs et non la structure. C’est d’autant plus valable lors d’un vote national au suffrage direct comme l’élection présidentielle. Un cartogramme déformé selon la population des communes, mettra en avant les centres urbains densément peuplés, qui pèsent pour beaucoup dans le vote national, au dépend des zones rurales, couvrant certes de larges part du territoire, mais au peuplement lâche.

Cette seconde planche compare les deux approches. L’échelle et le mode de visualisation (un dégradé mixte de valeur et de couleur varie) sont identiques, seul le fond – communal – varie : la population pour les cartogrammes, le territoire pour les cartes euclidiennes.

Quelques limites

Le premier problème touche à l’identification de l’espace géographique représenté, les déformations sont parfois telles qu’on ne reconnait pas. On le remarque bien dans la première planche ci-dessus. Cela peut être résolu en introduisant chaque cartogramme d’une carte classique. En parallèle, notre œil commence à s’habituer aux cartogrammes les plus répandus, l’accoutumance est en cours…

Le second inconvénient concerne notre capacité à juger la proportionnalité entre des objets aux formes différentes. C’est surtout le cas à l’échelle internationale où les États présentent de fortes inégalités, de superficie notamment. Cet aspect introduit donc un biais initial difficile à contourner : les petits États (tels Singapour, le Qatar ou les Pays-Bas) apparaissent systématiquement davantage « gonflés » que les grands (Russie, Brésil, etc.) qui montrent eux un aspect rétrécis en raison de leur grande taille.

Visualiser le résultat des candidats – présidentielles 2017, 1er tour, 1/3

Après trois premiers articles à la fois méthodologiques, appliqués et historiques (sur le maillage territorial, les résultats de 2012 et l’abstention), ce quatrième billet poursuit avec la même approche sur les résultats du premier tour de la présidentielle de 2012.

Trois graphiques en forme de résultat

On conserve la proposition formulée dans l’article précédent en considérant comme base 100 le nombre d’inscrits, et non celui des votants, ce qui permet d’incorporer l’abstention. Rappelons que les individus inscrits mais qui ne sont pas allés voter – les « abstentionnistes » donc – sont plus nombreux que les voix recueillies par le candidat arrivé en tête, Emmanuel Macron.

De manière assez classique, le résultat au niveau national peut être visualisé sous forme d’un diagramme en barres. Si le traitement paraît simple, il faut rester vigilant au tri (l’ordre des barres). L’efficacité de l’image finale en dépend.

Cette image triple montre les trois tris les plus répandus :

1. Selon les valeurs – il apparaît bien meilleur que les autres. C’est le classement par excellence. Il permet de retenir l’image (profil de la série et hauteurs de chaque barre) et de comparer immédiatement les candidats dans l’ordre d’arrivée.

2. Selon l’orientation politique – il se heurte aux limites de la pertinence du clivage droite/gauche comme typologie des candidats. En effet, sur de nombreux thèmes (sociétaux, internationaux, économiques, etc.) ce gradient binaire n’est plus vraiment valable. Le positionnement de certains « petits » candidats est délicat tout comme l’abstention et les votes blancs/nuls sortent de la typologie.

3. Selon l’ordre alphabétique – c’est le pire. Il s’avère sans fondement graphique ni statistique autant donc s’épargner l’effort de faire un diagramme et conserver une liste, en texte (puisque c’est la référence du tri). Cette option correspond à l’approche “neutre” souvent retenue par les administrations.

Explorez/cartographiez les résultats du premier tour avec Khartis !

Vous pouvez directement copier/coller dans Khartis les données du fichier ci-dessous :

>> résultats du premier tour par circonscription (csv) (source : data-gouv.fr).

L’abstention, 1965-2012 – en attendant le premier tour, 3/3

L’abstention est régulièrement citée par les spécialistes comme un des “premiers partis de France”. Dans ce troisième article, après avoir abordé le maillage territorial du vote puis les résultats de 2012, nous explorons la notion d’abstention. Dans ce dernier article de la séquence d’avant le premier tour (2017), davantage graphique et moins littéraire, nous pointons la question de la délimitation de l’abstention puis ses dimensions historiques et géographiques.

Imbrication des individus et des comportements

Resituons l’abstention au sein des comportement électoraux en partant de la population initiale, les individus qui ont le droit de voter.

Ce premier graphique amène des questions importantes en matière d’unités. Si les voix accordées aux candidats sont souvent exprimées en % des votes exprimés (la base 100 équivaut aux 35,9 millions, soit carré gris du diagramme précédent), l’abstention est généralement rapportée au nombre d’inscrits sur les listes électorales (100 % correspond alors aux 46 millions). Il est donc impératif de ne pas comparer les % des voix pour les candidats à celui de l’abstention, les bases 100 ne renvoient pas aux mêmes populations.

En revanche, il est possible de comparer les nombres absolus. Et dès lors que l’on intégre l’abstention, les non inscrits et les votes blancs et nuls, la physionomie du classement issue du premier tour de 2012 change considérablement :

L’abstention aux présidentielles depuis 1965

Ces deux dimensions de l’abstention (la magnitude et la part) peuvent être visualisées en mobilisant des objets graphiques propres. On peut alors remarquer que malgré un taux d’abstention au premier tour de 2002 supérieur de 8 points à celui de 2012, le nombre d’abstentionnistes est plus important lors de cette dernière élection.

La géographie de l’abstention en 2012

Carte de l'absention au 1er tour de la présidentielle de 2012

>> fichier original svg ou projet à ouvrir dans khartis

Retour sur les résultats de 2012 – en attendant le premier tour, 2/3

Après avoir introduit les unités géographiques électorales que sont les circonscriptions législatives, abordons les deux familles classiques de visualisations des données à partir des résultats de la présidentielle de 2012. Khartis permet ces représentations.

Récupérer les données

Elles sont notamment diffusées par le CDSP de Sciences Po. On peut les télécharger sur la plateforme data.gouv, dans un format csv, puis les utiliser telles quelles dans Khartis.

On peut aussi ouvrir l’appli et charger le projet correspondant dans lequel les données sont précédemment chargées et une visualisation déjà proposée :

>> projet khartis

Types de données/visualisation

À l’issue du dépouillement du vote, les données obtenues sont brutes : ce sont des nombres de voix. Par calcul, ils sont ensuite transformés en ratio en les divisant par le nombre de votes exprimés et deviennent alors des parts (exprimées en % des votants). Dans le tableau, ces deux types de données correspondent aux colonnes intitulées “voix” et “%”.

Pour les visualiser, les nombres sont idéalement montrés par des points proportionnels (la taille varie) alors que les parts le sont plutôt par des dégradés de couleur (la valeur varie).

Apprécier l’efficacité des images produites

Néanmoins, les cartes en points proportionnels peuvent parfois montrer des images peu ou pas assez contrastées. C’est souvent le cas en cartographie électorale. Plusieurs facteurs se combinent, citons le poids équivalent des circonscriptions, le nombre important de symboles et leurs faibles différences de taille.

Certes la nature de l’information n’est pas la même mais sur un plan strictement graphique – et n’est-ce pas l’objectif visé ? – les cartes en dégradés de couleur se montrent ici bien plus efficaces et rapides à interpréter, l’information étant “simplifiée” par l’agrégation en classes. Les deux cartes ci-dessous, extraites du projet kh partagé plus haut, l’illustrent :

 

Classes et comparaisons possibles

Faire des classes nécessite de choisir une méthode pour découper la série (la “discrétisation”). La sélection se fait selon le profil de la série – la dispersion par exemple – mais aussi du message à transmettre ou de la comparaison envisagée.

En la matière, Khartis ne propose pour l’instant que des méthodes statistiques (on ne peut pas entrer manuellement les valeurs des seuils). Elles restent néanmoins appropriées pour “voir la géographie” du vote pour un candidat, on pense notamment aux méthodes des quantiles ou des moyennes. En revanche, la comparaison de plusieurs candidats n’est pas envisageable. Il faut pour cela utiliser une légende commune dont les seuils des classes sont calculés sur l’ensemble de la série.

Ces deux approches (échelle propre et échelle commune) qui présentent chacune leur intérêt, sont respectivement illustrées par les deux planches ci-dessous. La première a été réalisée avec Khartis, la seconde avec Magrit.


Le maillage territorial du vote – en attendant le premier tour, 1/3

À quelques jours du premier tour de l’élection présidentielle, l’Atelier de cartographie de Sciences Po propose de brefs articles autour de la dimension cartographique de ce sujet. Cela permet d’éclairer certains points méthodologiques, de proposer des données et des fonds de cartes ainsi que de suggérer des usages immédiats avec Khartis.

Le premier article porte sur le matériel préalable à toute cartographie électorale : les unités géographiques du vote. Elles sont importantes puisqu’elles conditionnent la structure du fond de carte et des données.

 

Bureaux, circonscriptions, départements et nation

Le résultat de l’élection présidentielle s’applique au niveau national, le territoire français constituant alors l’unique circonscription. À des fins d’analyse, on peut avantageusement jouer avec les échelles dont les différents niveaux “s’emboîtent” géographiquement. Les voix ne sont comptabilisées qu’à l’échelon le plus fin, celui des bureaux de vote. Le résultat national résulte donc d’une vaste somme des étages inférieurs.


>> fichier original en svg (circonscriptions et départements).

 

Le fond de carte des circonscriptions de 2017

Nous optons pour le premier niveau agrégé, celui des circonscriptions législatives. Observer le vote à cette échelle présente un équilibre intéressant car il permet une vision d’ensemble au niveau national tout en conservant les détails et aspérités plus locales. Pour les autres niveaux, d’une part les bureaux de vote sont très nombreux, malgré leur pertinence pour l’analyse sociologique ; et d’autre part les départements proposent une géographie très agrégée, trop simplificatrice.

À l’heure de l’open data, on déplore l’absence de fond de carte officiel de référence sur les circonscriptions qui soit à la fois précis, libre et exploitable. Après un travail de nettoyage, d’adaptation et de vérification des données de toxicode, nous proposons un fichier qui fonctionne ! Attention, ce fond ne couvre pas les territoires d’outre-mer (TOM) ni les français votant de l’étranger.

>> fichiers shapefile ou geojson du fond de carte par circonscription (aussi sur data.gouv.fr)

 

Équivalence des circonscriptions, contrastes entre départements

Au plan cartographique, le choix des circonscriptions a deux conséquences.

D’abord, leur tracé est parfois biscornu car leur découpage est en soi un enjeu politique. Ensuite, le nombre d’inscrits dans chaque circonscription s’avère relativement homogène, la dimension démographique étant un des critères. Ainsi, les départements les moins peuplés (Creuse, Lozère) ne comptent qu’une seule circonscription quand le plus habité (Nord) en rassemble plus d’une vingtaine. Nous verrons dans un article à venir que cette homogénéité peut réduire l’efficacité de certaines cartes en points proportionnels.

Les deux cartes simples ci-après, entièrement réalisées avec Khartis, illustrent ces deux aspects.

>> fichier original en svg ou projet khartis

 

>> fichier original en svg ou projet khartis, données csv