Crédit : Phongphan/Shutterstock.


Ressources pédagogiques

Recherche et usage des statistiques sur l’international et le mondial

Benoît Martin

Benoît Martin
Publié le 7
/09/2017

▾ English version below 


Remarques préalables

Les « données » (tableaux de statistiques, data, big data) font aujourd’hui partie des outils d’analyse des chercheurs en sciences sociales (saisir une réalité sociale par des chiffres), des experts et des concepteurs de politiques publiques (gouverner en s’appuyant sur les données). Facilement accessibles elles sont également utilisées pour l’information, la communication et la vulgarisation auprès du grand public.

Face à cette prolifération d’accès et d’usage, il est nécessaire d’être vigilant et de mettre en place de bons réflexes d’analyse critique. En effet, ces données ne sont pas la réalité et n’ont que l’apparence de la neutralité. Il s’agit de constructions complexes, issues de chaînes de production parfois longues et qui impliquent des auteurs variés.

Les données sur l’international sont majoritairement construites par agrégation de statistiques nationales, rares sont celles qui ont été initiées à un niveau international (comme l’IDH du PNUD- créé en 1990). Si les Organisations internationales – avec les contraintes liées à leur fonctionnement interétatique) restent les principales productrices de données, bien que les ONG construisent des indicateurs pour défendre leur cause, et les centres de recherche et think tanks développent leur expertise en s’appuyant sur des indicateurs qu’ils construisent. Ces auteurs/acteurs statistiques peuvent coopérer ou être en concurrence. Dans tous les cas, ces données « inter-nationales » peinent encore à rendre compte de façon fine des enjeux véritablement mondiaux et transnationaux.

Les choix de définitions, d’unités de mesure, de méthodes d’homogénéisation, de pondérations, d’agrégation, de construction de modèles statistiques… doivent donc être analysés avec précision en amont de l’utilisation des données. Il s’agit alors de les considérer à la lumière de leurs auteurs, du contexte de leur conception, de leur production et de leurs usages (institutionnel, politique, idéologique et technique).

Au cours des 3 années de formation au Collège universitaire, les données quantitatives sur l’international se rencontrent dans trois types de situations :

  • chercher et traiter des données quantitatives pour démontrer/vérifier/illustrer,
  • trouver des données quantitatives au cours de lectures de tous types,
  • construire un tableau avec ses propres données.

Réflexes indispensables

Pour pouvoir aborder et utiliser une base de données, il est nécessaire :

  • d’identifier l’auteur (individuel ou collectif), la date et le contexte de production (rapport annuel, publication exceptionnelle…),
  • de vérifier qu’il s’agit de l’intégralité du jeu de données ou d’une extraction délibérée, susceptible d’en modifier le sens,
  • de savoir avec précision de quoi il est question (définitions, glossaire et mode de calculs doivent être fournis) et dans quelle temporalité (dernières dates disponible seulement ou séries historiques),
  • de s’interroger sur les unités (monnaie courante ou constante, parité de pouvoir d’achat…) et sur les agrégats (des données ou des unités géographiques),
  • de ne pas isoler une donnée de son contexte et de croiser les sources, en fonction des définitions et des producteurs de données (ce qui peut réserver bien des surprises),
  • de toujours être dans une posture comparative dans le temps et dans l’espace (à toutes les échelles), mais en ne comparant que ce qui est comparable (donc calculer des taux par exemple, utiliser une base 100, etc.),
  • d’enregistrer toutes les métadonnées,
  • et enfin, pour les grandes données de référence en sciences sociales, de les stocker de façon ordonnée et indépendante de l’exercice particulier qui a occasionné la recherche, afin de constituer progressivement un ensemble documentaire personnel et transdisciplinaire auquel il est facile de revenir au cours des 3 années.

Researching and using statistics on international and global issues 


Preliminary remarks

« Data » (statistical charts, data, big data) have become part of the analytical tools used by social science researchers to capture social realities through statistics, and by public policy makers and experts (governing by using data). Easily accessible, they are also used for information, communication and popularization among the general public.

In the face of this proliferation of access and use, it is important to be vigilant and to develop solid critical analysis reflexes. Indeed, such data do not represent reality and are neutral only in appearance. They are complex constructions produced by sometimes long production chains that involve different authors.

International data are mainly constructed by aggregating national statistics; they are rarely initiated at an international level (such as the UNDP’s HDI – created in 1990). International Organizations – with the restrictions linked to their interstate functioning – remain the main producers of data. NGOs construct indicators to defend their cause, and research centers and think tanks develop their expertise based on indicators they also construct. These statistic authors/actors may collaborate or be in competition. In any case, these « inter-national » data are still struggling to give a precise picture of truly global and transnational issues.

The choices of definitions, units of measurement, homogenization methods, weighting, aggregation, and construction of statistic models all must therefore be analyzed with precision before data is used. They must be considered in the light of the authors, the context of its design, production and usage (institutional, political, ideological and technical).

During the 3 years of training at the Undergraduate College, international quantitative data are found in three types of situations:

  • seeking and processing quantitative data to demonstrate/check/illustrate,
  • finding quantitative data throughout various readings,
  • constructing a chart using one’s own data.

Essential reflexes

To approach and use a database, one must

  • identify the author (single or collective), the date and the context of its production (annual report, one-off publication…)
  • check whether it is a complete data set or a deliberate extraction that might modify the meaning,
  • know exactly what it represents (definitions, glossary and calculation methods must be provided) and in which time frame (latest available dates only or historical series),
  • examine the units (current or constant currency, purchasing power parity…) and the aggregates (geographical data or units),
  • not isolate data from its context and cross-reference the sources according to definitions and producers of data (which can sometimes be surprising),
  • always take a comparative stance with regard to time and space (on every scale), but only compare what is comparable (so calculate rates for example, use a base of 100, etc.),
  • record all metadata,
  • and finally, for major social science master data, store them in an orderly fashion, independent from the particular exercise that brought about the research in order to progressively constitute a personal and interdisciplinary document that is easy to refer to over the course of the 3 years.