Accueil>Curathon Paris 2026 : une journée de formation et échanges de bonnes pratiques en lien avec la gestion des données de la recherche en SHS

6 mai 2026

Curathon Paris 2026 : une journée de formation et échanges de bonnes pratiques en lien avec la gestion des données de la recherche en SHS

À propos de cet événement

Le 06 mai 2026 de 09:30 à 16:00

Salle K011

1 pl. Saint-Thomas-d'Aquin, 75007, Paris

Organisé par

CDSP and Centre d'histoire de Sciences Po

Le CDSP diffuse des données de la recherche depuis plus de 20 ans. Entrepôt thématique de confiance du CoSO et certifié CoreTrustSeal depuis 2023, la Banque de données du CDSP est le seul entrepôt français spécialisé en science politique. Elle accueille également des données issues des sciences sociales et des résultats d’élections.

Dans le cadre du Printemps de la Donnée 2026, et pour participer à la journée nationale pour la curation des données de recherche organisée par Recherche Data Gouv, le CDSP organise, en collaboration avec le Centre d’histoire de Sciences Po, un curathon qui se tiendra sur le campus Saint‑Thomas le mercredi 6 mai 2026.

L’objectif est de réunir des personnes impliquées, de près ou de loin, dans la curation des jeux de données : chercheurs déposants souhaitant améliorer la qualité de la documentation de leurs jeux de données, personnels d’appui à la recherche, gestionnaires d’entrepôts de données, membres des centres de compétences, etc. .

L’édition locale vise à renforcer les compétences en curation, à améliorer la qualité documentaire des jeux de données et à favoriser le partage de pratiques entre professionnels et chercheurs. La journée débutera avec une matinée en plénière et continuera l’après-midi avec plusieurs ateliers concurrents.

Matinée plénière (K011)

 À partir de 9h30 : Accueil café

10h00 - 10h10 : Introduction, Emiliano Grossman (Sciences Po, Centre de données socio-politiques (CDSP), CNRS)

10h10 - 10h30

Le CDSP est engagé dans la science ouverte depuis 2005. Forts de près de vingt ans d’expérience dans la valorisation des données de la recherche, ses ingénieur·es ont élaboré plusieurs guides à destination des déposant·es, portant sur :

  • l’anonymisation des données de la recherche  en SHS,
  • le respect des conditions juridiques liées au partage des données en SHS,
  • la préparation des données et des métadonnées en vue de leur diffusion.

Par ailleurs, le CDSP bénéficie d’un financement ANR pour le projet FAIRwDDI, dont le deuxième workpackage est consacré à la création d’un guide dédié au standard de métadonnées Data Documentation Initiative (DDI). La présentation donnera un aperçu de l’ensemble de ces ressources, qui seront prochainement mises en ligne sur le site du CDSP et, pour certaines, sur la plateforme DORANUM.

10h30 - 10h50

Dans le cadre de la Science Ouverte, les entrepôts de données doivent garantir confiance et qualité pour leurs utilisateurs et financeurs. La certification CoreTrustSeal offre un cadre international fondé sur des critères organisationnels, techniques et documentaires assurant un accès fiable et durable aux données. 

Cette présentation introduit les principes de CoreTrustSeal, situe cette certification dans le paysage existant - notamment en SHS - et met en évidence ses bénéfices, notamment en matière d’amélioration continue. Elle illustre également son adoption en France et son impact sur les pratiques des équipes de gestion et de curation des données.

10h50 - 11h10

Le réseau RésIn rassemble les ingénieur·es et personnels d’appui à la recherche de Sciences Po et de l’Université Paris Cité, avec l’ambition de structurer, valoriser et renforcer cette communauté professionnelle au cœur de la production scientifique. En s’appuyant sur une dynamique inter‑établissements, RésIn développe des espaces d’échange, de formation et de mutualisation autour des pratiques méthodologiques, des outils et des savoir-faire. Ses actions - séminaires, ateliers, annuaire des compétences, liste de diffusion et journées d’étude - contribuent à professionnaliser les pratiques, soutenir l’innovation et rendre visibles les métiers de l’ingénierie de recherche. Cette présentation sera dédiée à la découverte du réseau et de ses principales activités.

 

11h10 - 11h30 : Pause

 

11h30 - 11h50

L'entrepôt Quetelet-Progedo est un entrepôt de données en sciences humaines et sociales géré par l'IR* Progedo. Il accueille en particulier les données issues de la statistique publique (données de l'Insee et des services statistiques ministériels), ainsi que des données issues d'enquêtes de recherche. On y trouve à la fois des données individuelles, mais aussi des données agrégées, en particulier issues du recensement, de l'état civil et des grandes bases administratives de l'Insee. 

Ces données sont documentées au sein de Progedo, selon le standard DDI, par une équipe de 5 curateurs et curatrices de métadonnées. Leur méthodologie de travail ainsi que les enjeux liés à la documentation et la gestion des demandes d'accès à ces données seront présentés.

11h50 - 12h10

La présentation propose une présentation du site de visualisation et d'analyse de données politiques, DataV. Développé au CDSP, DataV propose à la communauté scientifique un ensemble de jeux de données politiques sur la 5ème République et l'Union Européenne. 

Grâce à des fonctionnalités développées par les ingénieurs et les développeurs du CDSP, les chercheurs, enseignants, doctorants intéressés peuvent personnaliser leurs recherches. La présentation montrera également à l'aide d'une démonstration  comment les utilisateurs peuvent s'approprier cet outil et proposer  de nouvelles perspectives et thématiques de recherches.

12h10 - 12h30

Ce retour d’expérience présente l’accompagnement d’une ingénieure dans le dépôt, à la Banque de données du CDSP, de trois enquêtes du CERAPS menées par Tristan Haute et Emma Nemesien dans le cadre du projet CERTES. 

Il s’appuie sur un travail en plusieurs étapes, combinant formation au data management avec une attention particulière portée à l'anonymisation des données. Ce retour met en avant l’importance de la collaboration entre chercheurs et ingénieurs de données : dans ce cas, les échanges ont été réguliers, les recommandations bien prises en compte, et une relation de confiance s’est installée tout au long du processus jusqu'au dépôt final. Cette dynamique a contribué à la qualité de la curation et à la réutilisabilité des données en SHS.

Ateliers 

14h00 - 16h00 (K319)

Vous vous êtes déjà demandés à quoi servent les métadonnées ? Qu’est-ce que les données de la recherche et pourquoi et comment les rendre FAIR ? Que vous soyez professionnel de la donnée, chercheur, ou juste curieux, cet atelier est pour vous.


Nous allons aborder la question des données FAIR de la recherche à travers une introduction au standard ISO DDI (Data Documentation Initiative), largement utilisé pour la valorisation et la diffusion des données en sciences humaines et sociales.

En partant d’exemples concrets et d’exercices, vous découvrirez DDI et comment ce standard peut vous être utile dans le cadre de vos projets de valorisation des données de la recherche.
 

14h00 - 16h00 (K011)

Cet atelier pratique est destiné aux utilisateurs de l'entrepôt Recherche Data Gouv, tous domaines confondus, ayant déjà une connaissance du formulaire de dépôt. Il s'adresse en priorité aux curateurs d'espaces institutionnels, et est également ouvert aux déposants souhaitant se familiariser avec les bonnes pratiques.

Au programme : focus sur les métadonnées clés, panorama des ressources utiles et initiation à la rédaction de rapports de curation.
 

14h00 - 16h00 (CS16)

L'atelier a pour objectif de proposer un accompagnement autour de problèmes d'anonymisation des données quantitatives rencontrés dans les projets de recherche, que ces problèmes soient d'ordre conceptuel (identification de quasi-identifiants ou de variables sensibles) ou technique (mise en œuvre programmatique d'un protocole d'anonymisation).

Il est construit autour de deux temps. D'abord une présentation qui reprendra les définitions et notions importantes à connaître pour mettre en place un protocole d'anonymisation, ainsi qu'un rappel rapide des méthodes utilisées pour anonymiser des données quantitatives. Le reste de l'atelier sera sous le format "bring your own data" : vous êtes invité·es à venir avec vos données, vos questions et difficultés, les intervenant·es seront présent·es afin de vous accompagner pour trouver des solutions, et faire avancer vos traitements de données à des fins d'anonymisation. En particulier, Julie et Lucas pourront :

  • Aider au choix de quasi-identifiants (variables qui posent un risque de ré-identification), et à l'identification de variables sensibles ;
  • Accompagner la prise en main de sdcMicro ou la mise en œuvre (avec R) de traitements d'anonymisation ;
  • Accompagner à la documentation des opérations d'anonymisation.

Informations pratiques

L’événement aura lieu le mercredi 6 mai 2026, de 9h30 à 16h00, en salle K011, au 1 place Saint-Thomas-d’Aquin, 75007 Paris.

L’inscription est obligatoire.

 

 

 

Légende de l'image de couverture : Données open source (crédits : Caroline Maufroid_Sciences Po)

À propos de cet événement

Le 06 mai 2026 de 09:30 à 16:00

Salle K011

1 pl. Saint-Thomas-d'Aquin, 75007, Paris

Organisé par

CDSP and Centre d'histoire de Sciences Po