Utiliser des données de la statistique publique comme données de cadrage pour sa thèse en SHS
Résumé de la formation
La statistique publique française et européenne développée depuis la seconde moitié du XXe siècle comporte de nos jours une vaste palette de jeux de données d’enquête, de recensement, mais aussi de données administratives, qui couvrent la plupart des champs d’étude des Sciences Humaines et Sociales. Chaque sujet de recherche porte sur une population, un territoire, et il est utile pour le raisonnement et la démonstration scientifique de pouvoir les situer dans un ensemble plus vaste ou d’en préciser les effectifs.
Objectifs de la formation
Cette formation est destinée à un public de doctorant·e·s en SHS peu ou pas familier des méthodes quantitatives. Elle vise à donner les outils nécessaires à l’utilisation des données publiques disponibles, en tant que données de cadrage, de contexte, pour des projets de recherche en SHS. Il s’agira dans un premier temps de montrer la variété et les opportunités qui existent aujourd’hui d’utilisation de données issues de la statistique publique ou des administrations, ainsi que de permettre à chaque doctorant·e de trouver des données intéressantes pour illustrer son travail de thèse. Dans un second temps seront enseignés les éléments théoriques et pratiques élémentaires de la statistique descriptive, dans un environnement logiciel adapté à de l’initiation (tableur…). Le troisième volet de la formation portera sur la représentation graphique et – dans une moindre mesure pour les données qui le permettent – cartographique d’analyses descriptives menées avec des données publiques. A la fin de la formation, les doctorants seront en mesure de comprendre l’intérêt de l’utilisation de données publiques comme données de cadrage pour leur travail de thèse, et d’utiliser des outils simples à cet effet.
Programme
Séance 1 (4h) : Présentation du paysage de la statistique publique
- La TGIR Progedo et le réseau des PUD : accompagner et promouvoir l’usage des enquêtes de la statistique publique
- Paysage de la statistique publique Française et internationale
- Application : recherche de données de cadrage pour sa thèse (Quételet-Progedo-Diffusion…) et accès aux données (Quételet, en open access, etc.).
Séance 2 (4h) : Initiation à la statistique descriptive
- Eléments de base de la théorie statistique (statistique descriptive, notions de statistique inférentielle, etc.)
- Manipulations essentielles : importation, conversion de format, sélection, fusion, agrégation…
- Application : exercices sur un logiciel type tableur (statistique descriptive, formules, tableaux croisés, etc.)
Séance 3 (4h) : Représenter des données statistiques et des analyses descriptives
- Représentations graphiques sur un logiciel type tableur : histogrammes, courbes, pyramide des âges, etc…
- Principes élémentaires de la représentation cartographique de données localisées avec le logiciel Magrit : données localisées disponibles (data.gouv, INSEE, etc.), fonds de cartes, sémiologie graphique, numériser sa propre carte avec Phil Digit, etc.
Formateurs et formatrices
Charlotte Dion (Ingénieure de la Plateforme Universitaire des Grands Moulins, Centre des Humanités Numériques & TGIR PROGEDO)
Informations pratiques
Pas de date prévue pour le moment
Public
Doctorants en SHS
Durée
12h
Langue
Français
Format
Présentiel
Code
HUN14
Formations dans la même catégorie
Visualiser des données en humanités numériques
Langue : français
Format : distanciel
Code : HUN10 Lire la suite Visualiser des données en humanités numériques
Transcrire des documents avec Transkribus
Langue : français
Format : distanciel
Code : HUN9 Lire la suite Transcrire des documents avec Transkribus
Faire de la fouille de données et de l’apprentissage automatique avec WEKA
Langue : français
Format : distanciel
Code : HUN8 Lire la suite Faire de la fouille de données et de l’apprentissage automatique avec WEKA
Faire des humanités numériques hier et aujourd’hui
Langue : français
Format : distanciel
Code : HUN7 Lire la suite Faire des humanités numériques hier et aujourd’hui
Valoriser la recherche avec les Data Papers
Langue : français
Format : distanciel
Code : REV19 Lire la suite Valoriser la recherche avec les Data Papers
Science ouverte : webinaire introductif
Langue : Français
Format : Distanciel
Code : SCO10 Lire la suite Science ouverte : webinaire introductif
Règles et bonnes pratiques pour une recherche conforme au RGPD
Langue : Français
Format : Présentiel
Code : GST67 Lire la suite Règles et bonnes pratiques pour une recherche conforme au RGPD
Veille informationnelle et connaissance des réseaux sociaux de la recherche en psychologie
Langue : Français
Format : Distanciel
Code : GST52 Lire la suite Veille informationnelle et connaissance des réseaux sociaux de la recherche en psychologie