Explorer et visualiser des textes en humanités
Résumé de la formation
De nombreux projets en humanités numériques reposent sur des corpus textuels qui sont traités a posteriori pour en extraire les informations linguistiques nécessaires à leur analyse.
Cette formation vise à introduire la notion de « distant reading » et grâce à l’outil Voyant Tools à familiariser les participants à différentes méthodes de fouille ainsi que de visualisation souvent utilisées en humanités numériques.
Cette formation alternera donc présentations de concepts et exercices pratiques qui permettront d’amorcer un début de réflexion sur les particularités de l’utilisation d’outils numériques pour l’analyse textuelle.
Programme
- Introduction au « distant reading »
- Présentation de l’interface de Voyant Tools
- Exploration de textes :
-
- Statistiques textuelles et nuages de mots
- Collocations
- Extraction de thèmes (topic modeling)
- Entités nommées
Formateurs et formatrices
- Suzanne Mpouli, Direction générale déléguée des bibliothèques et musées
Informations pratiques
Pas de date proposée cette année
Public
Doctorants en Sciences Humaines et Sociales
Durée
2 heures
Langue
Français
Format
Distanciel
Code
HUN3
Formations dans la même catégorie
Utiliser des données de la statistique publique comme données de cadrage pour sa thèse en SHS
Langue : français
Format : présentiel
Code : HUN14 Lire la suite Utiliser des données de la statistique publique comme données de cadrage pour sa thèse en SHS
Gestion des données de la recherche et Plan de Gestion de Données pour les doctorants en SHS
Langue : français
Format : présentiel
Code : HUN13 Lire la suite Gestion des données de la recherche et Plan de Gestion de Données pour les doctorants en SHS
Annoter ses corpus d’images avec Tropy
Langue : français
Format : distanciel
Code : HUN18 Lire la suite Annoter ses corpus d’images avec Tropy
Nettoyer et enrichir ses données avec OpenRefine
Langue : français
Format : distanciel
Code : HUN17 Lire la suite Nettoyer et enrichir ses données avec OpenRefine
Valoriser ses documents numériques avec Omeka
Langue : français
Format : distanciel
Code : HUN11 Lire la suite Valoriser ses documents numériques avec Omeka
Logiciel R/R-Studio pour le traitement statistique de données d’enquêtes – Initiation
Langue : français
Format : présentiel
Code : HUN6 Lire la suite Logiciel R/R-Studio pour le traitement statistique de données d’enquêtes – Initiation
Visualiser des données en humanités numériques
Langue : français
Format : distanciel
Code : HUN10 Lire la suite Visualiser des données en humanités numériques
Transcrire des documents avec Transkribus
Langue : français
Format : distanciel
Code : HUN9 Lire la suite Transcrire des documents avec Transkribus