Table des matières

Francesco Beretta, TD "Outils numériques pour les historiens"

Cours dispensé à l'Université Lyon 3, Master I Histoire – Année 2015-2016, avec compléments et ajouts

Licence Creative Commons Le cours "Outils numériques pour les historiens" de Francesco Beretta, avec tous les documents, fichiers et scripts associés, est mis à disposition selon les termes de la licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International.

Introduction

Ce cours a pour but de permettre aux étudiants en master de prendre en main quelques outils informatiques permettant le stockage et l'exploitation des informations issues de sources historiques et de la bibliographie. Il est conçu comme support à l'initiation à la recherche en histoire et à la rédaction du mémoire de master.

Il s'agit tout d'abord de recenser les informations qu'on souhaite collecter en rapport avec les différents types de sources qui seront dépouillées (archives, textes, images, etc.), et de s'interroger en même temps sur la problématique de recherche et sur les questionnements qu'elle implique: voudra-t-on afficher la chronologie d'événements, ou les cartographier, ou soumettre une population à des analyses quantitatives, ou étudier la dynamique d'un réseau de correspondants, ou analyser le lexique utilisé dans un ensemble de récits ?

En fonction de la finalité de la recherche, on va choisir la/les technique/s de stockage des données la/les plus appropriées (simple texte, texte annoté, base de données) et on va construire un modèle sémantique qui permet de transformer les informations textuelles en données, celles-ci étant susceptibles d'être exploitées par les logiciels de cartographie, statistique, analyse des réseaux, etc. Les logiciels retenus seront de préférence libres et open-source.

Le cours est construit à partir d'exemples simples et fournit aux étudiants un outillage leur permettant de gérer leurs propres données. Cette démarche invite en même temps à s'interroger sur le rapport entre sources, informations qu'on en tire et problématique de recherche, et à prendre conscience du potentiel méthodologique que les outils numériques comportent pour le chercheur en histoire.

L'objectif du cours est d'amener les étudiants à rédiger leur travail de master en utilisant des données saisies dans un système d'information numérique tout en prenant connaissance des méthodes et technologies actuellement disponibles.

Un suivi est assuré par l'enseignant après la fin du cours (personnellement ou avec l'aide des autres membres du Pôle histoire numérique du LARHRA), en vue de l'extraction des données et de leur utilisation pour la rédaction du mémoire.

Documents:


Logiciels utilisés

En accédant aux différentes pages ci-dessous, on trouvera les liens pour le téléchargement des logiciels qui seront utilisés, avec les instructions pour l'installation et quelques indications supplémentaires.

Logiciels à installer

Zotero: un indispensable logiciel de gestion de la bibliographie

LibreOffice: une suite bureautique ouverte et performante.

PostgreSQL: un logiciel de bases de données performant et libre

R, logiciel de traitement de données

TXM, logiciel de textométrie

Exercices

Premier exercice

Problématique de la recherche. Reconnaissance et classement d'objets dans un texte.
Descriptif de l'exercice

Deuxième exercice

Annotation sémantique d'un texte
Descriptif de l'exercice

Troisième exercice

Mise en place d'une base de données permettant de créer les identifiants des objets et, ensuite, d'annoter les textes.
Descriptif de l'exercice

Quatrième exercice

Annotation semi-automatique de notices biographiques et extraction de connaissances.
Descriptif de l'exercice

Cinquième exercice

Production de données structures par annotation ou extraction manuelle à partir de notices biographiques.
Descriptif de l'exercice


Années précédentes

On trouvera ici le wiki des années précédente.