Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_4

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
td_histoire_numerique:exercice_4 [2016/01/05 17:48]
Francesco Beretta [Exploration du lexique des notices]
td_histoire_numerique:exercice_4 [2016/01/05 18:13]
Francesco Beretta [Encodage des notices]
Ligne 39: Ligne 39:
 ===== Encodage des notices ===== ===== Encodage des notices =====
  
-Cette première exploration permet de décider, en fonction de la problématique de recherche, les caractéristiques et propriété ​qu'on souhaitera encoder à fin d'​établir un profil plus précis de la population. A titre d'​exemple,​ ont été encodées les mentions des professions les plus fréquentes (supérieures à 20 mentions) ainsi que toutes les dates. Comme en règle générale la notice contient la date de naissance, du moins approximative,​ on peut dater la génération d'​appartenance des acteurs qui composent la population. ​+Cette première exploration permet de décider, en fonction de la problématique de recherche, les propriétés ​qu'on souhaitera encoder à fin d'​établir un profil plus précis de la population ​et de ses caractéristiques. A titre d'​exemple,​ ont été encodées les mentions des professions les plus fréquentes (supérieures à 20 mentions) ainsi que toutes les dates. Comme en règle générale la notice contient la date de naissance, du moins approximative, en première position, on peut dater la génération d'​appartenance des acteurs qui composent la population. ​
  
 <​code>​ <​code>​
Ligne 49: Ligne 49:
 {/ud} {/ud}
 </​code>​ </​code>​
 +
 +La méthode d'​encodage appliquée est celle présentée dans le [[td_histoire_numerique:​exercice_2#​principes_d_annotation|deuxième exercice]]. Le document encodé est {{:​td_histoire_numerique:​liste_notices_bnf_annote_lieux_professions.odt|accessible ici}}. Le codage a été effectué de manière semiautomatique,​ en partant des formes associées à chaque lemme. De cette manière les variantes ortographiques ont été prises en compte en les associant au même identifiant de la base de données. Afin de compléter le codage, on a également commencé à baliser les enseignements des différentes disciplines,​ car un peut admettre que "​Professeur de mathématiques"​ est équivalent à "​mathématicien"​. Mais cette demarche demande du temps car les formulations sont très variées et un codage manuel s'​avère indispensable. Les mêmes considérations s'​appliquent aux lieux de naissance.
 ===== Exploration du contenu encodé ===== ===== Exploration du contenu encodé =====
  
  
td_histoire_numerique/exercice_4.txt · Dernière modification: 2016/03/03 10:26 par Francesco Beretta