Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_4 [2016/01/05 17:46] Francesco Beretta [Exploration du lexique des notices] |
td_histoire_numerique:exercice_4 [2016/01/05 18:08] Francesco Beretta [Encodage des notices] |
||
---|---|---|---|
Ligne 33: | Ligne 33: | ||
{{ :td_histoire_numerique:graph_simi_9.png?200 |}} | {{ :td_histoire_numerique:graph_simi_9.png?200 |}} | ||
- | Une autre {{:td_histoire_numerique:liste_notices_bnf_cooccurrences_iramuteq.svg.zip|représentation graphique}} plus complète qu'on peut télécharger, dézipper et ouvrir dans un navigateur web. | + | Voici une autre {{:td_histoire_numerique:liste_notices_bnf_cooccurrences_iramuteq.svg.zip|représentation graphique}} plus complète qu'on peut télécharger, dézipper et ouvrir dans un navigateur web. |
- | Grâce à cette exploration du vocabulaire des notices on voit apparaître des 'profils' ou des 'domaines d'activité' dont les effectifs sont proportionnels à la fréquence des lemmes et des cooccurrences dans les notices, ce qui est mis en évidence dans le graphique: les mathématiciens avec toutes les autres professions qui leur sont associées; les enseignants (professeurs) avec les disciplines et institutions associées; le 'monde' des libraires et des imprimeurs dont on dévine grâce à la représentation visuelle de la fréquence des lemmes la proportion inférieure dans la population; le profil des astronomes en lien avec les observatoires et les géographes; le monde des académies. | + | Grâce à cette exploration du vocabulaire des notices on voit apparaître des 'profils' ou des 'domaines d'activité' dont les effectifs sont proportionnels à la fréquence des lemmes et des cooccurrences dans les notices (ce qui est mis en évidence dans le graphique par la taille des caractères): les mathématiciens avec toutes les autres professions qui leur sont associées; les enseignants (professeurs) avec les disciplines et institutions associées; le 'monde' des libraires et des imprimeurs dont on dévine grâce à la représentation visuelle de la fréquence des lemmes la proportion inférieure dans la population; le profil des astronomes en lien avec les observatoires et les géographes; le monde des académies. |
===== Encodage des notices ===== | ===== Encodage des notices ===== | ||
- | Cette première exploration permet de décider, en fonction de la problématique de recherche, les caractéristiques et propriété qu'on souhaitera encoder à fin d'établir un profil plus précis de la population. A titre d'exemple, ont été encodées les mentions des professions les plus fréquentes (supérieures à 20 mentions) ainsi que toutes les dates. Comme en règle générale la notice contient la date de naissance, du moins approximative, on peut dater la génération d'appartenance des acteurs qui composent la population. | + | Cette première exploration permet de décider, en fonction de la problématique de recherche, les propriétés qu'on souhaitera encoder à fin d'établir un profil plus précis de la population et de ses caractéristiques. A titre d'exemple, ont été encodées les mentions des professions les plus fréquentes (supérieures à 20 mentions) ainsi que toutes les dates. Comme en règle générale la notice contient la date de naissance, du moins approximative, en première position, on peut dater la génération d'appartenance des acteurs qui composent la population. |
<code> | <code> | ||
Ligne 49: | Ligne 49: | ||
{/ud} | {/ud} | ||
</code> | </code> | ||
+ | |||
+ | La méthode d'encodage appliquée est celle présentée dans le [[td_histoire_numerique:exercice_2#principes_d_annotation|deuxième exercice]]. Le document encodé est {{:td_histoire_numerique:liste_notices_bnf_annote_lieux_professions.odt|accessible ici}}. Le codage a été effectué de manière semiautomatique, en partant | ||
===== Exploration du contenu encodé ===== | ===== Exploration du contenu encodé ===== | ||