Ci-dessous, les différences entre deux révisions de la page.
Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_4 [2016/01/03 14:28] Francesco Beretta créée |
td_histoire_numerique:exercice_4 [2016/01/05 11:25] Francesco Beretta [Exploration du lexique des notices] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | Cette approche correspond à un constat: souvent, les directeurs d'études demandent aux étudiants d'étudier une population d'objets (acteurs, institutions, images, concepts, édifices, ...) et d'en mettre en évidence les caractéristiques, ainsi que leur évolution dans le temps. | + | Revenir à la [[:td_histoire_numerique:accueil#quatrieme_exercice|page d'accueil]]. |
+ | |||
+ | |||
+ | <html> | ||
+ | <table><tr><td style="vertical-align: middle;"><a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Licence Creative Commons" style="border-width:0; font-size:smaller" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a> | ||
+ | </td> | ||
+ | <td> | ||
+ | <span xmlns:dct="http://purl.org/dc/terms/" property="dct:title">Le cours "Informatique pour les historiens"</span> de <span xmlns:cc="http://creativecommons.org/ns#" property="cc:attributionName">Francesco Beretta</span>, avec tous les documents, fichiers et scripts associés, est mis à disposition selon les termes de la <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International</a>.</td></tr></table> | ||
+ | </html> | ||
+ | |||
+ | ====== Annotation de notices biographiques courtes issues de la BNF ====== | ||
+ | |||
+ | Dans cet exercice, nous allons annoter les notices biographiques courtes concernant une population de 790 mathématiciens et astronomes extraites des notices d'autorité de la Bibliothèque nationale de France. | ||
+ | |||
+ | Cette approche correspond à un constat: souvent, les étudiants sont amenés à étudier une population d'objets (acteurs, institutions, images, concepts, édifices, ...) afin d'en mettre en évidence les caractéristiques ou les relations entre leurs propriétés, ainsi que leur évolution dans le temps. | ||
+ | |||
+ | On peut traiter ce type de questionnement grâce à une collection de textes courts, tirés directement des sources ou rédigés par les étudians selon les cas, qui contiennent un descriptif des caractéristiques de chaque objet. Il s'agira ensuite d'encoder dans chaque texte les concepts essentiels, en lien avec leur définition dans la base de donnée, pour classer ensuite les objets, étudier l'évolution de leur caractéristiques dans le temps ou étudier les relations entre les objets encodés. | ||
+ | |||
+ | Les 790 notices biographiques issues des notices d'autorité de la BNF permettent d'illustrer cette méthode. | ||
+ | |||
+ | ===== Exploration du lexique des notices ===== | ||
+ | |||
+ | |||
+ | Sur [[td_histoire_numerique:exercice_2&#creation_du_deuxieme_document_a_annoter|cette page]] on trouvera les indications concernant le processus d'extraction des notices du site data.bnf.fr ainsi que la production du {{:td_histoire_numerique:liste_notices_bnf.odt|document à explorer}}. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | {{ :td_histoire_numerique:graph_simi_9.png?200 |}} | ||
+ | |||
+ | Une autre {{:td_histoire_numerique:liste_notices_bnf_cooccurrences_iramuteq.svg.zip|représentation graphique}} plus complète qu'on peut télécharger, dézipper et ouvrir dans un navigateur web. | ||
+ | |||
+ | ===== Encodage des notices ===== | ||
+ | |||
+ | |||
+ | |||
+ | ===== Exploration du contenu encodé ===== | ||
+ |