Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_4 [2016/01/05 19:03] Francesco Beretta [Exploration du contenu encodé] |
td_histoire_numerique:exercice_4 [2016/01/05 19:21] Francesco Beretta [Exploration du contenu encodé] |
||
---|---|---|---|
Ligne 89: | Ligne 89: | ||
Le script "exploration_notices.R" permet d'afficher un histogramme qui représente les générations de mathématiciens et astronomes avec un pas de 25 ans. | Le script "exploration_notices.R" permet d'afficher un histogramme qui représente les générations de mathématiciens et astronomes avec un pas de 25 ans. | ||
{{ :td_histoire_numerique:r_generations.jpg?300 |}} | {{ :td_histoire_numerique:r_generations.jpg?300 |}} | ||
- | On constate ainsi que la portion des individus nés avant 1450 est très faible par rapport à l'ensemble de la population. | + | On constate ainsi que la portion des individus nés avant 1450 est très faible par rapport à l'ensemble de la population. Ceci invite à restreindre l'analyse suivante, qui représente les effectifs de professions encodées sous forme de "boîte à moustaches" (boxplot), aux individus nés après 1400. |
+ | {{ :td_histoire_numerique:r_boxplot_soch.jpg?300 |}} | ||
+ | Cette visualisation permet de prendre rapidement la mesure de la distribution dans le temps des professions et de leurs effectifs. Cette exploration est effectuée dans le script "exploration_caracteres_sociaux.R" du projet R. | ||
+ | |||
+ | Enfin, on peut explorer les relations entre professions dans les notices, sous forme de fréquences de cooccurrences, en utilisant une requête SQL/XPath et une visualisation qui utilise des techniques d'analyse de réseaux. | ||
+ | {{ :td_histoire_numerique:r_reseau_cooccurrences.jpg?300 |}} |