Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_4 [2016/01/05 19:01] Francesco Beretta [Exploration du contenu encodé] |
td_histoire_numerique:exercice_4 [2016/01/05 19:18] Francesco Beretta [Exploration du contenu encodé] |
||
---|---|---|---|
Ligne 87: | Ligne 87: | ||
Les requêtes SQL peuvent être intégrées directement dans des scripts du logiciel R grâce à la bibliothèque "RPostgreSQL". Dans le projet R ci-joint, on trouvera quelques exemples d'exploration et de visualisation des données. Il faut d'abord ajouter ses propres paramètres de connexion (adresse de la base de données, login et mot de passe) dans le document "connexion_postgresql.R", puis exécuter ce script afin d'ouvrir une connexion avec la base de données qui pourra ensuite être appelée depuis les autres scripts. | Les requêtes SQL peuvent être intégrées directement dans des scripts du logiciel R grâce à la bibliothèque "RPostgreSQL". Dans le projet R ci-joint, on trouvera quelques exemples d'exploration et de visualisation des données. Il faut d'abord ajouter ses propres paramètres de connexion (adresse de la base de données, login et mot de passe) dans le document "connexion_postgresql.R", puis exécuter ce script afin d'ouvrir une connexion avec la base de données qui pourra ensuite être appelée depuis les autres scripts. | ||
- | Le script "exploration_notices.R" permet d'afficher un histogramme des générations de mathématicien et astronomes avec un pas de 25 ans. | + | Le script "exploration_notices.R" permet d'afficher un histogramme qui représente les générations de mathématiciens et astronomes avec un pas de 25 ans. |
{{ :td_histoire_numerique:r_generations.jpg?300 |}} | {{ :td_histoire_numerique:r_generations.jpg?300 |}} | ||
- | On constate ainsi que ... | + | On constate ainsi que la portion des individus nés avant 1450 est très faible par rapport à l'ensemble de la population. Ceci invite à restreindre l'analyse suivante, qui représente les effectifs de professions encodées sous forme de "boîte à moustaches" (boxplot), aux individus nés après 1400. |
+ | {{ :td_histoire_numerique:r_boxplot_soch.jpg?300 |}} | ||
+ | Cette visualisation permet de prendre rapidement la mesure de la distribution dans le temps des professions et de leurs effectifs. Cette exploration est effectuée dans le script "exploration_caracteres_sociaux.R" du projet R. | ||
+ | |||
+ | Enfin, on peut explorer les relations entre professions dans les notices, sous forme de fréquences de cooccurrences, en utilisant une requête SQL/XPath et une visualisation qui utilise des techniques d'analyse de réseaux. |