Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_4

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
td_histoire_numerique:exercice_4 [2016/01/05 18:27]
Francesco Beretta [Exploration du contenu encodé]
td_histoire_numerique:exercice_4 [2016/01/05 19:21]
Francesco Beretta [Exploration du contenu encodé]
Ligne 84: Ligne 84:
          id_ud          id_ud
 </​code>​ </​code>​
 +
 +Les requêtes SQL peuvent être intégrées directement dans des scripts du logiciel R grâce à la bibliothèque "​RPostgreSQL"​. Dans le projet R ci-joint, on trouvera quelques exemples d'​exploration et de visualisation des données. Il faut d'​abord ajouter ses propres paramètres de connexion (adresse de la base de données, login et mot de passe) dans le document "​connexion_postgresql.R",​ puis exécuter ce script afin d'​ouvrir une connexion avec la base de données qui pourra ensuite être appelée depuis les autres scripts.
 +
 +Le script "​exploration_notices.R"​ permet d'​afficher un histogramme qui représente les générations de mathématiciens et astronomes avec un pas de 25 ans.
 +{{ :​td_histoire_numerique:​r_generations.jpg?​300 |}}
 +On constate ainsi que la portion des individus nés avant 1450 est très faible par rapport à l'​ensemble de la population. Ceci invite à restreindre l'​analyse suivante, qui représente les effectifs de professions encodées sous forme de "​boîte à moustaches"​ (boxplot), aux individus nés après 1400.
 +{{ :​td_histoire_numerique:​r_boxplot_soch.jpg?​300 |}}
 +Cette visualisation permet de prendre rapidement la mesure de la distribution dans le temps des professions et de leurs effectifs. Cette exploration est effectuée dans le script "​exploration_caracteres_sociaux.R"​ du projet R.
 +
 +Enfin, on peut explorer les relations entre professions dans les notices, sous forme de fréquences de cooccurrences,​ en utilisant une requête SQL/XPath et une visualisation qui utilise des techniques d'​analyse de réseaux.
 +{{ :​td_histoire_numerique:​r_reseau_cooccurrences.jpg?​300 |}}
  
td_histoire_numerique/exercice_4.txt · Dernière modification: 2016/03/03 10:26 par Francesco Beretta