Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_4

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Dernière révision Les deux révisions suivantes
td_histoire_numerique:exercice_4 [2016/01/05 20:00]
Francesco Beretta [Exploration avec le logiciel R]
td_histoire_numerique:exercice_4 [2016/01/05 22:56]
Francesco Beretta [Transformation vers un texte en format XML]
Ligne 57: Ligne 57:
 En appliquant la méthode présentée dans le [[td_histoire_numerique:​exercice_3#​transformation_des_textes_encodes_en_xml|troisième exercice]], nous avons copié le texte encodé qui se trouve dans le document "​liste_notices_BNF_annote_lieux_professions.odt"​ et nous l'​avons collé dans l'​objet 36 de la base de données, un objet de type "objet digital"​ intitulé "​Notices BNF avec annotation sémantique"​. Nous avons ensuite exécuté cette transformation:​ En appliquant la méthode présentée dans le [[td_histoire_numerique:​exercice_3#​transformation_des_textes_encodes_en_xml|troisième exercice]], nous avons copié le texte encodé qui se trouve dans le document "​liste_notices_BNF_annote_lieux_professions.odt"​ et nous l'​avons collé dans l'​objet 36 de la base de données, un objet de type "objet digital"​ intitulé "​Notices BNF avec annotation sémantique"​. Nous avons ensuite exécuté cette transformation:​
 <code html>​SELECT vues.transformation_xml(36)</​code>​ <code html>​SELECT vues.transformation_xml(36)</​code>​
-qui produit le texte XML dans le champs "​texte_xml"​.+qui produit le texte XML inséré ​dans le champs "​texte_xml" ​du même objet.
  
 En combinant les requêtes XPath et SQL, on peut désormais explorer les textes encodés. En combinant les requêtes XPath et SQL, on peut désormais explorer les textes encodés.
Ligne 101: Ligne 101:
  
 Enfin, on peut explorer les relations entre professions dans les notices, sous forme de fréquences de cooccurrences,​ en utilisant une requête SQL/XPath et une visualisation qui utilise des techniques d'​analyse de réseaux. Enfin, on peut explorer les relations entre professions dans les notices, sous forme de fréquences de cooccurrences,​ en utilisant une requête SQL/XPath et une visualisation qui utilise des techniques d'​analyse de réseaux.
 +
 \\ \\
 {{ :​td_histoire_numerique:​r_reseau_cooccurrences.jpg?​300 |}} {{ :​td_histoire_numerique:​r_reseau_cooccurrences.jpg?​300 |}}
 Ce graphique représente une analyse équivalente à l'​analyse des similitudes des notices fondée sur les cooccurrences des lemmes effectuée ci-dessus avec le logiciel Iramuteq. Toutefois, elle est beaucoup plus précise dans la mesure où elle resulte de l'​encodage des concepts dans les textes. Ce travail d'​identification des entités nommées, en lien avec la base de données, ajoute une dimension sémantique résultant de l'​analyse du texte, et de son encodage, par le chercheur. De cette analyse des propriétés structurales et représentation graphique des relations entre concepts apparaît entre autres que les professions plus '​marginales',​ par ex. les cartographes,​ les architectes et les libraires, moins représentées en termes d'​effectifs dans la population que les mathématiciens et les astronomes (comme le montre le boxplot précédent) sont plus connectés avec l'​ensemble des autres professions,​ ce qui apparaît de leur degré de centralité représenté par le diamètre des sommets. Ce graphique représente une analyse équivalente à l'​analyse des similitudes des notices fondée sur les cooccurrences des lemmes effectuée ci-dessus avec le logiciel Iramuteq. Toutefois, elle est beaucoup plus précise dans la mesure où elle resulte de l'​encodage des concepts dans les textes. Ce travail d'​identification des entités nommées, en lien avec la base de données, ajoute une dimension sémantique résultant de l'​analyse du texte, et de son encodage, par le chercheur. De cette analyse des propriétés structurales et représentation graphique des relations entre concepts apparaît entre autres que les professions plus '​marginales',​ par ex. les cartographes,​ les architectes et les libraires, moins représentées en termes d'​effectifs dans la population que les mathématiciens et les astronomes (comme le montre le boxplot précédent) sont plus connectés avec l'​ensemble des autres professions,​ ce qui apparaît de leur degré de centralité représenté par le diamètre des sommets.
  
td_histoire_numerique/exercice_4.txt · Dernière modification: 2016/03/03 10:26 par Francesco Beretta