Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_2

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
td_histoire_numerique:exercice_2 [2015/09/22 21:39]
Francesco Beretta
td_histoire_numerique:exercice_2 [2015/09/25 07:33]
Francesco Beretta [Création du document à annoter]
Ligne 1: Ligne 1:
 Revenir à la [[:​td_histoire_numerique:​accueil|page d'​accueil]]. Revenir à la [[:​td_histoire_numerique:​accueil|page d'​accueil]].
 +
 +\\ 
  
 ===== Création du document à annoter ===== ===== Création du document à annoter =====
  
-**Document à télécharger pour l'​exercice de mardi 22 septembre**:​ {{:​td_histoire_numerique:​liste_notices_bnf.ods|liste_notices_BNF}}+**Document à télécharger pour l'​exercice de mardi 29 septembre**:​ {{:​td_histoire_numerique:​liste_notices_bnf.ods|liste_notices_BNF.ods}}
  
-==== Requête dans les données de la Bibliothèque nationale ====+Les indications concernant ​la production du document se trouvent sur  **[[td_histoire_numerique:​creation_liste_notices_bnf|cette page]]**.
  
-On interroge le point d'accès SPARQL de la Bibliothèque nationale de France pour créer ​un ensemble de données tirées des notices d'​autoritéOuvrir l'[[http://​data.bnf.fr/​sparql/​|Editeur SPARQL ​de data.bnf.fr]] et coller dans l'espace Rêquete ​la requête ​qui suit, tout en laissant ​le format ​de sortie par défaut: HTMLLe résultat de la requête est ainsi mis en forme et peut être parcouru.+Il s'agit maintenant le créer ​le document en format texte que nous allons annoter en introduisant une indexation sémantique. 
 +  * ouvrez le document ​'liste_notices_BNF.ods' 
 +  * sélectionnez toutes les cellules ​de la colonne '​notice' ​sauf la première (qui contient ​le nom de la colonne)Pour sélectionner les cellules sélectionnez ​la première, appuyez sur la touche majuscule puis sélectionnez la dernière. 
 +  * collez le contenu du presse-papier dans un document texte vide (Writer ou Word) 
 +  * sauvegardez ce document sous le nom '​liste_notices_BNF.odt'​
  
-<​file>​ 
-PREFIX egr: <​http://​rdvocab.info/​ElementsGr2/>​ 
  
-SELECT DISTINCT ?s ?na ?fn ?annee ?pb ?gd ?bio 
- 
-WHERE 
- 
-{ { { SELECT DISTINCT ?s ?bio 
- 
-WHERE 
- 
-{ { ?s egr:​biographicalInformation ?bio 
- 
-FILTER ( contains(?​bio,​ "​mathém"​) || contains(?​bio,​ "​Mathém"​) ) 
- 
-} 
- 
-UNION 
- 
-{ ?s egr:​biographicalInformation ?bio 
- 
-FILTER ( contains(?​bio,​ "​astrono"​) || contains(?​bio,​ "​Astrono"​) ) 
- 
-} 
- 
-} 
- 
-} 
- 
-?s egr:​dateOfBirth ?bd 
- 
-OPTIONAL 
- 
-{ ?s <​http://​xmlns.com/​foaf/​0.1/​name>​ ?na } 
- 
-OPTIONAL 
- 
-{ ?s <​http://​xmlns.com/​foaf/​0.1/​familyName>​ ?fn } 
- 
-OPTIONAL 
- 
-{ ?s egr:​placeOfBirth ?pb } 
- 
-OPTIONAL 
- 
-{ ?s <​http://​xmlns.com/​foaf/​0.1/​gender>​ ?gd } 
- 
-} 
- 
-BIND(strbefore(strafter(str(?​bd),​ "​http://​data.bnf.fr/​date/"​),​ "/"​) AS ?annee) 
- 
-FILTER ( ( ?annee> "​1100"​ ) && ( ?annee <"​1761"​ ) ) 
- 
-} 
- 
-ORDER BY ?annee 
-</​file>​ 
- 
-Pour les intéressés,​ une présentation des concepts du web sémantique,​ dans le contexte du mouvement //Open Data//, se trouve [[http://​phn-wiki.ish-lyon.cnrs.fr/​doku.php?​id=thatcamp_2014:​session_thatcamp2014|sur cette page]]. 
- 
-=== Création et nettoyage du fichier à encoder === 
- 
-    * Revenir à la page de la '​Requête'​ et changer le '​Format du résultat'​ à CSV (comma-separated values) 
-    * Reexécuter al requête, sélectionner toute la page du résultat et la copier dans le presse-papier 
-    * Ouvrir une nouvelle feuille de calcul dans le logiciel de tableur (Calc pour LibreOffice/​OpenOffice;​ Excel dans la suite Microsoft) 
-    * Coller avec collage spécial dans la première cellule de la feuille de calcul: A1 et choisir 'Texte non formaté'​. 
-      * Dans la boîte de dialogue mettre '​Virgule'​ comme séparateur 
-      * Mettre le 'Type de colonne':'​Texte'​ pour la colonne '​annee'​ 
-      * Importer et vérifier le résultat 
-    * Sauvegarder le nouveau fichier avec le nom '​liste_notices_BNF'​ au format .ods ou .xls 
- 
-    * Ajouter une colonne avant la colonne '​annee'​ qu'on va appeler '​nom'​ 
-    * Dans la première cellule qui contient les données insérer la formule: =SI(ESTVIDE(B2);​C2;​B2) 
-    * Copier-coller cette formule dans toutes les cellules de la colonne sauf la première ligne 
-    * Ajouter une colonne annee_mediane après la colonne année 
-    * Insérer dans toutes les cellules de cette colonne la formule =SI(ESTERREUR(CHERCHE("​-";​E2)) ; E2; CONCATENER(GAUCHE(E2;​2);"​51"​)) 
-    * Ajouter une colonne '​naissance'​ avant la colonne '​gd'​ (gender) et mettre cette formule dans toutes les cellules: =SI(ESTVIDE(G2);​F2;​CONCATENER(G2;",​ ";F2)) 
-    * Ajouter une colonne '​notice'​ après la colonne '​bio'​ et mettre dans toutes les cellules cette formule: =CONCATENER(D2;"​ (";​H2;"​) ";​J2;"​ [";​A2;"​]"​) 
-    * Trier les données d'​après les colonnes '​annee_mediane'​ et '​nom'​ 
- 
-On obtient ce résultat: {{:​td_histoire_numerique:​liste_notices_bnf.ods|liste_notices_BNF}} 
- 
-===== Annotation du document ===== 
- 
-==== Fonctionnalité '​Rechercher et remplacer'​ ==== 
- 
-Documentation de LibreOffice (traduction en français): 
- 
-    * [[https://​help.libreoffice.org/​Common/​Find_and_Replace/​fr|Rechercher & remplacer]] 
-    * [[https://​help.libreoffice.org/​Common/​List_of_Regular_Expressions/​fr|Liste des expressions régulières]] 
- 
-=== Recherche de similarités === 
- 
-    * L'​exemple de '​Jacob'​ 
-    * [[https://​fr.wikipedia.org/​wiki/​N-gramme|N-Gram]] 
-    * [[https://​books.google.com/​ngrams/​graph?​content=Galileo+Galilei,​Cartesio,​Descartes,​Copernico,​Copernicus,​Kopernik&​year_start=1800&​year_end=2000&​corpus=22&​smoothing=3&​share=&​direct_url=t1;,​Galileo Galilei;,​c0;​.t1;,​Cartesio;,​c0;​.t1;,​Descartes;,​c0;​.t1;,​Copernico;,​c0;​.t1;,​Copernicus;,​c0;​.t1;,​Kopernik;,​c0|Google NGram viewer]] – explication : [[https://​fr.wikipedia.org/​wiki/​Ngram_Viewer|Ngram Viewer]] 
  
-==== Principes d'​annotation ====+===== Principes d'​annotation ​=====
  
 Le principe de l'​[[https://​fr.wikipedia.org/​wiki/​Extensible_Markup_Language|encodage en format XML]] mais de manière simplifiée. Le principe de l'​[[https://​fr.wikipedia.org/​wiki/​Extensible_Markup_Language|encodage en format XML]] mais de manière simplifiée.
Ligne 159: Ligne 70:
  
 \\ \\
 +
 +===== Annotation de documents =====
 +
 +
 +
 +==== Annotation manuelle ====
 +
 +
 +==== Fonctionnalité '​Rechercher et remplacer'​ ====
 +
 +Documentation de LibreOffice (traduction en français):
 +
 +    * [[https://​help.libreoffice.org/​Common/​Find_and_Replace/​fr|Rechercher & remplacer]]
 +    * [[https://​help.libreoffice.org/​Common/​List_of_Regular_Expressions/​fr|Liste des expressions régulières]]
 +
 +=== Recherche de similarités ===
 +
 +    * L'​exemple de '​Jacob'​
 +    * [[https://​fr.wikipedia.org/​wiki/​N-gramme|N-Gram]]
 +    * [[https://​books.google.com/​ngrams/​graph?​content=Galileo+Galilei,​Cartesio,​Descartes,​Copernico,​Copernicus,​Kopernik&​year_start=1800&​year_end=2000&​corpus=22&​smoothing=3&​share=&​direct_url=t1;,​Galileo Galilei;,​c0;​.t1;,​Cartesio;,​c0;​.t1;,​Descartes;,​c0;​.t1;,​Copernico;,​c0;​.t1;,​Copernicus;,​c0;​.t1;,​Kopernik;,​c0|Google NGram viewer]] – explication : [[https://​fr.wikipedia.org/​wiki/​Ngram_Viewer|Ngram Viewer]]
  
td_histoire_numerique/exercice_2.txt · Dernière modification: 2019/10/07 09:15 par Francesco Beretta