Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_2

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
td_histoire_numerique:exercice_2 [2015/09/28 19:01]
Francesco Beretta [Annotation manuelle]
td_histoire_numerique:exercice_2 [2015/09/29 10:02]
Francesco Beretta [Principes d'annotation]
Ligne 26: Ligne 26:
 L'​annotation sémantique des textes utilise les principes de l'​[[https://​fr.wikipedia.org/​wiki/​Extensible_Markup_Language|encodage en format XML]], selon les recommandations de la [[http://​www.tei-c.org/​|Text encoding initiative]],​ en les appliquant de manière simplifiée. L'​annotation sémantique des textes utilise les principes de l'​[[https://​fr.wikipedia.org/​wiki/​Extensible_Markup_Language|encodage en format XML]], selon les recommandations de la [[http://​www.tei-c.org/​|Text encoding initiative]],​ en les appliquant de manière simplifiée.
  
 +Voir sur [[td_histoire_numerique:​descriptif_exercice_4&#​principes_du_xmlla_grammaire_de_l_encodagecette page]] une présentation synthétique
 ==== Balises ==== ==== Balises ====
  
Ligne 100: Ligne 101:
  
  
 +==== Fonctionnalité '​Rechercher et remplacer'​ ====
 +
 +Documentation de LibreOffice (traduction en français):
 +
 +    * [[https://​help.libreoffice.org/​Common/​Find_and_Replace/​fr|Rechercher & remplacer]]
 +    * [[https://​help.libreoffice.org/​Common/​List_of_Regular_Expressions/​fr|Liste des expressions régulières]]
 +
 +=== Recherche de similarités ===
 +
 +    * L'​exemple de '​Jacob'​
 +    * [[https://​fr.wikipedia.org/​wiki/​N-gramme|N-Gram]]
 +    * [[https://​books.google.com/​ngrams/​graph?​content=Galileo+Galilei,​Cartesio,​Descartes,​Copernico,​Copernicus,​Kopernik&​year_start=1800&​year_end=2000&​corpus=22&​smoothing=3&​share=&​direct_url=t1;,​Galileo Galilei;,​c0;​.t1;,​Cartesio;,​c0;​.t1;,​Descartes;,​c0;​.t1;,​Copernico;,​c0;​.t1;,​Copernicus;,​c0;​.t1;,​Kopernik;,​c0|Google NGram viewer]] – explication : [[https://​fr.wikipedia.org/​wiki/​Ngram_Viewer|Ngram Viewer]]
 +
 +\\
  
 ==== Annotation manuelle ==== ==== Annotation manuelle ====
Ligne 110: Ligne 125:
  
  
-Chercher ​dans LibreOffice ​afin de supprimer ​ou colorer +=== Chercher ​toutes les annotations ​afin de les mettre en couleur ​ou de les supprimer ===
-\{[a-zA-Z_/​0-9]*\}+
  
-(\{[a-zA-Z0-9_/​]*\}) ​ $1 [avec indication du format dans le champs remplacer] +  * Rechercher: ​ \{[a-zA-Z_/​0-9]*\} 
-==== Fonctionnalité '​Rechercher et remplacer'​ ====+  * Rechercher:  ​(\{[a-zA-Z0-9_/​]*\}) ​– Remplacer: ​$1 [avec indication du format dans le champs remplacer]
  
-Documentation de LibreOffice (traduction en français):+\\
  
-    * [[https://​help.libreoffice.org/​Common/​Find_and_Replace/​fr|Rechercher & remplacer]] +==== Annotation semi-automatique ====
-    * [[https://​help.libreoffice.org/​Common/​List_of_Regular_Expressions/​fr|Liste des expressions régulières]]+
  
-=== Recherche de similarités === 
  
-    ​L'​exemple de '​Jacob'​ +  ​Créer des unités documentaires,​ une par notice 
-    [[https://​fr.wikipedia.org/​wiki/​N-gramme|N-Gram]] +     ​Chercher $   ​Remplacer :​ \n{/ud}\n{ud0}\n 
-    [[https://​books.google.com/​ngrams/​graph?​content=Galileo+Galilei,​Cartesio,​Descartes,​Copernico,​Copernicus,​Kopernik&​year_start=1800&​year_end=2000&​corpus=22&​smoothing=3&​share=&​direct_url=t1;,​Galileo Galilei;,​c0;​.t1;,​Cartesio;,​c0;​.t1;,​Descartes;,​c0;​.t1;,​Copernico;,​c0;​.t1;,​Copernicus;,​c0;​.t1;,​Kopernik;​,c0|Google NGram viewer]] – explication : [[https://​fr.wikipedia.org/​wiki/​Ngram_Viewer|Ngram Viewer]]+     ​Ajouter la première et la dernière balise 
 + 
 +  * Annoter les dates de naissance 
 +     * Chercher (,\s|\()(\d{4})(\)) ​ Remplacer  ​$1{dat$2}$2{/dat}$3 
 +     * Avec cette expression on devrait trouver presque exclusivement les dates de naissance
  
 +  * Chercher les lieux de naissance
 +     * Chercher : ​ (\s\()([\w\s\(\),'​\?​]*)(,​\s\{) ​ Remplacer :​ $1{en0li}$2{/​en}$3
td_histoire_numerique/exercice_2.txt · Dernière modification: 2019/10/07 09:15 par Francesco Beretta