Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_2

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
td_histoire_numerique:exercice_2 [2015/10/10 08:24]
Francesco Beretta [Dates]
td_histoire_numerique:exercice_2 [2019/10/07 09:15] (Version actuelle)
Francesco Beretta [Annotation sémantique de textes]
Ligne 1: Ligne 1:
 Revenir à la [[:​td_histoire_numerique:​accueil|page d'​accueil]]. Revenir à la [[:​td_histoire_numerique:​accueil|page d'​accueil]].
  
-\\  +<​html>​ 
-====== ​Annotation ​de documents ======+<​table><​tr><​td style="​vertical-align:​ middle;"><​a rel="​license"​ href="​http://​creativecommons.org/​licenses/​by-nc-sa/​4.0/"><​img alt="​Licence Creative Commons"​ style="​border-width:​0;​ font-size:​smaller"​ src="​https://​i.creativecommons.org/​l/​by-nc-sa/​4.0/​88x31.png"​ /></​a>​ 
 +</​td>​ 
 +<​td>​ 
 +<span xmlns:​dct="​http://​purl.org/​dc/​terms/"​ property="​dct:​title">​Le cours "​Outils numériques pour les historiens"</​span> ​de <span xmlns:​cc="​http://​creativecommons.org/​ns#"​ property="​cc:​attributionName">​Francesco Beretta</​span>,​ avec tous les documents, fichiers et scripts associés, est mis à disposition selon les termes de la <a rel="​license"​ href="​http://​creativecommons.org/​licenses/​by-nc-sa/​4.0/">​licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International</​a>​.</​td></​tr></​table>​ 
 +</​html>​ 
 + 
 + 
 +====== Annotation sémantique de textes ====== 
 +\\ 
 + 
 + 
 +Fichier{{ {{:​td_histoire_numerique:​textes_tei_20191007.zip|}}| mis-à-jour}} 
 + 
 +{{:​td_histoire_numerique:​migration_0.zip|Migration 0 de la base de données}} 
 + 
 \\ \\
  
 ===== Documents à annoter ===== ===== Documents à annoter =====
  
 +Concernant le premier document à annoter [[td_histoire_numerique:​premier_exercice&#​reconnaissance_et_classement_d_entites_nommees_dans_un_texte|voir cette page]].
 +\\
 ==== Création du deuxième document à annoter ==== ==== Création du deuxième document à annoter ====
-**Document à télécharger pour l'​exercice de mardi 29 septembre**:​ {{:​td_histoire_numerique:​liste_notices_bnf.ods|liste_notices_BNF.ods}} 
  
-Les indications concernant la production du document se trouvent sur  **[[td_histoire_numerique:​creation_liste_notices_bnf|cette page]]**.+Document à télécharger pour l'​exercice de mardi 29 septembre: {{:​td_histoire_numerique:​liste_notices_bnf.ods|liste_notices_BNF.ods}} 
 + 
 +Les **indications concernant la production** du document se trouvent sur  **[[td_histoire_numerique:​creation_liste_notices_bnf|cette page]]**.
  
 Il s'agit maintenant le créer le document en format texte que nous allons annoter en introduisant une indexation sémantique. Il s'agit maintenant le créer le document en format texte que nous allons annoter en introduisant une indexation sémantique.
Ligne 20: Ligne 38:
 \\ \\
  
-Nous disposons donc de <​html><​span style="​color:​red;​font-weight:​bold;">​deux documents à annoter</​span></​html>​ : {{:​td_histoire_numerique:​liste_notices_bnf.odt|celui que nous venons de produire}} et celui que nous avons téléchargé pour le premier exercice (il est {{:​td_histoire_numerique:​notices_texte_brut.odt|téléchargeable ici}}).+Nous disposons donc de <​html><​span style="​color:​red;​font-weight:​bold;">​deux documents à annoter</​span></​html>​ : {{:​td_histoire_numerique:​liste_notices_bnf.odt|celui que nous venons de produire}} et celui que nous avons téléchargé pour le premier exercice (il est {{:​td_histoire_numerique:​notices_wikipedia_texte_brut.zip|téléchargeable ici}}).
  
 \\ \\
Ligne 94: Ligne 112:
  
 Nous utilisons pour les dates le [[https://​fr.wikipedia.org/​wiki/​ISO_8601|format ISO 8601]]. ​   \\ Nous utilisons pour les dates le [[https://​fr.wikipedia.org/​wiki/​ISO_8601|format ISO 8601]]. ​   \\
-En s'​inspirant du format ISO 8601, on saisira les dates sous forme de //​chiffres//​ assemblées dans un //texte//, ce qui permet de traiter les dates tronquées (seulement l'​année,​ ou seulement l'​année et le mois, etc.):+En s'​inspirant du format ISO 8601, on saisira les dates sous forme de //​chiffres//​ assemblées dans un //texte//, ce qui permet de traiter les dates tronquées (seulement l'​année,​ ou seulement l'​année et le mois, etc.)
 +Le nombre obligatoire de chiffres est égal au nombre de lettres dans le modèle. Le nombre manquant de chiffres sera remplacé par 0 au début de la date. 
 + 
 +^Forme ^ Signification ^ Exemples ^ 
 +| AAAA | Année | 0078; 0344; 1564  |  
 +| AAAAMM | Année, mois | 156403 | 
 +| AAAAMMJJ | Année, mois, jour | 15640309 | 
 +| AAAAMMJJHH | Année, mois, jour, heures | 1564030918 | 
 +| AAAAMMJJHHMM | Année, mois, jour, heures, minutes | 156403091830 | 
 +| AAAAMMJJHHMMSS | Année, mois, jour, heures, minutes, segondes | 15640309183022 |
  
-^Forme ^ Signification ^ Nombre obligatoire de positions ^ 
-| AAAA | Année |  4 – 0078; 0344; 1564 |  
-| AAAAMM | Année, mois | | 
-| AAAAMMJJ | Année, mois | | 
  
  
Ligne 134: Ligne 157:
 \\ \\
  
-===== Annotation de documents ​=====+===== Techniques d'​annotation ​=====
 \\ \\
 ==== Fonctionnalité '​Rechercher et remplacer'​ ==== ==== Fonctionnalité '​Rechercher et remplacer'​ ====
  
 +La manière la plus efficace d'​annoter un texte consiste à utiliser la fonctionnalité '​Rechercher et remplacer'​ de Writer ou de l'​éditeur de texte de son propre choix (Word, R, etc.). Aussi il est indispensable de se familiariser et d'​utiliser les expressions rationnelles ou régulières.
  
 === Expressions régulières === === Expressions régulières ===
Ligne 165: Ligne 188:
     * ouvrir la boîte de dialogue Chercher/​Remplacer et activer les expressions régulières     * ouvrir la boîte de dialogue Chercher/​Remplacer et activer les expressions régulières
     * entourer la chaîne recherchée avec une parenthèse ronde : ( )     * entourer la chaîne recherchée avec une parenthèse ronde : ( )
-    * dans la zone '​Remplacer'​ introduire le symbole $1 (qui se réfère aux premières ​parenthèses rondes de la recherche) en l'​entourant de la balise appropriée,​ par ex. {en0}$1{/​en} +    * dans la zone '​Remplacer'​ introduire le symbole $1 (qui se réfère aux parenthèses rondes de la recherche ​dans l'​ordre de leur apparition: 1,2,3, etc.) en l'​entourant de la balise appropriée,​ par ex. {en0}$1{/​en} 
-    * pour aller plus vite, utiliser les chaînes de remplacement des recherches précédentes,​ tout en remplaçant l'​identifiant précédent par celui de l'​objet en question et en ajoutant, le cas échéant ​des bons paramètres,​ par ex. {en789}$1{/​en}+    * pour aller plus vite, utiliser les chaînes de remplacement des recherches précédentes,​ tout en remplaçant l'​identifiant précédent par celui de l'​objet en question et en ajoutant, le cas échéant ​les bons paramètres,​ par ex. {en789}$1{/​en}
  
 === Chercher toutes les annotations afin de les mettre en couleur ou de les supprimer === === Chercher toutes les annotations afin de les mettre en couleur ou de les supprimer ===
  
-    * Rechercher: ​ %%\%%{[a-zA-Z_/​0-9\|]%%*%%%%\%%} +    * Rechercher: ​ %%\%%{[a-zA-Z_/​0-9\|]%%*%%%%\%%} ​– Remplacer par un champs vide: supprime toutes les annotations. 
-    * Rechercher: ​ (%%\%%{[a-zA-Z0-9_/​\|]%%*%%%%\%%}) – Remplacer: $1 [avec indication du format dans le champs remplacer]+    * Rechercher: ​ (%%\%%{[a-zA-Z0-9_/​\|]%%*%%%%\%%}) – Remplacer: $1 [avec indication du format dans le champs remplacer: par ex. une couleur].
  
 ==== Annotation semi-automatique ==== ==== Annotation semi-automatique ====
td_histoire_numerique/exercice_2.1444458271.txt.gz · Dernière modification: 2015/10/10 08:24 par Francesco Beretta