Outils pour utilisateurs

Outils du site


td_histoire_numerique:exercice_2

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
td_histoire_numerique:exercice_2 [2015/10/05 11:06]
Francesco Beretta [Annotation manuelle]
td_histoire_numerique:exercice_2 [2015/11/10 08:38]
Francesco Beretta [Création du deuxième document à annoter]
Ligne 2: Ligne 2:
  
 \\  \\ 
 +====== Annotation de documents ======
 +\\
  
 ===== Documents à annoter ===== ===== Documents à annoter =====
Ligne 18: Ligne 20:
 \\ \\
  
-Nous disposons donc de <​html><​span style="​color:​red;​font-weight:​bold;">​deux documents à annoter</​span></​html>​ : {{:​td_histoire_numerique:​liste_notices_bnf.odt|celui que nous venons de produire}} et celui que nous avons téléchargé pour le premier exercice (il est {{:​td_histoire_numerique:​notices_texte_brut.odt|téléchargeable ici}}).+Nous disposons donc de <​html><​span style="​color:​red;​font-weight:​bold;">​deux documents à annoter</​span></​html>​ : {{:​td_histoire_numerique:​liste_notices_bnf.odt|celui que nous venons de produire}} et celui que nous avons téléchargé pour le premier exercice (il est {{:​td_histoire_numerique:​notices_wikipedia_texte_brut.zip|téléchargeable ici}}).
  
 \\ \\
Ligne 46: Ligne 48:
  
 ==== Types ==== ==== Types ====
 +
 +
 +=== Types d'​objets ===
  
 On peut ajouter un sigle sur deux caractères aux balises '​en'​ et '​ro',​ après le 0 ou l'​identifiant numérique de l'​objet,​ qui indique quel est le type de l'​objet visé. On peut ajouter un sigle sur deux caractères aux balises '​en'​ et '​ro',​ après le 0 ou l'​identifiant numérique de l'​objet,​ qui indique quel est le type de l'​objet visé.
Ligne 61: Ligne 66:
  
 Par exemple: {en0cs}mathématicien{/​en} Par exemple: {en0cs}mathématicien{/​en}
 +
 +Cette possibilité n'est vraiment utile que si on renonce à créer les objets dans la base de données et que la valeur de l'​identifiant sera donc '​0'​. Grâce au sigle on pourra ainsi indiquer dans le texte de quel type d'​objet il s'​agit. Si on a créé l'​objet dans la base de données, et donc obligatoirement renseigné un type, celui-ci pourra être récupéré par une requête.
  
 \\ \\
-Si on souhaite spécifier ​un type sous forme d'un objet abstrait qu'on crée dans la base de donnéeson ajoutera l'​identifiant ​de l'​objet ​après un tiret bas.+ 
 + 
 +=== Typologie supplémentaire === 
 + 
 +Pour toutes les balises, sauf la balise '​dat'​ (pour la date), ​on peut ajouter ​un type sous forme d'un objet abstrait qu'on crée dans la base de données ​et dont on ajoutera l'​identifiant ​numérique ​après un tiret bas.
  
 Par ex.:\\ Par ex.:\\
-{seg_23}Érudit et collectionneur français{/​seg} 
  
-Dans la base de données, l'​objet 23 serait defini ​en tant que '​notice biographique succincte'​. Avec ce procédé on peut indexer et qualifier au point de vue sémantique toute portion de texte.+  * {seg_23}Érudit et collectionneur français{/​seg} 
 +    * dans la base de données, l'​objet 23 aura été préalablement défini, par exemple, ​en tant que '​notice biographique succincte'​. 
 +    * Avec ce procédé on peut indexer et qualifier au point de vue sémantique toute portion de texte. 
 +  * {en2ai_10}Johannes Kepler{/​en} 
 +    * Cette entité nommée correspond à un acteur individuel (ai) qui a le numéro 2 dans la base de données. Le sigle '​ai'​ n'est pas vraiment indispensable car le type de l'​objet est obligatoirement renseigné dans la base de données 
 +    * De plus il s'agit de l'​objet concerné par le texte qui entoure la balise (identifiant 10 de la base de données). 
 +  * {ro18|19<​del>​cs</​del>​_10|999}Philosophe et savant français{/​ro} 
 +    * si on identifie plusieurs objets dans une même portion de texte, enveloppée par une balise, on peut lui associer plusieurs clés d'​objets de la base de données (18 et 19 dans l'​exemple) séparées par un trait vertical "​|"​. Dans ce cas, il est toutefois interdit d'​ajouter le type d'​objet. 
 +    * de la même manière on peut associer une ou plusieurs typologies à un texte, après le tiret sous la ligne, en les séparant par un "​|"​. 
 + 
  
 \\ \\
Ligne 74: Ligne 94:
  
 Nous utilisons pour les dates le [[https://​fr.wikipedia.org/​wiki/​ISO_8601|format ISO 8601]]. ​   \\ Nous utilisons pour les dates le [[https://​fr.wikipedia.org/​wiki/​ISO_8601|format ISO 8601]]. ​   \\
-On saisira les dates sous forme de texte au format ISO 8601, ce qui permet de traiter les dates tronquées (seulement l'​année,​ ou seulement l'​année et le mois, etc.)+En s'​inspirant du format ISO 8601, on saisira les dates sous forme de //​chiffres//​ assemblées dans un //texte//, ce qui permet de traiter les dates tronquées (seulement l'​année,​ ou seulement l'​année et le mois, etc.)
 +Le nombre obligatoire de chiffres est égal au nombre de lettres dans le modèle. Le nombre manquant de chiffres sera remplacé par 0 au début de la date. 
 + 
 +^Forme ^ Signification ^ Exemples ^ 
 +| AAAA | Année | 0078; 0344; 1564  |  
 +| AAAAMM | Année, mois | 156403 | 
 +| AAAAMMJJ | Année, mois, jour | 15640309 | 
 +| AAAAMMJJHH | Année, mois, jour, heures | 1564030918 | 
 +| AAAAMMJJHHMM | Année, mois, jour, heures, minutes | 156403091830 | 
 +| AAAAMMJJHHMMSS | Année, mois, jour, heures, minutes, segondes | 15640309183022 | 
 + 
 + 
 + 
 + 
  
  \\ Mise en forme des dates :    \\  \\ {dat20001101} le premier novembre de la dernière année du siècle précédent{/​dat}  \\ Mise en forme des dates :    \\  \\ {dat20001101} le premier novembre de la dernière année du siècle précédent{/​dat}
Ligne 105: Ligne 139:
 \\ \\
  
-===== Annotation de documents ​=====+===== Techniques d'​annotation ​=====
 \\ \\
 ==== Fonctionnalité '​Rechercher et remplacer'​ ==== ==== Fonctionnalité '​Rechercher et remplacer'​ ====
  
 +La manière la plus efficace d'​annoter un texte consiste à utiliser la fonctionnalité '​Rechercher et remplacer'​ de Writer ou de l'​éditeur de texte de son propre choix (Word, R, etc.). Aussi il est indispensable de se familiariser et d'​utiliser les expressions rationnelles ou régulières.
  
 === Expressions régulières === === Expressions régulières ===
Ligne 136: Ligne 170:
     * ouvrir la boîte de dialogue Chercher/​Remplacer et activer les expressions régulières     * ouvrir la boîte de dialogue Chercher/​Remplacer et activer les expressions régulières
     * entourer la chaîne recherchée avec une parenthèse ronde : ( )     * entourer la chaîne recherchée avec une parenthèse ronde : ( )
-    * dans la zone '​Remplacer'​ introduire le symbole $1 (qui se réfère aux premières ​parenthèses rondes de la recherche) en l'​entourant de la balise appropriée,​ par ex. {en0}$1{/​en} +    * dans la zone '​Remplacer'​ introduire le symbole $1 (qui se réfère aux parenthèses rondes de la recherche ​dans l'​ordre de leur apparition: 1,2,3, etc.) en l'​entourant de la balise appropriée,​ par ex. {en0}$1{/​en} 
-    * pour aller plus vite, utiliser les chaînes de remplacement des recherches précédentes,​ tout en remplaçant l'​identifiant précédent par celui de l'​objet en question et en ajoutant, le cas échéant ​des bons paramètres,​ par ex. {en789}$1{/​en}+    * pour aller plus vite, utiliser les chaînes de remplacement des recherches précédentes,​ tout en remplaçant l'​identifiant précédent par celui de l'​objet en question et en ajoutant, le cas échéant ​les bons paramètres,​ par ex. {en789}$1{/​en}
  
 === Chercher toutes les annotations afin de les mettre en couleur ou de les supprimer === === Chercher toutes les annotations afin de les mettre en couleur ou de les supprimer ===
  
-    * Rechercher: ​ %%\%%{[a-zA-Z_/​0-9\|]%%*%%%%\%%} +    * Rechercher: ​ %%\%%{[a-zA-Z_/​0-9\|]%%*%%%%\%%} ​– Remplacer par un champs vide: supprime toutes les annotations. 
-    * Rechercher: ​ (%%\%%{[a-zA-Z0-9_/​\|]%%*%%%%\%%}) – Remplacer: $1 [avec indication du format dans le champs remplacer]+    * Rechercher: ​ (%%\%%{[a-zA-Z0-9_/​\|]%%*%%%%\%%}) – Remplacer: $1 [avec indication du format dans le champs remplacer: par ex. une couleur].
  
 ==== Annotation semi-automatique ==== ==== Annotation semi-automatique ====
td_histoire_numerique/exercice_2.txt · Dernière modification: 2019/10/07 09:15 par Francesco Beretta