Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_2 [2015/09/25 07:35] Francesco Beretta [Création du document à annoter] |
td_histoire_numerique:exercice_2 [2015/09/25 08:37] Francesco Beretta [Principes d'annotation] |
||
---|---|---|---|
Ligne 3: | Ligne 3: | ||
\\ | \\ | ||
- | ===== Création du document à annoter ===== | + | ===== Documents à annoter ===== |
+ | ==== Création du deuxième document à annoter ==== | ||
**Document à télécharger pour l'exercice de mardi 29 septembre**: {{:td_histoire_numerique:liste_notices_bnf.ods|liste_notices_BNF.ods}} | **Document à télécharger pour l'exercice de mardi 29 septembre**: {{:td_histoire_numerique:liste_notices_bnf.ods|liste_notices_BNF.ods}} | ||
Ligne 14: | Ligne 15: | ||
* collez le contenu du presse-papier dans un document texte vide (Writer) | * collez le contenu du presse-papier dans un document texte vide (Writer) | ||
* sauvegardez ce document sous le nom '**liste_notices_BNF.odt**' | * sauvegardez ce document sous le nom '**liste_notices_BNF.odt**' | ||
+ | |||
+ | \\ | ||
+ | |||
+ | Nous disposons donc de **deux documents à annoter**. Celui que nous venons de produire et celui que nous avons téléchargé pour le premier exercice (il est {{:td_histoire_numerique:notices_texte_brut.odt|téléchargeable ici}}). | ||
\\ | \\ | ||
Ligne 19: | Ligne 24: | ||
===== Principes d'annotation ===== | ===== Principes d'annotation ===== | ||
- | Le principe de l'[[https://fr.wikipedia.org/wiki/Extensible_Markup_Language|encodage en format XML]] mais de manière simplifiée. | + | L'annotation sémantique des textes utilise les principes de l'[[https://fr.wikipedia.org/wiki/Extensible_Markup_Language|encodage en format XML]], selon les recommandations de la [[http://www.tei-c.org/|Text encoding initiative]], en les appliquant de manière simplifiée. |
- | === Balises === | + | ==== Balises ==== |
|{ud0_}TTT{/ud} | unité documentaire | tei:div | Au dessus du niveau paragraphe, enveloppe un paragraphe | | |{ud0_}TTT{/ud} | unité documentaire | tei:div | Au dessus du niveau paragraphe, enveloppe un paragraphe | | ||
Ligne 34: | Ligne 39: | ||
Dans l'espace de noms du TD, le nom des balises possède deux caractères si la balise est susceptible d'être associée à un objet de la base de données, trois si cette possibilité est exclue. \\ Pour les balises à deux lettres, un 0 est ajouté si la référence à un objet dans la base de données est omise. | Dans l'espace de noms du TD, le nom des balises possède deux caractères si la balise est susceptible d'être associée à un objet de la base de données, trois si cette possibilité est exclue. \\ Pour les balises à deux lettres, un 0 est ajouté si la référence à un objet dans la base de données est omise. | ||
- | === Types === | + | ==== Types ==== |
On peut également ajouter un sigle sur deux caractères indiquant le type d'objet après le chiffre. | On peut également ajouter un sigle sur deux caractères indiquant le type d'objet après le chiffre. | ||
Ligne 51: | Ligne 56: | ||
Par exemple: {en0cs}mathématicien{/en} | Par exemple: {en0cs}mathématicien{/en} | ||
- | === Dates === | + | ==== Dates ==== |
Nous utilisons pour les dates le [[https://fr.wikipedia.org/wiki/ISO_8601|format ISO 8601]]. \\ | Nous utilisons pour les dates le [[https://fr.wikipedia.org/wiki/ISO_8601|format ISO 8601]]. \\ |