Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_2 [2015/09/25 07:38] Francesco Beretta [Création du deuxième document à annoter] |
td_histoire_numerique:exercice_2 [2015/09/25 09:04] Francesco Beretta [Balises] |
||
---|---|---|---|
Ligne 18: | Ligne 18: | ||
\\ | \\ | ||
- | Nous disposons donc de **deux documents à annoter**. Celui que nous venons de produire et celui que nous avons téléchargé pour le premier exercice (il est {{:td_histoire_numerique:notices_texte_brut.odt|téléchargeable ici}}. | + | Nous disposons donc de **deux documents à annoter**. Celui que nous venons de produire et celui que nous avons téléchargé pour le premier exercice (il est {{:td_histoire_numerique:notices_texte_brut.odt|téléchargeable ici}}). |
\\ | \\ | ||
Ligne 24: | Ligne 24: | ||
===== Principes d'annotation ===== | ===== Principes d'annotation ===== | ||
- | Le principe de l'[[https://fr.wikipedia.org/wiki/Extensible_Markup_Language|encodage en format XML]] mais de manière simplifiée. | + | L'annotation sémantique des textes utilise les principes de l'[[https://fr.wikipedia.org/wiki/Extensible_Markup_Language|encodage en format XML]], selon les recommandations de la [[http://www.tei-c.org/|Text encoding initiative]], en les appliquant de manière simplifiée. |
- | === Balises === | + | ==== Balises ==== |
|{ud0_}TTT{/ud} | unité documentaire | tei:div | Au dessus du niveau paragraphe, enveloppe un paragraphe | | |{ud0_}TTT{/ud} | unité documentaire | tei:div | Au dessus du niveau paragraphe, enveloppe un paragraphe | | ||
| {eud}TTT{/eud} | en-tête d'unité documentaire | tei:head | A placer toujours au début d'une unité documentaire pour disposer d'un titre | | | {eud}TTT{/eud} | en-tête d'unité documentaire | tei:head | A placer toujours au début d'une unité documentaire pour disposer d'un titre | | ||
| {seg}TTT{/seg} | segment | tei:seg | Au dessous du niveau paragraphe, toujours à l'intérieur d'un paragraphe, regroupe en règle générale plusieurs propositions. | | | {seg}TTT{/seg} | segment | tei:seg | Au dessous du niveau paragraphe, toujours à l'intérieur d'un paragraphe, regroupe en règle générale plusieurs propositions. | | ||
- | | {co0}TTT{/co} | contentu | tei:seg | | | + | | {co0}TTT{/co} | contenu | tei:seg | Identifie dans le texte une unité de connaissance de type 'contenu' | |
- | | {in0}TTT{/in} | information | tei:seg | | | + | | {in0}TTT{/in} | information | tei:seg | Identifie dans le texte une unité de connaissance de type 'information' | |
| {en0}TTT{/en} | entité nommée | tei:name | | | | {en0}TTT{/en} | entité nommée | tei:name | | | ||
| {ro0}TTT{/ro} | référence à un objet | tei:rs | | | | {ro0}TTT{/ro} | référence à un objet | tei:rs | | | ||
Ligne 39: | Ligne 39: | ||
Dans l'espace de noms du TD, le nom des balises possède deux caractères si la balise est susceptible d'être associée à un objet de la base de données, trois si cette possibilité est exclue. \\ Pour les balises à deux lettres, un 0 est ajouté si la référence à un objet dans la base de données est omise. | Dans l'espace de noms du TD, le nom des balises possède deux caractères si la balise est susceptible d'être associée à un objet de la base de données, trois si cette possibilité est exclue. \\ Pour les balises à deux lettres, un 0 est ajouté si la référence à un objet dans la base de données est omise. | ||
- | === Types === | + | ==== Types ==== |
On peut également ajouter un sigle sur deux caractères indiquant le type d'objet après le chiffre. | On peut également ajouter un sigle sur deux caractères indiquant le type d'objet après le chiffre. | ||
Ligne 56: | Ligne 56: | ||
Par exemple: {en0cs}mathématicien{/en} | Par exemple: {en0cs}mathématicien{/en} | ||
- | === Dates === | + | ==== Dates ==== |
Nous utilisons pour les dates le [[https://fr.wikipedia.org/wiki/ISO_8601|format ISO 8601]]. \\ | Nous utilisons pour les dates le [[https://fr.wikipedia.org/wiki/ISO_8601|format ISO 8601]]. \\ |