Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
td_histoire_numerique:exercice_2 [2015/10/09 21:20] Francesco Beretta [Types] |
td_histoire_numerique:exercice_2 [2015/10/10 08:05] Francesco Beretta [Balises] |
||
---|---|---|---|
Ligne 2: | Ligne 2: | ||
\\ | \\ | ||
+ | ====== Annotation de documents ====== | ||
+ | \\ | ||
===== Documents à annoter ===== | ===== Documents à annoter ===== | ||
Ligne 33: | Ligne 35: | ||
^ Balise ^ Définition ^ Explication ^ Balise TEI ^ Exemple complet ^ Transformé en XML ^ | ^ Balise ^ Définition ^ Explication ^ Balise TEI ^ Exemple complet ^ Transformé en XML ^ | ||
- | |{ud0}TTT{/ud} | unité documentaire | Au dessus du niveau paragraphe, enveloppe un paragraphe | tei:div | {ud0_8}TTT{/ud} | <ud ref="0" ana="8">TTT</ud> | | + | |{ud0}TTT{/ud} | unité documentaire | Au dessus du niveau paragraphe, enveloppe un paragraphe | tei:div | {ud0_8||20}TTT{/ud} | <ud ref="0" ana="8 20">TTT</ud> | |
| {eud}TTT{/eud} | en-tête d'unité documentaire | A placer toujours au début d'une unité documentaire pour disposer d'un titre | tei:head | {eud_9}TTT{/eud} | <eud type="9">TTT</eud> | | | {eud}TTT{/eud} | en-tête d'unité documentaire | A placer toujours au début d'une unité documentaire pour disposer d'un titre | tei:head | {eud_9}TTT{/eud} | <eud type="9">TTT</eud> | | ||
| {en0}TTT{/en} | entité nommée | Identifie dans le texte une chaîne de caractères qui représente le nom d'un objet | tei:name | {en2ai_10}TTT{/en} | <en type="ai" ref="2" ana="10">TTT</en> | | | {en0}TTT{/en} | entité nommée | Identifie dans le texte une chaîne de caractères qui représente le nom d'un objet | tei:name | {en2ai_10}TTT{/en} | <en type="ai" ref="2" ana="10">TTT</en> | | ||
- | | {ro0}TTT{/ro} | référence à un objet | Identifie dans le texte une chaîne de caractères qui se réfère à un objet sans être son nom | tei:rs | {ro0ai_10}TTT{/ro} | <ro type="ai" ref="2" ana="10">TTT</ro> | | + | | {ro0}TTT{/ro} | référence à un objet | Identifie dans le texte une chaîne de caractères qui se réfère à un objet sans être son nom | tei:rs | {ro0ai_10}TTT{/ro} – {ro18|19_10|111}TTT{/ro} | <ro type="ai" ref="2" ana="10">TTT</ro> — <ro ref="18 19" ana="10 111">TTT</ro> | |
| {dat}TTT{/dat} | date |Une chaîne de caractéres qui représente une date dans n'importe quel format | tei:date | {dat1576r_df} | <dat when="1576" cert="r" type="df">TTT</dat> | | | {dat}TTT{/dat} | date |Une chaîne de caractéres qui représente une date dans n'importe quel format | tei:date | {dat1576r_df} | <dat when="1576" cert="r" type="df">TTT</dat> | | ||
| {seg}TTT{/seg} | segment | Au dessous du niveau paragraphe, toujours à l'intérieur d'un paragraphe, regroupe en règle générale plusieurs propositions. | tei:seg | {seg_8}TTT{/seg} | <seg ana="8">TTT</seg> | | | {seg}TTT{/seg} | segment | Au dessous du niveau paragraphe, toujours à l'intérieur d'un paragraphe, regroupe en règle générale plusieurs propositions. | tei:seg | {seg_8}TTT{/seg} | <seg ana="8">TTT</seg> | | ||
Ligne 74: | Ligne 76: | ||
Par ex.:\\ | Par ex.:\\ | ||
- | * {seg_23}Érudit et collectionneur français{/seg} : dans la base de données, l'objet 23 serait defini en tant que 'notice biographique succincte'. Avec ce procédé on peut indexer et qualifier au point de vue sémantique toute portion de texte. | + | * {seg_23}Érudit et collectionneur français{/seg} |
- | * {en2ai_10}Johannes Kepler{/en} : cette entité nommée correspond à un acteur individuel (ai) qui a le numéro 2 dans la base de données; de plus il s'agit de l'objet concerné par le discours (identifant 10 de la base de données | + | * dans la base de données, l'objet 23 serait defini en tant que 'notice biographique succincte'. |
- | * {ro18|19<del>cs</del>_10|999}Philosophe et savant français{/ro} : comme on peut vouloir identifier plusieurs objets dans une même balise, ou lui associer plusieurs types, séparés par un trait vertical "|" | + | * Avec ce procédé on peut indexer et qualifier au point de vue sémantique toute portion de texte. |
+ | * {en2ai_10}Johannes Kepler{/en} | ||
+ | * Cette entité nommée correspond à un acteur individuel (ai) qui a le numéro 2 dans la base de données. | ||
+ | * De plus il s'agit de l'objet concerné par le discours (identifant 10 de la base de données | ||
+ | * {ro18|19<del>cs</del>_10|999}Philosophe et savant français{/ro} | ||
+ | * si on identifie plusieurs objets dans une même portion de texte, enveloppée par une balise, on peut ou lui associer plusieurs clés d'objets de la base de données (18 et 19 dans l'exemple) séparées par un trait vertical "|". Dans ce cas, il est toutefois interdit d'ajouter le type d'objet. | ||
+ | * de la même manière on peut associer une ou plusieurs typologies à un texte, après le tiret sous la ligne, en les séparant par un "|" | ||