Outils pour utilisateurs

Outils du site


td_histoire_numerique:descriptif_exercice_3

Ceci est une ancienne révision du document !


Création des objets et indexation des textes

Exercice pour la prochaine séance

Exercice pour la séance du 13 octobre – à remettre au plus tard dimanche soir

  1. Créer une trentaine d'objets dans votre base personnelle, de différents types, et les associer entre eux (quelques explications sur le sens des associations sont données ci-dessous)
  2. Exporter le schéma 'objets' de votre base de données personnelle selon les indications fournies ici
  3. Indexer un texte concernant votre sujet (vos notes, une transcription de sources, un article de dictionnaire, etc.) avec les clés des objets (= les identifiants préfixés par ObPe: ObPe1, ObPe2, etc.) selon l'un des deux procédés indiqués ci-dessous: si vous utilisez le traitement de texte, n'indexer qu'une dizaine d'objets; si vous utilisez XML, il n'y a pas de limite
  4. Envoyez-moi le fichier de sauvegarde du schéma 'objets' et le texte indexé dans un dossier contenant les deux, comportant votre nom dans le nom de dossier et compressé (.zip). Dans windows 7, la compression se fait avec un click droit sur le dossier, puis Envoyer vers > Dossier compressé; dans MacOSX, click droit, puis Compresser

Création des objets

Présentation du modèle conceptuel

Voici le fichier du MCD à télécharger.

Le modèle conceptuel (MCD) est le fondement de la construction d'une base de données. Il indique les entités qui vont étre créées ainsi que leurs associations.

Les entités représentent des classes d'objets, c'est-à-dire des ensembles d'objets qui partagent les mêmes propriétés. Le MCD liste donc également les propriété des entités et des associations.

Dans notre MCD

Création des objets

Création des associations

Encodage de textes en XML – TEI

Installer le navigateur Firefox

La page d'accueil de la Text encoding initiative.

Les Guidelines en 'français'.

Tutoriels d'introduction à XML.

Exemples d'utilisation des balises tirés des Guidelines, par ex. l'élément 'seg'. Remplacer le nom de l'élément après le tiret avec le nom de l'élément pour lequel on cherche des exemples.

Activation de l'éditeur jEdit

Télécharger le fichier contenant les documents pour jEdit, le dézipper et le placer dans le dossier du TD. Le dossier doit s'appeler 'documents_tei' sans date.

Pour les instructions de mise en fonction de jEdit, voir ici

Structure du codage

Dans le codage de nos textes (notes de lecture ou de dépouillement d'archives, transcriptions de textes, etc.) nous utilisons la sémantique de la Text encoding initiative, tout en choisissant une partie limitée de ses possibilités afin qu'elle soit adaptée à notre propos.

Nous distinguons entre un codage structurel, qui nous permet de restituer ou construire la stucture du texte encodé, et un codage sémantique, qui nous permet d'identifier des objets dans le texte –on parle d'entités nommées– et de mettre en évidence les relations qui subsistent entre ces objets.

Installation de Zotero

td_histoire_numerique/descriptif_exercice_3.1412959120.txt.gz · Dernière modification: 2014/10/29 12:03 (modification externe)