Outils pour utilisateurs

Outils du site


td_histoire_numerique:descriptif_exercice_3

Ceci est une ancienne révision du document !


Création des objets et indexation des textes

Exercice pour la prochaine séance, 13 octobre – à remettre au plus tard dimanche soir

  1. Créer une trentaine d'objets dans votre base personnelle, de différents types, et les associer entre eux (quelques explications sur le sens des associations sont données ci-dessous)
  2. Exporter le schéma 'objets' de votre base de données personnelle selon les indications fournies ici
  3. Indexer un texte concernant votre sujet (vos notes, une transcription de sources, un article de dictionnaire, etc.) avec les clés des objets (= les identifiants préfixés par ObPe: ObPe1, ObPe2, etc.) selon l'un des deux procédés indiqués ci-dessous: si vous utilisez le traitement de texte, n'indexer qu'une dizaine d'objets; si vous utilisez XML, il n'y a pas de limite
  4. Envoyez-moi le fichier de sauvegarde du schéma 'objets' et le texte indexé dans un dossier contenant les deux, comportant votre nom dans le nom de dossier et compressé (.zip). Dans windows 7, la compression se fait avec un click droit sur le dossier, puis Envoyer vers > Dossier compressé; dans MacOSX, click droit, puis Compresser

Présentation du modèle conceptuel

Voici le fichier du MCD à télécharger.

Création des objets

Création des associations

Encodage de textes en XML – TEI

Installer le navigateur Firefox

La page d'accueil de la Text encoding initiative.

Les Guidelines en 'français'.

Tutoriels d'introduction à XML.

Exemples d'utilisation des balises tirés des Guidelines, par ex. l'élément 'seg'. Remplacer le nom de l'élément après le tiret avec le nom de l'élément pour lequel on cherche des exemples.

Activation de l'éditeur jEdit

Télécharger le fichier contenant les documents pour jEdit, le dézipper et le placer dans le dossier du TD. Le dossier doit s'appeler 'documents_tei' sans date.

Mise en fonction de jEdit:

  • Dans le gestionnaire des plugins (Menu Plugins > Gestionnaires des plugins), vérifier si le plugin ProjectViewer est déjà installé (onglet Gestion), sinon l'ajouter (onglet Installation)
  • Ajouter également le plugin SQL
  • Ouvrir la fenêtre du ProjectViewer, dans le menu AllProjects créer un nouveau projet
  • L'appeler td_histoire_numerique
  • Comme 'root directory' = dossier racine chercher avec le bouton 'Choose' le dossier 'documents_tei' que vous venez de créer à partir du fichier dézippé, le sélectionner sans l'ouvrir et appuyer sur le bouton 'Parcourir'
  • Valider, ce qui comporte l'ouverture de la boite de dialogue 'Inital import', ne rien changer dans le paramètres et clicquer sur 'Import'
  • Le contenu du dossier sera visible dans la fenêtre des projets

Paramétrage de jEdit

  • Modification du menu contextuel
    • Par click droit au milieu de la fenêtre du texte activer le menu contextuel et sélectionner personnaliser ce menu
    • Clicquer sur le bouton '+' pour ajouter une nouvelle entrée
    • Sélectionner plugin XML
    • Ajouter les entrées: Indentation XML, Insertion XML (Afficher/Masquer), Editer la balise au curseur
    • A l'aide des fléches vertes monter les trois éléments insérés dans la deuxième zone du menu
    • Sélectionner Plugin: Sideclick-Parsers, ajouter xml (analyser xml) et le monter au début de la partie xml du menu contextuel
  • Création des raccourcis
    • Dans le menu Utilitaires > Options générales sélectionner Raccourcis
    • Ajouter des raccourcis: Ctrl-i pour Indentation XML; ctrl-maj-i pour Insertion XML; ctrl-maj-a pour xml 'analyser XML)
  • Modification de la largeur de la fenêtre
    • Menu Utilitaires > options générales, dans l'entrée Edition activer le retour à la ligne 'soft'
    • adapter la longueur de la ligne (80-100 caractères) en fonction de la largeur de son propre écran
  • Dans l'entrée encodages, mettre l'encodage par défaut à UTF-8
  • Docker les fenêtres des plugins (Sideclick, ProjectViewer, Insertion XML) dans la fenêtre de gauche: Otions globales, Ancrage
  • Dans 'Zone de texte' modifier la taille de la police de l'éditeur si souhaité


Structure du codage

Dans le codage de nos textes (notes de lecture ou de dépouillement d'archives, transcriptions de textes, etc.) nous utilisons la sémantique de la Text encoding initiative, tout en choisissant une partie limitée de ses possibilités afin qu'elle soit adaptée à notre propos.

Nous distinguons entre un codage structurel, qui nous permet de restituer ou construire la stucture du texte encodé, et un codage sémantique, qui nous permet d'identifier des objets dans le texte –on parle d'entités nommées– et de mettre en évidence les relations qui subsistent entre ces objets.

Installation de Zotero

td_histoire_numerique/descriptif_exercice_3.1412782658.txt.gz · Dernière modification: 2014/10/29 12:03 (modification externe)