Outils pour utilisateurs

Outils du site


td_histoire_numerique:descriptif_exercice_3

Ceci est une ancienne révision du document !


Création des objets et indexation des textes

Exercice pour la prochaine séance

Exercice pour la séance du 13 octobre – à remettre au plus tard dimanche soir

  1. Créer une trentaine d'objets dans votre base personnelle, de différents types, et les associer entre eux (quelques explications sur le sens des associations sont données ci-dessous)
  2. Exporter le schéma 'objets' de votre base de données personnelle selon les indications fournies ici
  3. Indexer un texte concernant votre sujet (vos notes, une transcription de sources, un article de dictionnaire, etc.) avec les clés des objets (= les identifiants préfixés par ObPe: ObPe1, ObPe2, etc.) selon l'un des deux procédés indiqués ci-dessous: si vous utilisez le traitement de texte, n'indexer qu'une dizaine d'objets; si vous utilisez XML, il n'y a pas de limite
  4. Envoyez-moi le fichier de sauvegarde du schéma 'objets' et le texte indexé dans un dossier contenant les deux, comportant votre nom dans le nom de dossier et compressé (.zip). Dans windows 7, la compression se fait avec un click droit sur le dossier, puis Envoyer vers > Dossier compressé; dans MacOSX, click droit, puis Compresser

Création des objets

Du modèle conceptuel à la base de données

Le modèle conceptuel: la sémantique du système d'information

Voici le fichier du MCD à télécharger.

Le modèle conceptuel (MCD) est le fondement de la construction d'une base de données. Il indique les entités qui vont étre créées ainsi que leurs associations. Il indique donc en quelque sorte le sens, la sémantique des données qu'on va produire.

Les entités représentent des classes d'objets, c'est-à-dire des ensembles d'objets qui partagent les mêmes propriétés. Le MCD liste donc également les propriété des entités et de leurs associations.

Dans notre MCD, la partie concernant les objets dont s'occupe l'historien (c'est-à-dire les acteurs, les lieux, les ouvrages consultés, etc.) comporte deux entités: les objets eux-mêmes et les noms des objets. Ces entités sont reliées par deux associations: l'une entre les objets et leurs noms, l'autre entre deux objets (on appelle cette association réflexive car elle relie l'entité objet à elle-même). La cardinalité des associations, c'est-à-dire les numéros qui figurent sur les pattes des associations indiquent qu'un nom d'objet ne peut être relié qu'à un seul objet, alors qu'on objet peut avoir plusieurs noms. Quant aux associations entre objets, elles peuvent associer autant de paires d'objets qu'on veut: c'est une association de cardinalité maximale de 'n' à 'n', comme disent les spécialistes.

Tous les objets, ainsi que leurs liens essentiels (un livre qui parle d'un personnage historique, une photo qui représente une personne avec ses caractéristiques, etc.) sont traités avec seulement deux entités et deux associations. Ce modèle des données est donc dit générique car il permet de tout traiter de manière simple et efficace.

Un modèle générique requiert quelques paramètres qui spécifient quel est le type des objets (acteurs, acteurs collectifs, objets abstraits, etc.) ainsi que le type des associations qui subsistent entre les objets (documentation, classes, reproduction, etc.). Tel est le rôle de l'entité 'paramètre système' et de l'association 'associer parametres systeme' qui permettent le bon fonctionnement du système d'information.

Les tables comme 'représentation informatique' du modèle

A partir du modèle des données, on a créé les tables qui se trouvent dans le schéma 'objets' de la base de données, ainsi que dans le schéma 'parametres'.

Un schéma est une sorte de dossier qui contient des tables, des fonctions, etc.
Une table est un ensemble de cellules, organisées en lignes et en colonnes. Une cellule appartient toujours à la même ligne et à la même colonne et ne peut pas être déplacée (ce qui est en revanche le cas dans une feuille de calcul qui, précisément, n'est pas une table de stockage de données mais un outil de calcul).

Dans une table, les lignes représentent les individus, c'est-à-dire les objets. Les colonnes représentent les propriétés des objets (les mêmes qu'on trouve dans le modèle conceptuel). Une cellule contient donc la valeur de la propriété pour l'individu représenté par la ligne. La table elle même représente informatiquement l'entité, la classe ou ensemble des individus.

Le logiciel client pgAdminIII permet de visualiser directement les tables. Dans le schéma 'objets' on trouve les trois tables qui vont accueillir vos propres objets. Dans le schéma 'parametres' se trouvent les deux tables des paramètres. Il ne faut pas toucher aux données de ces dernières car, pour une question de cohérence, c'est moi qui définis leur contenu.

L'interface du client Base (suite LibreOffice) permet une visualisation des tables et de leur contenu plus organique et facile à manipuler que d'accéder directement aux tables.

Création des objets

Création des associations

Encodage de textes en XML – TEI

Installer le navigateur Firefox

La page d'accueil de la Text encoding initiative.

Les Guidelines en 'français'.

Tutoriels d'introduction à XML.

Exemples d'utilisation des balises tirés des Guidelines, par ex. l'élément 'seg'. Remplacer le nom de l'élément après le tiret avec le nom de l'élément pour lequel on cherche des exemples.

Activation de l'éditeur jEdit

Télécharger le fichier contenant les documents pour jEdit, le dézipper et le placer dans le dossier du TD. Le dossier doit s'appeler 'documents_tei' sans date.

Pour les instructions de mise en fonction de jEdit, voir ici

Structure du codage

Dans le codage de nos textes (notes de lecture ou de dépouillement d'archives, transcriptions de textes, etc.) nous utilisons la sémantique de la Text encoding initiative, tout en choisissant une partie limitée de ses possibilités afin qu'elle soit adaptée à notre propos.

Nous distinguons entre un codage structurel, qui nous permet de restituer ou construire la stucture du texte encodé, et un codage sémantique, qui nous permet d'identifier des objets dans le texte –on parle d'entités nommées– et de mettre en évidence les relations qui subsistent entre ces objets.

Installation de Zotero

td_histoire_numerique/descriptif_exercice_3.1412973081.txt.gz · Dernière modification: 2014/10/29 12:03 (modification externe)