Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
fairdata:organisations_patronales_rhone_alpes [2020/05/26 14:24] Pierre Vernus |
fairdata:organisations_patronales_rhone_alpes [2020/06/16 17:18] (Version actuelle) Pierre Vernus [Base des syndicats patronaux en Rhône-Alpes (XIXe-XXe siècles)] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ==== Base des organisations patronales en Rhône-Alpes (XIXe-XXe siècles) ==== | + | Retour à [[fairdata:accueil|l'accueil]] |
+ | |||
+ | ==== Base des syndicats patronaux en Rhône-Alpes (XIXe-XXe siècles) ==== | ||
Base initialement créée sous Filemaker Pro dans le cadre d'un projet financé. Il n'y a pas de données personnelles. Licence : [[https://creativecommons.org/licenses/by-sa/4.0/|CC BY-SA 4.0]] | Base initialement créée sous Filemaker Pro dans le cadre d'un projet financé. Il n'y a pas de données personnelles. Licence : [[https://creativecommons.org/licenses/by-sa/4.0/|CC BY-SA 4.0]] | ||
Ligne 24: | Ligne 26: | ||
- | == contenu des colonnes == | + | == Contenu des colonnes == |
- | Exploration du contenu des données, avant toute exploitation visuelle afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : | + | Exploration du contenu des données, avant toute exploitation visuelle et analyse des données, afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : |
* quelles sont les différentes modalités présentes et combien de fois elles apparaissent | * quelles sont les différentes modalités présentes et combien de fois elles apparaissent | ||
- | * permet de voir s'il y a une ou plusieurs informations contenues dans un même champ, si elles pourront être facilement éclatées ou non, quelle est le type de données (entier, horodatage, booléan), est-ce que le typage des données dans la colonne est systématique. | + | * y a-t-il une ou plusieurs informations contenues dans un même champ, |
- | * permet de comprendre ce que contient la colonne au-delà de son label, quel est la sémantique de son contenu. | + | * les champs avec plusieurs informations pourront-ils être facilement éclatés ou non, |
+ | * quel est le type de données (entier, texte, horodatage, boolean) de la colonne ? Est-il systématique ? | ||
+ | |||
+ | Cette première exploration doit permettre de comprendre ce que contient la colonne au-delà de son label, quelle est la sémantique de son contenu. | ||
+ | |||
+ | Le fichier décrivant le contenu des colonnes : {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici}}. | ||
+ | |||
+ | Dossier contenant un fichier csv par colonne avec la distribution des modalités contenues par chaque colonne : {{:fairdata:syndicats_patronaux_rhonealpes_distributions.zip|ici}} | ||
+ | |||
+ | |||
+ | A l'issue de cette exploration il ressort que : | ||
+ | |||
+ | * certaines colonnes sont vides (nom en rouge) | ||
+ | * d'autres sont le résultat d'un calcul (nom en vert). | ||
+ | |||
+ | Les données de ces dernières ne seront pas importées. | ||
+ | |||
+ | == Préparation du mapping == | ||
- | Le fichier accessible {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici} décrit le contenu des colonnes. | + | Chaque ligne du tableau concerne un syndicat patronal. |
- | A l'issue de cette exploration on a noté que certaines colonnes sont vides et que d'autres sont le résultat d'un calcul. Les données de ces dernières ne sera pas importé. Par conséquent, un nouveau fichier a été créé ne contenant que les colonnes qui feront l'objet d'un traitement en vue de constituer un jeu de données fair. | + | Syndicat patronal : correspond à la classe **E40 Legal Body** du CIDOC-CRM [[http://ontome.dataforhistory.org/class/39|Legal Body]] du CIDOC-CRM. En effet, il bénéficie d'une reconnaissance officielle et d'un statut légal (loi de mars 1884). La constitution de la base repose avant tout sur les archives produites par le processus d'enregistrement des syndicats professionnels définit par la loi de 1884, les lois ultérieures la modifiant ou la complétant ainsi que par les arrêtés et circulaires en précisant la mise en oeuvre. |
- | === Jeu de données à traiter === | ||
+ | Nouvelle version du fichier ne contenant que les colonnes qui seront traitées (les colonnes correspondant à des champs calculées ou vides ont été exclues) : {{:fairdata:syndicats_patronaux_rhonealpes_mapping.ods|ici format .ods}} | ||
+ | {{:fairdata:syndicats_patronaux_rhonealpes_mapping.xlsx|ici format .xslx}} | ||