Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
fairdata:organisations_patronales_rhone_alpes [2020/04/03 16:48] Pierre Vernus |
fairdata:organisations_patronales_rhone_alpes [2020/06/15 11:23] Vincent Alamercery |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | Retour à [[fairdata:accueil|l'accueil]] | ||
+ | |||
==== Base des organisations patronales en Rhône-Alpes (XIXe-XXe siècles) ==== | ==== Base des organisations patronales en Rhône-Alpes (XIXe-XXe siècles) ==== | ||
Ligne 6: | Ligne 8: | ||
- | Les données sont{{:fairdata:syndicats_patronaux_rhonealpes.csv.zip|disponibles au format CSV}}. Le séparateur est le symbole pipe, "|". | + | Les données originelles sont{{:fairdata:syndicats_patronaux_rhonealpes.csv.zip|disponibles au format CSV}}. Le séparateur est le symbole pipe, "|". |
- | L'idée est pouvoir mettre ces données à dispositions pour puissent continuer de vivre et être liées à d'autres données (par exemple celles du [[http://www.patronsdefrance.fr/|Système d'information patrons et patronat français]]. | + | L'idée est pouvoir mettre ces données à disposition pour qu'elles puissent continuer de vivre et être liées à d'autres données (par exemple celles du [[http://www.patronsdefrance.fr/|Système d'information patrons et patronat français]]). |
=== Description du jeu de données === | === Description du jeu de données === | ||
Ligne 24: | Ligne 26: | ||
- | == contenu des colonnes == | + | == Contenu des colonnes == |
+ | |||
+ | Exploration du contenu des données, avant toute exploitation visuelle afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : | ||
+ | |||
+ | * quelles sont les différentes modalités présentes et combien de fois elles apparaissent | ||
+ | * permet de voir s'il y a une ou plusieurs informations contenues dans un même champ, si elles pourront être facilement éclatées ou non, quelle est le type de données (entier, horodatage, booléan), est-ce que le typage des données dans la colonne est systématique. | ||
+ | * permet de comprendre ce que contient la colonne au-delà de son label, quel est la sémantique de son contenu. | ||
+ | |||
+ | Le fichier accessible {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici}} décrit le contenu des colonnes. | ||
+ | |||
+ | A l'issue de cette exploration on a noté que certaines colonnes sont vides (nom en rouge) et que d'autres sont le résultat d'un calcul (nom en vert). Les données de ces dernières ne sera pas importé. Par conséquent, un nouveau fichier a été créé ne contenant que les colonnes qui feront l'objet d'un traitement en vue de constituer un jeu de données fair. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | |||