Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
fairdata:organisations_patronales_rhone_alpes [2020/04/03 16:48] Pierre Vernus |
fairdata:organisations_patronales_rhone_alpes [2020/05/26 14:24] Pierre Vernus |
||
---|---|---|---|
Ligne 6: | Ligne 6: | ||
- | Les données sont{{:fairdata:syndicats_patronaux_rhonealpes.csv.zip|disponibles au format CSV}}. Le séparateur est le symbole pipe, "|". | + | Les données originelles sont{{:fairdata:syndicats_patronaux_rhonealpes.csv.zip|disponibles au format CSV}}. Le séparateur est le symbole pipe, "|". |
- | L'idée est pouvoir mettre ces données à dispositions pour puissent continuer de vivre et être liées à d'autres données (par exemple celles du [[http://www.patronsdefrance.fr/|Système d'information patrons et patronat français]]. | + | L'idée est pouvoir mettre ces données à disposition pour qu'elles puissent continuer de vivre et être liées à d'autres données (par exemple celles du [[http://www.patronsdefrance.fr/|Système d'information patrons et patronat français]]). |
=== Description du jeu de données === | === Description du jeu de données === | ||
Ligne 25: | Ligne 25: | ||
== contenu des colonnes == | == contenu des colonnes == | ||
+ | |||
+ | Exploration du contenu des données, avant toute exploitation visuelle afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : | ||
+ | |||
+ | * quelles sont les différentes modalités présentes et combien de fois elles apparaissent | ||
+ | * permet de voir s'il y a une ou plusieurs informations contenues dans un même champ, si elles pourront être facilement éclatées ou non, quelle est le type de données (entier, horodatage, booléan), est-ce que le typage des données dans la colonne est systématique. | ||
+ | * permet de comprendre ce que contient la colonne au-delà de son label, quel est la sémantique de son contenu. | ||
+ | |||
+ | Le fichier accessible {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici} décrit le contenu des colonnes. | ||
+ | |||
+ | A l'issue de cette exploration on a noté que certaines colonnes sont vides et que d'autres sont le résultat d'un calcul. Les données de ces dernières ne sera pas importé. Par conséquent, un nouveau fichier a été créé ne contenant que les colonnes qui feront l'objet d'un traitement en vue de constituer un jeu de données fair. | ||
+ | |||
+ | === Jeu de données à traiter === | ||
+ | |||
+ | |||
+ | |||
+ | |||