Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
fairdata:organisations_patronales_rhone_alpes [2020/05/26 13:04] Pierre Vernus |
fairdata:organisations_patronales_rhone_alpes [2020/05/26 14:24] Pierre Vernus |
||
---|---|---|---|
Ligne 25: | Ligne 25: | ||
== contenu des colonnes == | == contenu des colonnes == | ||
+ | |||
+ | Exploration du contenu des données, avant toute exploitation visuelle afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : | ||
+ | |||
+ | * quelles sont les différentes modalités présentes et combien de fois elles apparaissent | ||
+ | * permet de voir s'il y a une ou plusieurs informations contenues dans un même champ, si elles pourront être facilement éclatées ou non, quelle est le type de données (entier, horodatage, booléan), est-ce que le typage des données dans la colonne est systématique. | ||
+ | * permet de comprendre ce que contient la colonne au-delà de son label, quel est la sémantique de son contenu. | ||
+ | |||
+ | Le fichier accessible {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici} décrit le contenu des colonnes. | ||
+ | |||
+ | A l'issue de cette exploration on a noté que certaines colonnes sont vides et que d'autres sont le résultat d'un calcul. Les données de ces dernières ne sera pas importé. Par conséquent, un nouveau fichier a été créé ne contenant que les colonnes qui feront l'objet d'un traitement en vue de constituer un jeu de données fair. | ||
+ | |||
+ | === Jeu de données à traiter === | ||
+ | |||
+ | |||
+ | |||
+ | |||