Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente | Prochaine révision Les deux révisions suivantes | ||
fairdata:organisations_patronales_rhone_alpes [2020/06/16 12:25] Pierre Vernus [Base des organisations patronales en Rhône-Alpes (XIXe-XXe siècles)] |
fairdata:organisations_patronales_rhone_alpes [2020/06/16 12:36] Pierre Vernus [Base des organisations patronales en Rhône-Alpes (XIXe-XXe siècles)] |
||
---|---|---|---|
Ligne 28: | Ligne 28: | ||
== Contenu des colonnes == | == Contenu des colonnes == | ||
- | Exploration du contenu des données, avant toute exploitation visuelle afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : | + | Exploration du contenu des données, avant toute exploitation visuelle et analyse des données, afin de savoir en quoi consiste précisément les données, quel est le contenu de chaque colonne : |
* quelles sont les différentes modalités présentes et combien de fois elles apparaissent | * quelles sont les différentes modalités présentes et combien de fois elles apparaissent | ||
- | * permet de voir s'il y a une ou plusieurs informations contenues dans un même champ, si elles pourront être facilement éclatées ou non, quelle est le type de données (entier, horodatage, booléan), est-ce que le typage des données dans la colonne est systématique. | + | * y a-t-il une ou plusieurs informations contenues dans un même champ, |
- | * permet de comprendre ce que contient la colonne au-delà de son label, quel est la sémantique de son contenu. | + | * les champs avec plusieurs informations pourront-ils être facilement éclatés ou non, |
+ | * quel est le type de données (entier, texte, horodatage, boolean) de la colonne ? Est-il systématique ? | ||
- | Le fichier accessible {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici}} décrit le contenu des colonnes. | + | Cette première exploration doit permettre de comprendre ce que contient la colonne au-delà de son label, quelle est la sémantique de son contenu. |
- | A l'issue de cette exploration on a noté que certaines colonnes sont vides (nom en rouge) et que d'autres sont le résultat d'un calcul (nom en vert). Les données de ces dernières ne sera pas importé. Par conséquent, un nouveau fichier a été créé ne contenant que les colonnes qui feront l'objet d'un traitement en vue de constituer un jeu de données fair. | + | Le fichier décrivant le contenu des colonnes : {{:fairdata:syndicats_patronaux_rhonealpes_description_contenu.ods|ici}}. |
+ | |||
+ | Dossier contenant un fichier csv par colonne avec la distribution des modalités contenues par chaque colonne : {{:fairdata:syndicats_patronaux_rhonealpes_distributions.zip|ici}} | ||
+ | |||
+ | |||
+ | A l'issue de cette exploration il ressort que : | ||
+ | |||
+ | * certaines colonnes sont vides (nom en rouge) | ||
+ | * d'autres sont le résultat d'un calcul (nom en vert). | ||
+ | |||
+ | Les données de ces dernières ne seront pas importées. | ||
== Préparation du mapping == | == Préparation du mapping == |