Outils pour utilisateurs

Outils du site


fairdata:good_practices

Ceci est une ancienne révision du document !


Retour à l'accueil

Production de données FAIR en histoire : bonnes pratiques

Prendre connaissance des données

Un petit script Python qui permet de prendre connaissance du contenu des données contenu dans un ou des tableurs excel. Le fichier à télécharger ici est zippé, il doit donc être décompressé.

Le script permet d'obtenir :

  • à partir d'un tableur avec une seule feuille un autre tableur dont chaque feuille contient la distribution des modalités contenu dans cette colonne. Ainsi, si le tableur de départ contenait un tableau avec 6 colonnes, le fichier de sortie contiendra 6 feuilles et dans chacune d'elle la liste des modalités apparaissant dans la colonne et le nombre d'occurrence de chacune de ces modalités.
  • à partir d'un tableur avec plusieurs feuilles, autant de fichiers qu'il y a de feuilles dans le fichier en entrée. Chaque fichier contient lui-même autant de feuille que de colonne dans le tableau qu'il résume.

Le dossier exploration_donnees contient trois sous-dossiers :

  • le dossier data dans lequel il faut placer le ou les fichiers des tableurs excel que l'on veut explorer ;
  • le dossier out dans lequel on récupère le ou les fichiers produits contenant les distribution des des modalités des colonnes des tableaux traités.
  • le dossier scripts contenant le script python.

Les opérations à effectuer sont les suivantes :

  • placer le ou les fichiers à explorer dans le dossier data
  • ouvrir Spyder (ou un autre IDE)
  • lancer le script (flèche verte dans Spyder). Selon le nombre de fichiers, le nombre de feuilles dans chacun d'eux et le volume des données, il peut être plus ou moins long.
  • récupérer les fichiers avec les distributions dans le dossier out
fairdata/good_practices.1589451007.txt.gz · Dernière modification: 2020/05/14 12:10 par Pierre Vernus