Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
fairdata:feuille_route_2020 [2020/04/03 15:09] Francesco Beretta |
fairdata:feuille_route_2020 [2020/05/15 13:35] Francesco Beretta [Feuille de route] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | Retour à [[atelier:2019-2020|atelier 2019-2020]] | + | [[accueil|Retour]] |
===== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs et CSV) en données FAIR ===== | ===== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs et CSV) en données FAIR ===== | ||
- | |||
- | |||
==== Descriptif sommaire du projet ==== | ==== Descriptif sommaire du projet ==== | ||
Ligne 24: | Ligne 21: | ||
- je répère un fichier Excel ou CSV contenant des données que je veux publier et rendre réutilisables | - je répère un fichier Excel ou CSV contenant des données que je veux publier et rendre réutilisables | ||
- je définis quelles sont les conditions de publication (licence) | - je définis quelles sont les conditions de publication (licence) | ||
- | - je créer une page de documentation de mon projet sur le [[fairdata:accueil|wiki dédié à ce défi]] – licence de la documentation du projet CC 4.0 BY SA donc mention explicite de l'auteur (?) | + | - je créer une page de documentation de mon projet sur le [[accueil|wiki dédié à ce défi]] – licence de la documentation du projet CC 4.0 BY SA donc mention explicite de l'auteur (?) |
- je documente mon choix et les données de base sur la page dédiée à mon projet du wiki | - je documente mon choix et les données de base sur la page dédiée à mon projet du wiki | ||
- je l'inspecte et analyse le contenu du fichier. En particulier je définis ce que sont les lignes (individus, mentions d'individus, etc.), à quels individus du monde réel (physique ou imaginaire) ils correspondent, et ce que sont les colonnes en tant que propriétés de ces individus. | - je l'inspecte et analyse le contenu du fichier. En particulier je définis ce que sont les lignes (individus, mentions d'individus, etc.), à quels individus du monde réel (physique ou imaginaire) ils correspondent, et ce que sont les colonnes en tant que propriétés de ces individus. | ||
Ligne 36: | Ligne 33: | ||
- je nettoye automatiquement ou à la main les données | - je nettoye automatiquement ou à la main les données | ||
- avec un librairie Python RDF j'écris dans le SPARQL ENDPOINT de l'ABES dans un graphe dédié à mon projet | - avec un librairie Python RDF j'écris dans le SPARQL ENDPOINT de l'ABES dans un graphe dédié à mon projet | ||
- | - je document tout le processus sur le wiki ou dans mes carnets jupyter publiés sur GitHub | + | - je documente tout le processus sur le wiki ou dans mes carnets jupyter publiés sur GitHub |
- j'explore les données avec des librairies Python et document dans un carnet public ma démarche | - j'explore les données avec des librairies Python et document dans un carnet public ma démarche | ||
- je me concerte avec d'autres collèques et je fais une proposition de site web PyProjects afin de publier mes données et des analyses, éventuellement interactives sous forme lisible par l'humain. | - je me concerte avec d'autres collèques et je fais une proposition de site web PyProjects afin de publier mes données et des analyses, éventuellement interactives sous forme lisible par l'humain. |