Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
fairdata:feuille_route_2020 [2020/04/15 17:12] Vincent Alamercery Page moved from atelier:feuille_route_2020 to fairdata:feuille_route_2020 |
fairdata:feuille_route_2020 [2020/05/26 11:46] Francesco Beretta [Feuille de route] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | Retour à [[atelier:2019-2020|atelier 2019-2020]] | + | [[accueil|Retour]] |
===== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs et CSV) en données FAIR ===== | ===== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs et CSV) en données FAIR ===== | ||
- | |||
- | |||
==== Descriptif sommaire du projet ==== | ==== Descriptif sommaire du projet ==== | ||
Ligne 24: | Ligne 21: | ||
- je répère un fichier Excel ou CSV contenant des données que je veux publier et rendre réutilisables | - je répère un fichier Excel ou CSV contenant des données que je veux publier et rendre réutilisables | ||
- je définis quelles sont les conditions de publication (licence) | - je définis quelles sont les conditions de publication (licence) | ||
- | - je créer une page de documentation de mon projet sur le [[fairdata:accueil|wiki dédié à ce défi]] – licence de la documentation du projet CC 4.0 BY SA donc mention explicite de l'auteur (?) | + | - je créer une page de documentation de mon projet sur le [[accueil|wiki dédié à ce défi]] – licence de la documentation du projet CC 4.0 BY SA donc mention explicite de l'auteur (?) |
- je documente mon choix et les données de base sur la page dédiée à mon projet du wiki | - je documente mon choix et les données de base sur la page dédiée à mon projet du wiki | ||
- je l'inspecte et analyse le contenu du fichier. En particulier je définis ce que sont les lignes (individus, mentions d'individus, etc.), à quels individus du monde réel (physique ou imaginaire) ils correspondent, et ce que sont les colonnes en tant que propriétés de ces individus. | - je l'inspecte et analyse le contenu du fichier. En particulier je définis ce que sont les lignes (individus, mentions d'individus, etc.), à quels individus du monde réel (physique ou imaginaire) ils correspondent, et ce que sont les colonnes en tant que propriétés de ces individus. | ||
- | - je modélise le fichier comme tel, puis ses colonnes dans un projet OntoME | + | - je modélise le fichier comme tel en définissant à quelle classe appartiennent les individus (c'est-à-dire les lignes du ficher : personnes, mentions de personnes, d'activités, etc.) |
+ | - ensuite je modélise ses colonnes (c'est-à-dire les propriétés des individus) et je vérifier la présence des classes et propriétés correspondantes dans un OntoME | ||
+ | - je complète éventuellement le modèle dans un espace de noms de OntoME | ||
+ | - je créer un profil correspondant à mon fichier ou mon projet, ou j'utilise un profil existant | ||
+ | - je vérifier la présence des classes de mes termes et instances dans Opentheso | ||
- j'importe le fichier dans Pandas (Python) ou sqlite je nettoye et crée un vocabulaire avec un seul terme par entrée | - j'importe le fichier dans Pandas (Python) ou sqlite je nettoye et crée un vocabulaire avec un seul terme par entrée | ||
- je l'importe dans Opentheso | - je l'importe dans Opentheso | ||
Ligne 36: | Ligne 37: | ||
- je nettoye automatiquement ou à la main les données | - je nettoye automatiquement ou à la main les données | ||
- avec un librairie Python RDF j'écris dans le SPARQL ENDPOINT de l'ABES dans un graphe dédié à mon projet | - avec un librairie Python RDF j'écris dans le SPARQL ENDPOINT de l'ABES dans un graphe dédié à mon projet | ||
- | - je document tout le processus sur le wiki ou dans mes carnets jupyter publiés sur GitHub | + | - je documente tout le processus sur le wiki ou dans mes carnets jupyter publiés sur GitHub |
- j'explore les données avec des librairies Python et document dans un carnet public ma démarche | - j'explore les données avec des librairies Python et document dans un carnet public ma démarche | ||
- je me concerte avec d'autres collèques et je fais une proposition de site web PyProjects afin de publier mes données et des analyses, éventuellement interactives sous forme lisible par l'humain. | - je me concerte avec d'autres collèques et je fais une proposition de site web PyProjects afin de publier mes données et des analyses, éventuellement interactives sous forme lisible par l'humain. |