Outils pour utilisateurs

Outils du site


fairdata:feuille_route_2020

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
fairdata:feuille_route_2020 [2020/04/03 08:49]
Francesco Beretta créée
fairdata:feuille_route_2020 [2020/04/03 12:27]
Francesco Beretta
Ligne 2: Ligne 2:
  
  
-===== Projet ​ =====+===== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs CSV) en données FAIR  =====
  
  
  
 +==== Descriptif sommaire du projet ====
 +
 +Nous savons que la plupart des historien-nes produisent des données de la recherche sous forme de texte ou de tableurs. Retenons pour cet atelier le cas des tableurs. D'​ailleurs les bases de données réalisées de manière empirique et sans formation sont au final des tableurs avec interface graphique de saisie.
 +
 +
 +La question posée en termes de défi à l'​atelier est: ces données sont-elles irrémédiablement perdues après la rehcerche ou on pourrait rendre ces données FAIR - i.e. machine actionable et réutilisables ​
 +elles ne seront pas parfaites mais elles sont là 
 +comment les remettre dans le circuit ​
 +ce défi nous permettra de réfléchir,​ collectivement,​ aux réquis des principes ​
 +FAIR appliqué à histoire - archéo ​
 +
 +
 +==== Feuille de route ====
 +
 +
 +1. j'​importe le fichier dans Pandas (Python) ou sqlite ​
 +2. je l'​inspecte,​ modélise, décide ce que sont les lignes (individus) et les colonnes: leur propriétés ​
 +des mentions de personnes ou des personnes (ou des sites archéologiques,​ etc.) 
 +les propriétés:​ ici lieux de naissance, dates, enseignements,​ etc. 
 +3. je crée ou utilise un profil dans OntoME et je fais un mapping ontologique:​ qu'​est-ce qu'un personne, un enseignement,​ un titre académique:​  licencié en droit 
 +4. je nettoye et crée un vocabulaire avec un seul terme par entrée ​
 +5. je l'​importe dans Opentheso ​
 +6. je reçois des ark et discute des définitions avec la communauté ​
 +7. j'​aligne avec les IdRef 
 +8. je mouline un peu le tout avec Python ​
 +9. avec un librairie Python RDF j'​écris dans le SPARQL ENDPOINT  de l'​ABES ​
 +10. on peut réutiliser les données ​
 +11. on demande à Alexandre de faire un site web Py Projects pour publier des visualisations ​
fairdata/feuille_route_2020.txt · Dernière modification: 2020/06/22 11:18 par Vincent Alamercery