Différences

Ci-dessous, les différences entre deux révisions de la page.

--- fairdata:feuille_route_2020 [2020/04/03 08:54]
Francesco Beretta
+++ fairdata:feuille_route_2020 [2020/04/03 12:37]
Francesco Beretta [Descriptif sommaire du projet]
@@ Ligne 2: / Ligne 2: @@
-====== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs CSV) en données FAIR  ======
+===== Comment transformer les données hétérogènes semi-structurées (notamment issues de tableurs CSV) en données FAIR  =====
+==== Descriptif sommaire du projet ====
+Nous savons que la plupart des historien-nes produisent des données de recherche sous forme de texte ou de tableurs. Retenons pour cet atelier le cas des tableurs. D'ailleurs les bases de données réalisées de manière empirique et sans formation sont au final des tableurs avec interface graphique de saisie.
+\\
+La question posée en termes de défi à l'atelier est: ces données sont-elles irrémédiablement perdues après la recherche ou pourrait-on rendre ces données FAIR - i.e. réutilisables pour d'autres recherches et écrites dans des formats accessibles par les machines (et donc pas seulement lues sur un site web) ? Comment remettre les données dans le circuit, tant pour les chercheur-es eux-elles mêmes que pour les autres chercheur-es et le public ?
+\\
+Le défi relevé dans cet atelier vise à réfléchir, collectivement, aux réquis des principes
+FAIR appliqué à histoire. Quelles sont les conditions pour rendre les données de la recherche (dans ce cas des données semistructurées) accessibles dans le sens d'un processus de repliquabilité de la production de connaissances et de réutilisation pour de nouvelles recherches ?
+Les réponses à ces questions n'existent pas toutes faites, l'objectif de l'atelier est de construire ensemble des bonnes pratiques à ce sujet, tout en partant de l'expérience du projet [[http://symogih.org/|symogih.org]] et autour des applications [[https://ontome.dataforhistory.org/|OntoME]] de modélisation des connaissances et [[https://www.mom.fr/ressources-numeriques/opentheso|Opentheso]] de gestion de vocabulaires contrôlés.
+==== Feuille de route ====
+. j'importe le fichier dans Pandas (Python) ou sqlite
+. je l'inspecte, modélise, décide ce que sont les lignes (individus) et les colonnes: leur propriétés
+des mentions de personnes ou des personnes (ou des sites archéologiques, etc.)
+les propriétés: ici lieux de naissance, dates, enseignements, etc.
+. je crée ou utilise un profil dans OntoME et je fais un mapping ontologique: qu'est-ce qu'un personne, un enseignement, un titre académique:  licencié en droit
+. je nettoye et crée un vocabulaire avec un seul terme par entrée
+. je l'importe dans Opentheso
+. je reçois des ark et discute des définitions avec la communauté
+. j'aligne avec les IdRef
+. je mouline un peu le tout avec Python
+. avec un librairie Python RDF j'écris dans le SPARQL ENDPOINT  de l'ABES
+. on peut réutiliser les données
+. on demande à Alexandre de faire un site web Py Projects pour publier des visualisations

Wiki de l'ARHNAxe de recherche en histoire numériqueLARHRA UMR5190

Outils pour utilisateurs

Outils du site

Différences

Outils de la page

Wiki de l'ARHN

Axe de recherche en histoire numérique
LARHRA UMR5190