Outils pour utilisateurs

Outils du site


siprojuris:enrichir_les_donnes_avec_lod

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
siprojuris:enrichir_les_donnes_avec_lod [2018/05/27 23:45]
Francesco Beretta
siprojuris:enrichir_les_donnes_avec_lod [2018/12/28 20:34]
Francesco Beretta [Pour trouver la biblio, inverser le triplet]
Ligne 6: Ligne 6:
  
  
-==== Remarque générale ====+===== Remarque générale ​=====
  
-L'​alignement des données du projet SIPROJURIS, effectué pour deux tiers des acteurs et en cours pour les autres, permet d'​accéder à plusieurs ressources publiées dans les LOD, dont les catalogues du SUDOC et BNF, Wikipedia et DBPedia, Wikidata, etc. +L'​alignement des données du projet SIPROJURIS, effectué pour trois quarts ​des acteurs ​(431 sur 567 professeurs) ​et en cours pour les autres, permet d'​accéder à plusieurs ressources publiées dans les LOD, dont les catalogues du SUDOC et BNF, Wikipedia et DBPedia, Wikidata, etc. 
  
 L'​objectif de cette partie du défi est d'​enrichir la population SIPROJURIS tant en l'​élargissant qu'en collectant de nouvelles informations concernant les acteurs de la population et en les transformant en utilisant l'​ontologie symogih.org (ou toute autre ontologie opportune) afin de pouvoir les intérroger et analyser dans leur ensemble. L'​objectif de cette partie du défi est d'​enrichir la population SIPROJURIS tant en l'​élargissant qu'en collectant de nouvelles informations concernant les acteurs de la population et en les transformant en utilisant l'​ontologie symogih.org (ou toute autre ontologie opportune) afin de pouvoir les intérroger et analyser dans leur ensemble.
  
-Les nouvelles données ainsi transformées peuvent être envoyées aux organisateurs du défi (respectivement à Francesco Beretta) au format XML ou ttl et elles seront mises dans un graphe supplémentaire du point d'​accès SPARQL)+Si souhaité, les nouvelles données ainsi transformées peuvent être envoyées aux organisateurs du défi (respectivement à Francesco Beretta) au format XML ou ttl, tout en les assortissant de métadonnées ​et d'une indication de licence explicite. Elles pourront alors être publiées ​dans un graphe supplémentaire du point d'​accès SPARQL.
  
-==== Un exemple : Gaston,​Louis,​ Henry May (1849 - 1940) ====+===== Un exemple : Gaston,​Louis,​ Henry May (1849 - 1940) =====
  
 +ATTENTION : requêtes à exécuter sur le [[http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql|point d'​accès SPARQL du projet //​symogih.org//​]]
  
-=== Son parcours biographique ​ ===+==== Son parcours biographique  ​====
  
 <code sparql> <code sparql>
Ligne 42: Ligne 43:
 </​code>​ </​code>​
  
-=== Les données IdRef le concernant ===+==== Les données IdRef le concernant ​====
  
 <code sparql> <code sparql>
Ligne 49: Ligne 50:
  
 { {
- 
- 
 GRAPH <​http://​symogih.org/​graph/​siprojuris-sym> ​ GRAPH <​http://​symogih.org/​graph/​siprojuris-sym> ​
             {syr:​Actr56241 owl:sameAs ?idRef.             {syr:​Actr56241 owl:sameAs ?idRef.
             }             }
 SERVICE <​https://​data.idref.fr/​sparql>​ SERVICE <​https://​data.idref.fr/​sparql>​
- 
   { ?idRef ?p ?o.   { ?idRef ?p ?o.
   }   }
- 
 } }
 +</​code>​
  
-Pour trouver la biblio, inverser le triplet 
-SELECT ?idRef ?s ?p 
-WHERE  
  
-{SERVICE <​https://​data.idref.fr/​sparql>​+==== Pour trouver la biblio, inverser le triplet ====
  
-{ ?s ?p ?idRef.+Une question intéressante en termes de TALN et d'​analyse de données: typologie des publications en fonctions de l'​évolution de la carrière.
  
-        ​{GRAPH <​http://​symogih.org/​graph/​siprojuris-sym> ​+<code sparql>​ 
 + 
 +SELECT ?s ?o 
 +WHERE   
 +
 +{GRAPH <​http://​symogih.org/​graph/​siprojuris-sym> ​
             {syr:​Actr56241 owl:sameAs ?idRef.             {syr:​Actr56241 owl:sameAs ?idRef.
             }             }
 +         }
 +SERVICE <​https://​data.idref.fr/​sparql>​
 +   { ?s ?p ?idRef;
 +     <​http://​purl.org/​dc/​terms/​bibliographicCitation>​ ?o}
 +}
  
-        ​}+</​code>​ 
 + 
 + 
 +===== Interroger l'​ensemble des données ===== 
 + 
 + 
 +ATTENTION: le requêtes suivantes sont à exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//​. 
 + 
 + 
 +==== Retrouver toutes les ressources liées ==== 
 + 
 + 
 +<code sparql>​ 
 +SELECT *  
 +WHERE { 
 +SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ 
 +{  
 +GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​ 
 +
 +?s owl:sameAs ?o. 
 +}
 } }
 } }
 </​code>​ </​code>​
  
 +==== Trouver les URIs des ressources liées à travers les IdRef ====
 +A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
 +
 +<code sparql>
 +SELECT * 
 +WHERE {
 +{
 +SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
 +{SELECT * 
 +WHERE { 
 +GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​
 +{
 +?s owl:sameAs ?idref.
 +}
 +}
 +}
 +?idref owl:sameAs ?url.
 +}
 +}
 +</​code>​
 +
 +
 +
 +==== Interroger la BNF ====
 +
 +=== Effectif des notices d'​autorité disponibles ​ ===
 +
 +A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
 +
 +<code sparql>
 +SELECT count(*) ​
 +WHERE {
 +{
 +SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
 +{SELECT * 
 +WHERE { 
 +GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​
 +{
 +?s owl:sameAs ?idref.
 +}
 +}
 +}
 +?idref owl:sameAs ?url.
 +FILTER ( CONTAINS(str(?​url),​ "​bnf"​))
 +}
 +}
 +</​code>​
 +
 +
 +
 +=== Les informations qu'​elles contiennent ===
 +
 +A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
 +
 +<code sparql>
 +SELECT * 
 +
 +WHERE {
 +{
 +SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
 +{SELECT * 
 +WHERE { 
 +GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​
 +{
 +?s owl:sameAs ?idref.
 +}
 +}
 +}
 +}
 +?idref owl:sameAs ?uri.
 +BIND (uri(replace(str(?​uri),​ '​foaf:​Person',​ '​about'​)) as ?new_uri)
 +
 +{
 +SERVICE <​http://​data.bnf.fr/​sparql>​
 +{
 +SELECT *
 +WHERE {
 +?new_uri ?pb ?ob
 +}
 +}
 +}
 +}
 +</​code>​
 +
 +
 +===== Elargir le corpus avec les données de la BNF =====
 +
 +
 +==== Retenir uniquement les notices biographiques de la BNF ====
 +
 +
 +A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
 +
 +<code sparql>
 +SELECT * 
 +WHERE {
 +{
 +SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
 +{SELECT * 
 +WHERE { 
 +GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​
 +{
 +?s owl:sameAs ?idref.
 +}
 +}
 +}
 +}
 +?idref owl:sameAs ?uri.
 +BIND (uri(replace(str(?​uri),​ '​foaf:​Person',​ '​about'​)) as ?new_uri)
 +{
 +SERVICE <​http://​data.bnf.fr/​sparql>​
 +{
 +SELECT *
 +WHERE {
 +?new_uri <​http://​rdvocab.info/​ElementsGr2/​biographicalInformation>​ ?ob
 +}
 +}
 +}
 +}
 +</​code>​
 +
 +
 +==== Obtenir les données concernant des acteurs similaires ====
 +
 +ATTENTION: le requêtes suivantes sont à exécuter sur le //​[[http://​data.bnf.fr/​sparq|point d'​accès SPARQL de la BNF]]//.
 +
 +
 +Chercher les acteurs dont le vocabulaire des notices est proche de celui de la population de départ
 +
 +<code sparql>
 +PREFIX ​ egr:  <​http://​rdvocab.info/​ElementsGr2/>​
 + 
 +SELECT DISTINCT ​ ?s ?na ?fn ?annee ?pb ?gd ?bio
 +WHERE
 +  { { { SELECT DISTINCT ​ ?s ?bio
 +        WHERE
 +          {   { ?s egr:​biographicalInformation ?bio
 +            FILTER (( CONTAINS(?​bio,​ "​droit"​) || CONTAINS(?​bio,​ "​Droit"​) )  && ( CONTAINS(?​bio,​ "​faculté"​) || CONTAINS(?​bio,​ "​Faculté"​) )  )
 +              }
 +            UNION
 +              { ?s egr:​biographicalInformation ?bio
 +            FILTER (( CONTAINS(?​bio,​ "​droit"​) || CONTAINS(?​bio,​ "​Droit"​) )  && ( CONTAINS(?​bio,​ "​professeur"​) || CONTAINS(?​bio,​ "​Professeur"​) )  )
 +        }
 +            UNION
 +              { ?s egr:​biographicalInformation ?bio
 +            FILTER (( CONTAINS(?​bio,​ "​juriste"​) || CONTAINS(?​bio,​ "​Juriste"​) )  && ( CONTAINS(?​bio,​ "​professeur"​) || CONTAINS(?​bio,​ "​Professeur"​) )  )
 +            }
 +          }
 +      }
 +      ?s egr:​dateOfBirth ?bd
 +      OPTIONAL
 +        { ?s <​http://​xmlns.com/​foaf/​0.1/​name>​ ?na }
 +      OPTIONAL
 +        { ?s <​http://​xmlns.com/​foaf/​0.1/​familyName>​ ?fn }
 +      OPTIONAL
 +        { ?s egr:​placeOfBirth ?pb }
 +      OPTIONAL
 +        { ?s <​http://​xmlns.com/​foaf/​0.1/​gender>​ ?gd }
 +    }
 +    BIND(STRBEFORE(STRAFTER(STR(?​bd),​ "​http://​data.bnf.fr/​date/"​),​ "/"​) AS ?annee)
 +    FILTER ( ( ?annee > "​1791"​ ) )
 +  }
 +ORDER BY ?annee
 +</​code>​
  
  
siprojuris/enrichir_les_donnes_avec_lod.txt · Dernière modification: 2024/01/10 19:15 par Vincent Alamercery