Outils pour utilisateurs

Outils du site


siprojuris:enrichir_les_donnes_avec_lod

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
siprojuris:enrichir_les_donnes_avec_lod [2019/01/30 12:06]
Francesco Beretta [Obtenir les données concernant des acteurs similaires]
siprojuris:enrichir_les_donnes_avec_lod [2021/12/09 15:13]
Francesco Beretta [Elargir le corpus avec les données de la BNF]
Ligne 12: Ligne 12:
 L'​objectif de cette partie du défi est d'​enrichir la population SIPROJURIS tant en l'​élargissant qu'en collectant de nouvelles informations concernant les acteurs de la population et en les transformant en utilisant l'​ontologie symogih.org (ou toute autre ontologie opportune) afin de pouvoir les intérroger et analyser dans leur ensemble. L'​objectif de cette partie du défi est d'​enrichir la population SIPROJURIS tant en l'​élargissant qu'en collectant de nouvelles informations concernant les acteurs de la population et en les transformant en utilisant l'​ontologie symogih.org (ou toute autre ontologie opportune) afin de pouvoir les intérroger et analyser dans leur ensemble.
  
-Quelques <​html><​span style="​color:​red;​font-weight:​bold;">​suggestions pour le défi</​span></​html>​ sont indiquées avant chaque requête.+Quelques <​html><​span style="​color:​blue;​font-weight:​bold;">​suggestions pour le défi</​span></​html>​ sont indiquées avant chaque requête.
  
-Si souhaité, les nouvelles données ainsi transformées peuvent être envoyées aux organisateurs du défi (respectivement à Francesco Beretta) ​au format XML ou ttl, tout en les assortissant de métadonnées et d'une indication de licence explicite. Elles pourront alors être publiées dans un graphe supplémentaire du point d'​accès SPARQL.+Si souhaité, les nouvelles données ainsi transformées peuvent être envoyées aux organisateurs du défi au format XML ou ttl, tout en les assortissant de métadonnées et d'une indication de licence explicite. Elles pourront alors être publiées dans un graphe supplémentaire du point d'​accès SPARQL.
  
 ===== Un exemple : Gaston,​Louis,​ Henry May (1849 - 1940) ===== ===== Un exemple : Gaston,​Louis,​ Henry May (1849 - 1940) =====
Ligne 124: Ligne 124:
 } }
 } }
 +</​code>​
 +
 +
 +=== Restreindre aux URI de la BNF ===
 +A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
 +
 +<code sparql>
 +SELECT * 
 +WHERE {
 +{
 +SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
 +{SELECT * 
 +WHERE { 
 +GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​
 +{
 +?s owl:sameAs ?idref.
 +}
 +}
 +}
 +?idref owl:sameAs ?url.
 +FILTER CONTAINS(STR(?​url),​ '​bnf'​)}
 +}
 +
 </​code>​ </​code>​
  
Ligne 169: Ligne 192:
  
 <code sparql> <code sparql>
 +PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​
 +
 +
 SELECT *  SELECT * 
  
Ligne 209: Ligne 235:
  
 Il y a un certain nombre de ces informations qui manquent dans les données SIPROJURIS: si elles sont extraites sous forme de données semi-structurées au cours du défi, elles pourront être intégrées par les soins du projet //​symogih.org//​ aux données de la base de donnée SIPROJURIS afin d'​enrichir les données existantes. Il y a un certain nombre de ces informations qui manquent dans les données SIPROJURIS: si elles sont extraites sous forme de données semi-structurées au cours du défi, elles pourront être intégrées par les soins du projet //​symogih.org//​ aux données de la base de donnée SIPROJURIS afin d'​enrichir les données existantes.
- 
 <code sparql> <code sparql>
-SELECT ​+PREFIX rdfs: <​http://​www.w3.org/​2000/​01/​rdf-schema#>​ 
 +PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​ 
 +  
 +SELECT ​?s ?label ?s_bnf ?p ?entity 
 + 
 WHERE { WHERE {
-+  
-SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ +    ​
-{SELECT *  +    SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ 
-WHERE {  +    {SELECT *  
-GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​ +    WHERE {  
-+    GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​ 
-?s owl:sameAs ?idref. +    
-} +    ?s owl:sameAs ?idref
-+       <​http://​symogih.org/​ontology/​objectStandardName>​ ?label 
-+           
-+    
-?idref owl:sameAs ?uri. +       # FILTER(CONTAINS(?label, 'Bras')) 
-BIND (uri(replace(str(?uri), 'foaf:​Person',​ 'about')) as ?new_uri+    } 
-{ +    LIMIT 20 
-SERVICE <​http://​data.bnf.fr/​sparql>​ +  }
-+
-SELECT * +
-WHERE { +
-?new_uri <​http://​rdvocab.info/​ElementsGr2/​biographicalInformation>​ ?ob +
-} +
-}+
 } }
 + 
 +?s_bnf owl:sameAs ?idref.
 +
 +?s_bnf <​http://​rdvocab.info/​ElementsGr2/​biographicalInformation>​ ?​entity. ​
 +?s_bnf ?p ?entity.
 +
 +# ?entity ?p ?​s_bnf.  ​
 + 
 } }
 +ORDER BY ?s_bnf ?p
 </​code>​ </​code>​
- 
- 
 ==== Obtenir les données concernant des acteurs similaires ==== ==== Obtenir les données concernant des acteurs similaires ====
  
Ligne 288: Ligne 318:
 ==== Lister les URI DBPedia ==== ==== Lister les URI DBPedia ====
  
-Seulement ​68 disponibles [28 décenbre 2018].+Seulement ​101 disponibles [9 décembre 2021].
  
 <code SPARQL> <code SPARQL>
 +PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​
 +
 SELECT *  SELECT * 
    
 WHERE { WHERE {
 +  ​
 { {
 SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
Ligne 305: Ligne 338:
 } }
 } }
-?idref owl:sameAs ?URI+ 
-BIND (URI(REPLACE(STR(?URI), 'foaf:​Person',​ 'about')) AS ?new_uri)+?s_bnf owl:​sameAs ​?idref
 + 
 +?​s_bnf ​owl:sameAs ?dbpedia
 +FILTER(CONTAINS(STR(?dbpedia), 'dbpedia'))
    
-{ 
-SERVICE <​http://​data.bnf.fr/​sparql>​ 
-{ 
-SELECT * 
-WHERE { 
-?new_uri owl:sameAs ?dbpedia. 
-FILTER(CONTAINS(STR(?​dbpedia),​ '​dbpedia'​)) 
-} 
- 
-} 
-} 
 } }
 </​code>​ </​code>​
Ligne 325: Ligne 350:
 ==== Données disponibles dans DBPedia ==== ==== Données disponibles dans DBPedia ====
  
-!!! Requête ​à vérifier.+!!! Attention : cette requête ne marche plus à cause du changement des réglages de sécurité du côté BNF. Il faut donc prévoir un stockage intermédiaire des URI.
  
 <code SPARQL> <code SPARQL>
-SELECT *+PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​ 
 +  
 +SELECT * 
    
 WHERE { WHERE {
 + 
 { {
 SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
Ligne 342: Ligne 370:
 } }
 } }
-?idref owl:sameAs ?URI. +  ​ 
-BIND (URI(REPLACE(STR(?​URI),​ '​foaf:​Person',​ '​about'​)) AS ?new_uri)+  
    
 +?s_bnf owl:sameAs ?idref.
 + 
 +?s_bnf owl:sameAs ?dbpedia.
 +FILTER(CONTAINS(STR(?​dbpedia),​ '​dbpedia'​))
  
-  
 { {
 SERVICE <​https://​fr.dbpedia.org/​sparql>​ SERVICE <​https://​fr.dbpedia.org/​sparql>​
Ligne 353: Ligne 384:
 WHERE { WHERE {
 ?dbpedia ?p ?o. ?dbpedia ?p ?o.
- 
-{ 
-SERVICE <​http://​data.bnf.fr/​sparql>​ 
-{ 
-SELECT ?dbpedia 
-WHERE { 
-?new_uri owl:sameAs ?dbpedia. 
-FILTER(CONTAINS(STR(?​dbpedia),​ '​dbpedia'​)) 
 } }
 } }
 } }
- +    ​
- +
-+
-+
-+
 } }
 </​code>​ </​code>​
  
siprojuris/enrichir_les_donnes_avec_lod.txt · Dernière modification: 2024/01/10 19:15 par Vincent Alamercery