Outils pour utilisateurs

Outils du site


siprojuris:enrichir_les_donnes_avec_lod

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
siprojuris:enrichir_les_donnes_avec_lod [2020/12/12 10:58]
Francesco Beretta [Remarque générale]
siprojuris:enrichir_les_donnes_avec_lod [2021/12/09 15:17]
Francesco Beretta [Elargir le corpus avec les données de la BNF]
Ligne 127: Ligne 127:
  
  
- +=== Restreindre aux URI de la BNF ===
-==== Interroger ​la BNF ===+
- +
- +
-=== Effectif des notices d'​autorité disponibles ​ === +
 A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]// A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
- 
- 
  
 <code sparql> <code sparql>
-SELECT ​count(*+SELECT * 
 WHERE { WHERE {
 { {
Ligne 151: Ligne 144:
 } }
 ?idref owl:sameAs ?url. ?idref owl:sameAs ?url.
-FILTER ​CONTAINS(str(?​url), ​"bnf")) +FILTER CONTAINS(STR(?​url), ​'bnf')}
-}+
 } }
 +
 </​code>​ </​code>​
  
  
  
-===== Elargir le corpus avec les données de la BNF =====+==== Interroger ​la BNF ====
  
  
-=== Les informations qu'elles contiennent ​===+=== Effectif des notices d'autorité disponibles  ​===
  
 A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]// A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL des IdRef]]//
  
-<​html><​span style="​color:​red;​font-weight:​bold;">​Suggestion pour le défi</​span></​html>​ Le résultat de cette requête apporte toute une série d'​informations biographiques (date et lieu de naissance, éléments biographiques) se trouvant dans les notices d'​autorité de la BNF. Les extraire et comparer avec les données publiées au format RDF. 
  
  
 <code sparql> <code sparql>
-SELECT *  +SELECT ​count(*
 WHERE { WHERE {
 { {
Ligne 182: Ligne 173:
 } }
 } }
-+?idref owl:sameAs ?url
-?idref owl:sameAs ?uri+FILTER ​CONTAINS(str(?url), "​bnf"​))
-BIND (uri(replace(str(?uri), '​foaf:​Person',​ '​about'​)) as ?new_uri) +
- +
-+
-SERVICE <​http://​data.bnf.fr/​sparql>​ +
-+
-SELECT * +
-WHERE { +
-?new_uri ?pb ?ob +
-+
-}+
 } }
 } }
Ligne 200: Ligne 181:
  
  
 +===== Elargir le corpus avec les données de la BNF =====
  
-=== Retenir uniquement les notices biographiques de la BNF === 
  
 +=== La population cherchée ===
  
-A exécuter sur le //​[[https://​data.idref.fr/​sparql|point d'​accès SPARQL ​des IdRef]]//+A exécuter sur le //​[[https://​data.bnf.fr/sparql/|point d'​accès SPARQL ​de la BNF]]//
  
-<​html><​span style="​color:​red;​font-weight:​bold;">​Suggestion pour le défi</​span></​html> ​En particulier la propriété <​http://​rdvocab.info/​ElementsGr2/​biographicalInformation>​ contient des court textes biographiques qu'il s'​agirait ​d'analyser avec les méthodes de TALN pour en extraire les informations ​disponibles ​et les comparer avec celles ​de la base de données (données RDF de SIPROJURIS). Les personnes, lieux, matières d'​enseignement sont présentes ​dans les données RDF et peuvent être utilisées pour faciliter la reconnaissance ​d'entités nommées ​et leur annotation ​avec les URI du projet //​symogih.org//,​ par ex. les codes AbOb12345 identifiant les matières enseignées sous forme de URI.+<​html><​span style="​color:​red;​font-weight:​bold;">​Suggestion pour le défi</​span></​html> ​Le résultat de cette requête apporte toute une série ​d'​informations ​biographiques (date et lieu de naissance, éléments biographiquesse trouvant ​dans les notices ​d'autorité de la BNF. Les extraire ​et comparer ​avec les données publiées au format RDF.
  
-Il y a un certain nombre de ces informations qui manquent dans les données SIPROJURIS: si elles sont extraites sous forme de données semi-structurées au cours du défi, elles pourront être intégrées par les soins du projet //​symogih.org//​ aux données de la base de donnée SIPROJURIS afin d'​enrichir les données existantes. 
  
 <code sparql> <code sparql>
-SELECT ​+PREFIX rdfs: <​http://​www.w3.org/​2000/​01/​rdf-schema#>​ 
 +PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​ 
 +  
 +SELECT ​?s ?label ?s_bnf ?uri 
 + 
 WHERE { WHERE {
-+  
-SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ +    ​
-{SELECT *  +    SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ 
-WHERE {  +    {SELECT *  
-GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​ +    WHERE {  
-+    GRAPH <​http://​symogih.org/​graph/​siprojuris-sym>​ 
-?s owl:sameAs ?idref. +    
-} +    ?s owl:sameAs ?idref
-+       <​http://​symogih.org/​ontology/​objectStandardName>​ ?label 
-+  
-+    
-?idref owl:sameAs ?uri. +       # FILTER(CONTAINS(?label, 'Bras')) 
-BIND (uri(replace(str(?uri), 'foaf:​Person',​ 'about')) as ?new_uri+    } 
-{ + 
-SERVICE <​http://​data.bnf.fr/​sparql>​ +  }
-+
-SELECT * +
-WHERE { +
-?new_uri <​http://​rdvocab.info/​ElementsGr2/​biographicalInformation>​ ?ob +
-} +
-}+
 } }
 + 
 +?s_bnf owl:sameAs ?idref.
 + 
 +?s_bnf owl:sameAs ?uri.
 + 
 + 
 } }
 +ORDER BY ?s_bnf
 </​code>​ </​code>​
- 
- 
 ==== Obtenir les données concernant des acteurs similaires ==== ==== Obtenir les données concernant des acteurs similaires ====
  
Ligne 288: Ligne 272:
 ==== Lister les URI DBPedia ==== ==== Lister les URI DBPedia ====
  
-Seulement ​68 disponibles [28 décenbre 2018].+Seulement ​101 disponibles [9 décembre 2021].
  
 <code SPARQL> <code SPARQL>
 +PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​
 +
 SELECT *  SELECT * 
    
 WHERE { WHERE {
 +  ​
 { {
 SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
Ligne 305: Ligne 292:
 } }
 } }
-?idref owl:sameAs ?URI+ 
-BIND (URI(REPLACE(STR(?URI), 'foaf:​Person',​ 'about')) AS ?new_uri)+?s_bnf owl:​sameAs ​?idref
 + 
 +?​s_bnf ​owl:sameAs ?dbpedia
 +FILTER(CONTAINS(STR(?dbpedia), 'dbpedia'))
    
-{ 
-SERVICE <​http://​data.bnf.fr/​sparql>​ 
-{ 
-SELECT * 
-WHERE { 
-?new_uri owl:sameAs ?dbpedia. 
-FILTER(CONTAINS(STR(?​dbpedia),​ '​dbpedia'​)) 
-} 
- 
-} 
-} 
 } }
 </​code>​ </​code>​
Ligne 325: Ligne 304:
 ==== Données disponibles dans DBPedia ==== ==== Données disponibles dans DBPedia ====
  
-!!! Requête ​à vérifier.+!!! Attention : cette requête ne marche plus à cause du changement des réglages de sécurité du côté BNF. Il faut donc prévoir un stockage intermédiaire des URI.
  
 <code SPARQL> <code SPARQL>
-SELECT *+PREFIX owl: <​http://​www.w3.org/​2002/​07/​owl#>​ 
 +  
 +SELECT * 
    
 WHERE { WHERE {
 + 
 { {
 SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​ SERVICE <​http://​bhp-publi.ish-lyon.cnrs.fr:​8888/​sparql>​
Ligne 342: Ligne 324:
 } }
 } }
-?idref owl:sameAs ?URI. +  ​ 
-BIND (URI(REPLACE(STR(?​URI),​ '​foaf:​Person',​ '​about'​)) AS ?new_uri)+  
    
 +?s_bnf owl:sameAs ?idref.
 + 
 +?s_bnf owl:sameAs ?dbpedia.
 +FILTER(CONTAINS(STR(?​dbpedia),​ '​dbpedia'​))
  
-  
 { {
 SERVICE <​https://​fr.dbpedia.org/​sparql>​ SERVICE <​https://​fr.dbpedia.org/​sparql>​
Ligne 353: Ligne 338:
 WHERE { WHERE {
 ?dbpedia ?p ?o. ?dbpedia ?p ?o.
- 
-{ 
-SERVICE <​http://​data.bnf.fr/​sparql>​ 
-{ 
-SELECT ?dbpedia 
-WHERE { 
-?new_uri owl:sameAs ?dbpedia. 
-FILTER(CONTAINS(STR(?​dbpedia),​ '​dbpedia'​)) 
 } }
 } }
 } }
- +    ​
- +
-+
-+
-+
 } }
 </​code>​ </​code>​
  
siprojuris/enrichir_les_donnes_avec_lod.txt · Dernière modification: 2024/01/10 19:15 par Vincent Alamercery