Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
siprojuris:enrichir_les_donnes_avec_lod [2020/12/12 10:58] Francesco Beretta [Remarque générale] |
siprojuris:enrichir_les_donnes_avec_lod [2021/12/09 15:17] Francesco Beretta [Elargir le corpus avec les données de la BNF] |
||
---|---|---|---|
Ligne 127: | Ligne 127: | ||
- | + | === Restreindre aux URI de la BNF === | |
- | ==== Interroger la BNF ==== | + | |
- | + | ||
- | + | ||
- | === Effectif des notices d'autorité disponibles === | + | |
A exécuter sur le //[[https://data.idref.fr/sparql|point d'accès SPARQL des IdRef]]// | A exécuter sur le //[[https://data.idref.fr/sparql|point d'accès SPARQL des IdRef]]// | ||
- | |||
- | |||
<code sparql> | <code sparql> | ||
- | SELECT count(*) | + | SELECT * |
WHERE { | WHERE { | ||
{ | { | ||
Ligne 151: | Ligne 144: | ||
} | } | ||
?idref owl:sameAs ?url. | ?idref owl:sameAs ?url. | ||
- | FILTER ( CONTAINS(str(?url), "bnf")) | + | FILTER CONTAINS(STR(?url), 'bnf')} |
- | } | + | |
} | } | ||
+ | |||
</code> | </code> | ||
- | ===== Elargir le corpus avec les données de la BNF ===== | + | ==== Interroger la BNF ==== |
- | === Les informations qu'elles contiennent === | + | === Effectif des notices d'autorité disponibles === |
A exécuter sur le //[[https://data.idref.fr/sparql|point d'accès SPARQL des IdRef]]// | A exécuter sur le //[[https://data.idref.fr/sparql|point d'accès SPARQL des IdRef]]// | ||
- | <html><span style="color:red;font-weight:bold;">Suggestion pour le défi</span></html> Le résultat de cette requête apporte toute une série d'informations biographiques (date et lieu de naissance, éléments biographiques) se trouvant dans les notices d'autorité de la BNF. Les extraire et comparer avec les données publiées au format RDF. | ||
<code sparql> | <code sparql> | ||
- | SELECT * | + | SELECT count(*) |
WHERE { | WHERE { | ||
{ | { | ||
Ligne 182: | Ligne 173: | ||
} | } | ||
} | } | ||
- | } | + | ?idref owl:sameAs ?url. |
- | ?idref owl:sameAs ?uri. | + | FILTER ( CONTAINS(str(?url), "bnf")) |
- | BIND (uri(replace(str(?uri), 'foaf:Person', 'about')) as ?new_uri) | + | |
- | + | ||
- | { | + | |
- | SERVICE <http://data.bnf.fr/sparql> | + | |
- | { | + | |
- | SELECT * | + | |
- | WHERE { | + | |
- | ?new_uri ?pb ?ob | + | |
- | } | + | |
- | } | + | |
} | } | ||
} | } | ||
Ligne 200: | Ligne 181: | ||
+ | ===== Elargir le corpus avec les données de la BNF ===== | ||
- | === Retenir uniquement les notices biographiques de la BNF === | ||
+ | === La population cherchée === | ||
- | A exécuter sur le //[[https://data.idref.fr/sparql|point d'accès SPARQL des IdRef]]// | + | A exécuter sur le //[[https://data.bnf.fr/sparql/|point d'accès SPARQL de la BNF]]// |
- | <html><span style="color:red;font-weight:bold;">Suggestion pour le défi</span></html> En particulier la propriété <http://rdvocab.info/ElementsGr2/biographicalInformation> contient des court textes biographiques qu'il s'agirait d'analyser avec les méthodes de TALN pour en extraire les informations disponibles et les comparer avec celles de la base de données (données RDF de SIPROJURIS). Les personnes, lieux, matières d'enseignement sont présentes dans les données RDF et peuvent être utilisées pour faciliter la reconnaissance d'entités nommées et leur annotation avec les URI du projet //symogih.org//, par ex. les codes AbOb12345 identifiant les matières enseignées sous forme de URI. | + | <html><span style="color:red;font-weight:bold;">Suggestion pour le défi</span></html> Le résultat de cette requête apporte toute une série d'informations biographiques (date et lieu de naissance, éléments biographiques) se trouvant dans les notices d'autorité de la BNF. Les extraire et comparer avec les données publiées au format RDF. |
- | Il y a un certain nombre de ces informations qui manquent dans les données SIPROJURIS: si elles sont extraites sous forme de données semi-structurées au cours du défi, elles pourront être intégrées par les soins du projet //symogih.org// aux données de la base de donnée SIPROJURIS afin d'enrichir les données existantes. | ||
<code sparql> | <code sparql> | ||
- | SELECT * | + | PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> |
+ | PREFIX owl: <http://www.w3.org/2002/07/owl#> | ||
+ | |||
+ | SELECT ?s ?label ?s_bnf ?uri | ||
+ | |||
WHERE { | WHERE { | ||
- | { | + | |
- | SERVICE <http://bhp-publi.ish-lyon.cnrs.fr:8888/sparql> | + | { |
- | {SELECT * | + | SERVICE <http://bhp-publi.ish-lyon.cnrs.fr:8888/sparql> |
- | WHERE { | + | {SELECT * |
- | GRAPH <http://symogih.org/graph/siprojuris-sym> | + | WHERE { |
- | { | + | GRAPH <http://symogih.org/graph/siprojuris-sym> |
- | ?s owl:sameAs ?idref. | + | { |
- | } | + | ?s owl:sameAs ?idref; |
- | } | + | <http://symogih.org/ontology/objectStandardName> ?label |
- | } | + | |
- | } | + | } |
- | ?idref owl:sameAs ?uri. | + | # FILTER(CONTAINS(?label, 'Bras')) |
- | BIND (uri(replace(str(?uri), 'foaf:Person', 'about')) as ?new_uri) | + | } |
- | { | + | |
- | SERVICE <http://data.bnf.fr/sparql> | + | } |
- | { | + | |
- | SELECT * | + | |
- | WHERE { | + | |
- | ?new_uri <http://rdvocab.info/ElementsGr2/biographicalInformation> ?ob | + | |
- | } | + | |
- | } | + | |
} | } | ||
+ | |||
+ | ?s_bnf owl:sameAs ?idref. | ||
+ | |||
+ | ?s_bnf owl:sameAs ?uri. | ||
+ | |||
+ | |||
} | } | ||
+ | ORDER BY ?s_bnf | ||
</code> | </code> | ||
- | |||
- | |||
==== Obtenir les données concernant des acteurs similaires ==== | ==== Obtenir les données concernant des acteurs similaires ==== | ||
Ligne 288: | Ligne 272: | ||
==== Lister les URI DBPedia ==== | ==== Lister les URI DBPedia ==== | ||
- | Seulement 68 disponibles [28 décenbre 2018]. | + | Seulement 101 disponibles [9 décembre 2021]. |
<code SPARQL> | <code SPARQL> | ||
+ | PREFIX owl: <http://www.w3.org/2002/07/owl#> | ||
+ | |||
SELECT * | SELECT * | ||
WHERE { | WHERE { | ||
+ | | ||
{ | { | ||
SERVICE <http://bhp-publi.ish-lyon.cnrs.fr:8888/sparql> | SERVICE <http://bhp-publi.ish-lyon.cnrs.fr:8888/sparql> | ||
Ligne 305: | Ligne 292: | ||
} | } | ||
} | } | ||
- | ?idref owl:sameAs ?URI. | + | |
- | BIND (URI(REPLACE(STR(?URI), 'foaf:Person', 'about')) AS ?new_uri) | + | ?s_bnf owl:sameAs ?idref. |
+ | |||
+ | ?s_bnf owl:sameAs ?dbpedia. | ||
+ | FILTER(CONTAINS(STR(?dbpedia), 'dbpedia')) | ||
- | { | ||
- | SERVICE <http://data.bnf.fr/sparql> | ||
- | { | ||
- | SELECT * | ||
- | WHERE { | ||
- | ?new_uri owl:sameAs ?dbpedia. | ||
- | FILTER(CONTAINS(STR(?dbpedia), 'dbpedia')) | ||
- | } | ||
- | |||
- | } | ||
- | } | ||
} | } | ||
</code> | </code> | ||
Ligne 325: | Ligne 304: | ||
==== Données disponibles dans DBPedia ==== | ==== Données disponibles dans DBPedia ==== | ||
- | !!! Requête à vérifier. | + | !!! Attention : cette requête ne marche plus à cause du changement des réglages de sécurité du côté BNF. Il faut donc prévoir un stockage intermédiaire des URI. |
<code SPARQL> | <code SPARQL> | ||
- | SELECT * | + | PREFIX owl: <http://www.w3.org/2002/07/owl#> |
+ | |||
+ | SELECT * | ||
WHERE { | WHERE { | ||
+ | |||
{ | { | ||
SERVICE <http://bhp-publi.ish-lyon.cnrs.fr:8888/sparql> | SERVICE <http://bhp-publi.ish-lyon.cnrs.fr:8888/sparql> | ||
Ligne 342: | Ligne 324: | ||
} | } | ||
} | } | ||
- | ?idref owl:sameAs ?URI. | + | |
- | BIND (URI(REPLACE(STR(?URI), 'foaf:Person', 'about')) AS ?new_uri) | + | |
+ | ?s_bnf owl:sameAs ?idref. | ||
+ | |||
+ | ?s_bnf owl:sameAs ?dbpedia. | ||
+ | FILTER(CONTAINS(STR(?dbpedia), 'dbpedia')) | ||
- | |||
{ | { | ||
SERVICE <https://fr.dbpedia.org/sparql> | SERVICE <https://fr.dbpedia.org/sparql> | ||
Ligne 353: | Ligne 338: | ||
WHERE { | WHERE { | ||
?dbpedia ?p ?o. | ?dbpedia ?p ?o. | ||
- | |||
- | { | ||
- | SERVICE <http://data.bnf.fr/sparql> | ||
- | { | ||
- | SELECT ?dbpedia | ||
- | WHERE { | ||
- | ?new_uri owl:sameAs ?dbpedia. | ||
- | FILTER(CONTAINS(STR(?dbpedia), 'dbpedia')) | ||
} | } | ||
} | } | ||
} | } | ||
- | + | | |
- | + | ||
- | } | + | |
- | } | + | |
- | } | + | |
} | } | ||
</code> | </code> | ||