Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
besson_sylvain:economist_jurist [2021/04/01 16:15] Sylvain Besson |
besson_sylvain:economist_jurist [2021/04/01 19:01] Sylvain Besson |
||
---|---|---|---|
Ligne 2: | Ligne 2: | ||
====== Économiste et juriste ====== | ====== Économiste et juriste ====== | ||
+ | |||
+ | <html> | ||
+ | <table><tr><td style="vertical-align: middle;"><a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Licence Creative Commons" style="border-width:0; font-size:smaller" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a> | ||
+ | </td> | ||
+ | <td> | ||
+ | <span xmlns:dct="http://purl.org/dc/terms/" property="dct:title">Le projet "Économiste et juriste"</span> de <span xmlns:cc="http://creativecommons.org/ns#" property="cc:attributionName">Sylvain Besson</span>, avec toute la documentation, les fichiers et scripts associés, est mis à disposition selon les termes de la <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International</a>. Cette autorité subsiste sous réserve de toutes les citations, extraits de documents, textes, images, etc. dont les droits reviennent à leurs auteurs respectifs, mentionnés explicitement ou non. </td></tr></table> | ||
+ | </html> | ||
+ | |||
\\ | \\ | ||
"Économiste et juriste" est un projet visant à étudier les économistes et les juristes depuis 1800 jusqu'à nos jours. Pour cela, nous allons prendre les données qui sont présentes sur **[[documentation_DBpedia|DBpedia]]** et **[[documentation_BnF_Data|BnF Data]]** et les lier entre elles. Le but final étant d'avoir une base de données fonctionnelle sur ces populations. De cette base de données créé, nous pourrons réaliser plusieurs traitements statistiques, d'analyses descriptives et d'analyses de réseaux. | "Économiste et juriste" est un projet visant à étudier les économistes et les juristes depuis 1800 jusqu'à nos jours. Pour cela, nous allons prendre les données qui sont présentes sur **[[documentation_DBpedia|DBpedia]]** et **[[documentation_BnF_Data|BnF Data]]** et les lier entre elles. Le but final étant d'avoir une base de données fonctionnelle sur ces populations. De cette base de données créé, nous pourrons réaliser plusieurs traitements statistiques, d'analyses descriptives et d'analyses de réseaux. | ||
- | **Sur cette page, vous retrouvez l'ensemble des éléments pour comprendre notre projet:** | ||
- | |||
- | * Une **[[projets_individuels:economiste_juriste_documentation|documentation]]** expliquant les différents langages utilisés, le fonctionnement des bases de données utilisées, etc. | ||
- | |||
- | * La **[[projets_individuels:economiste_juriste_delimitation|délimitation du sujet]]** sur la définition des termes "économistes" et "juristes" ainsi que les bornes chronologiques et géographiques choisies. | ||
- | |||
- | * La **feuille de route** retraçant les différentes étapes de notre projet. | ||
- | |||
- | * Le **détail** des étapes réalisés. | ||
---- | ---- | ||
Ligne 47: | Ligne 46: | ||
---- | ---- | ||
- | =====Sondage des données===== | + | =====Étapes du projet===== |
- | + | ||
- | La première étape est de connaître l'état des jeux de données de **[[documentation_DBpedia|DBpedia]]** et **[[documentation_BnF_Data|BnF Data]]** afin de voir le nombre de personnes dont on peut considérer qu'elles font parties de la "population" des Économistes et des juristes. | + | |
- | + | ||
- | Pour cela il faut réaliser des requêtes **[[documentation_SPARQL|SPARQL]]** afin de connaître indépendamment sur les deux bases de données le nombre de personnes qui répondre à ce critère. Pour cela, il ne faut faire les requêtes avec le moins grande nombre de critère de sélection afin de ne réduire la population si une personne ne correspond pas à une des critères. Les seuls critères qui sont conservés sont l'URI de la personne, sans quoi on ne peut pas l'identifier et l'année de naissance. | + | |
- | + | ||
- | Il est ensuite possible de rajouter des critères optionnels comme le nom (toutes les personnes n'ont pas systématiquement un nom inscrit), la nationalité, etc. | + | |
- | + | ||
- | Il est aussi parfois essentiel de conserver le résumé/la biographie de la personne, car c'est cet élément qui l'identifie en tant qu'économiste ou juriste. Il est possible dans le langage **[[documentation_SPARQL|SPARQL]]** d'aller chercher des chaînes de caractères avec la clause [[https://www.w3.org/TR/rdf-sparql-query/#funcex-regex|REGEX]]. C'est avec cette dernière que nous pouvons aller chercher dans les biographies et les résumées les mentions d'économistes, professeur d'économie, //jurist//, etc. | + | |
- | Pour **[[documentation_BnF_Data|BnF Data]]**, il y n'a besoin de chercher ces chaînes de caractère qu'en français, car toutes les biographies sont écrites en français. Par contre, pour **[[documentation_DBpedia|DBpedia]]**, il faut avant tout les faire en anglais, car c'est la langue qui est privilégiée. | + | |
- | + | ||
- | Voici un exemple d'interrogation possible pour obtenir les économistes sur le [[https://data.bnf.fr/sparql/|point de terminaison SPARQL]] BnF Data: | + | |
- | + | ||
- | <code sparql> | + | |
- | PREFIX egr: <http://rdvocab.info/ElementsGr2/> | + | |
- | PREFIX owl: <http://www.w3.org/2002/07/owl#> | + | |
- | PREFIX dbr: <http://dbpedia.org/resource/> | + | |
- | PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> | + | |
- | PREFIX skos: <http://www.w3.org/2004/02/skos/core#> | + | |
- | PREFIX foaf: <http://xmlns.com/foaf/0.1/> | + | |
- | + | ||
- | SELECT DISTINCT ?s ?name ?sName ?uri ?year ?bio | + | |
- | WHERE | + | |
- | { { ?s egr:biographicalInformation ?bio ; | + | |
- | egr:dateOfBirth ?bd | + | |
- | BIND(strbefore(strafter(str(?bd), "http://data.bnf.fr/date/"), "/") AS ?year) | + | |
- | # La clause "BIND" est utilisé afin de ne garder dans l'URL que la date. | + | |
- | FILTER ( ( regex(?bio, "juriste", "i") || regex(?bio, "professeur de droit", "i") ) || regex(?bio, "docteur en droit", "i") ) | + | |
- | # Ce filtre est nécessaire pour obtenir la population que nous avons défini. | + | |
- | OPTIONAL | + | |
- | { ?s foaf:name ?name } | + | |
- | OPTIONAL | + | |
- | { ?s skos:prefLabel ?sName } | + | |
- | OPTIONAL | + | |
- | { ?s owl:sameAs ?uri | + | |
- | FILTER regex(?uri, "viaf.org", "i") | + | |
- | # Ce filtre est utilisé pour fusionner les données issues de | + | |
- | # BnF Data et de DBpedia by l'URI VIAF. | + | |
- | } | + | |
- | } | + | |
- | UNION | + | |
- | { ?s egr:biographicalInformation ?bio ; | + | |
- | egr:dateOfBirth ?bd | + | |
- | BIND(strbefore(strafter(str(?bd), "http://data.bnf.fr/date/"), "/") AS ?year) | + | |
- | FILTER ( ?year > "1800" ) | + | |
- | FILTER ( ( ( regex(?bio, "économiste") || regex(?bio, "Economiste") ) || regex(?bio, "professeur d'économie", "i") ) || regex(?bio, "docteur en économie", "i") ) | + | |
- | OPTIONAL | + | |
- | { ?s foaf:name ?name } | + | |
- | OPTIONAL | + | |
- | { ?s skos:prefLabel ?sName } | + | |
- | OPTIONAL | + | |
- | { ?s owl:sameAs ?uri | + | |
- | FILTER regex(?uri, "viaf.org", "i") | + | |
- | } | + | |
- | } | + | |
- | } | + | |
- | ORDER BY DESC(?uri) | + | |
- | </code> | + | |
- | + | ||
- | Cette requête est exécuté sur [[python:accueil|Python]] est permet d'aller chercher à la fois les économistes et à la fois les juristes **[[documentation_BnF_Data|BnF Data]]**. (cf. **[[projets_individuels:economiste_juriste_documentation|documentation SPARQL]]** pour comprendre davantage comment se construit la requête). | + | |
- | Nous ajoutons de façon optionnelle les personnes qui aurait un URI **[[documentation_VIAF|VIAF]]**. Il est important, car il nous permet de faire une jointure entre les données **[[documentation_BnF_Data|BnF Data]]** et **[[documentation_DBpedia|DBpedia]]** pour les personnes qui ont le même URI **[[documentation_VIAF|VIAF]]** sur les bases de données. | + | Vous retrouver ici les différentes **[[etapes|étapes]]** du projet "Économiste et juriste". |
- | Il est possible de retrouver sur ce **[[https://github.com/Semantic-Data-for-Humanities/Economists_Jurists/blob/development/Notebooks/Issues/DBpedia_BnF_Data_URI.ipynb|carnet]]** la requête pour **[[documentation_BnF_Data|BnF Data]]** et **[[documentation_DBpedia|DBpedia]]**, ainsi que les démarches pour aligner les deux bases de données. | ||
---- | ---- | ||