Outils pour utilisateurs

Outils du site


besson_sylvain:economist_jurist

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
Prochaine révision Les deux révisions suivantes
besson_sylvain:economist_jurist [2021/03/25 19:07]
Sylvain Besson
besson_sylvain:economist_jurist [2021/04/01 16:44]
Sylvain Besson [Économiste et juriste]
Ligne 1: Ligne 1:
-Allez vers la [[besson_sylvain|page précédente]]+Allez vers la [[besson_sylvain|page précédente ​- stage]]
  
 ====== Économiste et juriste ====== ====== Économiste et juriste ======
 \\ \\
-Économiste et juriste est un projet visant à étudier les économistes et les juristes depuis 1800 jusqu'​à nos jours. Pour cela, nous allons prendre les données qui sont présentes sur DBpedia et BnF Data et les lier entre elles. Le but final étant d'​avoir une base de données fonctionnelle sur ces populations. ​+"Économiste et juriste" ​est un projet visant à étudier les économistes et les juristes depuis 1800 jusqu'​à nos jours. Pour cela, nous allons prendre les données qui sont présentes sur **[[documentation_DBpedia|DBpedia]]** et **[[documentation_BnF_Data|BnF Data]]** et les lier entre elles. Le but final étant d'​avoir une base de données fonctionnelle sur ces populations. De cette base de données créé, nous pourrons réaliser plusieurs traitements statistiques,​ d'​analyses descriptives et d'​analyses de réseaux.
  
-De cette base de données nous pourront réaliser plusieurs traitements statistiques,​ d'​analyses descriptives et d'​analyses de réseaux. 
  
-Nous utiliserons pour cela le langage SPARQL.+----
  
 =====Documentation===== =====Documentation=====
-Vous retrouverez la [[Economiste_Juriste_Documentation|Documentation]] qui peut être utile pour comprendre le projet avec les langages employés, les jeux de données utilisés, etc.+Vous retrouverez la **[[Economiste_Juriste_Documentation|documentation]]** qui peut être utile pour comprendre le projet avec les langages employés, les bases de données utilisés, etc.
  
 +----
  
-Accès à notre [[https://​github.com/​Semantic-Data-for-Humanities/​Economists_Lawyers|dépôt Github]] sur lequel nous mettons nos différents carnets Python.+=====Délimitation du sujet=====
  
-=====Extraction des données=====+Afin d'​avoir une population claire à étudier, il faut pour cela délimiter notre sujet et ainsi discriminer les personnes qui rentrent ou non dans la définition d'​économiste ou de juriste. ​
  
-La première étape ​est de connaître l'​état des jeux de données de DBpedia et BnF Data afin de voir le nombre ​de personnes dont on peut considérer qu'​elles font parties ​de la "​population"​ des Économistes et des juristes.+Dans cette section, vous retrouverez la **[[economiste_juriste_delimitation|délimitation du sujet]]** qui est le point de départ ​de notre recherche.
  
-Pour cela il faut réaliser ​des Requêtes SPARQL afin de connaître indépendamment ​sur les deux bases de données le nombre ​de personnes ​qui répondre à ce critère. Pour cela, il ne faut faire les requêtes ​avec le moins grande nombre ​de critère ​de sélection afin de ne réduire la population si une personne ne correspond pas à une des critèresLes seuls critères ​qui sont conservés sont l'​URI ​de la personne, sans quoi on ne peut pas l'​identifier ​et l'​année de naissance+---- 
 + 
 +=====Feuille de route===== 
 + 
 +Nous devons dans ce projet ​réaliser ​différentes étapes: 
 + 
 +  - Récolter le maximum ​de personnes ​sur **[[documentation_DBpedia|DBpedia]]** et **[[documentation_BnF_Data|BnF Data]]** via des requêtes **[[documentation_SPARQL|SPARQL]]** ​ - Aligner ​les deux jeux de données ​avec le langage [[python:​accueil|Python]] 
 +  - Voir s'il y a des propriétés qui sont présentes sur une majorité ​de personnes 
 +    * en extrayant ​les propriétés par des requêtes ​**[[documentation_SPARQL|SPARQL]]** 
 +  - Créer une ontologie particulière  
 +    * Basé sur des ontologies de haut niveau comme le [[http://​www.cidoc-crm.org/​|Cidoc CRM]] 
 +    * En utilisant [[https://​ontome.dataforhistory.org/​|OntoMe]] 
 +  - Créer un point de terminaison SPARQL 
 +  -  Comparer le jeux de données créé avec [[http://​siprojuris.symogih.org/​|Siprojuris]]  
 +    * **[[documentation_BnF_Data|BnF Data]]** et [[http://​siprojuris.symogih.org/​|Siprojuris]] ont tous les deux des [[https://​www.idref.fr/​|IDRef]] communs ​qui permettront ​de faire un alignement 
 +  -  Réaliser des différentes analyses statistiques 
 + 
 +---- 
 + 
 +=====Étapes du projet===== 
 + 
 +Vous retrouver ici les différentes **[[etapes|étapes]]** du projet "​Économiste ​et juriste"​. 
 + 
 +---- 
 + 
 +Accès à notre **[[https://​github.com/​Semantic-Data-for-Humanities/​Economists_Lawyers|dépôt Github]]** sur lequel nous mettons nos différents carnets [[python:​accueil|Python]].
  
-Il est ensuite possible de rajouter des critères optionnels comme le nom (toutes les personnes n'ont pas systématiquement un nom inscrit), la nationalité,​ etc.  
  
-Il est aussi parfois essentiel de conserver le résumé/la biographie de la personne, car c'est cet élément qui l'​identifie en tant qu'​économiste ou juriste. Il est possible dans le langage SPARQL d'​aller chercher des chaînes de caractères avec la clause REGEX. C'est avec cette dernière que nous pouvons aller chercher les biographies et les résumées les mentions d'​économistes,​ professeur d'​économie,​ //lawyer//, etc. 
-Pour la BnF, il y n'a besoins de chercher ses chaînes de caractère qu'en français, car toutes les biographies sont écrites en français. Par contre, pour DBpedia, il faut avant tout les faire en anglais, c'est car la langue qui est privilégiée. 
besson_sylvain/economist_jurist.txt · Dernière modification: 2021/07/22 19:05 par Sylvain Besson