Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
besson_sylvain:etapes_sondage [2021/04/07 17:34] Sylvain Besson |
besson_sylvain:etapes_sondage [2021/04/20 18:49] Sylvain Besson [Sondage des données] |
||
---|---|---|---|
Ligne 5: | Ligne 5: | ||
La première étape est de connaître l'état des jeux de données de **[[documentation_DBpedia|DBpedia]]**, **[[documentation_BnF_Data|BnF Data]]** et **[[documentation_Wikidata|Wikidata]]** afin de voir le nombre de personnes dont on peut considérer qu'elles font parties de la "population" des Économistes et des juristes. | La première étape est de connaître l'état des jeux de données de **[[documentation_DBpedia|DBpedia]]**, **[[documentation_BnF_Data|BnF Data]]** et **[[documentation_Wikidata|Wikidata]]** afin de voir le nombre de personnes dont on peut considérer qu'elles font parties de la "population" des Économistes et des juristes. | ||
- | Pour cela il faut réaliser des requêtes **[[documentation_SPARQL|SPARQL]]** afin de connaître indépendamment sur les deux bases de données le nombre de personnes qui répondre à ce critère. Pour cela, il ne faut faire les requêtes avec le moins grande nombre de critère de sélection afin de ne réduire la population si une personne ne correspond pas à une des critères. Les seuls critères qui sont conservés sont l'URI de la personne, sans quoi on ne peut pas l'identifier et l'année de naissance. | + | Pour cela il faut réaliser des requêtes **[[documentation_SPARQL|SPARQL]]** afin de connaître indépendamment sur les bases de données le nombre de personnes qui répondre à ce critère. Pour cela, il ne faut faire les requêtes avec le moins grande nombre de critère de sélection afin de ne réduire la population si une personne ne correspond pas à une des critères. Les seuls critères qui sont conservés sont l'URI de la personne, sans quoi on ne peut pas l'identifier et la date de naissance. |
Il est ensuite possible de rajouter des critères optionnels comme le nom (toutes les personnes n'ont pas systématiquement un nom inscrit), la nationalité, etc. | Il est ensuite possible de rajouter des critères optionnels comme le nom (toutes les personnes n'ont pas systématiquement un nom inscrit), la nationalité, etc. | ||
Ligne 65: | Ligne 65: | ||
Nous ajoutons de façon optionnelle les personnes qui aurait un URI **[[documentation_VIAF|VIAF]]**. Il est important, car il nous permet de faire une jointure entre les bases de données pour les personnes qui ont le même URI **[[documentation_VIAF|VIAF]]** sur les bases de données. | Nous ajoutons de façon optionnelle les personnes qui aurait un URI **[[documentation_VIAF|VIAF]]**. Il est important, car il nous permet de faire une jointure entre les bases de données pour les personnes qui ont le même URI **[[documentation_VIAF|VIAF]]** sur les bases de données. | ||
- | Il est possible de retrouver sur ce **[[https://github.com/Semantic-Data-for-Humanities/Economists_Jurists/blob/development/Notebooks/Issues/DBpedia_BnF_Data_URI.ipynb|carnet]]** l'intégralité des requêtes pour les différentes bases de données, ainsi que les démarches pour aligner les deux bases de données. | + | Il est possible de retrouver sur ce **[[https://github.com/Semantic-Data-for-Humanities/Economists_Jurists/blob/development/Notebooks/Merge/Merge_DBpedia_BnF_Data_Wikidata.ipynb|carnet]]** l'intégralité des requêtes pour les différentes bases de données. |