Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
thatcamp_2014:session_thatcamp2014 [2014/09/01 07:47] Francesco Beretta [Le web des données] |
thatcamp_2014:session_thatcamp2014 [2014/10/08 08:41] Francesco Beretta [Programme] |
||
---|---|---|---|
Ligne 15: | Ligne 15: | ||
* Un navigateur web (de préférence Firefox) | * Un navigateur web (de préférence Firefox) | ||
- | * [[http://jena.apache.org/documentation/serving_data/|Fuseki]], serveur SPARQL à installer en local | + | * [[http://jena.apache.org/documentation/serving_data/|Fuseki]], serveur SPARQL à installer en local [clé USB] |
* Le logiciel [[https://fr.libreoffice.org/discover/calc/|Calc]] de la suite bureautique LibreOffice | * Le logiciel [[https://fr.libreoffice.org/discover/calc/|Calc]] de la suite bureautique LibreOffice | ||
Ligne 28: | Ligne 28: | ||
- | ===== Le web des données ===== | + | === Le web des données === |
* Les principes du web du données: les [[http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes|5 étoiles]] | * Les principes du web du données: les [[http://fr.wikipedia.org/wiki/Donn%C3%A9es_ouvertes|5 étoiles]] | ||
* Grammaire et syntaxes: RDF, RDFS, OWL | * Grammaire et syntaxes: RDF, RDFS, OWL | ||
* Vocabulaires, ontologies | * Vocabulaires, ontologies | ||
+ | * Sérializations, espaces de noms | ||
- | ===== Les ressources disponibles ===== | + | === Les ressources disponibles === |
* Comment les trouver | * Comment les trouver | ||
Ligne 42: | Ligne 43: | ||
- | ===== Interroger le web des données ===== | + | === Interroger le web des données === |
* Le langage SPARQL | * Le langage SPARQL | ||
- | * Le logiciel Fuseki | + | * Le [[thatcamp_2014:fuseki|logiciel Fuseki]] (installation) |
* Procédure (documentation) | * Procédure (documentation) | ||
- | ===== Deux exemples ===== | + | === Deux exemples === |
- | ==== Les données statistiques des pays de la Communauté européenne ==== | ||
- | ==== Les universités dans le monde / en Europe ==== | + | == Les universités dans le monde / en Europe == |
+ | |||
+ | [[thatcamp_2014:requete_dbpedia|Utiliser DBPedia Live pour trouver les Universités du monde entier]] | ||
+ | |||
+ | |||
+ | == Les données statistiques des pays de la Communauté européenne == | ||
+ | |||
+ | Les [[données de la Communauté européenne]] | ||
===== Visualiser les données avec QGIS===== | ===== Visualiser les données avec QGIS===== | ||
Ligne 77: | Ligne 85: | ||
* [[http://epp.eurostat.ec.europa.eu/portal/page/portal/gisco_Geographical_information_maps/geodata/reference | Données géographiques Eurostat]] : Données géographiques de références pour les statistiques européennes. Lors de leur utilisation leur source doit être citée dans la légende de la carte et dans la page d'introduction de la publication, accompagnée de la mention suivante: : FR: © EuroGeographics pour les limites administratives. | * [[http://epp.eurostat.ec.europa.eu/portal/page/portal/gisco_Geographical_information_maps/geodata/reference | Données géographiques Eurostat]] : Données géographiques de références pour les statistiques européennes. Lors de leur utilisation leur source doit être citée dans la légende de la carte et dans la page d'introduction de la publication, accompagnée de la mention suivante: : FR: © EuroGeographics pour les limites administratives. | ||
+ | * Télécharger le dossier de données [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/NUTS_2010_10M_SH.zip|NUTS_2010_10M_SH.zip]] | ||
+ | * [[http://www.naturalearthdata.com/ | Natural Earth]]. Consulter les [[http://www.naturalearthdata.com/about/terms-of-use/|droits d'utilisation]] | ||
+ | * Télécharger le dossier de données [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/HYP_50M_SR_W.zip|HYP_50M_SR_W.zip]] | ||
=== Autres ressources === | === Autres ressources === | ||
* www.gadm.org | * www.gadm.org | ||
- | * www.naturalearthdata.com | ||
* Les géocodeurs : Google Map, Google Earth, Geonames... | * Les géocodeurs : Google Map, Google Earth, Geonames... | ||
* Les organismes qui fournissent de l'Open Data en téléchargement ou via les web-services : WMS, WFS | * Les organismes qui fournissent de l'Open Data en téléchargement ou via les web-services : WMS, WFS | ||
* Données IGN : Licences spécifiques pour la recherche et l'enseignement | * Données IGN : Licences spécifiques pour la recherche et l'enseignement | ||
- | ==== Programme ==== | ||
- | === Installation et découverte du logiciel QGIS === | ||
+ | ==== Installation et découverte du logiciel QGIS ==== | ||
- | === Affichage et préparation des données géographiques === | + | |
+ | ==== Affichage et préparation des données géographiques ==== | ||
* Données géographiques | * Données géographiques | ||
Ligne 108: | Ligne 118: | ||
* Afficher la nouvelle couche | * Afficher la nouvelle couche | ||
* Couche > Ajouter une couche vecteur | * Couche > Ajouter une couche vecteur | ||
+ | * Pour télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/NUTS_RG_10M_2010_pays.zip|NUTS_RG_10M_2010_pays.zip]] | ||
- | * Données statistiques | + | * Données tabulaires |
- | * Projection des données au format .csv | + | * Utilisation des données issues du web de données. |
+ | * Récupération des données au format .csv (cf 1ère partie du bootcamp) : {{:thatcamp_2014:resultat_corrige.csv.zip|Fichier nettoyé}} | ||
+ | * Observation du fichier .csv | ||
+ | * Ces données comprennent des valeurs et les coordonnées X Y du lieu concerné. Ces valeurs peuvent être utilisées pour créer des points et les projeter dans QGIS. | ||
+ | * Couche > Ajouter une couche de texte délimité | ||
+ | * Indiquer l'emplacement du fichier "resultat_corrige" | ||
+ | * Dans "autre délimiteurs" indiquer le séparateur "|" | ||
+ | * Indiquer le champ X = "long" et le champ Y = "lat" | ||
+ | * Indiquer le code EPSG des coordonnées : 4326 | ||
+ | * Enregistrer cette projection au format .shp | ||
+ | * Afficher la nouvelle couche | ||
- | === Exploration et analyse des données === | + | ==== Exploration et analyse des données ==== |
- | * Jointures attributaires ou spatiales | + | * **Les requêtes attributaires** |
+ | * Les requêtes attributaires se font avec la table d'attributs des données vectorielles, points, lignes ou polygones | ||
+ | * Couche > Propriétés > Ouvrir la table d'attributs > Select by expression | ||
+ | * Vous pouvez tester les requêtes sur les données, par exemple les universités de + de ... inscrits etc.. | ||
+ | * Tous les résultats peuvent être enregistrés dans de nouvelles couches. Ceci nous servira en fin de travail pour mettre au point une carte. | ||
* **Fonctions de requête spatiale** | * **Fonctions de requête spatiale** | ||
* Autre outil de sélection géographique par requête dans //Vecteur// > //Requête spatiale//. | * Autre outil de sélection géographique par requête dans //Vecteur// > //Requête spatiale//. | ||
- | * Pour installer cette extension aller dans //Extension// > //Gestionnaire d'extension// et rechercher //requête spatiale// | + | * Pour installer cette extension aller dans //Extension// > //Gestionnaire d'extension// et rechercher //requête spatiale// |
* Vous trouverez dans cet outil les opérateurs de requête spatiale : //Contient//, //A l'intérieur//, //Croise//, //Intersecte//, //Est disjoint//, //Est égal// | * Vous trouverez dans cet outil les opérateurs de requête spatiale : //Contient//, //A l'intérieur//, //Croise//, //Intersecte//, //Est disjoint//, //Est égal// | ||
- | * **Outils d'analyse spatiale** | + | * Tester avec l'outil : Sélection des entités sources depuis > "résultat_corrige", Où l'entité > "à l'intérieur", Entités références de "NUTS_RG_10M_2010_pays |
+ | * Vérifier et ajouter les entités non sélectionnées à cause de l'imprécision des données | ||
+ | * Enregistrer la sélection dans une nouvelle couche > resultat_corrige_europe.shp | ||
+ | * Ajouter la nouvelle couche à la carte | ||
+ | * Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/resultat_corrige_europe.zip|resultat_corrige_europe.zip]] | ||
+ | |||
+ | |||
+ | * **Outils d'analyse spatiale** : | ||
* Avant de se lancer dans l'analyse spatiale il faut bien réfléchir à la finalité du travail | * Avant de se lancer dans l'analyse spatiale il faut bien réfléchir à la finalité du travail | ||
* //Vecteur// > //Outils de géotraitement// | * //Vecteur// > //Outils de géotraitement// | ||
Ligne 130: | Ligne 162: | ||
* Les principaux outils sont : | * Les principaux outils sont : | ||
* //Tampons// pour créer une zone tampon autour d'une entité | * //Tampons// pour créer une zone tampon autour d'une entité | ||
- | * //Découper// pour découper une couche selon le feature | + | * //Découper// pour découper une couche selon une autre ou une entité |
* //Intersection// pour assembler des portions d'entités qui se superposent ou ayant une limite commune | * //Intersection// pour assembler des portions d'entités qui se superposent ou ayant une limite commune | ||
* //Regrouper// pour créer des fusions entre entités selon un champ donné | * //Regrouper// pour créer des fusions entre entités selon un champ donné | ||
* //Union// pour assembler des entités qui se superposent | * //Union// pour assembler des entités qui se superposent | ||
* //Différencier// pour récupérer tout ce qui n'est pas égal au feature. | * //Différencier// pour récupérer tout ce qui n'est pas égal au feature. | ||
+ | * Tester la création d'une zone tampon autour d'un polygone: | ||
+ | * Tampon > Couche vectorielle de saisie "NUTS_RG_10M_2010_pays" | ||
+ | * Distance tampon > 0.01 | ||
+ | * Définir un fichier de sortie, lancer le traitement et ajouter la nouvelle couche. | ||
+ | * Tester la possibilité de compter le nombre de points dans un polygone, par exemple le nombre d'université par pays | ||
+ | * //Vecteur// > Outil d'analyse > Compter les points dans les polygones > Indiquer les deux couches, le nom du champ en sortie (ex: nbr_univ) et la nouvelle couche : NUTS_RG_10M_2010_pays_univ.shp | ||
+ | * Ajouter la nouvelle couche et vérifier la présence des nouvelles données attributaires | ||
+ | * Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/NUTS_RG_10M_2010_pays_univ.zip|NUTS_RG_10M_2010_pays_univ.zip]] | ||
- | === Cartographie des données === | + | |
+ | |||
+ | * **Jointures attributaires ou spatiales** | ||
+ | * Les principes de la jointure attributaire | ||
+ | * Fenêtre des propriétés de la couche > Onglet Jointure | ||
+ | * Utilisée pour joindre des données tabulaires à partir d'un champ contenant un identifiant commun à la couche et à la table | ||
+ | * Voir pour faire une mise en pratique avec un fichier contenant une valeur par pays. Jointure sur le champ ID du pays. | ||
+ | * Tester la jointure spatiale : Ajouter à la table d'attribut des universités l'indicatif du pays auquel elles appartiennent | ||
+ | * Dans //Vecteur// > Outil de gestion de données > Joindre les attributs par localisation | ||
+ | * Indiquer la couche vecteur "resultat_corrige_europe" et joindre la couche vecteur "NUTS_RG_10M_2010_pays" | ||
+ | * Indiquer un fichier de sortie "resultat_corrige_europe_join" et lancer le traitement | ||
+ | * Ajouter la nouvelle couche et vérifier la présence des nouvelles données attributaires | ||
+ | * Tester la sélection attributaire ou spatiale des université françaises | ||
+ | * Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/resultat_corrige_europe_join.zip|resultat_corrige_europe_join.zip]] | ||
+ | |||
+ | |||
+ | ==== Cartographie des données ==== | ||
* **La symbologie des couches** | * **La symbologie des couches** | ||
* Pour gérer la symbologie d'une couche: clic droit sur la couche puis //Propriétés// > //Style// | * Pour gérer la symbologie d'une couche: clic droit sur la couche puis //Propriétés// > //Style// | ||
- | * Rappel sur la création des points proportionnels, deux solutions : | + | * Regarder les différentes possibilités de symbologie avec les couche des polygones ou celle des points. Il y a la plupart du temps deux possibilités de représentation, celle des cartes choroplètes (carte de surface) pour les valeurs relatives et catégories attributaires ou des points proportionnels pour les valeurs absolues. |
- | * Par symbole unique proportionnel | + | * Un exemple, celui du nombre d'université par pays : |
- | * //Propriétés// > //Style// > //Symbole unique// pour définir le style du symbole unique. | + | * La table d'attribut de la couche NUTS_RG_10M_2010_pays_univ contient le nombre d'université dans le champ nbr_univ. Nous souhaiterions le représenter par un point proportionnel mais il s'agit de polygone. Pour cela : |
- | * //Avancé// > //Champ de proportion// pour indiquer le champ de type entier qui définira la proportionnalité des points. | + | * //Vecteur// > //Outils de géométrie// > //Centroïdes de polygones// > choisir la couche NUTS_RG_10M_2010_pays_univ |
- | * Jouer sur la taille du symbole pour gérer la taille définitive des points. | + | * Enregistrer le résultat dans NUTS_RG_10M_2010_pays_univ_point.shp |
- | * Par diagramme proportionnel | + | * Ajouter la couche |
- | * //Propriétés// > //Diagramme// > //Afficher les diagrammes//. | + | * Les points centroïdes des polygones s'affichent. Il est possible d'éditer la couche pour déplacer et recentrer si besoin les points. C'est le cas de la France entre autre. |
- | * Dans onglet //Taille// > Décocher //Taille fixe// > choisir le champ //Attribut// > //Trouver la valeur maximale// > donner une //Taille// maximale à l'échelle de //Surface// et une //Taille minimale//. | + | * Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/NUTS_RG_10M_2010_pays_univ_point.zip|NUTS_RG_10M_2010_pays_univ_point.zip]] |
- | * Dans //Attributs// définir le champ contenant les données à représenter de manière proportionnelle. | + | * Pour la création des points proportionnels, deux solutions : |
- | * Dans onglet //Position// > //Emplacement// choisir //Sur le point// pour que le diagramme proportionnel soit centré. | + | * Par symbole unique proportionnel |
+ | * //Propriétés// > //Style// > //Symbole unique// pour définir le style du symbole unique. | ||
+ | * //Avancé// > //Champ de proportion// pour indiquer le champ de type entier qui définira la proportionnalité des points. | ||
+ | * Le champ de proportion peut être les valeur d'un champ ou le résultat d'une expression par exemple : "nombre" / 10000 | ||
+ | * Jouer sur la taille du symbole pour gérer la taille définitive des points. | ||
+ | * Par diagramme proportionnel | ||
+ | * //Propriétés// > //Diagramme// > //Afficher les diagrammes//. | ||
+ | * Dans onglet //Taille// > Décocher //Taille fixe// > choisir le champ //Attribut// > //Trouver la valeur maximale// > donner une //Taille// maximale à l'échelle de //Surface// et une //Taille minimale//. | ||
+ | * Dans //Attributs// définir le champ contenant les données à représenter de manière proportionnelle. | ||
+ | * Dans onglet //Position// > //Emplacement// choisir //Sur le point// pour que le diagramme proportionnel soit centré. | ||
+ | * Autre exemple, nous souhaiterions représenter le nombre d'université par pays via une carte choroplète | ||
+ | * Par symbole gradué sur la couche NUTS_RG_10M_2010_pays_univ | ||
+ | * //Propriétés// > //Style// > //Symbole gradué// pour définir la palette, les classes, leur nombre et la méthode de discrétisation. | ||
+ | * Intervalles égaux : Les classes sont d'étendue égale. L'étendue totale de la variable (max - mini) est calculée puis divisée par le nombre de classes désiré (qui apparaît dans le champ classe). | ||
+ | * Quantiles (effectifs égaux): cette méthode consiste à utiliser un même nombre ou une même fréquence de valeurs par classe. Il y a le même nombre dans chaque classe. | ||
+ | * Ruptures naturelles (Jenks) : cette méthode est souvent la plus performante. Elle permet d'obtenir des classes très proches des formes de la distribution de la variable. | ||
+ | * Ecart-type : cette méthode de discrétisation repose sur la moyenne. | ||
+ | * Jolies ruptures : cette méthode utilise un algorithme du logiciel de statistique R. | ||
+ | * Astuce : Tester les différentes possibilités et visualiser le rendu avec le bouton //Appliquer// pour ne pas fermer la fenêtre | ||
+ | |||
* **Composeur d'impression** | * **Composeur d'impression** | ||
* Rappel sur la mise en page d'une carte avec le composeur d'impression | * Rappel sur la mise en page d'une carte avec le composeur d'impression |