Ceci est une ancienne révision du document !
Atelier : Visualiser les données issues du web avec un logiciel SIG
Objectifs
Apprendre à interroger le web des données et à tirer profit des ressources disponibles – le point de vue du chercheur
Outils
Le web des données
Les principes du web du données: les
5 étoiles
-
-
-
-
-
-
-
-
Interroger le web des données
- A Geographic Query Language for RDF Data
Les ressources disponibles
Deux exemples
Les universités dans le monde / en Europe
Les données statistiques des pays de la Communauté européenne
Claire-Charlotte Butez – Visualiser les données avec QGIS
Objectifs
Supports
Outils
Quelques outils utiles :
Logiciel QGIS : Système d'Information Géographique (SIG) convivial distribué sous licence publique générale GNU. C'est un projet officiel de la fondation Open Source Geospatial (OSGeo). Il est compatible avec Linux, Unix, Mac
OS X, Windows et Android et intègre de nombreux formats vecteur, raster, base de données et fonctionnalités.
Logiciel GIMP : Outil d'édition et de retouche d'image et est diffusé sous la licence GPLv3 comme un logiciel gratuit et libre. Il en existe des versions pour la plupart des systèmes d'exploitation dont GNU/Linux,
OS X, et Microsoft Windows.
Données géographiques
Données géographiques Eurostat : Données géographiques de références pour les statistiques européennes. Lors de leur utilisation leur source doit être citée dans la légende de la carte et dans la page d'introduction de la publication, accompagnée de la mention suivante: : FR: © EuroGeographics pour les limites administratives.
-
Autres ressources à connaitre
-
-
Les organismes qui fournissent de l'Open Data en téléchargement ou via les web-services : WMS, WFS
Les géocodeurs : Google Map, Google Earth, Geonames…
Installation et découverte du logiciel QGIS
Affichage et préparation des données géographiques
Données géographiques
Affichage des données Eurostat
Visualisation des couches et de leurs métadonnées
Exploration de la couche NUTS_RG_10M_2010.shp
Données tabulaires
Utilisation des données issues du web de données.
Nous avons plusieurs fichiers à notre disposition que nous utiliserons au cours des exercices de cette deuxième partie (cf 1ère partie du bootcamp : requêtes sur les serveurs sparql)
-
* Populations en 2004 par province au format .csv :
eurostat_2004.csv: cf
les données de la communauté européenne * Populations au 2ème échelon administratif en 2010, répartitions hommes-femmes par régions: {{:thatcamp_2014:nuts2_pop_2010.zip| nuts2_pop_2010.csv}}
* Intégration des données tabulaires dans le SIG:
* Les données s'intègrent dans QGIS comme n'importe quelle autre couche vecteur avec Couche > Ajouter une couche vecteur
* Il est possible de créer une couche de point à partir d'un fichier .csv qui contient des coordonnées X et Y
* Récupération des données sur les universités : {{:thatcamp_2014:resultat_corrige.csv.zip|Fichier nettoyé}}
* Observation du fichier .csv : Ces données comprennent des valeurs et les coordonnées X Y du lieu concerné. Ces valeurs peuvent être utilisées pour créer des points et les projeter dans QGIS.
* Couche > Ajouter une couche de texte délimité
* Indiquer l'emplacement du fichier "resultat_corrige"
* Dans "autre délimiteurs" indiquer le séparateur "|"
* Indiquer le champ X = "long" et le champ Y = "lat"
* Indiquer le code EPSG des coordonnées : 4326
* Enregistrer cette projection au format .shp
* Afficher la nouvelle couche dans le SIG et choisir le fond vecteur adapté, par exemple la couche NUTS_RG_10M_2010_pays
==== Exploration et analyse des données ====
===Les requêtes attributaires===
* Les requêtes attributaires se font avec la table d'attributs des données vectorielles, points, lignes ou polygones
* Couche > Propriétés > Ouvrir la table d'attributs > Select by expression
* Vous pouvez tester les requêtes sur les données, par exemple les universités de + de … inscrits etc..
* Tous les résultats peuvent être enregistrés dans de nouvelles couches. Ceci pourra nous servir en fin de travail pour mettre au point une carte.
* **Fonctions de requête spatiale**
* Autre outil de sélection géographique par requête dans //Vecteur// > //Requête spatiale//.
* Pour installer cette extension aller dans //Extension// > //Gestionnaire d'extension// et rechercher //requête spatiale//
* Vous trouverez dans cet outil les opérateurs de requête spatiale : //Contient//, //A l'intérieur//, //Croise//, //Intersecte//, //Est disjoint//, //Est égal//
* Tester avec l'outil : Sélection des entités sources depuis > "résultat_corrige", Où l'entité > "à l'intérieur", Entités références de "NUTS_RG_10M_2010_pays"
* Vérifier et ajouter les entités non sélectionnées à cause de l'imprécision des données
* Enregistrer la sélection dans une nouvelle couche > resultat_corrige_europe.shp
* Ajouter la nouvelle couche à la carte
* Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/resultat_corrige_europe.zip|resultat_corrige_europe.zip]] <nowiki>* **Outils d'analyse spatiale** :
* Avant de se lancer dans l'analyse spatiale il faut bien réfléchir à la finalité du travail
* //Vecteur// > //Outils de géotraitement//
* Pour chaque outil :
* La //couche vectorielle de saisie// est l'input, couche sur laquelle on agit
* La //couche d'intersection// est la couche qui participe à l'opération, le feature.
* Le //fichier de sortie// est la couche résultante de l'opération, l'output.
* Les principaux outils sont :
* //Tampons// pour créer une zone tampon autour d'une entité
* //Découper// pour découper une couche selon une autre ou une entité
* //Intersection// pour assembler des portions d'entités qui se superposent ou ayant une limite commune
* //Regrouper// pour créer des fusions entre entités selon un champ donné
* //Union// pour assembler des entités qui se superposent
* //Différencier// pour récupérer tout ce qui n'est pas égal au feature.
* Tester la création d'une zone tampon autour d'un polygone:
* Tampon > Couche vectorielle de saisie "NUTS_RG_10M_2010_pays"
* Distance tampon > 0.01
* Définir un fichier de sortie, lancer le traitement et ajouter la nouvelle couche.
* Tester la possibilité de compter le nombre de points dans un polygone, par exemple le nombre d'université par pays
* //Vecteur// > Outil d'analyse > Compter les points dans les polygones > Indiquer les deux couches, le nom du champ en sortie (ex: nbr_univ) et la nouvelle couche : NUTS_RG_10M_2010_pays_univ.shp
* Ajouter la nouvelle couche et vérifier la présence des nouvelles données attributaires
* Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/NUTS_RG_10M_2010_pays_univ.zip|NUTS_RG_10M_2010_pays_univ.zip]] <nowiki>* **Jointures attributaires ou spatiales**
* **Tester la jointure spatiale :**
* Ajouter à la table d'attribut des universités l'indicatif du pays auquel elles appartiennent
* Dans //Vecteur// > Outil de gestion de données > Joindre les attributs par localisation
* Indiquer la couche vecteur "resultat_corrige_europe" et joindre la couche vecteur "NUTS_RG_10M_2010_pays"
* Indiquer un fichier de sortie "resultat_corrige_europe_join" et lancer le traitement
* Ajouter la nouvelle couche et vérifier la présence des nouvelles données attributaires
* Tester la sélection attributaire ou spatiale des université françaises
* Ou télécharger le résultat : [[http://clio.ish-lyon.cnrs.fr/formations/that_camp_2014/resultat_corrige_europe_join.zip|resultat_corrige_europe_join.zip]] <nowiki>* **Tester la jointure attributaire :**
* Compléter des données attributaires à partir d'une jointure faite sur un fichier .csv
* **1er exercice** : Récupération des données sur les populations par régions au format .csv : {{:thatcamp_2014:eurostat_2004.zip|eurostat_2004.csv}} <nowiki>* Couche > Ajouter une couche vecteur et ajouter le fichier eurostat_2004
* Les principes de la jointure attributaire
* Fenêtre des propriétés de la couche > Onglet Jointure
* Utilisée pour joindre des données tabulaires à partir d'un champ contenant un identifiant commun à la couche et à la table
* Préparer les champs de jointure : Ajouter un champ à la table attributaire de la couche NUTS_RG_10M_2010
* Ouvrir la table d'attribut > Basculer en mode édition > Ouvrir la calculatrice de champ > Créer un nouveau champ à partir de l'expression : lower( "NUTS_ID" ) > Enregistrer
* Fenêtre des propriétés de la couche > Onglet Jointure
* Ajouter une jointure sur eurostat2004.geocodeProvince = NUTS_RG_10M_2010.nuts_id_lo
* Créer une couche pour les entités concernées par la jointure : NUTS_RG_10M_2010_densite
* Possibilité de faire un calcul de densité de population sur les données
* Ajout d'un champ 'surf_km2' à la table attributaire à partir de l'expression : $area / 1000000
* Ajout d'un champ 'densite' à la table attributaire à partir de l'expression : "eurostat_4" / "surf_km2"
* Valider
* Propriété de la couche > Style > Symbole gradué > Sélection du champ 'densité', 5 classes, mode quantile ou autre (cf Cartographie des données)
* Ajouter les couches HYP_50M_SR_W ou doubler la couche "data_nuts_rg_2_pop" pour afficher les valeurs nulles dans le but de réaliser une carte
comme par exemple : {{:thatcamp_2014:europe_densite_pop.jpg?500}} <nowiki>* **2ème exercice** : Récupération des données sur les populations par régions au format .csv : {{:thatcamp_2014:nuts2_pop_2010.zip|nuts2_pop_2010.csv}} <nowiki>* Couche > Ajouter une couche vecteur et sélectionner le fichier nuts2_pop_2010.csv
* Dans la couche NUTS_RG_10M_2010 > Fenêtre des propriétés > Onglet Jointure
* Ajouter une jointure sur nuts2_pop_2010.nuts_id = NUTS_RG_10M_2010.NUTS_ID
* Vérifier dans la table attributaire si la jointure a fonctionné
* Créer une sélection sur NUTS_RG_10M_2010 : "STAT_LEVL__fckg_QUOT_ = 2 et faire une couche "data_nuts_rg_2_pop" à partir de cette sélection
* Ajouter le résultat "data_nuts_rg_2_pop" dans le projet
* Sur cette couche nous allons calculer la proportion Homme-Femme pour les données à notre disposition
* Pour cela il faut ajouter des champs à la table attributaire de la couche "data_nuts_rg_2_pop"
* Ouvrir la table d'attribut > Basculer en mode édition > Ouvrir la calculatrice de champ > Créer trois nouveaux champs à partir des expressions :
* Champ '%homme' : ("nuts2_po_2" <nowiki>* 100) / “nuts2_po_1” > Enregistrer
Cartographier le résultat : Propriété de la couche > Style > Symbole gradué > Sélection du champ 'F%H' > Créer une palette de couleur adaptée (cf Cartographie des données)
Cartographie des données
Composeur d'impression
Rappel sur la mise en page d'une carte avec le composeur d'impression
Pour faire une mise en page aller dans Projet > Nouveau composeur d'impression.
Dans le composeur d'impression, intégrer tous les éléments indispensables à la carte : Carte-s, légende, titre, orientation, échelle, sources, nom et dates de réalisation.
Exportation de la mise en page : Composeur > Exporter comme image