# Sélection des zones Z05 avec **R**

## 1) Répertoire de travail et installation du package *foreign*

La table de correspondance entre identifiant des zones z05 et numéros de cantons est contenue dans le fichier **z05.dbf** (table d'attribut de la couche **z05.shp**). Pour lire ce fichier, il faut installer le package `foreign`, puis le "loader" cette librairie à l'aide de la commande `library()`

In [1]:
install.packages('foreign', repos='http://cran.us.r-project.org')
library(foreign)


The downloaded binary packages are in
	/var/folders/cl/3jdthly11f7__5dn34t37vhr0000gn/T//RtmpqTLigX/downloaded_packages


In [2]:
library(foreign)

## 2) Chargement de la table d'attributs et sélection des zones

La librairie *foreign* donne accès à la commande `read.dbf()`, qui permet de lire le fichier **z05.dbf**. Nous pouvons dès lors l'enregistrer dans une variable ici appelée *mapData*

In [3]:
mapData = read.dbf("z05.dbf")

Il est possible de sélectionner les données d'un canton spécifique de la manière suivante (ici 22 : Vaud)

In [4]:
zVD = mapData$Z05[mapData$KT == 22]

Nous pouvons afficher un aperçu des zones Z05 appartenant au canton de Vaud à l'aide de la commande `head()`

In [5]:
head(zVD, 10)

Pour sélectionner des données appartenant à **plusieurs cantons** différents, il faut utiliser la commande `subset()` (ici 22, 23 : VD, VS). Vous trouverez les numéros de chaque cantons [ici.](https://www.bfs.admin.ch/bfs/fr/home/statistiques/statistique-regions/portraits-regionaux-chiffres-cles/cantons.assetdetail.453863.html)

In [6]:
zVSVD = subset(mapData$Z05, mapData$KT %in% c(22, 23))
head(zVSVD, 10)

## 3) Chargement des données statistiques

Dans cette partie, nous importons le jeu de données (ici celui relatif au domaine socio-économique) et nous effectuons un ajustement en renommant l'en-tête de la variable comportant l'information de l'identifiant des zones z05

In [7]:
donnees = read.csv("soceco.csv", header = T, sep = ";", encoding = "UTF-8")
colnames(donnees)[1] = "Z05"

Voici un aperçu de ces données à l'aide de la commande *head()*

In [8]:
head(donnees)

Z05,NAME,PLUGER,PLUFRA,PLUITA,PLURUM,PLUENG,PLUOTH,PLU2GF,PLU2GI,⋯,ADD3FIN,ADD3RE,ADD3PRO,ADD3SUP,ADD3ADM,ADD3EDU,ADD3HC,ADD3SOC,ADD3REC,ADD3PER
1.0,Reppischtal,3526,82,36,0,68,160,24,47,⋯,464,57,403,75,101,149,130,95,9,104
2.1,Affoltern am Albis Zentrum,4475,15,180,0,43,730,42,238,⋯,302,39,297,145,117,164,288,132,39,147
2.2,Affoltern am Albis-Zwillikon Hedingen,4263,41,166,0,117,228,43,168,⋯,320,42,281,114,201,194,326,146,18,91
3.0,Bonstetten,3611,9,64,7,40,166,63,80,⋯,409,31,324,80,116,187,155,89,16,57
4.0,Oberalbis,3895,24,16,0,74,108,22,66,⋯,158,23,331,111,147,282,188,134,16,103
9.0,Mettmenstetten,4858,41,120,8,79,235,45,45,⋯,327,8,326,88,197,288,260,139,49,64


## 4) Correspondance entre les zones Z05 et les données brutes avec `match()`

La commande `match()` permet d'identifier les numéros des lignes du jeu de données (`donnees$z05`) dont l'identifiant z05 "match" les identifiants des zones z05 du canton de Vaud (`zVD`). Ces numéros de lignes sont enregistrés dans la variable `rowData`. La commande `length()` permet de vérifier le nombre de *matchs*, qui doit être égal au nombre de zones z05 du canton.

In [9]:
rowDataVSVD = match(zVSVD, donnees$Z05)
length(rowDataVD)

## 5) Extraction des données de la région
Pour extraire les données du canton de Vaud, nous les enregistrons dans une nouvelle variable appelée `DonneesVD`, constitutée sur la base d'une sélections des lignes (celles de `rowData`) du jeu de `donnees`

In [10]:
DonneesVSVD = donnees[rowDataVSVD,]

Le résultat est ainsi composé des données des zones z05 des **deux cantons** Valais et Vaud

In [11]:
head(DonneesVSVD, 20)

Unnamed: 0,Z05,NAME,PLUGER,PLUFRA,PLUITA,PLURUM,PLUENG,PLUOTH,PLU2GF,PLU2GI,⋯,ADD3FIN,ADD3RE,ADD3PRO,ADD3SUP,ADD3ADM,ADD3EDU,ADD3HC,ADD3SOC,ADD3REC,ADD3PER
1164,5841.0,Enhaut,187,2611,17,0,126,283,172,0,⋯,59,48,123,83,95,102,168,70,25,47
1176,5888.0,Saint-Légier-La Chiésaz,170,2701,41,0,240,200,210,0,⋯,211,23,311,98,117,188,205,129,28,72
1121,5602.0,Bourg-en-Lavaux,145,2896,36,0,97,197,198,0,⋯,164,36,258,85,90,164,234,103,36,88
1160,5793.0,Oron,38,3267,16,0,31,232,155,0,⋯,91,35,161,107,187,150,215,165,46,86
1140,5678.0,Moudon,43,2214,33,0,8,661,77,0,⋯,67,17,118,94,95,83,130,143,20,48
1077,5518.0,Echallens,42,3320,45,0,16,327,113,0,⋯,149,39,174,112,192,113,181,183,34,109
1137,5646.0,Saint-Prex,87,2593,100,0,96,453,159,4,⋯,255,29,204,115,80,166,118,144,40,65
1239,6300.0,Zermatt,2731,117,149,0,93,643,103,49,⋯,42,17,92,40,67,86,33,76,66,34
1236,6292.0,Mattertal,3318,24,26,0,0,417,64,34,⋯,69,8,88,72,74,50,45,114,15,42
1216,6159.0,Vouvry-Vionnaz,80,3859,62,0,16,322,136,0,⋯,118,41,168,150,160,140,216,210,41,47


# 6) Exportation du *data-frame* en format CSV
Une fois les modifications effectuées sur votre data-frame, il vous est possible de l'exporter à nouveau en csv à l'aide de la fonction write.csv() de la manière suivante:

In [12]:
write.csv(DonneesVSVD, file = "DonneesVSVD.csv", fileEncoding = "UTF-8")

Pour s'assurer que tout a bien fonctionné nous pouvons charger le fichier à l'aide de `read.csv()`

In [13]:
read.csv(file="DonneesVSVD.csv", sep=",")

X,Z05,NAME,PLUGER,PLUFRA,PLUITA,PLURUM,PLUENG,PLUOTH,PLU2GF,⋯,ADD3FIN,ADD3RE,ADD3PRO,ADD3SUP,ADD3ADM,ADD3EDU,ADD3HC,ADD3SOC,ADD3REC,ADD3PER
1164,5841.0,Enhaut,187,2611,17,0,126,283,172,⋯,59,48,123,83,95,102,168,70,25,47
1176,5888.0,Saint-Légier-La Chiésaz,170,2701,41,0,240,200,210,⋯,211,23,311,98,117,188,205,129,28,72
1121,5602.0,Bourg-en-Lavaux,145,2896,36,0,97,197,198,⋯,164,36,258,85,90,164,234,103,36,88
1160,5793.0,Oron,38,3267,16,0,31,232,155,⋯,91,35,161,107,187,150,215,165,46,86
1140,5678.0,Moudon,43,2214,33,0,8,661,77,⋯,67,17,118,94,95,83,130,143,20,48
1077,5518.0,Echallens,42,3320,45,0,16,327,113,⋯,149,39,174,112,192,113,181,183,34,109
1137,5646.0,Saint-Prex,87,2593,100,0,96,453,159,⋯,255,29,204,115,80,166,118,144,40,65
1239,6300.0,Zermatt,2731,117,149,0,93,643,103,⋯,42,17,92,40,67,86,33,76,66,34
1236,6292.0,Mattertal,3318,24,26,0,0,417,64,⋯,69,8,88,72,74,50,45,114,15,42
1216,6159.0,Vouvry-Vionnaz,80,3859,62,0,16,322,136,⋯,118,41,168,150,160,140,216,210,41,47
