# Las librerías de manipulación de datos

## Leer del archivo EXCEL `Canarias_poblacion.xls` la hoja 2019 y cargar en un `data.frame` llamado `can_pob_2019`

In [83]:
install.packages('openxlsx')

library(openxlsx)
library(tidyverse)
library(readxl)

Installing package into ‘/usr/local/lib/R/site-library’
(as ‘lib’ is unspecified)



In [84]:
data <- read_xls(
    path = 'Canarias_poblacion.xls',
    sheet = '2019'
)
can_pob_2019 <- data.frame(data)
head(can_pob_2019)

Unnamed: 0_level_0,Isla,Municipio,Población
Unnamed: 0_level_1,<chr>,<chr>,<dbl>
1,LANZAROTE,Arrecife,62988
2,LANZAROTE,Haría,5123
3,LANZAROTE,San Bartolomé,18816
4,LANZAROTE,Teguise,22342
5,LANZAROTE,Tías,20170
6,LANZAROTE,Tinajo,6279


## Cargar ahora las dos hojas restantes (2018 y 2017) en crear un único `data.frame` `can_pob` con filas los municipios y columnas los 3 años

In [85]:
data <- read_xls(
    path = 'Canarias_poblacion.xls',
    sheet = '2018'
)
can_pob_2018 <- data.frame(data)
head(can_pob_2018)


data <- read_xls(
    path = 'Canarias_poblacion.xls',
    sheet = '2017'
)
can_pob_2017 <- data.frame(data)
head(can_pob_2017)

Unnamed: 0_level_0,Isla,Municipio,Población
Unnamed: 0_level_1,<chr>,<chr>,<dbl>
1,LANZAROTE,Arrecife,61351
2,LANZAROTE,Haría,4969
3,LANZAROTE,San Bartolomé,18327
4,LANZAROTE,Teguise,22122
5,LANZAROTE,Tías,20006
6,LANZAROTE,Tinajo,6119


Unnamed: 0_level_0,Isla,Municipio,Población
Unnamed: 0_level_1,<chr>,<chr>,<dbl>
1,LANZAROTE,Arrecife,59771
2,LANZAROTE,Haría,4858
3,LANZAROTE,San Bartolomé,18249
4,LANZAROTE,Teguise,21896
5,LANZAROTE,Tías,19964
6,LANZAROTE,Tinajo,6028


In [86]:
can_pob <- can_pob_2017 %>%
    left_join(., can_pob_2018, by = 'Municipio') %>%
    left_join(., can_pob_2019, by = 'Municipio') %>%
    select(Isla.x, Municipio, Población.x, Población.y, Población) %>%
    rename(
        'Isla' = Isla.x,
        'Pob_2017' = Población.x,
        'Pob_2018' = Población.y,
        'Pob_2019' = Población
    )

head(can_pob)

Unnamed: 0_level_0,Isla,Municipio,Pob_2017,Pob_2018,Pob_2019
Unnamed: 0_level_1,<chr>,<chr>,<dbl>,<dbl>,<dbl>
1,LANZAROTE,Arrecife,59771,61351,62988
2,LANZAROTE,Haría,4858,4969,5123
3,LANZAROTE,San Bartolomé,18249,18327,18816
4,LANZAROTE,Teguise,21896,22122,22342
5,LANZAROTE,Tías,19964,20006,20170
6,LANZAROTE,Tinajo,6028,6119,6279


## A partir del `data.frame` `can_pob` crear un vector llamado __Variables__ que contenga los nombres de las variables

In [87]:
variables = colnames(can_pob)
variables

## Calcular una variable **porcentaje_pob** que sea el porcentaje de población de cada municipio sobre la población total de Canarias

In [88]:
can_pob <- can_pob %>%
    mutate(Porcentaje_pob_2017 = (Pob_2017 / sum(Pob_2017)) * 100) %>%
    mutate(Porcentaje_pob_2018 = (Pob_2018 / sum(Pob_2018)) * 100) %>%
    mutate(Porcentaje_pob_2019 = (Pob_2019 / sum(Pob_2019)) * 100)

can_pob

Isla,Municipio,Pob_2017,Pob_2018,Pob_2019,Porcentaje_pob_2017,Porcentaje_pob_2018,Porcentaje_pob_2019
<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
LANZAROTE,Arrecife,59771,61351,62988,2.83527369,2.88346254,2.92506370
LANZAROTE,Haría,4858,4969,5123,0.23044218,0.23354021,0.23790407
LANZAROTE,San Bartolomé,18249,18327,18816,0.86565240,0.86135871,0.87378546
LANZAROTE,Teguise,21896,22122,22342,1.03865006,1.03972158,1.03752736
LANZAROTE,Tías,19964,20006,20170,0.94700447,0.94027076,0.93666309
LANZAROTE,Tinajo,6028,6119,6279,0.28594184,0.28758956,0.29158689
LANZAROTE,Yaiza,16257,16289,16571,0.77116067,0.76557385,0.76953119
FUERTEVENTURA,Antigua,11405,11948,12461,0.54100310,0.56154929,0.57866925
FUERTEVENTURA,Betancuria,710,731,758,0.03367928,0.03435659,0.03520033
FUERTEVENTURA,Oliva (La),25349,25884,26580,1.20244521,1.21653346,1.23433342


## Filtras las islas de la provincia de Las Palmas

In [89]:
can_pob <- can_pob %>%
    filter(Isla == 'LANZAROTE' | Isla == 'GRANCANARIA' | Isla == 'FUERTEVENTURA')

head(can_pob)

Unnamed: 0_level_0,Isla,Municipio,Pob_2017,Pob_2018,Pob_2019,Porcentaje_pob_2017,Porcentaje_pob_2018,Porcentaje_pob_2019
Unnamed: 0_level_1,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
1,LANZAROTE,Arrecife,59771,61351,62988,2.8352737,2.8834625,2.9250637
2,LANZAROTE,Haría,4858,4969,5123,0.2304422,0.2335402,0.2379041
3,LANZAROTE,San Bartolomé,18249,18327,18816,0.8656524,0.8613587,0.8737855
4,LANZAROTE,Teguise,21896,22122,22342,1.0386501,1.0397216,1.0375274
5,LANZAROTE,Tías,19964,20006,20170,0.9470045,0.9402708,0.9366631
6,LANZAROTE,Tinajo,6028,6119,6279,0.2859418,0.2875896,0.2915869


## Encontrar los municipios con menos del 30% de población

Si filtramos los municipios con menos del 30% de la población **global** de canarias, veremos que obtendremos todos los municipios originales.

In [90]:
paralel_can_pob <- can_pob

can_pob <- can_pob %>%
    filter(Porcentaje_pob_2019 < 30)

head(can_pob)

Unnamed: 0_level_0,Isla,Municipio,Pob_2017,Pob_2018,Pob_2019,Porcentaje_pob_2017,Porcentaje_pob_2018,Porcentaje_pob_2019
Unnamed: 0_level_1,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
1,LANZAROTE,Arrecife,59771,61351,62988,2.8352737,2.8834625,2.9250637
2,LANZAROTE,Haría,4858,4969,5123,0.2304422,0.2335402,0.2379041
3,LANZAROTE,San Bartolomé,18249,18327,18816,0.8656524,0.8613587,0.8737855
4,LANZAROTE,Teguise,21896,22122,22342,1.0386501,1.0397216,1.0375274
5,LANZAROTE,Tías,19964,20006,20170,0.9470045,0.9402708,0.9366631
6,LANZAROTE,Tinajo,6028,6119,6279,0.2859418,0.2875896,0.2915869


Esto es así porque comparar cualquier población de cualquier municipio con la totalidad canaria es una idea pésima, pues la diferencia de magnitudes provocará que nunca haya un municipio tan sobre-poblado como para que alcance el 30% de la población, por lo que el conjunto de municipios original será igual que el conjunto final.

En el _excel_ del siguiente apartado se guardarán todos los municipios con más del 30% de la población, pues es estrictamente lo que exige el enunciado. Sin embargo, para mostrar otras poblaciones, vamos a mostrar aquellos municipios que tienen menos de un 30% de población **frente a la población total de su propia isla**.

In [91]:
poblacion_por_isla <- paralel_can_pob %>%
    group_by(Isla) %>%
    summarise('Poblacion' = sum(Pob_2019)) %>%
    rename('Isla_n' = Isla)

poblacion_por_isla

Isla_n,Poblacion
<chr>,<dbl>
FUERTEVENTURA,116886
GRANCANARIA,851231
LANZAROTE,152289


In [92]:
filter(poblacion_por_isla, Isla_n == 'LANZAROTE')$Poblacion

In [93]:
paralel_can_pob <- paralel_can_pob %>%
    filter(., Pob_2019 <= (0.3 * case_when(
        Isla == 'LANZAROTE' ~ filter(poblacion_por_isla, Isla_n == 'LANZAROTE')$Poblacion,
        Isla == 'FUERTEVENTURA' ~ filter(poblacion_por_isla, Isla_n == 'FUERTEVENTURA')$Poblacion,
        Isla == 'GRANCANARIA' ~ filter(poblacion_por_isla, Isla_n == 'GRANCANARIA')$Poblacion
    )))

head(paralel_can_pob)

Unnamed: 0_level_0,Isla,Municipio,Pob_2017,Pob_2018,Pob_2019,Porcentaje_pob_2017,Porcentaje_pob_2018,Porcentaje_pob_2019
Unnamed: 0_level_1,<chr>,<chr>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<dbl>
1,LANZAROTE,Haría,4858,4969,5123,0.2304422,0.2335402,0.2379041
2,LANZAROTE,San Bartolomé,18249,18327,18816,0.8656524,0.8613587,0.8737855
3,LANZAROTE,Teguise,21896,22122,22342,1.0386501,1.0397216,1.0375274
4,LANZAROTE,Tías,19964,20006,20170,0.9470045,0.9402708,0.9366631
5,LANZAROTE,Tinajo,6028,6119,6279,0.2859418,0.2875896,0.2915869
6,LANZAROTE,Yaiza,16257,16289,16571,0.7711607,0.7655739,0.7695312


## Grabar los resultados en un excel

In [95]:
write.xlsx(
    can_pob,
    file = 'can_pob.xlsx'
)