# Explorando Madrid a través de sus datos
En este proyecto, realizaré un análisis de datos sobre la ciudad de Madrid, enfocándome en aspectos clave como la población, los movimientos migratorios (inmigración y emigración), las tasas de natalidad y mortalidad, el desempleo y los nombres más comunes entre los residentes.

Utilizaré datos proporcionados por el **Banco de Datos del Ayuntamiento de Madrid**, una fuente confiable y completa, que cubre diversos aspectos de la vida en la ciudad, como la demografía, la economía y la salud.

Este análisis ofrecerá una visión general de la situación social y económica de Madrid entre 2018 y 2023.

# Carga de bibliotecas necesarias para analizar los datos 📚

In [1]:
# Cargar bibliotecas
library(tidyverse)
library(knitr)
library(scales)
library(wordcloud2)
library(visNetwork)
library(networkD3)
library(ggplot2)


## Cargamos una fuente preseleccionada para los gráficos  🔤

In [2]:
## Cambiar texto a Oswald
library(showtext)
font_add_google('Oswald')
showtext_auto()

## Carga de Datos ⚙️
Procederemos a cargar los conjuntos de datos.

In [3]:
# Leer los datos
population <- read.csv('../input/population.csv', sep=',', fileEncoding='UTF-8')
age_population <- read.csv('../input/age_population.csv', sep=',', fileEncoding='UTF-8')
immigrants_emigrants_by_sex <- read.csv('../input/immigrants_emigrants_by_sex.csv', sep=',', fileEncoding='UTF-8')
immigrants_emigrants_by_destination <- read.csv('../input/immigrants_emigrants_by_destination.csv', sep=',', fileEncoding='UTF-8')
immigrants_emigrants_by_destination2 <- read.csv('../input/immigrants_emigrants_by_destination2.csv', sep=',', fileEncoding='UTF-8')
immigrants_by_nationality <- read.csv('../input/immigrants_by_nationality.csv', sep=',', fileEncoding='UTF-8')
births <- read.csv('../input/births.csv', sep=',', fileEncoding='UTF-8')
deaths <- read.csv('../input/deaths.csv', sep=',', fileEncoding='UTF-8')
deaths_causes <- read.csv('../input/deaths_causes.csv', sep=',', fileEncoding='UTF-8')
unemployment <- read.csv('../input/unemployment.csv', sep=',', fileEncoding='UTF-8')
baby_names <- read.csv('../input/most_frequent_baby_names.csv', sep=',')
names <- read.csv('../input/most_frequent_names.csv', sep=',')
surname <- read.csv('../input/most_frequent_surname.csv', sep=',')

## Análisis de Datos 📊
### Población por Edad (2023)
La distribución de la población está centrada en los rangos de edad de 35 a 44 años. Es interesante observar cómo la población masculina disminuye considerablemente a partir del rango de 40-44 años, mientras que en el género femenino la disminución es menos pronunciada. ¡Parece claro que los hombres viven menos años en Madrid!

In [4]:
## Niveles ordenados para la edad
age_population$Age <- ordered(age_population$Age, levels=c("0-4", "5-9", "10-14", "15-19",
                                                   "20-24", "25-29", "30-34", "35-39",
                                                   "40-44", "45-49", "50-54", "55-59",
                                                   "60-64", "65-69", "70-74", "75-79",
                                                   "80-84", "85-89", "90-94", "95-99",  
                                                   "100&more"))

## Población por edad (2023)
ggplot(data=age_population, aes(x=Age, fill=Gender)) +
  geom_bar(data=filter(age_population, Gender=="Female"), aes(y=Number), stat="identity") + 
  geom_bar(data=filter(age_population, Gender=="Male"), aes(y=Number), stat="identity") + 
  scale_y_continuous(labels=comma) +
  labs(title="Población por Edad en Madrid (2023)", x="Edad", y="Población", fill="Género") +
  theme_minimal() + 
  theme(
    plot.background = element_rect(fill = "#f6f0ec", color = NA)
  ) +
  theme(
    panel.border = element_blank(), 
    panel.grid = element_blank(), 
    axis.line = element_line(color = "#f6f0ec"), 
    text = element_text(family = "Oswald", size = 15, color = "black") 
  )

![Población por Edad en Madrid (2023)](images/1.population.png)

### Población por Año (2018-2023)
A continuación, analizaremos la población por año, observando cómo ha evolucionado a lo largo de los últimos años en Madrid. Este análisis nos proporcionará una visión sobre las tendencias demográficas a lo largo del tiempo.

In [5]:
## Población por Año (2018-2023)
ggplot(data=population, aes(x=Year, y=Population)) +
  geom_line(color = "#1f77b4", size = 1) +
  geom_point(color = "#ff7f0e", size = 2) +
  scale_y_continuous(labels=comma) +
  labs(title="Evolución de la Población por Año en Madrid (2018-2023)", x="Año", y="Población") +
  theme_minimal() + 
  theme(
    plot.background = element_rect(fill = "#f6f0ec", color = NA)
  ) +
  theme(
    panel.border = element_blank(), 
    panel.grid = element_blank(), 
    axis.line = element_line(color = "#f6f0ec"), 
    text = element_text(family = "Oswald", size = 15, color = "black") 
  )

![Población por Año en Madrid (2018-2023)](images/2.Age_population.png)

### Análisis de la población por distritos de Madrid
Ahora vamos a analizar la población por distritos. Podemos hacernos una idea del tamaño y la ubicación de cada distrito utilizando el siguiente mapa.

![Mapa de distritos de Madrid](images/Madrid_district_map.png)