# Explorando Madrid a trav칠s de sus datos
En este proyecto, realizar칠 un an치lisis de datos sobre la ciudad de Madrid, enfoc치ndome en aspectos clave como la poblaci칩n, los movimientos migratorios (inmigraci칩n y emigraci칩n), las tasas de natalidad y mortalidad, el desempleo y los nombres m치s comunes entre los residentes.
Utilizar칠 datos proporcionados por el **Banco de Datos del Ayuntamiento de Madrid**, una fuente confiable y completa, que cubre diversos aspectos de la vida en la ciudad, como la demograf칤a, la econom칤a y la salud.
Este an치lisis ofrecer치 una visi칩n general de la situaci칩n social y econ칩mica de Madrid entre 2018 y 2023.

# Carga de bibliotecas necesarias para analizar los datos 游닄

In [1]:
# Cargar bibliotecas necesarias
library(tidyverse)
library(knitr)
library(scales)
library(wordcloud2)
library(visNetwork)
library(networkD3)
library(ggplot2)


# Cargamos una fuente preseleccionada para los gr치ficos 游댟

In [2]:
# Cambiar texto a Oswald
library(showtext)
font_add_google('Oswald')
showtext_auto()

# Carga de Datos 丘뙖잺
Procederemos a cargar los conjuntos de datos.

In [3]:
# Leer los datos
population <- read.csv('../input/population.csv', sep=',', fileEncoding='UTF-8')
age_population <- read.csv('../input/age_population.csv', sep=',', fileEncoding='UTF-8')
immigrants_emigrants_by_sex <- read.csv('../input/immigrants_emigrants_by_sex.csv', sep=',', fileEncoding='UTF-8')
immigrants_emigrants_by_destination <- read.csv('../input/immigrants_emigrants_by_destination.csv', sep=',', fileEncoding='UTF-8')
immigrants_emigrants_by_destination2 <- read.csv('../input/immigrants_emigrants_by_destination2.csv', sep=',', fileEncoding='UTF-8')
immigrants_by_nationality <- read.csv('../input/immigrants_by_nationality.csv', sep=',', fileEncoding='UTF-8')
births <- read.csv('../input/births.csv', sep=',', fileEncoding='UTF-8')
deaths <- read.csv('../input/deaths.csv', sep=',', fileEncoding='UTF-8')
deaths_causes <- read.csv('../input/deaths_causes.csv', sep=',', fileEncoding='UTF-8')
unemployment <- read.csv('../input/unemployment.csv', sep=',', fileEncoding='UTF-8')
baby_names <- read.csv('../input/most_frequent_baby_names.csv', sep=',')
names <- read.csv('../input/most_frequent_names.csv', sep=',')
surname <- read.csv('../input/most_frequent_surname.csv', sep=',')

# An치lisis de Datos 游늵
### Poblaci칩n por Edad 游논
El siguiente gr치fico muestra la poblaci칩n por edades para el a침o 2023, mostrando la distribuci칩n por g칠nero.

In [4]:
# Orden de las edades
age_population$Age <- ordered(age_population$Age, levels=c("0-4", "5-9", "10-14", "15-19",
                                                   "20-24", "25-29", "30-34", "35-39",
                                                   "40-44", "45-49", "50-54", "55-59",
                                                   "60-64", "65-69", "70-74", "75-79",
                                                   "80-84", "85-89", "90-94", "95-99",  
                                                   "100&more"))

# Poblaci칩n por edad (2023)
ggplot(data=age_population, aes(x=Age, fill=Gender)) +
  geom_bar(data=filter(age_population, Gender=="Female"), aes(y=Number), stat="identity") + 
  geom_bar(data=filter(age_population, Gender=="Male"), aes(y=Number*(-1)), stat="identity") +
  scale_y_continuous(breaks=seq(-100000, 100000, 20000), 
                     labels=comma(abs(seq(-100000, 100000, 20000)))) + 
  scale_fill_manual(values = c("#91C8E4", "#FFABAB"), name = "Gender") +
  labs(x="Age", y="Population", title="Population by age (2023)") +
  coord_flip() +
  theme_minimal() +
  theme(
    plot.background = element_rect(fill = "#f6f0ec", color = NA),
    panel.border = element_blank(),
    panel.grid = element_blank(),
    axis.line = element_line(color = "#f6f0ec"),
    text = element_text(family = "Oswald", size = 15, color = "black")
  )