## Data Visualization Project

Me preocupa mucho el tema de movilidad y medio ambiente en la Ciudad de México, por lo que me propuse visualizar algunos de los datos públicos sobre estos temas. Primero, investigué en la mejor fuente para los datos que necesitaba: https://datos.cdmx.gob.mx/pages/home/. Posteriormente, decidí analizar los cambios en los límites de velocidad en las vialidades de la CDMX (2015-2019), así como los cambios de clasificación en las mismas.

Como bonus, realicé un mapa de las relaciones entre los tiraderos de basura clandestinos y las zonas de mayor riesgo de precipitación, con la finalidad de encontrar los puntos geográficos en la ciudad con mayor probabilidad de inundación.

Importo librerías. Al final no utilicé algunas, pero por si las dudas.

In [1]:
import pandas as pd
import numpy as np
import matplotlib as plt
import plotly as py
import plotly.graph_objects as go
import plotly.express as px
import seaborn as sns

Importo la base de datos de las vialidades de la CDMX, e inicié la exploración de los datos.

In [2]:
limite_velocidad = pd.read_csv('vialidades-de-la-ciudad-de-mexico.csv', sep=';')

In [3]:
limite_velocidad.head()

Unnamed: 0,Geo Point,Geo Shape,clasif_15,vel_15,clasif_19,vel_19,Nombre,Inicia,Termina,Shape_Leng,Mixta
0,"19.351710442, -99.0690930576","{""type"": ""LineString"", ""coordinates"": [[-99.14...",Eje Vial,50,Eje Vial,50,Eje 8 Sur Calzada Ermita Iztapalapa,Calzada de Tlalpan,Calzada Ignacio Zaragoza,20.3499,No
1,"19.4065032037, -99.1063734226","{""type"": ""LineString"", ""coordinates"": [[-99.13...",Via de acceso controlado,80,Via de acceso controlado,80,Viaducto Rio de la Piedad,Calzada de Tlalpan,Calzada Ignacio Zaragoza,6.435393,No
2,"19.4213409304, -99.1201092791","{""type"": ""LineString"", ""coordinates"": [[-99.09...",Eje Vial,50,Eje Vial,50,Eje 1 Sur Fray Servando Teres de Mier,Circuito Interior Jesus Galindo y Villa,Eje Central Lazaro Cardenas,11.259555,No
3,"19.4960948813, -99.214227899","{""type"": ""LineString"", ""coordinates"": [[-99.20...",Arteria principal,50,Arteria principal,50,Calzada de las Armas,Calzada de la Naranja,Herreros,4.890099,No
4,"19.3543679679, -99.1899852361","{""type"": ""LineString"", ""coordinates"": [[-99.18...",Arteria principal,50,Arteria principal,50,Eje 4 Poniente Av. Revolucion,Molinos,Eje 10 Sur Av. San Jeronimo,4.080091,Si


In [4]:
limite_velocidad.dtypes

Geo Point      object
Geo Shape      object
clasif_15      object
vel_15          int64
clasif_19      object
vel_19          int64
Nombre         object
Inicia         object
Termina        object
Shape_Leng    float64
Mixta          object
dtype: object

In [5]:
limite_velocidad.isnull().sum()

Geo Point      0
Geo Shape      0
clasif_15      1
vel_15         0
clasif_19      0
vel_19         0
Nombre         0
Inicia         0
Termina        0
Shape_Leng     0
Mixta         33
dtype: int64

Elimino las columnas que no necesito, en este caso la geolocalización. No mapearé esta base de datos.

In [7]:
limite_velocidad = limite_velocidad.drop(['Geo Point', 'Geo Shape'], axis=1)

Reordeno las columnas para mayor comodidad al analizar y graficar.

In [8]:
column_order = ['Nombre','Inicia','Termina','Shape_Leng','clasif_15','vel_15','clasif_19','vel_19','Mixta']
limite_velocidad = limite_velocidad[column_order]
limite_velocidad.head()

Unnamed: 0,Nombre,Inicia,Termina,Shape_Leng,clasif_15,vel_15,clasif_19,vel_19,Mixta
0,Eje 8 Sur Calzada Ermita Iztapalapa,Calzada de Tlalpan,Calzada Ignacio Zaragoza,20.3499,Eje Vial,50,Eje Vial,50,No
1,Viaducto Rio de la Piedad,Calzada de Tlalpan,Calzada Ignacio Zaragoza,6.435393,Via de acceso controlado,80,Via de acceso controlado,80,No
2,Eje 1 Sur Fray Servando Teres de Mier,Circuito Interior Jesus Galindo y Villa,Eje Central Lazaro Cardenas,11.259555,Eje Vial,50,Eje Vial,50,No
3,Calzada de las Armas,Calzada de la Naranja,Herreros,4.890099,Arteria principal,50,Arteria principal,50,No
4,Eje 4 Poniente Av. Revolucion,Molinos,Eje 10 Sur Av. San Jeronimo,4.080091,Arteria principal,50,Arteria principal,50,Si


Grafico dos histogramas, uno para cada año, de acuerdo a sus clasificaciones e histogramas.

Una de las relaciones más relevantes es la reducción de las Vías de acceso controlado (o carreteras) con un límite de velocidad de 80 km/h.

In [11]:
fig = px.histogram(limite_velocidad, x="clasif_15", color='vel_15', title='Histograma | Límites de velocidad por vialidad, año 2015')
fig.show()

In [12]:
fig = px.histogram(limite_velocidad, x="clasif_19", color='vel_19', title='Histograma | Límites de velocidad por vialidad, año 2019')
fig.show()

Grafico box plots para los cuatro tipos de vialidad y la longitud de las mismas.

Hay cierta delimitación real en la longitud de las vialidades, sin embargo, en las arterias principales los outsiders son muchos para su importancia.

In [20]:
fig = px.box(limite_velocidad, x="clasif_19", y='Shape_Leng', title='Box plot | Longitudes de los cuatro tipos de vailidades en la CDMX')
fig.show()

In [22]:
fig = go.Figure(data=[
    go.Bar(name='2015', x=limite_velocidad.clasif_15, y=limite_velocidad.vel_15),
    go.Bar(name='2019', x=limite_velocidad.clasif_19, y=limite_velocidad.vel_19)
])

fig.update_layout(barmode='group', title='Gráfica de barras | Comparación entre total de vialidades en la CDMX, 2015-2019')
fig.show()

Gráfico scatter plots para comparar los límites de velocidad por tipo de vialidad y su longitud.

Resulta más fácil visulizar las relaciones entre cierto límite de velocidad y la longitud a la que se puede conducir en tal camino. Es una gráfica que puede servir para encontrar coincidencias con los accidentes viales.

In [21]:
fig = px.scatter(limite_velocidad, x="vel_19", y="Shape_Leng", color="clasif_19", title='Scatter Plot | Límites de velocidad por tipo de vialidad y su longitud en la CDMX, año 2019')
fig.show()

## Bonus

Importo dos bases de datos para comparar en un mapa el riesgo de precipitación por zonas y los tiraderos clandestinos en la CDMX.

In [23]:
riesgo_precipitacion = pd.read_csv('atlas-de-riesgo-precipitacion.csv', sep=';')

In [24]:
riesgo_precipitacion.head()

Unnamed: 0,Geopoint,Geoshape,ID,Fenómeno,Taxonomía,Rpve,Intensidad,Descripción,Fuente,Cvegeo,Alcaldía,Entidad,Área mt2,Perímetro,Period_Ret,Intens_Uni,Intens_Num,int2
0,"19.3849470814, -99.1438969068","{""type"": ""Polygon"", ""coordinates"": [[[-99.1436...",6.0,Hidrometeorológicos,Precipitación,Peligro,Bajo,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901400010488,Benito Juárez,Ciudad de México,230762.640075,2038.108726,5 años,mm,54 a 60,2
1,"19.2544657488, -99.0722615538","{""type"": ""Polygon"", ""coordinates"": [[[-99.0748...",9.0,Hidrometeorológicos,Precipitación,Peligro,Bajo,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901300011366,Xochimilco,Ciudad de México,726107.19297,4849.029938,5 años,mm,54 a 60,2
2,"19.38126606, -99.1828865778","{""type"": ""Polygon"", ""coordinates"": [[[-99.1808...",11.0,Hidrometeorológicos,Precipitación,Peligro,Medio,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901400010562,Benito Juárez,Ciudad de México,273658.477588,2334.776117,5 años,mm,60 a 64,3
3,"19.3867775197, -99.1794146708","{""type"": ""Polygon"", ""coordinates"": [[[-99.1766...",12.0,Hidrometeorológicos,Precipitación,Peligro,Medio,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",090140001037A,Benito Juárez,Ciudad de México,159743.594,1937.902239,5 años,mm,60 a 64,3
4,"19.2474326506, -99.0175796705","{""type"": ""Polygon"", ""coordinates"": [[[-99.0210...",22.0,Hidrometeorológicos,Precipitación,Peligro,Muy Bajo,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901300011192,Xochimilco,Ciudad de México,837259.010624,5699.033668,5 años,mm,41 a 54,1


In [25]:
riesgo_precipitacion.dtypes

Geopoint        object
Geoshape        object
ID             float64
Fenómeno        object
Taxonomía       object
Rpve            object
Intensidad      object
Descripción     object
Fuente          object
Cvegeo          object
Alcaldía        object
Entidad         object
Área mt2       float64
Perímetro      float64
Period_Ret      object
Intens_Uni      object
Intens_Num      object
int2             int64
dtype: object

In [26]:
riesgo_precipitacion.isnull().sum()

Geopoint       0
Geoshape       0
ID             0
Fenómeno       0
Taxonomía      0
Rpve           0
Intensidad     0
Descripción    0
Fuente         0
Cvegeo         0
Alcaldía       0
Entidad        0
Área mt2       0
Perímetro      0
Period_Ret     0
Intens_Uni     0
Intens_Num     0
int2           0
dtype: int64

In [27]:
riesgo_precipitacion[['Latitud','Longitud']] = riesgo_precipitacion['Geopoint'].str.split(expand=True)

In [28]:
riesgo_precipitacion['Latitud'] = riesgo_precipitacion['Latitud'].str.replace(',', '')
riesgo_precipitacion.head()

Unnamed: 0,Geopoint,Geoshape,ID,Fenómeno,Taxonomía,Rpve,Intensidad,Descripción,Fuente,Cvegeo,Alcaldía,Entidad,Área mt2,Perímetro,Period_Ret,Intens_Uni,Intens_Num,int2,Latitud,Longitud
0,"19.3849470814, -99.1438969068","{""type"": ""Polygon"", ""coordinates"": [[[-99.1436...",6.0,Hidrometeorológicos,Precipitación,Peligro,Bajo,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901400010488,Benito Juárez,Ciudad de México,230762.640075,2038.108726,5 años,mm,54 a 60,2,19.3849470814,-99.1438969068
1,"19.2544657488, -99.0722615538","{""type"": ""Polygon"", ""coordinates"": [[[-99.0748...",9.0,Hidrometeorológicos,Precipitación,Peligro,Bajo,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901300011366,Xochimilco,Ciudad de México,726107.19297,4849.029938,5 años,mm,54 a 60,2,19.2544657488,-99.0722615538
2,"19.38126606, -99.1828865778","{""type"": ""Polygon"", ""coordinates"": [[[-99.1808...",11.0,Hidrometeorológicos,Precipitación,Peligro,Medio,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901400010562,Benito Juárez,Ciudad de México,273658.477588,2334.776117,5 años,mm,60 a 64,3,19.38126606,-99.1828865778
3,"19.3867775197, -99.1794146708","{""type"": ""Polygon"", ""coordinates"": [[[-99.1766...",12.0,Hidrometeorológicos,Precipitación,Peligro,Medio,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",090140001037A,Benito Juárez,Ciudad de México,159743.594,1937.902239,5 años,mm,60 a 64,3,19.3867775197,-99.1794146708
4,"19.2474326506, -99.0175796705","{""type"": ""Polygon"", ""coordinates"": [[[-99.0210...",22.0,Hidrometeorológicos,Precipitación,Peligro,Muy Bajo,Total acumulado de partículas liquidas o solid...,"Dirección de Análisis de Riesgo de la SPCGIR, ...",0901300011192,Xochimilco,Ciudad de México,837259.010624,5699.033668,5 años,mm,41 a 54,1,19.2474326506,-99.0175796705


In [29]:
riesgo_precipitacion = riesgo_precipitacion.drop(['Geopoint', 'Geoshape', 'Entidad', 'int2', 'Taxonomía', 'Fenómeno', 'Rpve', 'Fuente', 'ID'], axis=1)

In [30]:
column_order = ['Alcaldía','Cvegeo','Intensidad','Área mt2','Perímetro','Period_Ret','Intens_Num','Intens_Uni','Longitud','Latitud','Descripción']
riesgo_precipitacion = riesgo_precipitacion[column_order]
riesgo_precipitacion.head()

Unnamed: 0,Alcaldía,Cvegeo,Intensidad,Área mt2,Perímetro,Period_Ret,Intens_Num,Intens_Uni,Longitud,Latitud,Descripción
0,Benito Juárez,0901400010488,Bajo,230762.640075,2038.108726,5 años,54 a 60,mm,-99.1438969068,19.3849470814,Total acumulado de partículas liquidas o solid...
1,Xochimilco,0901300011366,Bajo,726107.19297,4849.029938,5 años,54 a 60,mm,-99.0722615538,19.2544657488,Total acumulado de partículas liquidas o solid...
2,Benito Juárez,0901400010562,Medio,273658.477588,2334.776117,5 años,60 a 64,mm,-99.1828865778,19.38126606,Total acumulado de partículas liquidas o solid...
3,Benito Juárez,090140001037A,Medio,159743.594,1937.902239,5 años,60 a 64,mm,-99.1794146708,19.3867775197,Total acumulado de partículas liquidas o solid...
4,Xochimilco,0901300011192,Muy Bajo,837259.010624,5699.033668,5 años,41 a 54,mm,-99.0175796705,19.2474326506,Total acumulado de partículas liquidas o solid...


In [31]:
tiraderos_clandestinos = pd.read_csv('tiraderos-clandestinos-al-cierre-de-2017.csv', sep=';')

In [32]:
tiraderos_clandestinos.dtypes

Column 1        int64
FID_            int64
id_sedema       int64
no_alcaldi      int64
alcaldia       object
direccion_    float64
tipo_tirad    float64
calle          object
no_ext        float64
no_int        float64
colonia        object
entre_que_    float64
longitud      float64
latitud       float64
geo_point      object
dtype: object

In [33]:
tiraderos_clandestinos.isnull().sum()

Column 1         0
FID_             0
id_sedema        0
no_alcaldi       0
alcaldia         0
direccion_    1129
tipo_tirad    1129
calle            0
no_ext        1129
no_int        1129
colonia          7
entre_que_    1129
longitud         0
latitud          0
geo_point        0
dtype: int64

In [34]:
tiraderos_clandestinos.drop(columns=['Column 1','FID_','direccion_','tipo_tirad','no_ext','no_int','entre_que_','geo_point'], inplace=True)

In [35]:
column_order = ['no_alcaldi','alcaldia','id_sedema','longitud','latitud','calle','colonia']
tiraderos_clandestinos = tiraderos_clandestinos[column_order]

In [36]:
tiraderos_clandestinos.head()

Unnamed: 0,no_alcaldi,alcaldia,id_sedema,longitud,latitud,calle,colonia
0,10,Alvaro Obregon,409,-99.19734,19.39942,"Calle Sur 114, Esquina Poniente 85, Colonia Co...",COVE
1,12,Tlalpan,66,-99.1413,19.30105,"Calle Bordo Esquina Jazmines, Colonia Ejido Vi...",VIEJO EJIDO DE STA URSULA
2,14,Benito Juarez,567,-99.13998,19.36772,"Municipio Libre Es2Quina Miraflores, Colonia P...",PORTALES ORIENTE
3,17,Venustiano Carranza,1083,-99.12486,19.42981,Calle De Manzanares Esquina Av. Circunvalacion...,COL. MERCED ZONA CENTRO
4,17,Venustiano Carranza,1077,-99.12345,19.4252,"Calle Carretones Esquina Rosario, Colonia Mora...",COL. MERCED ZONA CENTRO


Utilizo plotly.graph_objects y la función Scattergo. En esta caso selecciono las coordenadas de las zonas por cada base de datos. Para las zonas de precipitación agrego el tamaño de las mismas (área en metros cuadrados) y modifico la escala.

Esta función de plotly no tiene una opción para mapear México en específico, ni ninguno de los estados, por lo que en el update_layout debo especificar las coordenadas de la CDMX.

Aún me falta aprender más sobre esta librería para que el mapa sea más ameno. Pero los resultados sirven para encontrar zonas con mayor tendencia a inundarse debido al riesgo de precipitación ya los tiraderos de basura clandestinos.

In [43]:
fig = go.Figure()

fig.add_trace(go.Scattergeo(
    lon = tiraderos_clandestinos['longitud'],
    lat = tiraderos_clandestinos['latitud'],
    text = 'Tiradero clandestino en'+' '+tiraderos_clandestinos['alcaldia'],
    mode = 'markers',
    name = 'Tiraderos clandestinos',
    ))
fig.add_trace(go.Scattergeo(
    lon = riesgo_precipitacion['Longitud'],
    lat = riesgo_precipitacion['Latitud'],
    text = 'Riesgo de precipitación '+riesgo_precipitacion['Intens_Num']+' mm',
    marker = dict(size = riesgo_precipitacion['Área mt2']/100000, sizemode = 'area'),
    name = 'Zona de riesgo de precipitación',
    ))

fig.update_layout(
        title = 'Tiraderos clandestinos y zonas de riesgo de precipitación en la CDMX',
        geo = go.layout.Geo(
            scope='north america',
            lonaxis_range= [ -99.8332, -97.852362 ],
            lataxis_range= [ 19.0701465, 19.9326 ])
        )

fig.show()