In [3]:
import pandas as pd 

path = "https://datos.cdmx.gob.mx/dataset/5b938119-7d49-491f-9eba-09cd4f7241b5/resource/9ad1062f-98d6-4244-b1bb-f76e333d7d2d/download/ic_delitos_alto_impacto_2024_03.csv"
df = pd.read_csv(path)

df.head()

Unnamed: 0,fecha,ciudad_de_mexico,alvaro_obregon,azcapotzalco,benito_juarez,coyoacan,cuajimalpa,cuauhtemoc,gustavo_a_madero,iztacalco,iztapalapa,magdalena_contreras,miguel_hidalgo,milpa_alta,tlahuac,tlalpan,venustiano_carranza,xochimilco
0,2016-01-31,2778,170,163,156,188,22,335,420,127,488,40,131,19,66,167,192,94
1,2016-02-29,2817,161,145,192,176,16,334,397,119,549,31,135,16,81,177,171,117
2,2016-03-31,3000,190,182,194,165,15,332,436,144,583,46,136,17,83,185,166,126
3,2016-04-30,2923,173,154,237,217,21,310,387,138,539,29,168,10,74,180,161,125
4,2016-05-31,2890,176,118,207,179,13,366,397,134,560,48,139,12,72,173,168,128


In [6]:
#Checamos los tipos de datos
df.dtypes


fecha                  datetime64[ns]
ciudad_de_mexico                int64
alvaro_obregon                  int64
azcapotzalco                    int64
benito_juarez                   int64
coyoacan                        int64
cuajimalpa                      int64
cuauhtemoc                      int64
gustavo_a_madero                int64
iztacalco                       int64
iztapalapa                      int64
magdalena_contreras             int64
miguel_hidalgo                  int64
milpa_alta                      int64
tlahuac                         int64
tlalpan                         int64
venustiano_carranza             int64
xochimilco                      int64
Fecha                          object
Año                             int32
Mes                            object
dtype: object

In [7]:
# Aseguramos que sea datetime
df['fecha'] = pd.to_datetime(df['fecha'])
df['Fecha'] = df['fecha'].dt.strftime('%b-%Y')
df['Año'] = df['fecha'].dt.year
df['Mes'] = df['fecha'].dt.strftime('%b')
df.head()

Unnamed: 0,fecha,ciudad_de_mexico,alvaro_obregon,azcapotzalco,benito_juarez,coyoacan,cuajimalpa,cuauhtemoc,gustavo_a_madero,iztacalco,...,magdalena_contreras,miguel_hidalgo,milpa_alta,tlahuac,tlalpan,venustiano_carranza,xochimilco,Fecha,Año,Mes
0,2016-01-31,2778,170,163,156,188,22,335,420,127,...,40,131,19,66,167,192,94,Jan-2016,2016,Jan
1,2016-02-29,2817,161,145,192,176,16,334,397,119,...,31,135,16,81,177,171,117,Feb-2016,2016,Feb
2,2016-03-31,3000,190,182,194,165,15,332,436,144,...,46,136,17,83,185,166,126,Mar-2016,2016,Mar
3,2016-04-30,2923,173,154,237,217,21,310,387,138,...,29,168,10,74,180,161,125,Apr-2016,2016,Apr
4,2016-05-31,2890,176,118,207,179,13,366,397,134,...,48,139,12,72,173,168,128,May-2016,2016,May


Barras Verticales

In [27]:
#Importamos la libreria plotly
import plotly.graph_objects as go

# Crear la figura
fig = go.Figure(
    data=[
        go.Bar(
            x=df.Fecha,
            y=df.tlalpan,
            # Mostrar valores encima de cada barra
            text=df.tlalpan,  
            # Colores por nombre, Hexadecimal, RGBA          
            textposition='outside',
            marker={
              'color': '#FF0000'
            
            }   
        )
    ]
     #titulo del grafico
    ,layout_title_text="Delitos en la Alcadía Tlalpan"
)

# Mostrar la figura
fig.show()

In [26]:
# Personalizamos el layout
fig.update_layout(
    title='Delitos de Alto Impacto',
    xaxis_title='Delitos',
    yaxis_title='Año',
    # https://plotly.com/python/templates/
    template='plotly_dark',
)
# Mostrar la figura
fig.show()

In [31]:
import plotly.graph_objects as go

# Crear la figura
fig = go.Figure(
    data=[
        go.Bar(
            x=df.Fecha,
            y=df.ciudad_de_mexico,
            # Mostrar valores encima de cada barra
            text=df.ciudad_de_mexico,  
            # Colores por nombre, Hexadecimal, RGBA          
            textposition='outside',
            marker={
              # Usamos los valores para asignar color
              "color": df.ciudad_de_mexico,
              # https://plotly.com/python/builtin-colorscales/
              "colorscale": 'rainbow', #Cambiar aquí la escala de colores     
              "colorbar": {
                  "title":'Valor'
              }
            }  
        )
    ]
)

# Mostrar la figura
fig.show()

In [51]:
import plotly.graph_objects as go

# Crear figura GO agregando una barra por cada columna (medalla)
fig = go.Figure()

for ano in df['Año'].unique():
    filtered = df[df['Año'] == ano]
    fig.add_trace(
            go.Bar(
              x=filtered.Mes,
              y=filtered.ciudad_de_mexico,
              name=f"{ano}".capitalize(),
              text=filtered.ciudad_de_mexico,            
              textposition='outside',
        )
    )
fig.update_layout(
    # Valores en píxeles
    width=800,   
    height=600,
    colorway=['#FF0000', '#00FF00', '#0000FF'],
    #titulo del grafico
    title='Delitos CDMX',
    xaxis_title='Mes',
    yaxis_title='Delitos',
    # https://plotly.com/python/templates/
    template='seaborn',
)
fig.show()

Barras Verticales

In [43]:
import plotly.graph_objects as go

# Crear la figura
fig = go.Figure(
    data=[
        go.Bar(
            y=df.Fecha,
            x=df.ciudad_de_mexico,
            # Mostrar valores encima de cada barra
            text=df.ciudad_de_mexico,            
            textposition='outside',
            orientation='h'
            
        )
    ]
)

# Mostrar la figura
fig.show()

In [45]:
# Personalizamos el layout
fig.update_layout(
    # Valores en píxeles
    width=900,   
    height=1600,
    title='Delitos de alto impacto',
    xaxis_title='Delitos',
    yaxis_title='Año',
    # https://plotly.com/python/templates/
    template='xgridoff',
)

# Mostrar la figura
fig.show()

Gráficas Apiladas

In [1]:
import pandas as pd 

path = "https://datos.cdmx.gob.mx/dataset/5b938119-7d49-491f-9eba-09cd4f7241b5/resource/9ad1062f-98d6-4244-b1bb-f76e333d7d2d/download/ic_delitos_alto_impacto_2024_03.csv"
df = pd.read_csv(path)

df.head()

Unnamed: 0,fecha,ciudad_de_mexico,alvaro_obregon,azcapotzalco,benito_juarez,coyoacan,cuajimalpa,cuauhtemoc,gustavo_a_madero,iztacalco,iztapalapa,magdalena_contreras,miguel_hidalgo,milpa_alta,tlahuac,tlalpan,venustiano_carranza,xochimilco
0,2016-01-31,2778,170,163,156,188,22,335,420,127,488,40,131,19,66,167,192,94
1,2016-02-29,2817,161,145,192,176,16,334,397,119,549,31,135,16,81,177,171,117
2,2016-03-31,3000,190,182,194,165,15,332,436,144,583,46,136,17,83,185,166,126
3,2016-04-30,2923,173,154,237,217,21,310,387,138,539,29,168,10,74,180,161,125
4,2016-05-31,2890,176,118,207,179,13,366,397,134,560,48,139,12,72,173,168,128


In [2]:
# Aseguramos que sea datetime
df['fecha'] = pd.to_datetime(df['fecha'])
df['Año'] = df['fecha'].dt.year
df['Mes'] = df['fecha'].dt.strftime('%b')

In [5]:
import plotly.graph_objects as go

# Crear figura GO agregando una barra por cada columna (medalla)
fig = go.Figure()

for ano in df['Año'].unique():
    filtered = df[df['Año'] == ano]
    fig.add_trace(
            go.Bar(
              x=filtered.Mes,
              y=filtered.ciudad_de_mexico,
              name=f"{ano}".capitalize(),
              text=df.ciudad_de_mexico,            
              textposition='outside',
        )
    )



In [None]:
# Personalizamos el layout
fig.update_layout(
    # Valores en píxeles
     width=800,
    height=500,
    title='Delitos de alto impacto',
    xaxis_title='Delitos',
    yaxis_title='Año',
    # https://plotly.com/python/templates/
    template='plotly_white',
    barmode='stack', #stack, group, overlay. Este comando, hace  la diferencia entre las barras apiladas, agrupadas y superpuestas
    legend_title_text='Año',
)

Ejercicios

* Cambie CDMX por alguna alcandia de su interes.

* Pruebe con otro dataset distinto

* Muestre las barra argupadas en horizontal

* Muestre las barras apiladas en horizontal

In [16]:
# Crear figura GO agregando una barra por cada columna (medalla)
"""fig = go.Figure()

for ano in df['Año'].unique():
    filtered = df[df['Año'] == ano]
    fig.add_trace(
            go.Bar(
              x=filtered.Mes,
              y=filtered.tlalpan,
              name=f"{ano}".capitalize(),
              text=df.tlalpan,            
              textposition='outside',
        )
    )
    
fig.show()


import plotly.graph_objects as go"""

# Crear la figura
fig = go.Figure(
    data=[
        go.Bar(
            x=df.fecha,
            y=df.tlalpan,
            # Mostrar valores encima de cada barra
            text=df.tlalpan,  
            # Colores por nombre, Hexadecimal, RGBA          
            textposition='outside',
            marker={
              'color': '#FF0000'
            
            }   
        )
    ]
     #titulo del grafico
    ,layout_title_text="Delitos en la Alcadía Tlalpan"
)

# Mostrar la figura
fig.show()



The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result



In [27]:


# Crear figura GO agregando una barra por cada columna (medalla)
fig = go.Figure()

for ano in df['Año'].unique():
    filtered = df[df['Año'] == ano]
    #añadimos horientacion a las barras vertical
    fig.add_trace(
            go.Bar(
              y=filtered.Mes, #recuerda cambiar x por y 
              x=filtered.tlalpan,
              name=f"{ano}".capitalize(),
              text=filtered.tlalpan,            
              textposition='outside',
              orientation='h',
        )
    )

# Personalizamos el layout
fig.update_layout(
    # Valores en píxeles
    width=900,   
    height=1600,
    title='Delitos Tlalpan',
    xaxis_title='Delitos',
    yaxis_title='Año',
    # https://plotly.com/python/templates/
    template='xgridoff',
)

fig.show()

In [29]:
# Personalizamos el layout con la escala de colores
fig.update_layout(
    # Valores en píxeles
    width=900,   
    height=1600,
    title='Delitos Tlalpan',
    xaxis_title='Delitos',
    yaxis_title='Año',
    # https://plotly.com/python/templates/
    template='xgridoff',
    #colorway=['#FF0000', '#00FF00', '#0000FF'],
)
fig.update_layout(
    # Valores en píxeles
     width=800,
    height=500,
    title='Delitos de Alto Impacto Tlalpan',
    xaxis_title='Delitos',
    yaxis_title='Año',
    # https://plotly.com/python/templates/
    template='plotly_dark',
    barmode='stack', #stack, group, overlay. Este comando, hace  la diferencia entre las barras apiladas, agrupadas y superpuestas
    legend_title_text='Año',
)

Gráfica de Barras

In [31]:
# Aseguramos que sea datetime
df['fecha'] = pd.to_datetime(df['fecha'])
df['Año'] = df['fecha'].dt.year
df['Mes'] = df['fecha'].dt.strftime('%b')
df.head()

Unnamed: 0,fecha,ciudad_de_mexico,alvaro_obregon,azcapotzalco,benito_juarez,coyoacan,cuajimalpa,cuauhtemoc,gustavo_a_madero,iztacalco,iztapalapa,magdalena_contreras,miguel_hidalgo,milpa_alta,tlahuac,tlalpan,venustiano_carranza,xochimilco,Año,Mes
0,2016-01-31,2778,170,163,156,188,22,335,420,127,488,40,131,19,66,167,192,94,2016,Jan
1,2016-02-29,2817,161,145,192,176,16,334,397,119,549,31,135,16,81,177,171,117,2016,Feb
2,2016-03-31,3000,190,182,194,165,15,332,436,144,583,46,136,17,83,185,166,126,2016,Mar
3,2016-04-30,2923,173,154,237,217,21,310,387,138,539,29,168,10,74,180,161,125,2016,Apr
4,2016-05-31,2890,176,118,207,179,13,366,397,134,560,48,139,12,72,173,168,128,2016,May


In [33]:
_df = df.copy()
year = 2021#Ingresa un año
month = "Feb"#Ingresa un mes en ingles (tres primeras letras)
_df = _df[(_df["Año"]==year) & (_df["Mes"]==month)]
_df.head()

_df.drop(columns = ['fecha', 'ciudad_de_mexico', 'Año', 'Mes'], inplace=True)
_df.head()

_df_T = _df.T.reset_index()
_df_T.columns = ['Alcaldia', 'Delitos']
_df_T.head()

Unnamed: 0,Alcaldia,Delitos
0,alvaro_obregon,248
1,azcapotzalco,142
2,benito_juarez,162
3,coyoacan,173
4,cuajimalpa,27


In [40]:
fig = go.Figure(
    data=[go.Pie(
        labels=_df_T.Alcaldia,
        values=_df_T.Delitos,
        textinfo='percent', #value, percent, label
        insidetextorientation='radial'
    )]
)

fig.update_layout(
    title=f'Distribución de Delitos por Alcaldía ({month}-{year})',
    legend_title_text='Alcaldía'
)

fig.show()

Grafico de Dona

In [None]:
#Primero se calacula el valor máximo del conjunto de los datos
import numpy as np

# Calcular el índice del valor máximo
max_idx = np.argmax(_df_T.Delitos.tolist())
pull_values = [0.1 if i == max_idx else 0 for i in range(len(_df_T.Delitos.tolist()))] 
_df_T.Delitos.tolist()

[248, 142, 162, 173, 27, 252, 319, 146, 546, 56, 201, 23, 117, 175, 187, 125]

In [51]:
print(pull_values )

[0, 0, 0, 0, 0, 0, 0, 0, 0.1, 0, 0, 0, 0, 0, 0, 0]


In [52]:
fig = go.Figure(
    data=[go.Pie(
        labels=_df_T.Alcaldia,
        values=_df_T.Delitos,
        textinfo='label+percent',
        hole=0.3,
        pull=  [0, 0.1, 0, 0, 0, 0, 0, 0, 0.1, 0, 0, 0, 0, 0, 0, 0] #pull_values  # Resalta la alcaldía con más delitos
    )]
)

fig.update_layout(
    title=f'Distribución de delitos por alcaldía ({month}-{year})',
    legend_title_text='Alcaldía'
)

fig.show()

In [50]:
fig = go.Figure(
    data=[go.Pie(
        labels=_df_T.Alcaldia,
        values=_df_T.Delitos,
        textinfo='percent',
        textposition='outside',#label outside
        hole=0.4,
        rotation=120 #aqui cambias el grado de rotation
    )]
)

fig.update_layout(
    title=f'Distribución de delitos por alcaldía ({month}-{year})',
    legend_title_text='Alcaldía'
)

fig.show()

Tarea. Personalizar el gráfico

In [56]:
# @title Pie Chart Interactivo
# @markdown Seleciona el año y el mes
year = 2021 # @param {"type":"slider","min":2016,"max":2024,"step":1}
month = "Sep" # @param ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"]

"""import pandas as pd
import plotly.graph_objects as go

path = "https://datos.cdmx.gob.mx/dataset/5b938119-7d49-491f-9eba-09cd4f7241b5/resource/9ad1062f-98d6-4244-b1bb-f76e333d7d2d/download/ic_delitos_alto_impacto_2024_03.csv"
df = pd.read_csv(path)"""

# Aseguramos que sea datetime
df['fecha'] = pd.to_datetime(df['fecha'])
df['Año'] = df['fecha'].dt.year
df['Mes'] = df['fecha'].dt.strftime('%b')

_df = df.copy()
_df = _df[(_df["Año"]==year) & (_df["Mes"]==month)]
_df.head()

_df.drop(columns = ['fecha', 'ciudad_de_mexico', 'Año', 'Mes'], inplace=True)
_df.head()

_df_T = _df.T.reset_index()
_df_T.columns = ['Alcaldia', 'Delitos']
_df_T.head()

fig = go.Figure(
    data=[go.Pie(
        labels=_df_T.Alcaldia,
        values=_df_T.Delitos,
        textinfo='label+percent'
    )]
)

fig.update_layout(
    title=f'Distribución de delitos por alcaldía ({month}-{year})',
    legend_title_text='Alcaldía'
)
fig.show()

In [67]:
# Calcular el índice del valor máximo
max_idx = np.argmax(_df_T.Delitos.tolist())
pull_values = [0.1 if i == max_idx else 0 for i in range(len(_df_T.Delitos.tolist()))] 
_df_T.Delitos.tolist()
colors = ['#636EFA', '#EF553B', '#00CC96', '#AB63FA', '#FFA15A', '#19D3F3', '#FF6692', '#B6E880', '#FF97FF', '#FECB52']

fig = go.Figure(
    data=[go.Pie(
        labels=_df_T.Alcaldia,
        values=_df_T.Delitos,
        textinfo='percent',
        hole=0.5,
        pull=pull_values,  # Resalta la alcaldía con más delitos
        marker=dict(colors=colors) 
    )]
)

fig.update_layout(
    title=f'Distribución de Delitos por Alcaldía ({month}-{year})',
    legend_title_text='Alcaldía',
    template='plotly_dark'
)
