# 🏳️‍🌈 LGBTQ

En este cuaderno de Jupyter vamos a abordar a traves de un analisis explotario de datos, el comportamiento de la violencia hacia personas de la comunidad LGBTQ.

Es importante señalar que los registros de estas agresiones vienen registradas desde el año 1960 hasta la actualidad, por lo que veremos años con pocos incidentes registrados, es decir, hay años que presentan sesgos. Por lo que se ha decidido, tomar los 5 años más actuales.

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

In [2]:
# Carga de datos
df = pd.read_csv('../../Datasets/reportes_visible_2023-10-oct.csv', encoding='latin1')
df

Unnamed: 0,reportante,tipo_de_testiga,tipo_de_victima,edad_victima,sexo_asignado_nacer,identidad_genero,orientacion_sexual,expresion_genero,tipo_de_agresora,tipo_de_agresion,...,satisfaccion_reporte_previo,razon_no_reporte_previo,estado_civil,nacionalidad,escolaridad,ocupacion,ingreso,seguridad_social,identidades,id
0,Testiga,ONG,Determinada,De 18 a 25 años,Hombre,Hombre cis,Gay,Neutra,Familiar o cohabitante,Expulsión del hogar,...,,El contacto señaló se encontraba ya en la casa...,,,,,,,,225
1,Testiga,ONG,Determinada,De 36 a 40 años,Hombre,Mujer trans,No reportada,Femenina,Familiar o cohabitante,Exclusión,...,,Me lo contó la víctima y no quiere que se sepa,,,,,,,,227
2,Testiga,ONG,Determinada,De 12 a 17 años,Hombre,Hombre cis,No reportada,Un poco femenina,Maestra o personal educativo,Educativa,...,2.0,,,,,,,,,230
3,Personal,Personal,Determinada,De 26 a 30 años,Hombre,Persona no binaria,Gay,Femenina,Vecina,Psicológica,...,,Creo que no habrá consecuencias de la denuncia,,,,,,,,231
4,Personal,Personal,Determinada,De 18 a 25 años,Mujer,Mujer cis,Bisexual,Femenina,Amiga,Exclusión,...,,Tengo miedo de denunciar,,,,,,,,232
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2790,Personal,Personal,Determinada,De 31 a 35 años,Hombre,Mujer trans,Heterosexual,Femenina,Patrona o fuente de ingreso pública,Impedimento de identidad o expresión,...,,No sabía en dónde denunciarlo,Soltera,Mexicana,Primaria,Empleada,Igual a esta cantidad,,Raza no enlistada,13570
2791,Personal,Personal,Determinada,De 18 a 25 años,Hombre,Hombre cis,Gay,Un poco masculina,Persona no identificada,Sexual,...,3.0,,,,,,,,,13574
2792,Personal,Personal,Determinada,De 36 a 40 años,Hombre,Hombre cis,Gay,Femenina,Compañera de escuela,Verbal,...,,,,,,,,,,13579
2793,Personal,Personal,Determinada,De 12 a 17 años,Hombre,Hombre cis,Gay,Un poco femenina,Familiar o cohabitante,Física,...,,Creo que no habrá consecuencias de la denuncia,Unión libre,Mexicana,Secundaria,Estudiante,1000,,Religión no enlistada|Atea,13580


In [3]:
# Info general
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2795 entries, 0 to 2794
Data columns (total 33 columns):
 #   Column                       Non-Null Count  Dtype  
---  ------                       --------------  -----  
 0   reportante                   2795 non-null   object 
 1   tipo_de_testiga              2795 non-null   object 
 2   tipo_de_victima              2795 non-null   object 
 3   edad_victima                 2658 non-null   object 
 4   sexo_asignado_nacer          2682 non-null   object 
 5   identidad_genero             2730 non-null   object 
 6   orientacion_sexual           2739 non-null   object 
 7   expresion_genero             2661 non-null   object 
 8   tipo_de_agresora             2795 non-null   object 
 9   tipo_de_agresion             2795 non-null   object 
 10  subtipo_de_agresion          2795 non-null   object 
 11  descripcion_incidente        2795 non-null   object 
 12  dia_incidente                2795 non-null   object 
 13  hora_incidente    

In [4]:
# Listado de columnas
df.columns

Index(['reportante', 'tipo_de_testiga', 'tipo_de_victima', 'edad_victima',
       'sexo_asignado_nacer', 'identidad_genero', 'orientacion_sexual',
       'expresion_genero', 'tipo_de_agresora', 'tipo_de_agresion',
       'subtipo_de_agresion', 'descripcion_incidente', 'dia_incidente',
       'hora_incidente', 'fecha_reporte_visible', 'entidad', 'ciudad',
       'tipo_de_lugar', 'subtipo_de_lugar', 'latitud', 'longitud',
       'reporte_previo', 'reporte_previo_quien', 'satisfaccion_reporte_previo',
       'razon_no_reporte_previo', 'estado_civil', 'nacionalidad',
       'escolaridad', 'ocupacion', 'ingreso', 'seguridad_social',
       'identidades', 'id'],
      dtype='object')

In [5]:
# Primeras filas
df.head()

Unnamed: 0,reportante,tipo_de_testiga,tipo_de_victima,edad_victima,sexo_asignado_nacer,identidad_genero,orientacion_sexual,expresion_genero,tipo_de_agresora,tipo_de_agresion,...,satisfaccion_reporte_previo,razon_no_reporte_previo,estado_civil,nacionalidad,escolaridad,ocupacion,ingreso,seguridad_social,identidades,id
0,Testiga,ONG,Determinada,De 18 a 25 años,Hombre,Hombre cis,Gay,Neutra,Familiar o cohabitante,Expulsión del hogar,...,,El contacto señaló se encontraba ya en la casa...,,,,,,,,225
1,Testiga,ONG,Determinada,De 36 a 40 años,Hombre,Mujer trans,No reportada,Femenina,Familiar o cohabitante,Exclusión,...,,Me lo contó la víctima y no quiere que se sepa,,,,,,,,227
2,Testiga,ONG,Determinada,De 12 a 17 años,Hombre,Hombre cis,No reportada,Un poco femenina,Maestra o personal educativo,Educativa,...,2.0,,,,,,,,,230
3,Personal,Personal,Determinada,De 26 a 30 años,Hombre,Persona no binaria,Gay,Femenina,Vecina,Psicológica,...,,Creo que no habrá consecuencias de la denuncia,,,,,,,,231
4,Personal,Personal,Determinada,De 18 a 25 años,Mujer,Mujer cis,Bisexual,Femenina,Amiga,Exclusión,...,,Tengo miedo de denunciar,,,,,,,,232


In [6]:
# Eliminamos el id y latitud & longitud
df.drop(columns=['id', 'latitud', 'longitud'], inplace=True)

In [7]:
# Estadistica
df.describe().transpose()

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
satisfaccion_reporte_previo,665.0,1.733835,1.038338,1.0,1.0,1.0,2.0,4.0


In [10]:
# Valores unicos de orientacion
df.orientacion_sexual.value_counts()

orientacion_sexual
Gay                                1503
No reportada                        378
Bisexual                            278
Lesbiana                            191
Heterosexual                        162
Pansexual                           121
Personas no heterosexuales           69
Privada                               7
Asexual                               6
Otra                                  5
Polisexual                            5
Demisexual                            4
Androsexual                           4
Omnisexual                            4
Demisexual homorromántico             1
Gay con tendencias demisexuales       1
Name: count, dtype: int64

In [None]:
# Valores unicos de orientacion
df.tipo_de_victima.value_counts()

Determinada      2658
Indeterminada     137
Name: tipo_de_victima, dtype: int64

In [None]:
# Valores unicos de orientacion
df.identidad_genero.value_counts()

Hombre cis                      1425
Mujer trans                      476
Mujer cis                        209
No reportada                     199
Persona no binaria               186
Hombre trans                     140
Personas trans                    51
Género fluido                     14
Queer                             13
Muxe                               4
Andrógino                          2
Demigénero                         2
Andróginx                          1
Queer no binarie                   1
No binarie de género fluido        1
Travesti                           1
Agénero                            1
No conforme/Hombre cisgénero       1
Descubriéndolo                     1
Mujer trans no binarie             1
Chica demifluida                   1
Name: identidad_genero, dtype: int64

In [None]:
# Valores unicos de orientacion
df.tipo_de_agresora.value_counts()

Persona no identificada                                      680
Familiar o cohabitante                                       344
Patrona o fuente de ingreso privada                          279
Empleada de establecimiento comercial o profesionista        263
Compañera de escuela                                         154
Servidora pública                                            149
Doctora, psicóloga, enfermera o personal de salud            127
Maestra o personal educativo                                 126
Policía, tránsito o MP                                       103
Patrona o fuente de ingreso pública                          102
Vecina                                                        93
Medio de comunicación o periodista                            73
Pareja                                                        72
Compañera de trabajo privado                                  53
Amiga                                                         49
Compañera de trabajo públ

In [12]:
# Valores unicos de tipo de agresión
df.tipo_de_agresion.value_counts()

tipo_de_agresion
Verbal                                                                769
Psicológica                                                           341
Impedimento de entrada, negación de servicios o derechos              316
Física                                                                284
A la intimidad                                                        230
Laboral                                                               172
Asesinato                                                             159
Exclusión                                                             156
Sexual                                                                102
Impedimento de identidad o expresión                                   61
Otra discriminación                                                    41
Expulsión del hogar                                                    36
Detención injustificada                                                34
Económica            

In [13]:
# Valores unicos de orientacion
df.dia_incidente.value_counts()

dia_incidente
2022-12-24    22
2022-12-22    16
2022-12-01    14
2023-05-19    12
2022-11-04    12
              ..
2021-01-05     1
2021-01-04     1
2022-07-27     1
2019-03-05     1
2023-09-27     1
Name: count, Length: 1371, dtype: int64

In [14]:
# Valores unicos de hora_incidente
df.hora_incidente.value_counts()

hora_incidente
00:01:00    303
00:00:00    271
12:00:00    166
11:00:00    127
10:00:00    126
           ... 
13:48:00      1
01:28:00      1
02:13:00      1
20:05:00      1
19:10:00      1
Name: count, Length: 286, dtype: int64

In [15]:
# Valores unicos de orientacion
df.fecha_reporte_visible.value_counts()

fecha_reporte_visible
2020-10-04 21:31:57    11
2020-10-04 01:59:27     6
2020-10-04 22:53:52     5
2020-10-04 23:26:34     5
2020-10-01 02:25:01     3
                       ..
2022-01-10 18:05:47     1
2022-01-10 18:06:45     1
2022-01-10 18:07:50     1
2022-01-10 18:08:53     1
2023-10-02 18:50:01     1
Name: count, Length: 2761, dtype: int64

In [16]:
df.entidad.value_counts()

entidad
Ciudad de México       551
Jalisco                341
Estado de México       328
Guanajuato             247
Puebla                 120
Veracruz               105
Querétaro               96
Nuevo León              92
Chihuahua               68
Hidalgo                 64
Baja California         64
Nacional                53
Yucatán                 51
Morelos                 50
Chiapas                 50
Quintana Roo            48
Coahuila                45
Guerrero                42
Sinaloa                 39
Michoacán               38
Tamaulipas              37
Tabasco                 32
Sonora                  32
Aguascalientes          30
San Luis Potosí         29
Oaxaca                  28
Baja California Sur     27
Colima                  16
Zacatecas               16
Nayarit                 14
Campeche                14
Tlaxcala                12
Durango                 12
Estados Unidos           4
Name: count, dtype: int64

In [17]:
df.ciudad.value_counts()

ciudad
Guadalajara         174
Cuauhtémoc          137
León                114
Puebla               87
Querétaro            85
                   ... 
San Mateo Atenco      1
Tepoztlán             1
Todos Santos          1
Paraíso               1
Tlahuelilpan          1
Name: count, Length: 399, dtype: int64

# Conversión tipo fecha

In [18]:
import locale

locale.setlocale(locale.LC_ALL,'es_ES.UTF-8')

from datetime import datetime as dt

dt.now().strftime('%A %d de %B, %Y')

'viernes 08 de diciembre, 2023'

In [19]:
df.dia_incidente = pd.to_datetime(df.dia_incidente)
df['dia_incidente2'] = pd.to_datetime(df.dia_incidente).dt.strftime("%d-%b-%Y %H:%M:%S")

### Agrupando

In [21]:
# Por Mes
result = df.groupby(pd.Grouper(key='dia_incidente', freq='M'), as_index=False).size()

In [9]:
import kaleido #required
from plotly.graph_objs import *

In [23]:
fig = px.bar(result[result.dia_incidente.dt.year >= 2018],
            x='dia_incidente',
            y='size',
            labels={'dia_incidente': 'Fecha', 'size': 'Total'},
            title='Violencia hacia la comunidad LGBTQ+ del 2018 al presente año',
            width=1080,
            height=720)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})
fig.update_xaxes(
    dtick="M1",
    ticklabelmode="period")

fig.write_image('../Images/grafica_total_violencia_2018_2023.png')
fig.write_image('../Images/grafica_total_violencia_2018_2023.svg')

fig.show(config={'locale': 'es_ES'})

In [24]:
fig = px.line(result[result.dia_incidente.dt.year >= 2018],
    x='dia_incidente',
    y='size',
    labels={'dia_incidente': 'Fecha', 'size': 'Total'},
    title='Violencia hacia la comunidad LGBTQ+ del 2018 al presente año (mensual)'
)

fig.update_layout(
    showlegend=True,
)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.update_xaxes(
    dtick="M1",
    tickformat="%b",
    ticklabelmode="period")

fig.write_image('../Images/grafica_serie_tiempo_total_violencia_2018_2023_con_meses.png')
fig.write_image('../Images/grafica_serie_tiempo_total_violencia_2018_2023_con_meses.svg')

fig.show(config={'locale': 'es_ES'})

In [25]:
# Por Año
result2 = df.groupby(pd.Grouper(key='dia_incidente', freq='Y'), as_index=False).size()
result2

Unnamed: 0,dia_incidente,size
0,1967-12-31,1
1,1968-12-31,0
2,1969-12-31,0
3,1970-12-31,0
4,1971-12-31,0
5,1972-12-31,1
6,1973-12-31,0
7,1974-12-31,0
8,1975-12-31,0
9,1976-12-31,0


In [26]:
result22 = df.groupby(df.dia_incidente.dt.year, as_index=False).size()
result22

Unnamed: 0,dia_incidente,size
0,1967,1
1,1972,1
2,1979,1
3,1984,1
4,1985,1
5,1987,1
6,1990,1
7,1991,1
8,1994,1
9,1995,2


In [27]:
fig = px.line(result22[result22.dia_incidente >= 2018],
            x='dia_incidente',
            y='size',
            labels={'dia_incidente': 'Fecha', 'size': 'Total'},
            title='Violencia LGBTQ+ del 2018 al 2023 de manera anualizada',
            width=1200,
            height=800,
            markers=True)
fig.update_layout(showlegend=True)
fig.update_traces(line={'width': 5})


fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_azul_total_violencia_anual.png')
fig.write_image('../Images/grafica_azul_total_violencia_anual.svg')

fig.show()

In [28]:
fig = px.line(result22[(result22.dia_incidente >= 2018) & (result22.dia_incidente < 2023)],
            x='dia_incidente',
            y='size',
            labels={'dia_incidente': 'Fecha', 'size': 'Total'},
            title='Violencia LGBTQ+ de 2018 a 2022 de manera anualizada',
            width=1200,
            height=800,
            markers=True)
fig.update_layout(showlegend=True)


fig.update_layout(
    xaxis = dict(
        tickmode = 'linear',
        tick0 = 1.0,
        dtick = 1.0
    )
)

fig.update_traces(
    marker=dict(size=12, line=dict(width=2, color='DarkSlateGrey')),
    line={'width': 3, 'color': 'violet'}
)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_violeta_total_violencia_anual.png')
fig.write_image('../Images/grafica_violeta_total_violencia_anual.svg')

fig.show()

In [29]:
# Por Día
result3 = df.groupby(pd.Grouper(key='dia_incidente', freq='D'), as_index=False).size()
result3

Unnamed: 0,dia_incidente,size
0,1967-08-01,1
1,1967-08-02,0
2,1967-08-03,0
3,1967-08-04,0
4,1967-08-05,0
...,...,...
20507,2023-09-23,1
20508,2023-09-24,0
20509,2023-09-25,1
20510,2023-09-26,0


> Hay datos de 1967, tomaremos como analisis los ultimos 5 años.

In [36]:
result3 = df[df.dia_incidente.dt.year >= 2018].groupby(pd.Grouper(key='dia_incidente', freq='D'), as_index=False).size()
result3

Unnamed: 0,dia_incidente,size
0,2018-01-01,1
1,2018-01-02,0
2,2018-01-03,0
3,2018-01-04,0
4,2018-01-05,0
...,...,...
2091,2023-09-23,1
2092,2023-09-24,0
2093,2023-09-25,1
2094,2023-09-26,0


In [37]:
# Seteamos el index
result3.set_index(result3.dia_incidente.dt.year, inplace=True)

In [38]:
result3

Unnamed: 0_level_0,dia_incidente,size
dia_incidente,Unnamed: 1_level_1,Unnamed: 2_level_1
2018,2018-01-01,1
2018,2018-01-02,0
2018,2018-01-03,0
2018,2018-01-04,0
2018,2018-01-05,0
...,...,...
2023,2023-09-23,1
2023,2023-09-24,0
2023,2023-09-25,1
2023,2023-09-26,0


In [39]:
# Obtenemos los años
years = set([x for x in result3.index])
years

{2018, 2019, 2020, 2021, 2022, 2023}

In [40]:
years = [year for year in years]
years

[2018, 2019, 2020, 2021, 2022, 2023]

In [41]:
# Para probar
years[0:3]

[2018, 2019, 2020]

In [42]:
# Obteniendo los datos del 2023
result3.loc[2023, :]

Unnamed: 0_level_0,dia_incidente,size
dia_incidente,Unnamed: 1_level_1,Unnamed: 2_level_1
2023,2023-01-01,4
2023,2023-01-02,1
2023,2023-01-03,1
2023,2023-01-04,0
2023,2023-01-05,2
...,...,...
2023,2023-09-23,1
2023,2023-09-24,0
2023,2023-09-25,1
2023,2023-09-26,0


In [44]:
# Iteramos por año
for year in years:
    title = f"Violencia LGBTQ+ en {year}"
    fig = px.line(result3.loc[year, :], x='dia_incidente', y='size', labels={'dia_incidente': 'Fecha', 'size': 'Total'}, title=title)
    fig.update_layout(showlegend=True)
    fig.update_layout({
        'plot_bgcolor': 'rgba(0, 0, 0, 0)',
        'paper_bgcolor': 'rgba(0, 0, 0, 0)',
    })


    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}.png'.format(year))
    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}.svg'.format(year))
    fig.show()

In [45]:
# Iteramos por año
for year in years:
    title = f"Violencia LGBTQ+ en {year}"
    fig = px.line(result3.loc[year, :], x='dia_incidente', y='size', labels={'dia_incidente': 'Fecha', 'size': 'Total'}, title=title, markers=True)
    fig.update_layout(showlegend=True)
    fig.update_layout(showlegend=True)
    fig.update_layout({
        'plot_bgcolor': 'rgba(0, 0, 0, 0)',
        'paper_bgcolor': 'rgba(0, 0, 0, 0)',
    })


    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}_con_marcadores.png'.format(year))
    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}_con_marcadores.svg'.format(year))
    fig.show()

### Aplicando Suavizado exponencial

In [46]:
from statsmodels.tsa.holtwinters import SimpleExpSmoothing
import warnings

warnings.filterwarnings("ignore")

In [47]:
# Obteniendo los datos del 2023 para probar
temporal = result3[result3.dia_incidente.dt.year == 2023]
temporal

Unnamed: 0_level_0,dia_incidente,size
dia_incidente,Unnamed: 1_level_1,Unnamed: 2_level_1
2023,2023-01-01,4
2023,2023-01-02,1
2023,2023-01-03,1
2023,2023-01-04,0
2023,2023-01-05,2
...,...,...
2023,2023-09-23,1
2023,2023-09-24,0
2023,2023-09-25,1
2023,2023-09-26,0


In [48]:
temporal.info()

<class 'pandas.core.frame.DataFrame'>
Index: 270 entries, 2023 to 2023
Data columns (total 2 columns):
 #   Column         Non-Null Count  Dtype         
---  ------         --------------  -----         
 0   dia_incidente  270 non-null    datetime64[ns]
 1   size           270 non-null    int64         
dtypes: datetime64[ns](1), int64(1)
memory usage: 5.3 KB


In [49]:
temporal2 = temporal.reset_index(drop=True)
temporal2.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 270 entries, 0 to 269
Data columns (total 2 columns):
 #   Column         Non-Null Count  Dtype         
---  ------         --------------  -----         
 0   dia_incidente  270 non-null    datetime64[ns]
 1   size           270 non-null    int64         
dtypes: datetime64[ns](1), int64(1)
memory usage: 4.3 KB


In [50]:
data = [x for _, x in temporal2.values]
data

[4,
 1,
 1,
 0,
 2,
 1,
 2,
 0,
 0,
 2,
 0,
 1,
 2,
 1,
 0,
 0,
 0,
 1,
 3,
 4,
 1,
 1,
 1,
 0,
 0,
 1,
 0,
 0,
 1,
 0,
 0,
 0,
 4,
 1,
 2,
 1,
 2,
 2,
 0,
 1,
 2,
 4,
 2,
 2,
 0,
 0,
 4,
 2,
 7,
 3,
 1,
 1,
 1,
 1,
 1,
 4,
 2,
 1,
 2,
 6,
 1,
 1,
 3,
 1,
 2,
 6,
 3,
 3,
 6,
 3,
 0,
 2,
 2,
 1,
 3,
 1,
 1,
 1,
 1,
 1,
 0,
 1,
 0,
 0,
 4,
 1,
 3,
 1,
 1,
 2,
 0,
 4,
 0,
 2,
 2,
 2,
 0,
 0,
 0,
 3,
 2,
 3,
 2,
 2,
 0,
 0,
 1,
 0,
 1,
 1,
 1,
 0,
 1,
 0,
 0,
 0,
 2,
 1,
 1,
 0,
 4,
 1,
 2,
 1,
 2,
 0,
 4,
 0,
 2,
 5,
 4,
 4,
 1,
 0,
 3,
 2,
 5,
 4,
 12,
 4,
 2,
 2,
 2,
 1,
 0,
 1,
 0,
 0,
 0,
 2,
 0,
 3,
 3,
 1,
 2,
 0,
 2,
 1,
 4,
 0,
 2,
 2,
 2,
 1,
 2,
 4,
 7,
 10,
 0,
 2,
 2,
 1,
 1,
 0,
 2,
 1,
 2,
 1,
 3,
 1,
 1,
 1,
 1,
 2,
 4,
 0,
 0,
 3,
 1,
 1,
 3,
 1,
 2,
 1,
 1,
 2,
 0,
 1,
 0,
 3,
 1,
 3,
 2,
 0,
 1,
 0,
 2,
 0,
 1,
 1,
 1,
 0,
 3,
 0,
 0,
 0,
 0,
 1,
 0,
 1,
 3,
 3,
 1,
 3,
 0,
 1,
 5,
 1,
 1,
 0,
 0,
 0,
 1,
 0,
 1,
 1,
 0,
 2,
 1,
 6,
 2,
 1,
 3,
 0,
 0,
 0,
 0,
 1,
 0,
 3

In [51]:
# Aplicando el suavizamiento exponencial
alpha = 0.6
sexp = SimpleExpSmoothing(data)
model = sexp.fit(smoothing_level = alpha)

In [52]:
res = model.fittedvalues
res

array([4.        , 4.        , 2.2       , 1.48      , 0.592     ,
       1.4368    , 1.17472   , 1.669888  , 0.6679552 , 0.26718208,
       1.30687283, 0.52274913, 0.80909965, 1.52363986, 1.20945594,
       0.48378238, 0.19351295, 0.07740518, 0.63096207, 2.05238483,
       3.22095393, 1.88838157, 1.35535263, 1.14214105, 0.45685642,
       0.18274257, 0.67309703, 0.26923881, 0.10769552, 0.64307821,
       0.25723128, 0.10289251, 0.04115701, 2.4164628 , 1.56658512,
       1.82663405, 1.33065362, 1.73226145, 1.89290458, 0.75716183,
       0.90286473, 1.56114589, 3.02445836, 2.40978334, 2.16391334,
       0.86556533, 0.34622613, 2.53849045, 2.21539618, 5.08615847,
       3.83446339, 2.13378536, 1.45351414, 1.18140566, 1.07256226,
       1.02902491, 2.81160996, 2.32464398, 1.52985759, 1.81194304,
       4.32477722, 2.32991089, 1.53196435, 2.41278574, 1.5651143 ,
       1.82604572, 4.33041829, 3.53216731, 3.21286693, 4.88514677,
       3.75405871, 1.50162348, 1.80064939, 1.92025976, 1.36810

In [53]:
temporal2['suavizado_exp'] = res

In [55]:
# Graficamos
title = "Violencia LGBTQ+ en 2023"
fig = px.line(temporal2, x='dia_incidente', y=['size', 'suavizado_exp'], labels={'dia_incidente': 'Fecha', 'value': 'Total'}, title=title, markers=True)
fig.update_layout(showlegend=True)
fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.show()

### Aplicando el suavizado por año

In [56]:
# Iteramos por año
for year in years:
    # Obtenemos los datos del año
    temporal = result3[result3.dia_incidente.dt.year == year]
    # Reseteamos los indices
    temporal2 = temporal.reset_index(drop=True)
    # Obtenemos los datos, tomamos los valores del size y guardamos en una lista
    data = [x for _, x in temporal2.values]
    # Creamos el modelo del suavizado
    alpha = 0.6
    sexp = SimpleExpSmoothing(data)
    # Evaluamos
    model = sexp.fit(smoothing_level = alpha)
    # Obtenemos los valores predecidos
    res = model.fittedvalues
    # Creamos columna suavizado exponencial
    temporal2['suavizado_exp'] = res
    # Graficamos
    title = f"Violencia LGBTQ+ en {year}"
    fig = px.line(temporal2, x='dia_incidente', y=['suavizado_exp'], labels={'dia_incidente': 'Fecha', 'size': 'Total'}, title=title, markers=False)
    fig.update_layout(showlegend=True)
    fig.update_layout({
        'plot_bgcolor': 'rgba(0, 0, 0, 0)',
        'paper_bgcolor': 'rgba(0, 0, 0, 0)',
    })


    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}_con_suavizado_exp.png'.format(year))
    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}_con_suavizado_exp.svg'.format(year))

    fig.show()


In [57]:
# Iteramos por año
for year in years:
    # Obtenemos los datos del año
    temporal = result3[result3.dia_incidente.dt.year == year]
    # Reseteamos los indices
    temporal2 = temporal.reset_index(drop=True)
    # Obtenemos los datos, tomamos los valores del size y guardamos en una lista
    data = [x for _, x in temporal2.values]
    # Creamos el modelo del suavizado
    alpha = 0.6
    sexp = SimpleExpSmoothing(data)
    # Evaluamos
    model = sexp.fit(smoothing_level = alpha)
    # Obtenemos los valores predecidos
    res = model.fittedvalues
    # Creamos columna suavizado exponencial
    temporal2['suavizado_exp'] = res
    # Graficamos
    title = f"Violencia LGBTQ+ en {year}"
    fig = px.line(temporal2, x='dia_incidente', y=['size', 'suavizado_exp'], labels={'dia_incidente': 'Fecha', 'size': 'Total'}, title=title, markers=True)
    fig.update_layout(showlegend=True)
    fig.update_layout({
        'plot_bgcolor': 'rgba(0, 0, 0, 0)',
        'paper_bgcolor': 'rgba(0, 0, 0, 0)',
    })

    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}_y_suavizado_exp.png'.format(year))
    fig.write_image('../Images/grafica_serie_tiempo_violencia_en_{}_y_suavizado_exp.svg'.format(year))

    fig.show()


# Graficas pastel

In [58]:
idGenero = df[df.identidad_genero.notnull()].groupby('identidad_genero', as_index=False).size()
idGenero = idGenero.sort_values('size', ascending=False)
idGenero.reset_index(inplace=True, drop='index')
idGenero

Unnamed: 0,identidad_genero,size
0,Hombre cis,1425
1,Mujer trans,476
2,Mujer cis,209
3,No reportada,199
4,Persona no binaria,186
5,Hombre trans,140
6,Personas trans,51
7,Género fluido,14
8,Queer,13
9,Muxe,4


In [59]:
# Colores de la bandera LGBTQ+
colors = ["#c095cb", "#6a95d5", "#74ac6f", "#f7d168", "#f6934c", "#e15971"]

fig = px.pie(idGenero.head(5),
            values='size',
            names='identidad_genero',
            title='Identidades de genero con mayor presencia',
            color_discrete_sequence=colors,
            labels={'size': 'Identidad genero'},
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_identidad_genero_mayor.png')
fig.write_image('../Images/grafica_pie_identidad_genero_mayor.svg')

fig.show()


In [60]:
colors = ["#c095cb", "#6a95d5", "#74ac6f", "#f7d168", "#f6934c", "#e15971"]
fig = px.pie(idGenero[idGenero['size'] < 186].head(5),
            values='size',
            names='identidad_genero',
            title='Identidades de genero con menor presencia',
            color_discrete_sequence=colors,
            labels={'size': 'Identidad genero'},
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_identidad_genero_menor.png')
fig.write_image('../Images/grafica_pie_identidad_genero_menor.svg')


fig.show()


In [61]:
dfOrientacion = df[df.orientacion_sexual.notnull()].groupby('orientacion_sexual', as_index=False).size()
dfOrientacion = dfOrientacion.sort_values('size', ascending=False)
dfOrientacion.reset_index(inplace=True, drop='index')
dfOrientacion

Unnamed: 0,orientacion_sexual,size
0,Gay,1503
1,No reportada,378
2,Bisexual,278
3,Lesbiana,191
4,Heterosexual,162
5,Pansexual,121
6,Personas no heterosexuales,69
7,Privada,7
8,Asexual,6
9,Otra,5


In [62]:
fig = px.pie(dfOrientacion.head(5),
            values='size',
            names='orientacion_sexual',
            color_discrete_sequence=colors,
            title='Orientación sexual con mayor presencia registradas',
            labels={'size': 'Identidad genero'},
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_orientacion_sex_mayor.png')
fig.write_image('../Images/grafica_pie_orientacion_sex_mayor.svg')


fig.show()


In [63]:
fig = px.pie(dfOrientacion.tail(5),
            values='size',
            color_discrete_sequence=colors,
            names='orientacion_sexual',
            title='Orientación sexual con menor presencia registradas',
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_orientacion_sex_menor.png')
fig.write_image('../Images/grafica_pie_orientacion_sex_menor.svg')

fig.show()


In [64]:
dfTVictima = df[df.tipo_de_victima.notnull()].groupby('tipo_de_victima', as_index=False).size()
dfTVictima = dfTVictima.sort_values('size', ascending=False)
dfTVictima.reset_index(inplace=True, drop='index')
dfTVictima

Unnamed: 0,tipo_de_victima,size
0,Determinada,2658
1,Indeterminada,137


In [65]:
fig = px.pie(dfTVictima,
            values='size',
            names='tipo_de_victima',
            title='Tipo de victimas registradas',
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_tipo_de_victima.png')
fig.write_image('../Images/grafica_pie_tipo_de_victima.svg')

fig.show()


In [66]:
dfTAgresores = df[df.tipo_de_agresora.notnull()].groupby('tipo_de_agresora', as_index=False).size()
dfTAgresores = dfTAgresores.sort_values('size', ascending=False)
dfTAgresores.reset_index(inplace=True, drop='index')
dfTAgresores

Unnamed: 0,tipo_de_agresora,size
0,Persona no identificada,680
1,Familiar o cohabitante,344
2,Patrona o fuente de ingreso privada,279
3,Empleada de establecimiento comercial o profes...,263
4,Compañera de escuela,154
5,Servidora pública,149
6,"Doctora, psicóloga, enfermera o personal de salud",127
7,Maestra o personal educativo,126
8,"Policía, tránsito o MP",103
9,Patrona o fuente de ingreso pública,102


In [67]:

fig = px.pie(dfTAgresores.head(5),
            values='size',
            names='tipo_de_agresora',
            title='Tipo de agresores con mayor presencia registrados',
            # width=1200,
            # height=800,
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_tipo_de_agresora_mayor.png')
fig.write_image('../Images/grafica_pie_tipo_de_agresora_mayor.svg')

fig.update_layout(

        legend={
            'x': 1.2,
        },
    )


fig.show()


In [68]:

fig = px.pie(dfTAgresores.tail(5),
            values='size',
            names='tipo_de_agresora',
            title='Tipo de agresores con menor presencia registrados',
            # width=1200,
            # height=800
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_tipo_de_agresora_menor.png')
fig.write_image('../Images/grafica_pie_tipo_de_agresora_menor.svg')

fig.update_layout(

        legend={
            'x': 1.2,
        },
    )


fig.show()


In [69]:
dfTAgresion = df[df.tipo_de_agresion.notnull()].groupby('tipo_de_agresion', as_index=False).size()
dfTAgresion = dfTAgresion.sort_values('size', ascending=False)
dfTAgresion.reset_index(inplace=True, drop='index')
dfTAgresion

Unnamed: 0,tipo_de_agresion,size
0,Verbal,769
1,Psicológica,341
2,"Impedimento de entrada, negación de servicios ...",316
3,Física,284
4,A la intimidad,230
5,Laboral,172
6,Asesinato,159
7,Exclusión,156
8,Sexual,102
9,Impedimento de identidad o expresión,61


In [70]:
fig = px.pie(dfTAgresion.head(5),
            names='tipo_de_agresion',
            values='size',
            title='Tipo de agresiones con mayor presencia registradas',
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_pie_tipo_de_agresion_mayor.png')
fig.write_image('../Images/grafica_pie_tipo_de_agresion_mayor.svg')

fig.update_layout(

        legend={
            'x': 1.2,
        },
    )


fig.show()


In [71]:
dfTAgresion

Unnamed: 0,tipo_de_agresion,size
0,Verbal,769
1,Psicológica,341
2,"Impedimento de entrada, negación de servicios ...",316
3,Física,284
4,A la intimidad,230
5,Laboral,172
6,Asesinato,159
7,Exclusión,156
8,Sexual,102
9,Impedimento de identidad o expresión,61


In [72]:
fig = px.pie(dfTAgresion[dfTAgresion['size'] < 41].head(5),
            names='tipo_de_agresion',
            values='size',
            title='Tipo de agresiones con menor presencia registradas',
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_pie_tipo_de_agresion_menor.png')
fig.write_image('../Images/grafica_pie_tipo_de_agresion_menor.svg')

fig.update_layout(

        legend={
            'x': 1.2,
        },
    )


fig.show()


In [73]:
dfTSexoOrigen = df[df.sexo_asignado_nacer.notnull()].groupby('sexo_asignado_nacer', as_index=False).size()
dfTSexoOrigen = dfTSexoOrigen.sort_values('size', ascending=False)
dfTSexoOrigen.reset_index(inplace=True, drop='index')
dfTSexoOrigen

Unnamed: 0,sexo_asignado_nacer,size
0,Hombre,2170
1,Mujer,394
2,No reportado,114
3,Intersex,4


In [74]:
fig = px.pie(dfTSexoOrigen,
            values='size',
            names='sexo_asignado_nacer',
            title='Porcentaje por genero originario al nacer registrados',
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_pie_sexo_asignado_nacer.png')
fig.write_image('../Images/grafica_pie_sexo_asignado_nacer.svg')

fig.show()

In [75]:
dfEntidades = df[df.entidad.notnull()].groupby('entidad', as_index=False).size()
dfEntidades = dfEntidades.sort_values('size', ascending=False)
dfEntidades.reset_index(inplace=True, drop='index')
dfEntidades

Unnamed: 0,entidad,size
0,Ciudad de México,551
1,Jalisco,341
2,Estado de México,328
3,Guanajuato,247
4,Puebla,120
5,Veracruz,105
6,Querétaro,96
7,Nuevo León,92
8,Chihuahua,68
9,Hidalgo,64


In [76]:
fig = px.pie(dfEntidades.head(5),
            values='size',
            names='entidad',
            title='Entidades con mayor casos de agresión',
            #width=1200,
            #height=1000
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_pie_entidad_mayor.png')
fig.write_image('../Images/grafica_pie_entidad_mayor.svg')

fig.show()

In [77]:
fig = px.pie(dfEntidades.tail(5),
            values='size',
            names='entidad',
            title='Entidades con menores casos de agresión',
            #width=1200,
            #height=1000
            color_discrete_sequence=colors,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_pie_entidad_menor.png')
fig.write_image('../Images/grafica_pie_entidad_menor.svg')

fig.show()

In [78]:
data_escolaridad = df.groupby('escolaridad', as_index=False).size().sort_values('size', ascending=False)
data_escolaridad

Unnamed: 0,escolaridad,size
3,Preparatoria,109
1,Licenciatura,72
5,Secundaria,39
2,Posgrado,28
4,Primaria,7
6,Técnica,2
0,Especialidad,1


In [63]:
fig = px.bar(data_escolaridad,
            x='escolaridad',
            y='size',
            labels={'escolaridad': 'Nivel de estudios', 'size': 'Total'},
            color='escolaridad',
            title='Nivel de escolaridad de las victimas',
            width=1200,
            height=1000,
            color_discrete_sequence=colors)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_barras_niveles_escolaridad.png')
fig.write_image('../Images/grafica_barras_niveles_escolaridad.svg')

fig.show()

In [79]:
data_ingreso = df.groupby('ingreso', as_index=False).size().sort_values('size', ascending=False)
data_ingreso

Unnamed: 0,ingreso,size
2,Menor,79
3,Más de 1 salario mínimo hasta 2 salarios mínimos,40
1,Igual a esta cantidad,33
5,Más de 2 salarios mínimos hasta 3 salarios mín...,26
6,Más de 3 salarios mínimos hasta 5 salarios mín...,24
7,Más de 5 salarios mínimos hasta 10 salarios mí...,13
4,Más de 10 salarios mínimos,10
8,Ninguno,9
0,1000,1
9,Sin ingresos,1


In [80]:
# Colores extra de la bandera
colors2 = colors + ["#71d1fb", "#5766ce", "#c6237c", "#ed595e"]
colors2

['#c095cb',
 '#6a95d5',
 '#74ac6f',
 '#f7d168',
 '#f6934c',
 '#e15971',
 '#71d1fb',
 '#5766ce',
 '#c6237c',
 '#ed595e']

In [81]:
fig = px.bar(data_ingreso,
            x='ingreso',
            y='size',
            labels={'ingreso': 'Tipo de ingreso', 'size': 'Total'},
            color='ingreso',
            title='Tipo de ingreso de las victimas',
            width=1200,
            height=1000,
            color_discrete_sequence=colors2)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_barras_ingreso.png')
fig.write_image('../Images/grafica_barras_ingreso.svg')

fig.show()

In [82]:
data_byyear = df.groupby(df.dia_incidente.dt.year, as_index=False).size()
data_byyear

Unnamed: 0,dia_incidente,size
0,1967,1
1,1972,1
2,1979,1
3,1984,1
4,1985,1
5,1987,1
6,1990,1
7,1991,1
8,1994,1
9,1995,2


In [83]:
# Filtramos
dfcopy = data_byyear[data_byyear.dia_incidente >= 2018]
# Convertimos el dato para que sea categorico
dfcopy.dia_incidente = dfcopy.dia_incidente.astype(str)

In [84]:
fig = px.bar(dfcopy,
            x='dia_incidente',
            y='size',
            labels={'dia_incidente': 'Año', 'size': 'Total'},
            title='Total de agresiones del 2018 al 2023',
            text='size',
            width=1200,
            height=1000)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_barras_total_incidente_por_año_1Color.png')
fig.write_image('../Images/grafica_barras_total_incidente_por_año_1Color.svg')


fig.show()

In [85]:
dfcopy2 = data_byyear[(data_byyear.dia_incidente >= 2018) & (data_byyear.dia_incidente < 2023)]
dfcopy2.dia_incidente = dfcopy2.dia_incidente.astype(str)

In [86]:
fig = px.scatter(dfcopy2,
            x='dia_incidente',
            y='size',
            trendline="ols",
            color="dia_incidente",
            labels={'dia_incidente': 'Año', 'size': 'Total'},
            title='Tendencia (OLS) de agresiones a la comunidad LGBTQ+',
            trendline_scope="overall",
            color_discrete_sequence=colors2,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_barras_tendencia_ols_agresiones.png')
fig.write_image('../Images/grafica_barras_tendencia_ols_agresiones.svg')

fig.update_traces(line={'width': 5})

fig.show()


In [87]:
fig = px.scatter(dfcopy2,
            x='dia_incidente',
            y='size',
            trendline="lowess",
            color="dia_incidente",
            # error_x="e",
            labels={'dia_incidente': 'Año', 'size': 'Total'},
            title='Tendencia (Lowess) de agresiones a la comunidad LGBTQ+',
            trendline_scope="overall",
            color_discrete_sequence=colors2,
            width=1080,
            height=720)

fig.update_layout(showlegend=True)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})

fig.write_image('../Images/grafica_barras_tendencia_LOWESS_agresiones.png')
fig.write_image('../Images/grafica_barras_tendencia_LOWESS_agresiones.svg')


fig.update_layout(showlegend=True)
fig.update_traces(line={'width': 5})

fig.show()


# Sunburst

In [89]:
df.columns

Index(['reportante', 'tipo_de_testiga', 'tipo_de_victima', 'edad_victima',
       'sexo_asignado_nacer', 'identidad_genero', 'orientacion_sexual',
       'expresion_genero', 'tipo_de_agresora', 'tipo_de_agresion',
       'subtipo_de_agresion', 'descripcion_incidente', 'dia_incidente',
       'hora_incidente', 'fecha_reporte_visible', 'entidad', 'ciudad',
       'tipo_de_lugar', 'subtipo_de_lugar', 'reporte_previo',
       'reporte_previo_quien', 'satisfaccion_reporte_previo',
       'razon_no_reporte_previo', 'estado_civil', 'nacionalidad',
       'escolaridad', 'ocupacion', 'ingreso', 'seguridad_social',
       'identidades', 'dia_incidente2'],
      dtype='object')

In [90]:
# Agreupamos por tipo de agreso x tipo de agresion
dfAgresorAgresiones = df[(df.tipo_de_agresora.notnull()) & (df.tipo_de_agresion.notnull())].groupby(['tipo_de_agresora', 'tipo_de_agresion'], as_index=False).size()
dfAgresorAgresiones = dfAgresorAgresiones.sort_values('size', ascending=False)
dfAgresorAgresiones.reset_index(inplace=True, drop='index')
dfAgresorAgresiones.head(10)

Unnamed: 0,tipo_de_agresora,tipo_de_agresion,size
0,Persona no identificada,Verbal,239
1,Persona no identificada,Asesinato,141
2,Empleada de establecimiento comercial o profes...,"Impedimento de entrada, negación de servicios ...",132
3,Patrona o fuente de ingreso privada,Laboral,126
4,Persona no identificada,Física,105
5,Familiar o cohabitante,Psicológica,93
6,Familiar o cohabitante,Verbal,92
7,"Doctora, psicóloga, enfermera o personal de salud","Impedimento de entrada, negación de servicios ...",72
8,Servidora pública,"Impedimento de entrada, negación de servicios ...",56
9,Servidora pública,Verbal,54


In [91]:
dfAgresorAgresiones['size'].sum()

2795

In [92]:
dfAgresorAgresiones['porcentaje'] = round(dfAgresorAgresiones['size']/dfAgresorAgresiones['size'].sum(), 2) * 100
dfAgresorAgresiones.head(10)

Unnamed: 0,tipo_de_agresora,tipo_de_agresion,size,porcentaje
0,Persona no identificada,Verbal,239,9.0
1,Persona no identificada,Asesinato,141,5.0
2,Empleada de establecimiento comercial o profes...,"Impedimento de entrada, negación de servicios ...",132,5.0
3,Patrona o fuente de ingreso privada,Laboral,126,5.0
4,Persona no identificada,Física,105,4.0
5,Familiar o cohabitante,Psicológica,93,3.0
6,Familiar o cohabitante,Verbal,92,3.0
7,"Doctora, psicóloga, enfermera o personal de salud","Impedimento de entrada, negación de servicios ...",72,3.0
8,Servidora pública,"Impedimento de entrada, negación de servicios ...",56,2.0
9,Servidora pública,Verbal,54,2.0


In [93]:
dfAgresorAgresiones[dfAgresorAgresiones['tipo_de_agresora'] == 'Persona no identificada']['size'].sum()

680

In [94]:
fig = px.sunburst(
    dfAgresorAgresiones.head(10),
    title='Tipo de agresión por tipo de agresor',
    path=['tipo_de_agresora', 'tipo_de_agresion'],
    names='tipo_de_agresora',
    values='size',
    color_discrete_sequence=colors,
            labels={'size': 'Identidad genero'},
            width=1080,
            height=1080)

fig.update_layout({
    'plot_bgcolor': 'rgba(0, 0, 0, 0)',
    'paper_bgcolor': 'rgba(0, 0, 0, 0)',
})


fig.write_image('../Images/grafica_sun_agresor_x_tipo_agresion.png')
fig.write_image('../Images/grafica_sun_agresor_x_tipo_agresion.svg')

fig.show()