In [1]:
%load_ext jupyter_black

import warnings

warnings.filterwarnings("ignore")

from IPython.display import display, HTML

In [2]:
import funciones_graficos as fg

In [3]:
import numpy as np
import pandas as pd
import geopandas as gpd
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

layout = go.Layout

In [9]:
# data = pd.read_pickle("vdbg_final.pkl")

data = pd.read_csv("../raw/datos_2024.csv", index_col=0)

FileNotFoundError: [Errno 2] No such file or directory: 'raw/datos_2024.csv'

In [None]:
parentesco_lista = [
    s for s in list(data.columns) if "parentesco_" in s or "identificacion_" in s
]

In [None]:
data.loc[:, parentesco_lista] = data[parentesco_lista].astype("category")

In [None]:
data.edad = data.edad.astype("category").cat.set_categories(
    ["14-17", "18-25", "26-40", "41-60", "Más de 60"], ordered=True
)

In [None]:
data.horas_internet = data.horas_internet.astype("category").cat.set_categories(
    [
        "No lo utilizo diariamente",
        "Menos de 2 horas",
        "2-4 horas",
        "5-7 horas",
        "Más de 7 horas",
    ],
    ordered=True,
)

In [None]:
# data.info()

# Reporte de resultados

{{< pagebreak >}}

Los resultados corresponden a 386 respuestas obtenidas. A continuación se muestra la cantidad de respuestas por sexo y género.

In [None]:
tbl_sexo = data.sexo.value_counts()

In [None]:
fig = go.Figure(
    data=[go.Pie(labels=tbl_sexo.index, values=tbl_sexo)],
)
fig.update_layout(
    title_text="Respuestas por sexo",
    legend_title="Sexo",
    font=dict(family="Arial", size=18, color="black"),
    width=1500,
    height=900,
    legend=dict(font=dict(size=18)),
)
fig.update_traces(
    marker=dict(
        colors=["rgb(149, 27, 129)", "rgb(57, 105, 172)", "rgb(7, 171, 157)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/1.png");

In [None]:
df_sexo_genero = data.pivot_table(
    columns="sexo", index="genero", aggfunc={"sexo": "count"}
).fillna(0)
df_sexo_genero.index.name = "Género"
df_sexo_genero.columns.names = [None, "Sexo"]
df_sexo_genero.columns = df_sexo_genero.columns.droplevel(0)
df_sexo_genero.astype("int")

In [None]:
df_sg = df_sexo_genero.stack(level=0)
pd.DataFrame(round(df_sg / df_sg.sum() * 100, 2)).rename(columns={0: "%"})

In [None]:
datos = data.query("sexo == 'Mujer'")

{{< pagebreak >}}

## Resultados para las mujeres

{{< pagebreak >}}

Los siguientes resultados corresponden a las **mujeres** que respondieron la encuesta.

### Respuestas por rangos de edad

In [None]:
tbl_edad = pd.DataFrame(datos.edad.value_counts()).sort_index()

In [None]:
tbl_edad_porcentaje = (
    round(tbl_edad / tbl_edad.sum() * 100, 2)["count"].astype(str) + " %"
)

In [None]:
fig = px.bar(tbl_edad, text=tbl_edad_porcentaje)
fig.update_layout(
    title="Rangos de edades",
    xaxis_title="Edades",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(7, 171, 157)",
    marker_line_color="white",
)
fig.show()
fig.write_image("img/edades.png")

### Respuestas por estados

In [None]:
serie_estados = datos.estado.value_counts()

In [None]:
fp = "./Estados_Venezuela/Estados_Venezuela.shp"
df_mapa = gpd.read_file(fp)

In [None]:
ls = []
for i in df_mapa.ESTADO:
    if i in serie_estados.index:
        ls.append(serie_estados.loc[i])
    else:
        ls.append(0)
df_mapa["Mujeres"] = ls

In [None]:
df_mapa.plot(
    "Mujeres",
    cmap="RdPu",
    edgecolor="black",
    categorical=True,
    legend=True,
    legend_kwds={"loc": "center left", "bbox_to_anchor": (1, 0.5), "fmt": "{:.0f}"},
);

In [None]:
informacion_estados = pd.DataFrame(serie_estados.sort_index())
informacion_estados["%"] = round(
    informacion_estados / informacion_estados.sum() * 100, 2
)
informacion_estados.rename_axis(index={"estado": "Estado"}, inplace=True)
informacion_estados.rename(columns={"count": "Nº de mujeres"})

### Ocupaciones de las mujeres

In [None]:
for i in [
    "Defensora de DDHH de las mujeres",
    "Trabajo social ",
    "Trabajador social ",
    "Trabajadora Social",
    "Trabajadora Social ",
    "Trabajadora social. Actriz militante afrofemisnita",
    "Trabajadora humanitaria",
    "Promotora Social ",
    "Trabajadora Humanitaria",
    "Trabajadora de organización internacional ",
    "Gestora de casos en VBG Y TDP ",
    "El feminismo ",
    "Defensora de Mujeres ",
    "Atención a víctimas de VBG" "Defensora de DDHH de las mujeres",
    "Atención a víctimas de VBG",
    "El feminismo ",
    "Trabajando social ) Ayuda humanista",
]:
    datos.loc[datos["ocupacionO"] == i, "ocupacion"] = "Trabajo social"

In [None]:
for i in [
    "Del hogar ",
    "Crianza y cuidado del hogar ",
    "Ama de casa",
    "Trabajo on line. Trabajadora del hogar",
]:
    datos.loc[datos["ocupacionO"] == i, "ocupacion"] = "Ama de casa"

In [None]:
datos.loc[datos["ocupacionO"] == "Abogado", "ocupacion"] = "Abogado(a)"

In [None]:
datos.loc[datos["ocupacionO"] == "Psicologa ", "ocupacion"] = "Psicólogo(a)"

### Ocupaciones más comunes

In [None]:
df_ocupaciones = (
    pd.DataFrame(datos.ocupacion.value_counts())
    .rename_axis(index={"ocupacion": "Ocupación"})
    .rename(columns={"count": "Nº de mujeres"})
)
df_ocupaciones["%"] = round(df_ocupaciones / len(datos) * 100, 2)
df_ocupaciones.drop("Otra")[:10]

En el caso de "otra" hay 34 respuestas, que se dividen de la siguiente manera:

In [None]:
pd.DataFrame(datos.query('ocupacion == "Otra"').ocupacionO.value_counts()).rename_axis(
    index={"ocupacionO": "Ocupación"}
).rename(columns={"count": "Nº de mujeres"})

### Horas de uso de internet

In [None]:
tbl_uso_internet = pd.DataFrame(datos.horas_internet.value_counts().sort_index())

In [None]:
tbl_uso_porcentaje = (
    round(tbl_uso_internet / tbl_uso_internet.sum() * 100, 2)["count"].astype(str)
    + " %"
)

In [None]:
fig = px.bar(tbl_uso_internet, text=tbl_uso_porcentaje)
fig.update_layout(
    title="Uso de internet por rangos de tiempo",
    xaxis_title="Tiempo",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(149, 27, 129)",
    marker_line_color="white",
)
fig.show()
fig.write_image("img/uso_internet.png")

### Principales usos de internet

In [None]:
tbl_usos = pd.DataFrame(
    datos[
        [
            "uso_familia",
            "uso_trabajo",
            "uso_venta",
            "uso_distraer",
            "uso_estudiar",
            "uso_banco",
            "uso_otra",
            "uso_peli",
            "uso_noticias",
        ]
    ].sum()
)

In [None]:
tbl_usos.index = [
    "Comunicarme con familiares y amigos/as",
    "Trabajar",
    "Vender productos",
    "Distraerme",
    "Estudiar o investigar",
    "Realizar operaciones bancarias",
    "Otras actividades",
    "Ver películas y/o series",
    "Ver noticias",
]

In [None]:
tbl_usos_porcentaje = pd.DataFrame(
    round(tbl_usos / tbl_usos.sum() * 100, 2)[0].astype(str) + " %"
)

In [None]:
tbl_usos_concat = pd.concat(
    [tbl_usos, tbl_usos_porcentaje.rename(columns={0: "p"})], axis=1
).sort_values(0)

In [None]:
fig = px.bar(tbl_usos_concat[0], text=tbl_usos_concat.p)
fig.update_layout(
    title="Usos de internet",
    xaxis_title="Actividades",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(149, 27, 129)",
    marker_line_color="white",
)
fig.show()
fig.write_image("img/usos_internet.png")

En el caso de la respuesta "Otras actividades", se desglosa de la siguiente manera:

In [None]:
pd.DataFrame(datos.uso_otraR.value_counts()).rename_axis(
    index={"uso_otraR": "Otros usos de internet"}
).rename(columns={"count": "Nº de mujeres"})

### Aumento de uso de internet por Covid19

In [None]:
tbl_covid_aumento = datos.covid_aumento.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_covid_aumento.index, values=tbl_covid_aumento)])
fig.update_layout(
    title_text="Aumento del uso de internet",
    legend_title="¿Has aumentado tu tiempo de <br> conexión a internet?",
    font=dict(family="Arial", size=18, color="black"),
    width=1500,
    height=1000,
    legend=dict(font=dict(size=18)),
)
fig.update_traces(
    marker=dict(
        colors=["rgb(149, 27, 129)", "rgb(57, 105, 172)", "rgb(7, 171, 157)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/covid.png")

### Uso de redes sociales/aplicaciones

In [None]:
datos.loc[:, "telegram"] = datos.telegram.apply(str.strip)

In [None]:
redes = [
    "facebook",
    "twitter",
    "instagram",
    "tiktok",
    "discord",
    "slack",
    "citas",
    "videojuegos",
    "whatsapp",
    "telegram",
    "reddit",
    "estudio",
    "linkedin",
    "twich",
    "youtube",
    "pinterest",
    "flickr",
]

dicts = {}
for i in redes:
    dicts[i.capitalize()] = (
        datos[[i]].value_counts().reset_index().set_index(i)["count"]
    )

In [None]:
tbl_aplicaciones = round(
    (
        pd.DataFrame.from_dict(dicts, orient="index").fillna(0)[
            [
                "Menos de 2 horas",
                "2-4 horas",
                "5-7 horas",
                "Más de 7 horas",
                "No la utilizo",
            ]
        ]
        / len(datos)
    )
    * 100,
    2,
)

In [None]:
fig = px.bar(
    tbl_aplicaciones.sort_values("No la utilizo"),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Bold[:4]
    + [px.colors.qualitative.Prism_r[0]],
    width=1500,
    height=800,
)
fig.update_layout(
    title="Uso de aplicaciones/redes sociales",
    xaxis_title="% de mujeres",
    yaxis_title="Aplicación/red social",
    legend_title="Horas de uso diario",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)

fig.show()
fig.write_image("img/uso_apps.png")

### Incidencia de violencias

In [None]:
violencias_nombres = {
    "identidad": "Duplicación de identidad",
    "ciberacoso": "Ciberacoso",
    "doxxing": "Doxxing",
    "mobbing": "Mobbing",
    "ciberdifamacion": "Ciberdifamación",
    "stalking": "Cibervigilancia (stalking)",
    "ciberextorsion": "Ciberextorsión",
    "grooming": "Grooming",
    "phishing_vs": "Phishing/Vishing/Smishing",
    "trata": "Trata de personas en línea",
    "explotacion": "Captación con fines de explotación sexual",
    "exclusion": "Exclusión digital",
    "cyberflashing": "Cyberflashing",
    "deepfake": "Deepfake",
    "clonacion": "Clonación de aplicaciones",
}

In [None]:
violencias = list(violencias_nombres.keys())

In [None]:
dic = {}
for i in violencias:
    datos.loc[:, i] = datos[i].apply(str.strip).apply(str.capitalize)
    dic[violencias_nombres[i]] = datos[[i]].value_counts().sort_index()

In [None]:
tbl_sufrio = pd.DataFrame.from_dict(dic, orient="index").fillna(0)

In [None]:
tbl_sufrio

In [None]:
tbl_sufrio = tbl_sufrio.set_axis(["No", "Sí"], axis=1)

In [None]:
sufrio_porcentaje = round(tbl_sufrio / len(datos) * 100, 2)

In [None]:
fig = px.bar(
    sufrio_porcentaje[["Sí", "No"]].sort_values("Sí"),
    orientation="h",
    text_auto=True,
    color_discrete_map={"Sí": "rgb(149, 27, 129)", "No": "rgb(57, 105, 172)"},
    width=1500,
    height=800,
)
fig.update_layout(
    title="Incidencia de violencias",
    yaxis_title="Violencia",
    xaxis_title="% de mujeres",
    legend_title="¿Sufrió la violencia?",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    cliponaxis=False,
    marker_line_color="white",
    texttemplate="%{value: 4} %",
)
fig.show()
fig.write_image("img/incidencia.png")

In [None]:
for i in violencias:
    datos.loc[:, i].replace(
        [
            "No",
            "Sí",
        ],
        [0, 1],
        inplace=True,
    )

In [None]:
tbl_numero_violencia = pd.DataFrame(
    datos[violencias].T.sum().value_counts()
).sort_index()
tbl_violencia_porcentaje = round(tbl_numero_violencia / len(datos) * 100, 2)

In [None]:
tbl_violencia_porcentaje.index = tbl_violencia_porcentaje.index.astype("string")

In [None]:
fig = px.bar(
    tbl_violencia_porcentaje,
    text_auto=True,
)
fig.update_layout(
    title="Cantidad de violencias sufridas",
    xaxis_title="Nº de violencias sufridas",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_line_color="white",
    marker_color="rgb(149, 27, 129)",
    texttemplate="%{value}%",
)
fig.show()
fig.write_image("img/numero_violencia.png")

In [None]:
dic_violencias = {}
for i in violencias:
    dic_violencias[i] = [s for s in list(datos.columns)[:-32] if i in s]

#### Resultados para los casos de duplicación de identidad

In [None]:
tbl_identidad = datos.query("identidad == 1")[dic_violencias["identidad"]]

Se han reportado 43 casos de duplicación de identidad.

In [None]:
frecuencia_identidad = fg.grafico_frecuencia(tbl_identidad)

In [None]:
temporalidad_identidad = fg.grafico_temporalidad(tbl_identidad)

In [None]:
tbl_identidad.columns

In [None]:
edad_identidad = fg.grafico_edad(tbl_identidad)

In [None]:
parentesco_identidad = fg.grafico_parentesco(tbl_identidad)

In [None]:
sexo_identidad = fg.grafico_sexo_parentesco(tbl_identidad)

In [None]:
medios_identidad = fg.grafico_medios(tbl_identidad)[2]

In [None]:
pd.DataFrame(tbl_identidad.otraR_identidad.value_counts()).rename_axis(
    index={"otraR_identidad": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de Mujeres"})

#### Resultados para los casos de ciberacoso

In [None]:
tbl_ciberacoso = datos.query("ciberacoso == 1")[dic_violencias["ciberacoso"]]

Se han reportado 135 casos de ciberacoso.

In [None]:
frecuencia_ciberacoso = fg.grafico_frecuencia(tbl_ciberacoso)

In [None]:
temporalidad_ciberacoso = fg.grafico_temporalidad(tbl_ciberacoso)

In [None]:
edad_ciberacoso = fg.grafico_edad(tbl_ciberacoso)

In [None]:
parentesco_ciberacoso = fg.grafico_parentesco(tbl_ciberacoso)

In [None]:
sexo_ciberacoso = fg.grafico_sexo_parentesco(tbl_ciberacoso)

In [None]:
medios_ciberacoso = fg.grafico_medios(tbl_ciberacoso)[2]

In [None]:
pd.DataFrame(tbl_ciberacoso.otraR_ciberacoso.value_counts()).rename_axis(
    index={"otraR_ciberacoso": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos doxxing

In [None]:
tbl_doxxing = datos.query("doxxing == 1")[dic_violencias["doxxing"]]

Se han reportado 45 casos de doxxing.

In [None]:
frecuencia_doxxing = fg.grafico_frecuencia(tbl_doxxing)

In [None]:
temporalidad_doxxing = fg.grafico_temporalidad(tbl_doxxing)

In [None]:
edad_doxxing = fg.grafico_edad(tbl_doxxing)

In [None]:
parentesco_doxxing = fg.grafico_parentesco(tbl_doxxing)

In [None]:
sexo_doxxing = fg.grafico_sexo_parentesco(tbl_doxxing)

In [None]:
medios_doxxing = fg.grafico_medios(tbl_doxxing)[2]

In [None]:
pd.DataFrame(tbl_doxxing.otraR_doxxing.value_counts()).rename_axis(
    index={"otraR_doxxing": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de mobbing

In [None]:
tbl_mobbing = datos.query("mobbing == 1")[dic_violencias["mobbing"]]

Se han reportado 58 casos de mobbing.

In [None]:
frecuencia_mobbing = fg.grafico_frecuencia(tbl_mobbing)

In [None]:
temporalidad_mobbing = fg.grafico_temporalidad(tbl_mobbing)

In [None]:
tbl_mobbing.columns

In [None]:
edad_mobbing = fg.grafico_edad(tbl_mobbing)

In [None]:
parentesco_mobbing = fg.grafico_parentesco(tbl_mobbing)

In [None]:
sexo_mobbing = fg.grafico_sexo_parentesco(tbl_mobbing)

In [None]:
medios_mobbing = fg.grafico_medios(tbl_mobbing)[2]

In [None]:
pd.DataFrame(tbl_mobbing.otraR_mobbing.value_counts()).rename_axis(
    index={"otraR_mobbing": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de ciberdifamación

In [None]:
tbl_ciberdifamacion = datos.query("ciberdifamacion == 1")[
    dic_violencias["ciberdifamacion"]
]

Se han reportado 60 casos de ciberdifamación.

In [None]:
frecuencia_ciberdifamacion = fg.grafico_frecuencia(tbl_ciberdifamacion)

In [None]:
temporalidad_ciberdifamacion = fg.grafico_temporalidad(tbl_ciberdifamacion)

In [None]:
edad_ciberdifamacion = fg.grafico_edad(tbl_ciberdifamacion)

In [None]:
parentesco_ciberdifamacion = fg.grafico_parentesco(tbl_ciberdifamacion)

In [None]:
sexo_ciberdifamacion = fg.grafico_sexo_parentesco(tbl_ciberdifamacion)

In [None]:
medios_ciberdifamacion = fg.grafico_medios(tbl_ciberdifamacion)[2]

In [None]:
pd.DataFrame(tbl_ciberdifamacion.otraR_ciberdifamacion.value_counts()).rename_axis(
    index={"otraR_ciberdifamacion": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de cibervigilancia (stalking)

In [None]:
tbl_stalking = datos.query("stalking == 1")[dic_violencias["stalking"]]

Se han reportado 166 casos de stalking.

In [None]:
frecuencia_stalking = fg.grafico_frecuencia(tbl_stalking)

In [None]:
temporalidad_stalking = fg.grafico_temporalidad(tbl_stalking)

In [None]:
edad_stalking = fg.grafico_edad(tbl_stalking)

In [None]:
parentesco_stalking = fg.grafico_parentesco(tbl_stalking)

In [None]:
sexo_stalking = fg.grafico_sexo_parentesco(tbl_stalking)

In [None]:
medios_stalking = fg.grafico_medios(tbl_stalking)[2]

In [None]:
pd.DataFrame(tbl_stalking.otraR_stalking.value_counts()).rename_axis(
    index={"otraR_stalking": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de ciberextorsión

In [None]:
tbl_ciberextorsion = datos.query("ciberextorsion == 1")[
    dic_violencias["ciberextorsion"]
]

Se han reportado 21 casos de ciberextorsión.

In [None]:
frecuencia_ciberextorsion = fg.grafico_frecuencia(tbl_ciberextorsion)

In [None]:
temporalidad_ciberextorsion = fg.grafico_temporalidad(tbl_ciberextorsion)

In [None]:
edad_ciberextorsion = fg.grafico_edad(tbl_ciberextorsion)

In [None]:
parentesco_ciberextorsion = fg.grafico_parentesco(tbl_ciberextorsion)

In [None]:
sexo_ciberextorsion = fg.grafico_sexo_parentesco(tbl_ciberextorsion)

In [None]:
medios_ciberextorsion = fg.grafico_medios(tbl_ciberextorsion)[2]

In [None]:
pd.DataFrame(tbl_ciberextorsion.otraR_ciberextorsion.value_counts()).rename_axis(
    index={"otraR_ciberextorsion": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de grooming

In [None]:
tbl_grooming = datos.query("grooming == 1")[dic_violencias["grooming"]]

Se han reportado 40 casos de grooming.

In [None]:
frecuencia_grooming = fg.grafico_frecuencia(tbl_grooming)

In [None]:
temporalidad_grooming = fg.grafico_temporalidad(tbl_grooming)

In [None]:
edad_grooming = fg.grafico_edad(tbl_grooming)

In [None]:
parentesco_grooming = fg.grafico_parentesco(tbl_grooming)

In [None]:
sexo_grooming = fg.grafico_sexo_parentesco(tbl_grooming)

In [None]:
medios_grooming = fg.grafico_medios(tbl_grooming)[2]

In [None]:
pd.DataFrame(tbl_grooming.otraR_grooming.value_counts()).rename_axis(
    index={"otraR_grooming": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de phishing-vishing-smishing

In [None]:
tbl_phishing_vs = datos.query("phishing_vs == 1")[dic_violencias["phishing_vs"]]

Se han reportado 78 casos de phishing-vishing-smishing.

In [None]:
frecuencia_phishing_vs = fg.grafico_frecuencia(tbl_phishing_vs)

In [None]:
temporalidad_phishing_vs = fg.grafico_temporalidad(tbl_phishing_vs)

In [None]:
edad_phishing_vs = fg.grafico_edad(tbl_phishing_vs)

In [None]:
parentesco_phishing_vs = fg.grafico_parentesco(tbl_phishing_vs)

In [None]:
sexo_phishing_vs = fg.grafico_sexo_parentesco(tbl_phishing_vs)

In [None]:
pd.DataFrame(tbl_phishing_vs.otraR_phishing_vs.value_counts()).rename_axis(
    index={"otraR_phishing_vs": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

In [None]:
medios_phishing_vs = fg.grafico_medios(tbl_phishing_vs)[2]

#### Resultados para los casos de trata de personas en línea

In [None]:
for i in datos.query("otraR_trata == 'Instagram '").index:
    datos.loc[i, "instagram_trata"] = True

In [None]:
tbl_trata = datos.query("trata == 1")[dic_violencias["trata"]]

Se han reportado 39 casos de trata de personas en línea.

In [None]:
frecuencia_trata = fg.grafico_frecuencia(tbl_trata)

In [None]:
temporalidad_trata = fg.grafico_temporalidad(tbl_trata)

In [None]:
edad_trata = fg.grafico_edad(tbl_trata)

In [None]:
parentesco_trata = fg.grafico_parentesco(tbl_trata)

In [None]:
sexo_trata = fg.grafico_sexo_parentesco(tbl_trata)

In [None]:
medios_trata = fg.grafico_medios(tbl_trata)[2]

In [None]:
pd.DataFrame(tbl_trata.otraR_trata.value_counts()).rename_axis(
    index={"otraR_trata": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"}).iloc[1:]

#### Resultados para los casos de captación con fines de explotación sexual

In [None]:
tbl_explotacion = datos.query("explotacion == 1")[dic_violencias["explotacion"]]

Se han reportado 7 casos de captación con fines de explotación sexual.

In [None]:
frecuencia_explotacion = fg.grafico_frecuencia(tbl_explotacion)

In [None]:
temporalidad_explotacion = fg.grafico_temporalidad(tbl_explotacion)

In [None]:
edad_explotacion = fg.grafico_edad(tbl_explotacion)

In [None]:
parentesco_explotacion = fg.grafico_parentesco(tbl_explotacion)

In [None]:
sexo_explotacion = fg.grafico_sexo_parentesco(tbl_explotacion)

In [None]:
medios_explotacion = fg.grafico_medios(tbl_explotacion)[2]

In [None]:
pd.DataFrame(tbl_explotacion.otraR_explotacion.value_counts()).rename_axis(
    index={"otraR_explotacion": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de exclusión digital

In [None]:
tbl_exclusion = datos.query("exclusion == 1")[dic_violencias["exclusion"]]

Se han reportado 37 casos de exclusión digital.

In [None]:
frecuencia_exclusion = fg.grafico_frecuencia(tbl_exclusion)

In [None]:
temporalidad_exclusion = fg.grafico_temporalidad(tbl_exclusion)

In [None]:
edad_exclusion = fg.grafico_edad(tbl_exclusion)

En el caso de exclusión no se realizó la pregunta asociada las personas agresoras.

In [None]:
medios_exclusion = fg.grafico_medios(tbl_exclusion)[2]

In [None]:
pd.DataFrame(tbl_exclusion.otraR_exclusion.value_counts()).rename_axis(
    index={"otraR_exclusion": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de cyberflashing

In [None]:
tbl_cyberflashing = datos.query("cyberflashing == 1")[dic_violencias["cyberflashing"]]

Se han reportado 190 casos de cyberflashing.

In [None]:
frecuencia_cyberflashing = fg.grafico_frecuencia(tbl_cyberflashing)

In [None]:
temporalidad_cyberflashing = fg.grafico_temporalidad(tbl_cyberflashing)

In [None]:
edad_cyberflashing = fg.grafico_edad(tbl_cyberflashing)

In [None]:
parentesco_cyberflashing = fg.grafico_parentesco(tbl_cyberflashing)

In [None]:
sexo_cyberflashing = fg.grafico_sexo_parentesco(tbl_cyberflashing)

In [None]:
medios_cyberflashing = fg.grafico_medios(tbl_cyberflashing)[2]

In [None]:
pd.DataFrame(tbl_cyberflashing.otraR_cyberflashing.value_counts()).rename_axis(
    index={"otraR_cyberflashing": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de deepfake

In [None]:
tbl_deepfake = datos.query("deepfake == 1")[dic_violencias["deepfake"]]

Se han reportado 10 casos de deepfake.

In [None]:
frecuencia_deepfake = fg.grafico_frecuencia(tbl_deepfake)

In [None]:
temporalidad_deepfake = fg.grafico_temporalidad(tbl_deepfake)

In [None]:
edad_deepfake = fg.grafico_edad(tbl_deepfake)

In [None]:
parentesco_deepfake = fg.grafico_parentesco(tbl_deepfake)

In [None]:
sexo_deepfake = fg.grafico_sexo_parentesco(tbl_deepfake)

In [None]:
medios_deepfake = fg.grafico_medios(tbl_deepfake)[2]

In [None]:
pd.DataFrame(tbl_deepfake.otraR_deepfake.value_counts()).rename_axis(
    index={"otraR_deepfake": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

#### Resultados para los casos de clonación de aplicaciones

In [None]:
tbl_clonacion = datos.query("clonacion == 1")[dic_violencias["clonacion"]]

Se han reportado 50 casos de clonación de aplicaciones.

In [None]:
frecuencia_clonacion = fg.grafico_frecuencia(tbl_clonacion)

In [None]:
temporalidad_clonacion = fg.grafico_temporalidad(tbl_clonacion)

In [None]:
edad_clonacion = fg.grafico_edad(tbl_clonacion)

In [None]:
parentesco_clonacion = fg.grafico_parentesco(tbl_clonacion)

In [None]:
sexo_clonacion = fg.grafico_sexo_parentesco(tbl_clonacion)

In [None]:
medios_clonacion = fg.grafico_medios(tbl_clonacion)[2]

In [None]:
pd.DataFrame(tbl_clonacion.otraR_clonacion.value_counts()).rename_axis(
    index={"otraR_clonacion": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de mujeres"})

### Conocimiento sobre violencia digital basada en género

In [None]:
tbl_vdbg = datos.vdbg.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_vdbg.index, values=tbl_vdbg)])
fig.update_layout(
    title_text="Conocimiento de VDBG",
    legend_title="¿Habías escuchado antes el término <br> Violencia Digital Basada en Género?",
    font=dict(family="Arial", size=18, color="black"),
    width=1500,
    height=1000,
)
fig.update_traces(
    marker=dict(
        colors=["rgb(149, 27, 129)", "rgb(57, 105, 172)", "rgb(7, 171, 157)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/vdbg.png")

In [None]:
vdbg_violencias = [s for s in list(datos.columns) if "vdbg_" in s]

In [None]:
con_violencia = pd.DataFrame(
    datos.query("vdbg == 'Sí'")[vdbg_violencias[1:]].T.sum().value_counts()
)
con_violencia.index.name = "Nº de violencias conocidas"
con_violencia["%"] = round(con_violencia / len(datos) * 100, 2)
con_violencia.rename(columns={"count": "Cantidad de mujeres"}).sort_index()

In [None]:
tbl_conocimiento_violencia = pd.DataFrame(datos[vdbg_violencias[1:]].sum())

In [None]:
tbl_conocimiento_violencia.index = violencias
tbl_conocimiento_violencia.rename(
    index=violencias_nombres, columns={0: "cantidad"}, inplace=True
)
tbl_conocimiento_violencia = round(tbl_conocimiento_violencia / len(datos) * 100, 2)

In [None]:
fig = px.bar(
    tbl_conocimiento_violencia.sort_values("cantidad", ascending=False),
    y="cantidad",
    x=tbl_conocimiento_violencia.index,
    text_auto=True,
)
fig.update_layout(
    title="Conocimiento de la violencia",
    xaxis_title="Violencia",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(149, 27, 129)",
    marker_line_color="white",
    texttemplate="%{value: .4} %",
)
fig.show()
fig.write_image("img/conocimiento_violencia.png")

### Reacciones de las víctima al sufrir la(s) violencia(s)

In [None]:
reacciones = [s for s in list(datos.columns) if "reaccion_" in s]

In [None]:
tbl_reacciones = round(pd.DataFrame(datos[reacciones].sum() / len(datos) * 100), 2)

In [None]:
tbl_reacciones.rename(
    index={
        "reaccion_ignorar": "Ignoraron al agresor",
        "reaccion_contar": "Le contaron a un amigo(a) o familiar",
        "reaccion_ayuda": "Acudieron a un centro de ayuda o denuncia",
        "reaccion_reportar": "Reportaron el perfil o publicación en la red social",
        "reaccion_internet": "Redujeron el uso en internet",
        "reaccion_borrar": "Borraron la aplicación donde ocurrió",
        "reaccion_eliminar": "Eliminaron la cuenta de usuario",
        "reaccion_crear": "Crearon una cuenta de usuario distinta",
        "reaccion_bloquear": "Bloquearon a la persona agresora",
        "reaccion_enfrentar": "Enfrentaron a la persona agresora",
    },
    columns={0: "cantidad"},
    inplace=True,
)

In [None]:
fig = px.bar(
    tbl_reacciones.sort_values("cantidad", ascending=False),
    y=tbl_reacciones["cantidad"],
    x=tbl_reacciones.index,
    text_auto=True,
)
fig.update_layout(
    title="Reacción de la víctima al sufrir la(s) violencia(s)",
    xaxis_title="Violencia",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(57, 105, 172)",
    marker_line_color="white",
    texttemplate="%{value: .4} %",
)
fig.show()
fig.write_image("img/reaccion_violencia.png")

### Conocimiento de víctimas

In [None]:
tbl_victima = datos.victima.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_victima.index, values=tbl_victima)])
fig.update_layout(
    title_text="Conocimiento de Víctimas",
    font=dict(family="Arial", size=18, color="black"),
    legend_title="¿Conoces a alguna mujer que haya <br> sido víctima de violencia digital?",
    width=1500,
    height=1000,
    legend=dict(font=dict(size=18)),
)
fig.update_traces(
    marker=dict(
        colors=["rgb(149, 27, 129)", "rgb(57, 105, 172)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/victima.png")

In [None]:
num_victimas = pd.DataFrame(datos.numero_victima.value_counts())

In [None]:
fig = px.bar(
    num_victimas.sort_index(),
    y=num_victimas.sort_index()["count"],
    x=num_victimas.sort_index().index.values,
    text=round(num_victimas.sort_index() / len(datos) * 100, 2)["count"],
)
fig.update_layout(
    title="Cantidad de víctimas conocidas",
    xaxis_title="Nº de victimas",
    yaxis_title="% de mujeres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(7, 171, 157)",
    marker_line_color="white",
    texttemplate="%{text: .4} %",
)
fig.show()
fig.write_image("img/num_victimas.png")

### Conocimiento de leyes y normas

In [None]:
tbl_leyes = datos.leyes_normas.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_leyes.index, values=tbl_leyes)])
fig.update_layout(
    title_text="Conocimiento de Leyes y Normas",
    legend_title="¿Conoces leyes o normativas en el país <br> que contemplan las violencias digitales?",
    width=1500,
    height=1000,
    font=dict(family="Arial", size=18, color="black"),
)
fig.update_traces(
    marker=dict(
        colors=["rgb(149, 27, 129)", "rgb(57, 105, 172)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/ley.png")

### Interacciones entre ciertos ítems de la encuesta

#### Tipos de violencia y edad en que ocurrió por primera vez

In [None]:
edades_violencias = [s for s in list(datos.columns) if "edad_" in s]

In [None]:
lista_edades_violencias = []
for i in edades_violencias:
    j = (
        pd.cut(
            datos[edades_violencias].loc[:, i],
            bins=[0, 10, 15, 18, 25, 30, 40, 50, 60, 75],
            right=False,
        )
        .value_counts()
        .sort_index()
    )
    j = j.reset_index()
    for k in violencias_nombres.keys():
        if k in j.columns[0]:
            j["violencia"] = [violencias_nombres[k]] * len(j)
    j = j.rename(columns={j.columns[0]: "Edad"})
    lista_edades_violencias.append(j)

In [None]:
tbl_edades_primera_vez = pd.concat(lista_edades_violencias, join="inner").reset_index(
    drop=True
)

In [None]:
tbl_edades_primera_vez.Edad = tbl_edades_primera_vez.Edad.astype("str")

In [None]:
l_ = []
for i in lista_edades_violencias:
    j = round(i["count"] / i["count"].sum() * 100, 3)
    i["count"] = j
    l_.append(i)

In [None]:
edades_primera_vez = (
    pd.concat(l_, join="inner")
    .reset_index(drop=True)
    .rename(columns={"violencia": "Violencia"})
)

In [None]:
edades_primera_vez.Edad = edades_primera_vez.Edad.astype("str")

In [None]:
fig = px.bar(
    edades_primera_vez,
    x="Edad",
    y="count",
    color="Violencia",
    title="Tasa de incidencia por grupo etario según tipo de violencia",
    barmode="group",
    color_discrete_sequence=px.colors.qualitative.Plotly,
    width=1600,
    height=600,
)
fig.update_layout(
    font=dict(family="Arial", size=16, color="black"),
)
fig.update_yaxes(title="% de mujeres")
fig.update_xaxes(
    title="Rangos de edad",
    labelalias={
        "[0, 10)": "0-9",
        "[10, 15)": "10-14",
        "[15, 18)": "15-17",
        "[18, 25)": "18-24",
        "[25, 30)": "24-29",
        "[30, 40)": "30-39",
        "[40, 50)": "40-49",
        "[50, 60)": "50-59",
        "[60, 75)": "60 y más",
    },
)
fig.show()
fig.write_image("img/violencia_edad2.png")

#### Tipo de violencia según el medio por el cual ocurrió

In [None]:
lista_medios = [s for s in list(vars()) if "medios_" in s]
ls_medios = []
for i in [s for s in list(vars()) if "medios_" in s]:
    df = vars()[i]
    ls_medios.append(df)

In [None]:
lista_df_medios = []
for df, i in zip(ls_medios, lista_medios):
    tbl = pd.DataFrame(df)
    if i.split("_")[1] in violencias_nombres.keys():
        l_violencia = [violencias_nombres[i.split("_")[1]]] * len(df)
    else:
        l_violencia = ["Phishing/Vishing/Smishing"] * len(df)
    tbl["violencia"] = l_violencia
    tbl.rename(columns={0: "cantidad"}, inplace=True)
    tbl.reset_index(inplace=True)
    tbl.rename(columns={"index": "Medio"}, inplace=True)
    lista_df_medios.append(tbl)

In [None]:
tbl_violencia_medio = pd.concat(lista_df_medios)

In [None]:
tbl_violencia_medio.reset_index(drop=True, inplace=True)

In [None]:
tbl_violencia_medio = tbl_violencia_medio.astype(
    {"cantidad": "float", "violencia": "str", "Medio": "str"}
)

In [None]:
fig = px.bar(
    tbl_violencia_medio.sort_values("cantidad", ascending=False),
    x="cantidad",
    y="violencia",
    color="Medio",
    title="Tipo de violencia según el medio por el cual ocurrió",
    barmode="stack",
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Bold,
    width=1600,
    height=600,
)
fig.update_layout(
    font=dict(family="Arial", size=16, color="black"),
)
fig.update_yaxes(title="Violencia")
fig.update_xaxes(title="% de mujeres")
fig.show()
fig.write_image("img/violencia_medio1.png")

#### Parentesco de la persona agresora con las mujeres que han sufrido violencias

In [None]:
lista_df_parentescos = [
    parentesco_identidad[2],
    parentesco_ciberacoso[2],
    parentesco_doxxing[2],
    parentesco_ciberdifamacion[2],
    parentesco_stalking[2],
    parentesco_ciberextorsion[2],
    parentesco_explotacion[2],
    parentesco_cyberflashing[2],
    parentesco_deepfake[2],
    parentesco_clonacion[2],
]

In [None]:
parentescos_ = [
    "identidad",
    "ciberacoso",
    "doxxing",
    "ciberdifamacion",
    "stalking",
    "ciberextorsion",
    "explotacion",
    "cyberflashing",
    "deepfake",
    "clonacion",
]

In [None]:
for i, j in zip(lista_df_parentescos, parentescos_):
    if j in violencias_nombres.keys():
        ls_index = [violencias_nombres[j]] * len(i)
    i["violencia"] = ls_index

In [None]:
tbl_parentesco_ = pd.concat(lista_df_parentescos)

In [None]:
tbl_parentesco_.reset_index(inplace=True)

In [None]:
fig = px.bar(
    tbl_parentesco_,
    x="violencia",
    y="count",
    color="parentesco",
    title="Parentesco de la persona agresora con las mujeres que han sufrido violencias",
    barmode="group",
    color_discrete_sequence=px.colors.qualitative.Plotly,
    width=1500,
    height=1000,
)
fig.update_layout(
    legend_title="Parentesco con el agresor(a):",
    font=dict(family="Arial", size=18, color="black"),
)
fig.update_xaxes(title="Violencia")
fig.update_yaxes(title="% de mujeres")
fig.show()
fig.write_image("img/violencia_parentesco1.png")

NOTA: Para las siguientes violencias, la pregunta sobre parentesco se reformuló consultando si se logró o no identificar al agresor(a).

In [None]:
parentesco_violencia = tbl_parentesco_.pivot(
    index="violencia", columns="parentesco", values="count"
).fillna(0)

In [None]:
tbl_grooPt = pd.concat(
    [parentesco_grooming[2], parentesco_phishing_vs[2], parentesco_trata[2]],
    axis=1,
    keys=["Grooming", "Phishing", "Trata"],
).T.reset_index(level=1, drop=True)
tbl_grooPt

NOTA: Para mobbing, por la naturaleza de la agresión, la víctima conoce a su agresor(a).

In [None]:
tbl_parentesco_mobbing = parentesco_mobbing[1]

In [None]:
tbl_parentesco_mobbing.astype({"count": "int"}).rename_axis(
    index={"parentesco_mobbing": "Relación laboral"}
).rename(columns={"count": "N° de mujeres"})

#### Identificación de la persona agresora

In [None]:
tbl_identificacion_si = pd.DataFrame(
    parentesco_violencia[
        [
            "Fue mi ex-pareja en ese momento",
            "Fue mi pareja",
            "Fue un compañero(a) de trabajo",
            "Fue un familiar",
            "No conocía a quien me agredió, pero le identifiqué",
            "Teníamos una amistad",
        ]
    ].sum(1)
).rename(columns={0: "Sí"})

In [None]:
tbl_identificacion_no = pd.DataFrame(
    parentesco_violencia["No le pude identificar"]
).rename(columns={"No le pude identificar": "No"})

In [None]:
tabla_identificacion = pd.concat(
    [tbl_identificacion_si.join(tbl_identificacion_no), tbl_grooPt]
)

In [None]:
porcentaje_identificacion = round(
    (tabla_identificacion.T / tabla_identificacion.sum(1) * 100).T, 2
)

In [None]:
fig = px.bar(
    porcentaje_identificacion,
    barmode="group",
    text_auto="True",
    color_discrete_map={"Sí": "rgb(149, 27, 129)", "No": "rgb(57, 105, 172)"},
    width=1500,
    height=1000,
)
fig.update_layout(
    title="Identificación del agresor",
    xaxis_title="Violencia",
    yaxis_title="% de mujeres",
    legend_title="¿Identificó al agresor?",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    texttemplate="%{value} %",
)

fig.show()
fig.write_image("img/id_agresor.png")

#### Sexo del agresor por tipo de violencia

In [None]:
variables_sexo = [
    "sexo_identidad",
    "sexo_ciberacoso",
    "sexo_doxxing",
    "sexo_mobbing",
    "sexo_ciberdifamacion",
    "sexo_stalking",
    "sexo_ciberextorsion",
    "sexo_grooming",
    "sexo_phishing_vs",
    "sexo_trata",
    "sexo_explotacion",
    "sexo_cyberflashing",
    "sexo_deepfake",
    "sexo_clonacion",
    "sexo_violencias",
]

In [None]:
sexo_violencias = []
names_ = []
for i in variables_sexo:
    df = vars()[i]
    names_.append(df[1].index.name.split)
    sexo_violencias.append(df[1])

In [None]:
tbl_sexo_violencias = (
    pd.concat(
        sexo_violencias,
        join="outer",
        axis=1,
        keys=[
            "Duplicación de identidad",
            "Ciberacoso",
            "Doxxing",
            "Mobbing",
            "Ciberdifamación",
            "Cibervigilancia (stalking)",
            "Ciberextorsión",
            "Grooming",
            "Phishing/Vishing/Smishing",
            "Trata de personas en línea",
            "Captación con fines de explotación sexual",
            "Cyberflashing",
            "Deepfake",
            "Clonación",
        ],
    )
    .T.reset_index(1, drop=True)
    .fillna(0)
)

In [None]:
sexo_porcentaje = round((tbl_sexo_violencias.T / tbl_sexo_violencias.sum(1) * 100).T, 2)

In [None]:
fig = px.bar(
    sexo_porcentaje,
    barmode="group",
    color_discrete_sequence=[
        "rgb(149, 27, 129)",
        "rgb(57, 105, 172)",
        "rgb(7, 171, 157)",
    ],
    width=1500,
    height=1000,
    text_auto=True,
)
fig.update_layout(
    title="Sexo del agresor por tipo de violencia",
    xaxis_title="Violencia",
    yaxis_title="% de mujeres",
    legend_title="Sexo del agresor(a)",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    texttemplate="%{value: } %",
)

fig.show()
fig.write_image("img/sexo_agresor_violencia.png")

In [None]:
cruce = porcentaje_identificacion.join(sexo_porcentaje)

In [None]:
cruce.columns = pd.MultiIndex.from_tuples(
    [
        ("Sí", "%"),
        ("No", "%"),
        ("Sí", "Mujer"),
        ("Sí", "Hombre"),
        ("Sí", "Un grupo de personas"),
    ]
)

In [None]:
variables = [
    s
    for s in tbl_identidad.columns
    if s.startswith("sexo_") or s.startswith("parentesco_")
]

In [None]:
lista = []
for j, k in zip(tbl_identidad[variables[0]], tbl_identidad[variables[1]]):
    if j != "No le pude identificar" and j != "No":
        lista.append((j, k))
df = pd.DataFrame(lista, columns=["Parentesco", "Sexo"]).value_counts()

In [None]:
dic_sexo = {}
for i in [s for s in violencias if s != "exclusion"]:
    lista = []
    g = datos.query(f"{i} == 1")
    for j, k in zip(g[dic_violencias[i][4]], g[dic_violencias[i][5]]):
        if j != "No le pude identificar" and j != "No":
            lista.append((j, k))
    dic_sexo[i] = pd.DataFrame(lista, columns=["Parentesco", "Sexo"]).value_counts()

In [None]:
for i in [s for s in violencias if s != "exclusion"]:
    lista = []
    g = datos.query(f"{i} == 1")
    for j, k in zip(g[dic_violencias[i][4]], g[dic_violencias[i][5]]):
        if j != "No le pude identificar" and j != "No":
            lista.append((j, k))
    dic_sexo[i] = pd.DataFrame(lista, columns=["Parentesco", "Sexo"]).value_counts()

#### Sexo del agresor(a) y parentesco con la víctima por tipo de violencia

In [None]:
dic_sexo = {}
for i in [s for s in violencias if s != "exclusion"]:
    lista = []
    g = datos.query(f"{i} == 1")
    for j, k in zip(g[dic_violencias[i][4]], g[dic_violencias[i][5]]):
        if j != "No le pude identificar" and j != "No":
            lista.append((i, j, k))
    dic_sexo[i] = pd.DataFrame(
        lista, columns=["Violencia", "Parentesco", "Sexo"]
    ).value_counts()

In [None]:
lista_sexo = [
    dic_sexo[i].reset_index(level=0, drop=True)
    for i in dic_sexo
    if i
    in [
        "identidad",
        "ciberacoso",
        "doxxing",
        "ciberdifamacion",
        "stalking",
        "ciberextorsion",
        "explotacion",
        "cyberflashing",
        "deepfake",
        "clonacion",
    ]
]

In [None]:
lista_parentesco_sexo = [
    round(dic_sexo[i] / dic_sexo[i].sum() * 100, 2).reset_index()
    for i in dic_sexo
    if i
    in [
        "identidad",
        "ciberacoso",
        "doxxing",
        "ciberdifamacion",
        "stalking",
        "ciberextorsion",
        "explotacion",
        "cyberflashing",
        "deepfake",
        "clonacion",
    ]
]

In [None]:
porcentaje_parentesco_sexo = pd.concat(lista_parentesco_sexo)

In [None]:
porcentaje_parentesco_sexo.Violencia.replace(violencias_nombres, inplace=True)

In [None]:
porcentaje_parentesco_sexo.reset_index(drop=True, inplace=True)

In [None]:
fig = px.bar(
    porcentaje_parentesco_sexo,
    x="Parentesco",
    y="count",
    color="Sexo",
    barmode="group",
    facet_col="Violencia",
    facet_col_wrap=2,
    color_discrete_map={"Mujer": "rgb(149, 27, 129)", "Hombre": "rgb(57, 105, 172)"},
    width=1000,
    height=1500,
    text_auto=True,
)
fig.update_layout(
    title="Sexo del agresor(a) y parentesco con la víctima por tipo de violencia",
    legend_title="Sexo del agresor(a)",
    font=dict(
        family="Arial",
        size=14,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    texttemplate="%{value} %",
)
fig.for_each_annotation(lambda a: a.update(text=a.text.split("=")[-1]))
fig.for_each_yaxis(lambda y: y.update(title=""))
fig.add_annotation(
    x=-0.07,
    y=0.5,
    text="% de incidencias",
    textangle=-90,
    xref="paper",
    yref="paper",
)
fig.show()
fig.write_image("img/violencia_parentesco_sexo.png")

In [None]:
tbl_parentesco_sexo = (
    pd.concat(
        lista_sexo,
        join="outer",
        keys=[
            "identidad",
            "ciberacoso",
            "doxxing",
            "ciberdifamacion",
            "stalking",
            "ciberextorsion",
            "explotacion",
            "cyberflashing",
            "deepfake",
            "clonacion",
        ],
        axis=1,
    )
    .fillna(0)
    .sort_index(level=0)
    .T
)

#### Sexo del agresor(a) y parentesco con la víctima por tipo de violencia: individual

In [None]:
sp_df = []
for i in lista_parentesco_sexo:
    df = i.pivot(index="Parentesco", columns="Sexo", values="count").fillna(0)
    df.Hombre = df.Hombre * -1
    sp_df.append(df)

In [None]:
for i, j in zip(sp_df, lista_parentesco_sexo):
    v = j.Violencia[1]
    if len(i.columns) < 2:
        print(v, "Son solo hombres")
    else:
        if v in violencias_nombres.keys():
            # Creating instance of the figure
            fig = go.Figure()

            # Adding Male data to the figure
            fig.add_trace(
                go.Bar(
                    y=i.index,
                    x=i.Hombre,
                    name="Hombre",
                    orientation="h",
                    text=-1 * i.Hombre.values.astype("float"),
                    marker_color="rgb(57, 105, 172)",
                )
            )

            # Adding Female data to the figure
            fig.add_trace(
                go.Bar(
                    y=i.index,
                    x=i.Mujer,
                    name="Mujer",
                    orientation="h",
                    text=i.Mujer,
                    marker_color="rgb(149, 27, 129)",
                )
            )

            # Updating the layout for our graph
            fig.update_layout(
                title=" ".join(
                    [
                        "Sexo del agresor(a) y parentesco con la víctima de",
                        violencias_nombres[v].casefold(),
                    ]
                ),
                legend_title="Sexo del agresor",
                title_font_size=22,
                barmode="relative",
                bargap=0.0,
                bargroupgap=0.5,
                xaxis=dict(
                    title="% de Mujeres",
                    title_font_size=14,
                    tickvals=[-100, -50, 0, 0, 50, 100],
                    ticktext=["100", "50", "0", "0", "50", "100"],
                ),
                width=1500,
                height=600,
                margin=dict(l=30),
                font=dict(
                    family="Arial",
                    size=18,
                    color="black",
                ),
            )
            fig.update_traces(
                textfont_size=10,
                textangle=0,
                textposition="outside",
                cliponaxis=False,
                texttemplate="%{text: 4}%",
            )
            fig.show()
            fig.write_image("".join(["img/piramide_", v, ".png"]))

In [None]:
veces_violencias = [s for s in list(datos.columns) if "veces_" in s]

In [None]:
violencias_6 = [s for s in list(datos.columns) if "6_" in s]

In [None]:
r_inf = []
r_sup = []
for i in datos["edad"]:
    if i == "Más de 60":
        r_inf.append(60)
        r_sup.append(100)
    else:
        r_inf.append(int(i.split("-")[0]))
        r_sup.append(int(i.split("-")[1]))

#### Violencias por ocupación

In [None]:
dict_violencias_ocupaciones = {}
for i in violencias:
    df = datos.query(f"{i} == 1 and ocupacion != 'Otra'")["ocupacion"].value_counts()
    df = round(df[:10] / df.sum() * 100, 2)
    dict_violencias_ocupaciones[violencias_nombres[i]] = df

In [None]:
tbl_vo = pd.DataFrame.from_dict(dict_violencias_ocupaciones, orient="index").fillna(0)

In [None]:
fig = px.bar(
    tbl_vo.sort_values("Abogado(a)"),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Bold,
    width=1500,
    height=800,
)
fig.update_layout(
    title="Ocupaciones más frecuentes por violencia sufrida",
    xaxis_title="% de mujeres",
    yaxis_title="Violencia",
    legend_title="Ocupaciones",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)

fig.show()
fig.write_image("img/violencia_ocupacion.png")

#### Violencias por estados

In [None]:
for i in violencias:
    df_ = datos.query(f"{i} == 1")["estado"].value_counts()
    df = df_ / df_.sum() * 100

    lista_valores = []
    for j in df_mapa.ESTADO:
        if j in df.index:
            lista_valores.append(df.loc[j])
        else:
            lista_valores.append(0)
    df_mapa[violencias_nombres[i]] = lista_valores

In [None]:
tbl_violencia_estado = df_mapa.drop(columns="Mujeres")

In [None]:
tbl_ve = (
    pd.melt(
        tbl_violencia_estado,
        id_vars=["ESTADO"],
        value_vars=[violencias_nombres[s] for s in violencias_nombres.keys()],
        var_name="violencia",
        value_name="porcentaje",
    )
    .pivot(index="violencia", columns="ESTADO", values="porcentaje")
    .sort_index(axis=0)
)

In [None]:
fig = px.bar(
    tbl_ve.sort_index(axis=1),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Bold,
    width=1500,
    height=800,
)
fig.update_layout(
    title="Ubicación de las víctimas por violencia sufrida",
    xaxis_title="% de mujeres",
    yaxis_title="Violencia",
    legend_title="Estado",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)

fig.show()
fig.write_image("img/violencia_estado.png")

#### Promedio de incidencias

In [None]:
round(
    (tbl_numero_violencia.index * tbl_numero_violencia["count"]).sum()
    / tbl_numero_violencia.sum().iloc[0],
    3,
)

En promedio una mujer es víctima de 3 violencias.

#### Cantidad de veces en que la víctima reporta haber sufrido la violencia

In [None]:
repeticiones = []
for j in [i for i in list(vars().keys()) if "frecuencia_" in i]:
    df = vars()[j][2].rename(columns={"count": fg.violencias_names[j.split("_")[1]]})
    df.rename(index={"Sólo una vez": "Solo una vez"}, inplace=True)
    repeticiones.append(df)

In [None]:
tbl_repeticiones = pd.concat(repeticiones, axis=1).fillna(0).T

In [None]:
fig = px.bar(
    tbl_repeticiones.sort_values("Solo una vez"),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Bold,
    width=1500,
    height=800,
)
fig.update_layout(
    title="Cantidad de veces que la víctima reporta haber sufrido la violencia",
    xaxis_title="% de mujeres",
    yaxis_title="Violencia",
    legend_title="Frecuencias",
    font=dict(
        family="Arial",
        size=14,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    cliponaxis=False,
    marker_line_color="white",
    texttemplate="%{value: 4} %",
)
fig.show()
fig.write_image("img/repeticiones_violencia.png")

#### Patrón de uso de aplicaciones por tipo de violencias y según medio más frecuente por el que ocurrió

In [None]:
dict_medios_medios = {}
medio_frecuente = []
for i in violencias:
    df = datos.query(f"{i} == 1")
    variable = [s for s in df.columns if "".join(["medio_", i]) in s]
    start_cols = list(range(23, 40))
    var_idx = df.columns.get_loc(variable[0])
    end_col = df.columns.get_loc("".join(["otraR_", i]))

    # concatenar rangos de columnas con np.r_[]
    col_range = np.r_[start_cols, var_idx + 1 : end_col]

    # seleccionar las columnas del DataFrame
    info = df.iloc[:, col_range]

    # Cálculo del valor máximo en el medio de la violencia
    medio_mas_freq = info.loc[:, "".join(["twitter_", i]) :].sum().astype(int).idxmax()
    medio_frecuente.append(medio_mas_freq.split("_")[0])

    df_medios = info.query(f"{medio_mas_freq} == 1")[redes]

    dicts = {}
    for red_app in redes:
        dicts[red_app.capitalize()] = (
            df_medios[[red_app]]
            .value_counts()
            .reset_index()
            .set_index(red_app)["count"]
        )

    aplicaciones = pd.DataFrame.from_dict(dicts, orient="index").fillna(0)

    dict_medios_medios[violencias_nombres[i]] = round(aplicaciones / len(df) * 100, 2)

In [None]:
for i, j in zip(dict_medios_medios.keys(), medio_frecuente):
    fig = px.bar(
        dict_medios_medios[i].sort_values("No la utilizo"),
        orientation="v",
        barmode="group",
        color_discrete_sequence=px.colors.qualitative.Bold,
        width=1500,
        height=800,
    )
    fig.update_layout(
        title=f"Patrón de uso de aplicaciones para {i.casefold()} sufrida por {j} ",
        yaxis_title="% de mujeres",
        xaxis_title="Aplicación o red social",
        legend_title="Frecuencia de uso",
        font=dict(
            family="Arial",
            size=18,
            color="black",
        ),
    )
    fig.update_traces(
        textfont_size=18,
        textangle=0,
        textposition="outside",
        cliponaxis=False,
        texttemplate="%{value: 4}%",
    )
    fig.show()
    fig.write_image(f"img/apps{i[:8]}.png")

#### Víctimas y conocimiento del nombre de la violencia que sufrieron

In [None]:
dict_conocimiento_frecuencia = {}
for i in violencias:
    df = datos.query(f"{i} == 1")["vdbg"].value_counts()
    dict_conocimiento_frecuencia[violencias_nombres[i]] = round(df / df.sum() * 100, 2)

In [None]:
df_victima_conocimiento = pd.DataFrame.from_dict(
    dict_conocimiento_frecuencia, orient="index"
).fillna(0)

df_victima_conocimiento.columns.name = "Conocimiento del nombre de la violencia"

df_victima_conocimiento

Esta tabla contiene la información de las mujeres que sufrieron las violencias y se compara con la respuesta de si conoce o no el nombre.

In [None]:
# data = pd.read_pickle("vdbg_final.pkl")

data = pd.read_csv("datos_final.csv", index_col=0)

In [None]:
parentesco_lista = [
    s for s in list(data.columns) if "parentesco_" in s or "identificacion_" in s
]

In [None]:
data.loc[:, parentesco_lista] = data[parentesco_lista].astype("category")

In [None]:
data.edad = data.edad.astype("category").cat.set_categories(
    ["14-17", "18-25", "26-40", "41-60", "Más de 60"], ordered=True
)

Los siguientes resultados corresponden a los 21 **hombres** que respondieron la encuesta.

In [None]:
data.horas_internet = data.horas_internet.astype("category").cat.set_categories(
    [
        "No lo utilizo diariamente",
        "Menos de 2 horas",
        "2-4 horas",
        "5-7 horas",
        "Más de 7 horas",
    ],
    ordered=True,
)

{{< pagebreak >}}

## Resultados para los hombres

{{< pagebreak >}}

In [None]:
del data

In [None]:
# data = pd.read_pickle("vdbg_final.pkl")

data = pd.read_csv("datos_final.csv", index_col=0)

In [None]:
parentesco_lista = [
    s for s in list(data.columns) if "parentesco_" in s or "identificacion_" in s
]

In [None]:
data.loc[:, parentesco_lista] = data[parentesco_lista].astype("category")

In [None]:
data.edad = data.edad.astype("category").cat.set_categories(
    ["14-17", "18-25", "26-40", "41-60", "Más de 60"], ordered=True
)

In [None]:
data.horas_internet = data.horas_internet.astype("category").cat.set_categories(
    [
        "No lo utilizo diariamente",
        "Menos de 2 horas",
        "2-4 horas",
        "5-7 horas",
        "Más de 7 horas",
    ],
    ordered=True,
)

In [None]:
datos = data.query("sexo == 'Hombre'")

### Rangos de edad

In [None]:
tbl_edad = pd.DataFrame(datos.edad.value_counts()).sort_index()

In [None]:
tbl_edad_porcentaje = (
    round(tbl_edad / tbl_edad.sum() * 100, 2)["count"].astype(str) + " %"
)

In [None]:
fig = px.bar(tbl_edad, text=tbl_edad_porcentaje)
fig.update_layout(
    title="Rangos de edades",
    xaxis_title="Edades",
    yaxis_title="% de hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(157, 178, 191)",
    marker_line_color="white",
)
fig.show()
fig.write_image("img/hombres/edades.png");

### Respuestas por estados


In [None]:
serie_estados = datos.estado.value_counts()

In [None]:
fp = "./Estados_Venezuela/Estados_Venezuela.shp"
df_mapa = gpd.read_file(fp)

In [None]:
ls = []
for i in df_mapa.ESTADO:
    if i in serie_estados.index:
        ls.append(serie_estados.loc[i])
    else:
        ls.append(0)
df_mapa["Hombres"] = ls

In [None]:
df_mapa.plot(
    "Hombres",
    cmap="GnBu",
    categorical=True,
    edgecolor="black",
    legend=True,
    legend_kwds={"loc": "center left", "bbox_to_anchor": (1, 0.5), "fmt": "{:.0f}"},
);

In [None]:
informacion_estados = pd.DataFrame(serie_estados.sort_index())
informacion_estados["%"] = round(
    informacion_estados / informacion_estados.sum() * 100, 2
)
informacion_estados.rename_axis(index={"estado": "Estado"}, inplace=True)
informacion_estados.rename(columns={"count": "Nº de hombres"})

{{< pagebreak >}}{{< pagebreak >}}

### Ocupaciones de los hombres

#### Ocupaciones más comunes

In [None]:
df_ocupaciones = (
    pd.DataFrame(datos.ocupacion.value_counts())
    .rename_axis(index={"ocupacion": "Ocupación"})
    .rename(columns={"count": "Nº de hombres"})
)
df_ocupaciones["%"] = round(df_ocupaciones / len(datos) * 100, 2)
df_ocupaciones.drop("Otra")[:10]

En "otros" hay 2 respuestas, que se dividen de la siguiente manera:

In [None]:
pd.DataFrame(datos.ocupacionO.value_counts()).rename_axis(
    index={"ocupacionO": "Ocupación"}
).rename(columns={"count": "N° de hombres"})

### Horas de uso de internet

In [None]:
tbl_uso_internet = pd.DataFrame(datos.horas_internet.value_counts().sort_index())

In [None]:
tbl_uso_porcentaje = (
    round(tbl_uso_internet / tbl_uso_internet.sum() * 100, 2)["count"].astype(str)
    + " %"
)

In [None]:
fig = px.bar(tbl_uso_internet, text=tbl_uso_porcentaje)
fig.update_layout(
    title="Uso de internet por rangos de tiempo",
    xaxis_title="Tiempo",
    yaxis_title="% de hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(39, 55, 77)",
    marker_line_color="white",
)
fig.show()
fig.write_image("img/hombres/uso_internet.png")

### Principales usos de internet

In [None]:
tbl_usos = pd.DataFrame(
    datos[
        [
            "uso_familia",
            "uso_trabajo",
            "uso_venta",
            "uso_distraer",
            "uso_estudiar",
            "uso_banco",
            "uso_otra",
            "uso_peli",
            "uso_noticias",
        ]
    ].sum()
)

In [None]:
tbl_usos.index = [
    "Comunicarme con familiares y amigos/as",
    "Trabajar",
    "Vender productos",
    "Distraerme",
    "Estudiar o investigar",
    "Realizar operaciones bancarias",
    "Otras actividades",
    "Ver películas y/o series",
    "Ver noticias",
]

In [None]:
tbl_usos_porcentaje = pd.DataFrame(
    round(tbl_usos / tbl_usos.sum() * 100, 2)[0].astype(str) + " %"
)

In [None]:
tbl_usos_concat = pd.concat(
    [tbl_usos, tbl_usos_porcentaje.rename(columns={0: "p"})], axis=1
).sort_values(0)

In [None]:
fig = px.bar(tbl_usos_concat[0], text=tbl_usos_concat.p)
fig.update_layout(
    title="Usos de internet",
    xaxis_title="Actividades",
    yaxis_title="% de hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=900,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(39, 55, 77)",
    marker_line_color="white",
)
fig.show()
fig.write_image("img/hombres/usos_internet.png")

En el caso de la respuesta "Otras actividades", se desglosa de la siguiente manera:

In [None]:
pd.DataFrame(datos.uso_otraR.value_counts()).rename_axis(
    index={"uso_otraR": "Otros usos de internet"}
).rename(columns={"count": "Nº de hombres"})

### Aumento de uso de internet por Covid19

In [None]:
tbl_covid_aumento = datos.covid_aumento.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_covid_aumento.index, values=tbl_covid_aumento)])
fig.update_layout(
    title_text="Aumento del uso de internet",
    legend_title="¿Has aumentado tu tiempo de <br> conexión a internet?",
    font=dict(family="Arial", size=18, color="black"),
    width=1500,
    height=800,
)
fig.update_traces(
    marker=dict(
        colors=["rgb(39, 55, 77)", "rgb(82, 109, 130)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/hombres/covid.png")

### Uso de redes sociales/aplicaciones

In [None]:
datos.loc[:, "telegram"] = datos.telegram.apply(str.strip)

In [None]:
redes = [
    "facebook",
    "twitter",
    "instagram",
    "tiktok",
    "discord",
    "slack",
    "citas",
    "videojuegos",
    "whatsapp",
    "telegram",
    "reddit",
    "estudio",
    "linkedin",
    "twich",
    "youtube",
    "pinterest",
    "flickr",
]

dicts = {}
for i in redes:
    dicts[i.capitalize()] = (
        datos[[i]].value_counts().reset_index().set_index(i)["count"]
    )

In [None]:
tbl_aplicaciones = round(
    pd.DataFrame.from_dict(dicts, orient="index").fillna(0)[
        [
            "Menos de 2 horas",
            "2-4 horas",
            "5-7 horas",
            "Más de 7 horas",
            "No la utilizo",
        ]
    ]
    / len(datos)
    * 100,
    2,
)

In [None]:
fig = px.bar(
    tbl_aplicaciones.sort_values("No la utilizo"),
    orientation="h",
    color_discrete_sequence=[
        "rgb(39, 55, 77)",
        "rgb(82, 109, 130)",
        "rgb(102, 102, 102)",
        "rgb(157, 178, 191)",
        "rgb(221, 230, 237)",
    ],
    width=1500,
    height=800,
)
fig.update_layout(
    title="Uso de aplicaciones/redes sociales",
    xaxis_title="% de hombres",
    yaxis_title="Aplicación/red social",
    legend_title="Horas de uso diario",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)

fig.show()
fig.write_image("img/hombres/uso_apps.png")

### Incidencia de violencias

In [None]:
violencias_nombres = {
    "identidad": "Duplicación de identidad",
    "ciberacoso": "Ciberacoso",
    "doxxing": "Doxxing",
    "mobbing": "Mobbing",
    "ciberdifamacion": "Ciberdifamación",
    "stalking": "Cibervigilancia (stalking)",
    "ciberextorsion": "Ciberextorsión",
    "grooming": "Grooming",
    "phishing_vs": "Phishing/Vishing/Smishing",
    "trata": "Trata de personas en línea",
    "explotacion": "Captación con fines de explotación sexual",
    "exclusion": "Exclusión digital",
    "cyberflashing": "Cyberflashing",
    "deepfake": "Deepfake",
    "clonacion": "Clonación de aplicaciones",
}

In [None]:
violencias = list(violencias_nombres.keys())

In [None]:
dic = {}
for i in violencias:
    datos.loc[:, i] = datos[i].apply(str.strip).apply(str.capitalize)
    dic[violencias_nombres[i]] = datos[[i]].value_counts().sort_index()

In [None]:
tbl_sufrio = pd.DataFrame.from_dict(dic, orient="index").fillna(0)

In [None]:
tbl_sufrio = tbl_sufrio.set_axis(["No", "Sí"], axis=1)

In [None]:
sufrio_porcentaje = round(tbl_sufrio / len(datos) * 100, 2)

In [None]:
fig = px.bar(
    sufrio_porcentaje[["Sí", "No"]].sort_values("Sí"),
    orientation="h",
    text_auto=True,
    color_discrete_map={"Sí": "rgb(39, 55, 77)", "No": "rgb(82, 109, 130)"},
    width=1500,
    height=800,
)
fig.update_layout(
    title="Incidencia de violencias",
    yaxis_title="Violencia",
    xaxis_title="% de hombres",
    legend_title="¿Sufrió la violencia?",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    cliponaxis=False,
    marker_line_color="white",
    texttemplate="%{value: 4} %",
)
fig.show()
fig.write_image("img/hombres/incidencia.png")

In [None]:
for i in violencias:
    datos.loc[:, i].replace(
        [
            "No",
            "Sí",
        ],
        [0, 1],
        inplace=True,
    )

In [None]:
tbl_numero_violencia = pd.DataFrame(
    datos[violencias].T.sum().value_counts()
).sort_index()
tbl_violencia_porcentaje = round(tbl_numero_violencia / len(datos) * 100, 2)

In [None]:
tbl_violencia_porcentaje.index = tbl_violencia_porcentaje.index.astype("string")

In [None]:
fig = px.bar(
    tbl_violencia_porcentaje,
    text_auto=True,
)
fig.update_layout(
    title="Cantidad de violencias sufridas",
    xaxis_title="Nº de violencias sufridas",
    yaxis_title="% de hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
    width=1500,
    height=800,
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_line_color="white",
    marker_color="rgb(39, 55, 77)",
    texttemplate="%{value}%",
)
fig.show()
fig.write_image("img/hombres/numero_violencia.png")

In [None]:
dic_violencias = {}
for i in violencias:
    dic_violencias[i] = [s for s in list(datos.columns)[:-32] if i in s]

#### Resultados para los casos de duplicación de identidad

In [None]:
tbl_identidad = datos.query("identidad == 1")[dic_violencias["identidad"]]

In [None]:
print(
    f"Se han reportado {tbl_identidad.iloc[:, 0].sum()} casos de duplicación de identidad."
)

In [None]:
frecuencia_identidad = fg.grafico_frecuencia(tbl_identidad, "M")

In [None]:
temporalidad_identidad = fg.grafico_temporalidad(tbl_identidad, "H")

In [None]:
edad_identidad = fg.grafico_edad(tbl_identidad, "Hombre")

In [None]:
parentesco_identidad = fg.grafico_parentesco(tbl_identidad, "H")

In [None]:
sexo_identidad = fg.grafico_sexo_parentesco(tbl_identidad, "H")

In [None]:
medios_identidad = fg.grafico_medios(tbl_identidad, "H")[2]

#### Resultados para los casos de ciberacoso

In [None]:
tbl_ciberacoso = datos.query("ciberacoso == 1")[dic_violencias["ciberacoso"]]

In [None]:
print(f"Se han reportado {tbl_ciberacoso.iloc[:, 0].sum()} casos de ciberacoso.")

In [None]:
frecuencia_ciberacoso = fg.grafico_frecuencia(tbl_ciberacoso, "H")

In [None]:
temporalidad_ciberacoso = fg.grafico_temporalidad(tbl_ciberacoso, "H")

In [None]:
edad_ciberacoso = fg.grafico_edad(tbl_ciberacoso, "H")

In [None]:
parentesco_ciberacoso = fg.grafico_parentesco(tbl_ciberacoso, "H")

In [None]:
sexo_ciberacoso = fg.grafico_sexo_parentesco(tbl_ciberacoso, "H")

In [None]:
medios_ciberacoso = fg.grafico_medios(tbl_ciberacoso, "H")[2]

#### Resultados para los casos de doxxing

In [None]:
tbl_doxxing = datos.query("doxxing == 1")[dic_violencias["doxxing"]]

In [None]:
print(f"Se han reportado {tbl_doxxing.iloc[:, 0].sum()} casos de doxxing.")

In [None]:
frecuencia_doxxing = fg.grafico_frecuencia(tbl_doxxing, "H")

In [None]:
temporalidad_doxxing = fg.grafico_temporalidad(tbl_doxxing, "H")

In [None]:
edad_doxxing = fg.grafico_edad(tbl_doxxing, "H")

In [None]:
parentesco_doxxing = fg.grafico_parentesco(tbl_doxxing, "H")

In [None]:
sexo_doxxing = fg.grafico_sexo_parentesco(tbl_doxxing, "H")

In [None]:
medios_doxxing = fg.grafico_medios(tbl_doxxing, "H")[2]

In [None]:
pd.DataFrame(tbl_doxxing.otraR_doxxing.value_counts()).rename_axis(
    index={"otraR_doxxing": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de hombres"})

#### Resultados para los casos de mobbing

In [None]:
tbl_mobbing = datos.query("mobbing == 1")[dic_violencias["mobbing"]]

In [None]:
print(f"Se han reportado {tbl_mobbing.iloc[:, 0].sum()} casos de mobbing")

In [None]:
frecuencia_mobbing = fg.grafico_frecuencia(tbl_mobbing, "H")

In [None]:
temporalidad_mobbing = fg.grafico_temporalidad(tbl_mobbing, "H")

In [None]:
edad_mobbing = fg.grafico_edad(tbl_mobbing, "H")

In [None]:
parentesco_mobbing = fg.grafico_parentesco(tbl_mobbing, "H")

In [None]:
sexo_mobbing = fg.grafico_sexo_parentesco(tbl_mobbing, "H")

In [None]:
medios_mobbing = fg.grafico_medios(tbl_mobbing, "H")[2]

#### Resultados para los casos de ciberdifamación

In [None]:
tbl_ciberdifamacion = datos.query("ciberdifamacion == 1")[
    dic_violencias["ciberdifamacion"]
]

In [None]:
print(
    f"Se han reportado {tbl_ciberdifamacion.iloc[:, 0].sum()} casos de ciberdifamación."
)

In [None]:
frecuencia_ciberdifamacion = fg.grafico_frecuencia(tbl_ciberdifamacion, "H")

In [None]:
temporalidad_ciberdifamacion = fg.grafico_temporalidad(tbl_ciberdifamacion, "H")

In [None]:
edad_ciberdifamacion = fg.grafico_edad(tbl_ciberdifamacion, "H")

In [None]:
parentesco_ciberdifamacion = fg.grafico_parentesco(tbl_ciberdifamacion, "H")

In [None]:
sexo_ciberdifamacion = fg.grafico_sexo_parentesco(tbl_ciberdifamacion, "H")

In [None]:
medios_ciberdifamacion = fg.grafico_medios(tbl_ciberdifamacion, "H")[2]

#### Resultados para los casos de cibervigilancia (stalking)

In [None]:
tbl_stalking = datos.query("stalking == 1")[dic_violencias["stalking"]]

In [None]:
print(
    f"Se han reportado {tbl_stalking.iloc[:, 0].sum()} casos de cibervigilancia (stalking)."
)

In [None]:
frecuencia_stalking = fg.grafico_frecuencia(tbl_stalking, "H")

In [None]:
temporalidad_stalking = fg.grafico_temporalidad(tbl_stalking, "H")

In [None]:
edad_stalking = fg.grafico_edad(tbl_stalking, "H")

In [None]:
parentesco_stalking = fg.grafico_parentesco(tbl_stalking, "H")

In [None]:
sexo_stalking = fg.grafico_sexo_parentesco(tbl_stalking, "H")

In [None]:
medios_stalking = fg.grafico_medios(tbl_stalking, "H")[2]

#### Resultados para los casos de ciberextorsión

In [None]:
tbl_ciberextorsion = datos.query("ciberextorsion == 1")[
    dic_violencias["ciberextorsion"]
]

In [None]:
print(
    f"Se han reportado {tbl_ciberextorsion.iloc[:, 0].sum()} casos de ciberextorsión."
)

In [None]:
frecuencia_ciberextorsion = fg.grafico_frecuencia(tbl_ciberextorsion, "H")

In [None]:
temporalidad_ciberextorsion = fg.grafico_temporalidad(tbl_ciberextorsion, "H")

In [None]:
edad_ciberextorsion = fg.grafico_edad(tbl_ciberextorsion, "H")

In [None]:
parentesco_ciberextorsion = fg.grafico_parentesco(tbl_ciberextorsion, "H")

In [None]:
sexo_ciberextorsion = fg.grafico_sexo_parentesco(tbl_ciberextorsion, "H")

In [None]:
medios_ciberextorsion = fg.grafico_medios(tbl_ciberextorsion, "H")[2]

#### Resultados para los casos de grooming

In [None]:
tbl_grooming = datos.query("grooming == 1")[dic_violencias["grooming"]]

In [None]:
print(f"Se han reportado {tbl_grooming.iloc[:, 0].sum()} casos de grooming.")

In [None]:
frecuencia_grooming = fg.grafico_frecuencia(tbl_grooming, "H")

In [None]:
temporalidad_grooming = fg.grafico_temporalidad(tbl_grooming, "H")

In [None]:
edad_grooming = fg.grafico_edad(tbl_grooming, "H")

In [None]:
parentesco_grooming = fg.grafico_parentesco(tbl_grooming, "H")

In [None]:
sexo_grooming = fg.grafico_sexo_parentesco(tbl_grooming, "H")

In [None]:
medios_grooming = fg.grafico_medios(tbl_grooming, "H")[2]

In [None]:
pd.DataFrame(tbl_grooming.otraR_grooming.value_counts()).rename_axis(
    index={"otraR_grooming": "Otras aplicaciones o redes sociales"}
).rename(columns={"count": "N° de hombres"})

#### Resultados para los casos de los casos de phishing/vishing/smishing

In [None]:
tbl_phishing_vs = datos.query("phishing_vs == 1")[dic_violencias["phishing_vs"]]

In [None]:
print(
    f"Se han reportado {tbl_phishing_vs.iloc[:, 0].sum()} casos de phishing/vishing/smishing."
)

In [None]:
frecuencia_phishing_vs = fg.grafico_frecuencia(tbl_phishing_vs, "H")

In [None]:
temporalidad_phishing_vs = fg.grafico_temporalidad(tbl_phishing_vs, "H")

In [None]:
edad_phishing_vs = fg.grafico_edad(tbl_phishing_vs, "H")

In [None]:
parentesco_phishing_vs = fg.grafico_parentesco(tbl_phishing_vs, "H")

In [None]:
sexo_phishing_vs = fg.grafico_sexo_parentesco(tbl_phishing_vs, "H")

In [None]:
medios_phishing_vs = fg.grafico_medios(tbl_phishing_vs, "H")[2]

#### Resultados para los casos de trata

In [None]:
for i in datos.query("otraR_trata == 'Instagram '").index:
    datos.loc[i, "instagram_trata"] = True

In [None]:
tbl_trata = datos.query("trata == 1")[dic_violencias["trata"]]

In [None]:
print(
    f"Se han reportado {tbl_trata.iloc[:, 0].sum()} casos de trata de persona en línea."
)

In [None]:
frecuencia_trata = fg.grafico_frecuencia(tbl_trata, "H")

In [None]:
temporalidad_trata = fg.grafico_temporalidad(tbl_trata, "H")

In [None]:
edad_trata = fg.grafico_edad(tbl_trata, "H")

In [None]:
parentesco_trata = fg.grafico_parentesco(tbl_trata, "H")

In [None]:
medios_trata = fg.grafico_medios(tbl_trata, "H")[2]

#### Resultados para los casos de exclusión

In [None]:
tbl_exclusion = datos.query("exclusion == 1")[dic_violencias["exclusion"]]

In [None]:
print(
    f"Se han reportado {tbl_exclusion.iloc[:, 0].sum()} víctimas de exclusión digital."
)

In [None]:
frecuencia_exclusion = fg.grafico_frecuencia(tbl_exclusion, "H")

In [None]:
temporalidad_exclusion = fg.grafico_temporalidad(tbl_exclusion, "H")

In [None]:
edad_exclusion = fg.grafico_edad(tbl_exclusion, "H")

Para exclusión no se pregunto por agresor.

In [None]:
medios_exclusion = fg.grafico_medios(tbl_exclusion, "H")[2]

#### Resultados para los casos de cyberflashing

In [None]:
tbl_cyberflashing = datos.query("cyberflashing == 1")[dic_violencias["cyberflashing"]]

In [None]:
print(f"Se han reportado {tbl_cyberflashing.iloc[:, 0].sum()} casos de cyberflashing")

In [None]:
frecuencia_cyberflashing = fg.grafico_frecuencia(tbl_cyberflashing, "H")

In [None]:
temporalidad_cyberflashing = fg.grafico_temporalidad(tbl_cyberflashing, "H")

In [None]:
edad_cyberflashing = fg.grafico_edad(tbl_cyberflashing, "H")

In [None]:
parentesco_cyberflashing = fg.grafico_parentesco(tbl_cyberflashing, "H")

In [None]:
medios_cyberflashing = fg.grafico_medios(tbl_cyberflashing, "H")[2]

#### Resultados para los casos de clonación de aplicaciones

In [None]:
tbl_clonacion = datos.query("clonacion == 1")[dic_violencias["clonacion"]]

In [None]:
print(
    f"Se han reportado {tbl_clonacion.iloc[:, 0].sum()} casos de clonación de aplicaciones"
)

In [None]:
frecuencia_clonacion = fg.grafico_frecuencia(tbl_clonacion, "H")

In [None]:
temporalidad_clonacion = fg.grafico_temporalidad(tbl_clonacion, "H")

In [None]:
edad_clonacion = fg.grafico_edad(tbl_clonacion, "H")

In [None]:
parentesco_clonacion = fg.grafico_parentesco(tbl_clonacion, "H")

In [None]:
medios_clonacion = fg.grafico_medios(tbl_clonacion, "H")[2]

### Conocimiento sobre violencia digital basada en género

In [None]:
tbl_vdbg = datos.vdbg.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_vdbg.index, values=tbl_vdbg)])
fig.update_layout(
    title_text="Conocimiento de VDBG",
    legend_title="¿Habías escuchado antes el término <br> Violencia Digital Basada en Género?",
    font=dict(family="Arial", size=18, color="black"),
)
fig.update_traces(
    marker=dict(
        colors=["rgb(39, 55, 77)", "rgb(82, 109, 130)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/hombres/vdbg.png")

In [None]:
vdbg_violencias = [s for s in list(datos.columns) if "vdbg_" in s]

In [None]:
con_violencia = pd.DataFrame(
    datos.query("vdbg == 'Sí'")[vdbg_violencias[1:]].T.sum().value_counts()
)
con_violencia.index.name = "Nº de violencias conocidas"
con_violencia["%"] = round(con_violencia / len(datos) * 100, 2)
con_violencia.rename(columns={"count": "Cantidad de hombres"}).sort_index()

In [None]:
tbl_conocimiento_violencia = pd.DataFrame(datos[vdbg_violencias[1:]].sum())
tbl_conocimiento_violencia.index = violencias
tbl_conocimiento_violencia.rename(
    index=violencias_nombres, columns={0: "cantidad"}, inplace=True
)
tbl_conocimiento_violencia = round(tbl_conocimiento_violencia / len(datos) * 100, 2)

In [None]:
fig = px.bar(
    tbl_conocimiento_violencia.sort_values("cantidad", ascending=False),
    y="cantidad",
    x=tbl_conocimiento_violencia.index,
    text_auto=True,
)
fig.update_layout(
    title="Conocimiento de la violencia",
    xaxis_title="Violencia",
    yaxis_title="% de hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(82, 109, 130)",
    marker_line_color="white",
    texttemplate="%{value: .4} %",
)
fig.show()
fig.write_image("img/hombres/conocimiento_violencia.png")

### Reacciones de las víctimas al sufrir la(s) violencia(s)

In [None]:
reacciones = [s for s in list(datos.columns) if "reaccion_" in s]

In [None]:
tbl_reacciones = round(pd.DataFrame(datos[reacciones].sum() / len(datos) * 100), 2)

In [None]:
tbl_reacciones.rename(
    index={
        "reaccion_ignorar": "Ignoraron al agresor",
        "reaccion_contar": "Le contaron a un amigo(a) o familiar",
        "reaccion_ayuda": "Acudieron a un centro de ayuda o denuncia",
        "reaccion_reportar": "Reportaron el perfil o publicación en la red social",
        "reaccion_internet": "Redujeron el uso en internet",
        "reaccion_borrar": "Borraron la aplicación donde ocurrió",
        "reaccion_eliminar": "Eliminaron la cuenta de usuario",
        "reaccion_crear": "Crearon una cuenta de usuario distinta",
        "reaccion_bloquear": "Bloquearon a la persona agresora",
        "reaccion_enfrentar": "Enfrentaron a la persona agresora",
    },
    columns={0: "cantidad"},
    inplace=True,
)

In [None]:
fig = px.bar(
    tbl_reacciones.sort_values("cantidad", ascending=False),
    y=tbl_reacciones["cantidad"],
    x=tbl_reacciones.index,
    text_auto=True,
)
fig.update_layout(
    title="Reacción de la víctima al sufrir la(s) violencia(s)",
    xaxis_title="Violencia",
    yaxis_title="Nº de Hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(157, 178, 191)",
    marker_line_color="white",
    texttemplate="%{value: .4} %",
)
fig.show()
fig.write_image("img/hombres/reaccion_violencia.png")

### Conocimiento de víctimas

In [None]:
tbl_victima = datos.victima.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_victima.index, values=tbl_victima)])
fig.update_layout(
    title_text="Conocimiento de Víctimas",
    legend_title="¿Conoces a alguna mujer que haya <br> sido víctima de violencia digital?",
)
fig.update_traces(
    marker=dict(
        colors=["rgb(39, 55, 77)", "rgb(82, 109, 130)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/hombres/victima.png")

In [None]:
num_victimas = pd.DataFrame(datos.numero_victima.value_counts())

In [None]:
fig = px.bar(
    num_victimas.sort_index(),
    y=num_victimas.sort_index()["count"],
    x=num_victimas.sort_index().index.values,
    text=round(num_victimas.sort_index() / len(datos) * 100, 2)["count"],
)
fig.update_layout(
    title="Cantidad de víctimas conocidas",
    xaxis_title="Nº de victimas",
    yaxis_title="% de hombres",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    showlegend=False,
    marker_color="rgb(82, 109, 130)",
    marker_line_color="white",
    texttemplate="%{text: .4} %",
)
fig.show()
fig.write_image("img/hombres/num_victimas.png")

### Conocimiento de leyes y normas

In [None]:
tbl_leyes = datos.leyes_normas.value_counts()

In [None]:
fig = go.Figure(data=[go.Pie(labels=tbl_leyes.index, values=tbl_leyes)])
fig.update_layout(
    title_text="Conocimiento de Leyes y Normas",
    legend_title="¿Conoces leyes o normativas en el país <br> que contemplan las violencias digitales?",
)
fig.update_traces(
    marker=dict(
        colors=["rgb(39, 55, 77)", "rgb(82, 109, 130)"],
        line=dict(color="white", width=1),
    )
)
fig.show()
fig.write_image("img/hombres/ley.png")

### Interacciones entre ciertos ítems de la encuesta

#### Tipos de violencia y edad en que ocurrió por primera vez

In [None]:
edades_violencias = [s for s in list(datos.columns) if "edad_" in s]

In [None]:
lista_edades_violencias = []
for i in edades_violencias:
    j = (
        pd.cut(
            datos[edades_violencias].loc[:, i],
            bins=[0, 10, 15, 18, 25, 30, 40, 50, 60, 75],
            right=False,
        )
        .value_counts()
        .sort_index()
    )
    j = j.reset_index()
    for k in violencias_nombres.keys():
        if k in j.columns[0]:
            j["violencia"] = [violencias_nombres[k]] * len(j)
    j = j.rename(columns={j.columns[0]: "Edad"})
    lista_edades_violencias.append(j)

In [None]:
tbl_edades_primera_vez = pd.concat(lista_edades_violencias, join="inner").reset_index(
    drop=True
)

In [None]:
tbl_edades_primera_vez.Edad = tbl_edades_primera_vez.Edad.astype("str")

In [None]:
l_ = []
for i in lista_edades_violencias:
    j = round(i["count"] / i["count"].sum() * 100, 3)
    i["count"] = j
    l_.append(i)

In [None]:
edades_primera_vez = (
    pd.concat(l_, join="inner")
    .reset_index(drop=True)
    .rename_axis(columns={"violencia": "Violencia"})
)

In [None]:
edades_primera_vez.Edad = edades_primera_vez.Edad.astype("str")

In [None]:
fig = px.bar(
    edades_primera_vez,
    x="Edad",
    y="count",
    color="violencia",
    title="Tasa de incidencia por grupo etario según tipo de violencia",
    barmode="group",
    color_discrete_sequence=px.colors.qualitative.Prism_r,
    width=1200,
    height=600,
)
fig.update_yaxes(title="% de hombres")
fig.update_xaxes(
    title="Rangos de edad",
    labelalias={
        "[0, 10)": "0-9",
        "[10, 15)": "10-14",
        "[15, 18)": "15-17",
        "[18, 25)": "18-24",
        "[25, 30)": "24-29",
        "[30, 40)": "30-39",
        "[40, 50)": "40-49",
        "[50, 60)": "50-59",
        "[60, 75)": "60 y más",
    },
)
fig.show()
fig.write_image("img/violencia_edad2.png")

#### Tipo de violencia según el medio por el cual ocurrió

In [None]:
lista_medios_hombres = [s for s in list(vars()) if "medios_" in s]
ls_medios = []
for i in [s for s in list(vars()) if "medios_" in s]:
    df = vars()[i]
    ls_medios.append(df)

In [None]:
lista_df_medios_hombres = []
for df, i in zip(ls_medios, lista_medios):
    tbl = pd.DataFrame(df)
    if i.split("_")[1] in violencias_nombres.keys():
        l_violencia = [violencias_nombres[i.split("_")[1]]] * len(df)
    else:
        l_violencia = ["Phishing/Vishing/Smishing"] * len(df)
    tbl["violencia"] = l_violencia
    tbl.rename(columns={0: "cantidad"}, inplace=True)
    tbl.reset_index(inplace=True)
    tbl.rename(columns={"index": "Medio"}, inplace=True)
    lista_df_medios.append(tbl)

In [None]:
tbl_violencia_medio = pd.concat(lista_df_medios)

In [None]:
tbl_violencia_medio.reset_index(drop=True, inplace=True)

In [None]:
tbl_violencia_medio = tbl_violencia_medio.astype(
    {"cantidad": "float", "violencia": "str", "Medio": "str"}
)

In [None]:
fig = px.bar(
    tbl_violencia_medio.sort_values("cantidad", ascending=False),
    x="cantidad",
    y="violencia",
    color="Medio",
    title="Tipo de violencia según el medio por el cual ocurrió",
    barmode="stack",
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Antique_r,
    width=1600,
    height=600,
)
fig.update_yaxes(title="Violencia")
fig.update_xaxes(title="% de hombres")
fig.show()
fig.write_image("img/hombres/violencia_medio1.png")

#### Parentesco de la persona agresora con las mujeres que han sufrido violencias

In [None]:
lista_df_parentescos = [
    parentesco_identidad[2],
    parentesco_ciberacoso[2],
    parentesco_doxxing[2],
    parentesco_ciberdifamacion[2],
    parentesco_stalking[2],
    parentesco_ciberextorsion[2],
    parentesco_cyberflashing[2],
    parentesco_clonacion[2],
]

In [None]:
parentescos_ = [
    "identidad",
    "ciberacoso",
    "doxxing",
    "ciberdifamacion",
    "stalking",
    "ciberextorsion",
    "explotacion",
    "cyberflashing",
    "deepfake",
    "clonacion",
]

In [None]:
for i, j in zip(lista_df_parentescos, parentescos_):
    if j in violencias_nombres.keys():
        ls_index = [violencias_nombres[j]] * len(i)
    i["violencia"] = ls_index

In [None]:
tbl_parentesco_ = pd.concat(lista_df_parentescos)

In [None]:
tbl_parentesco_.reset_index(inplace=True)

In [None]:
fig = px.bar(
    tbl_parentesco_,
    x="violencia",
    y="count",
    color="parentesco",
    title="Parentesco del agresor con los hombres que han sufrido violencias",
    barmode="group",
    color_discrete_sequence=px.colors.qualitative.Prism_r,
    width=1200,
    height=600,
)
fig.update_layout(
    legend_title="Parentesco con el agresor(a):",
    font=dict(family="Arial", size=18, color="black"),
)
fig.update_xaxes(title="Violencia")
fig.update_yaxes(title="% de hombres")
fig.show()
fig.write_image("img/hombres/violencia_parentesco1.png")

NOTA: Para las siguientes violencias la pregunta sobre parentesco se reformulo a si logró o no identificar el agresor.

In [None]:
parentesco_violencia = tbl_parentesco_.pivot(
    index="violencia", columns="parentesco", values="count"
).fillna(0)

In [None]:
tbl_grooPt = (
    pd.concat(
        [parentesco_grooming[2], parentesco_phishing_vs[2], parentesco_trata[2]],
        axis=1,
        keys=["Grooming", "Phishing", "Trata"],
    )
    .T.reset_index(level=1, drop=True)
    .fillna(0)
)
tbl_grooPt

NOTA: Para mobbing la víctima por la naturaleza de la agresión conoce a su agresor(a).

In [None]:
tbl_parentesco_mobbing = parentesco_mobbing[1]

In [None]:
tbl_parentesco_mobbing.astype({"count": "int"}).rename_axis(
    index={"parentesco_mobbing": "Relación laboral"}
).rename(columns={"count": "N° de hombres"})

#### Identificación de la persona agresora

In [None]:
tbl_identificacion_si = round(
    pd.DataFrame(
        parentesco_violencia[
            [
                "Fue mi ex-pareja en ese momento",
                "Fue un compañero(a) de trabajo",
                "No conocía a quien me agredió, pero le identifiqué",
                "Teníamos una amistad",
            ]
        ].sum(1)
    ).rename(columns={0: "Sí"}),
    2,
)

In [None]:
tbl_identificacion_no = pd.DataFrame(
    parentesco_violencia["No le pude identificar"]
).rename(columns={"No le pude identificar": "No"})

In [None]:
tabla_identificacion = pd.concat(
    [tbl_identificacion_si.join(tbl_identificacion_no), tbl_grooPt]
)

In [None]:
porcentaje_identificacion = round(
    (tabla_identificacion.T / tabla_identificacion.sum(1) * 100).T, 2
).fillna(0)

In [None]:
fig = px.bar(
    porcentaje_identificacion,
    barmode="group",
    text_auto="True",
    color_discrete_map={"Sí": "rgb(39, 55, 77)", "No": "rgb(82, 109, 130)"},
    width=1200,
    height=600,
)
fig.update_layout(
    title="Identificación del agresor(a)",
    xaxis_title="Violencia",
    yaxis_title="% de hombres",
    legend_title="¿Identificó al agresor(a)?",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    texttemplate="%{value} %",
)

fig.show()
fig.write_image("img/hombres/id_agresor.png")

#### Sexo del agresor por tipo de violencia

In [None]:
variables_sexo = [
    "sexo_identidad",
    "sexo_ciberacoso",
    "sexo_doxxing",
    "sexo_mobbing",
    "sexo_ciberdifamacion",
    "sexo_stalking",
    "sexo_ciberextorsion",
    "sexo_grooming",
    "sexo_phishing_vs",
]

In [None]:
sexo_violencias = []
names_ = []
for i in variables_sexo:
    df = vars()[i]
    names_.append(df[1].index.name.split)
    sexo_violencias.append(df[1])

In [None]:
tbl_sexo_violencias = (
    pd.concat(
        sexo_violencias,
        join="outer",
        axis=1,
        keys=[
            "Duplicación de identidad",
            "Ciberacoso",
            "Doxxing",
            "Mobbing",
            "Ciberdifamación",
            "Cibervigilancia (stalking)",
            "Ciberextorsión",
            "Grooming",
            "Phishing/Vishing/Smishing",
            "Clonación",
        ],
    )
    .T.reset_index(1, drop=True)
    .fillna(0)
)

In [None]:
sexo_porcentaje = round((tbl_sexo_violencias.T / tbl_sexo_violencias.sum(1) * 100).T, 2)

In [None]:
fig = px.bar(
    sexo_porcentaje,
    barmode="group",
    color_discrete_sequence=[
        "rgb(39, 55, 77)",
        "rgb(82, 109, 130)",
        "rgb(157, 178, 191)",
    ],
    width=1200,
    height=600,
    text_auto=True,
)
fig.update_layout(
    title="Sexo del agresor por tipo de violencia",
    xaxis_title="Violencia",
    yaxis_title="% de hombres",
    legend_title="Sexo del agresor",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    texttemplate="%{value: } %",
)

fig.show()
fig.write_image("img/hombres/sexo_agresor_violencia.png")

In [None]:
cruce = porcentaje_identificacion.join(sexo_porcentaje)

In [None]:
cruce.columns = pd.MultiIndex.from_tuples(
    [
        ("Sí", "%"),
        ("No", "%"),
        ("Sí", "Mujer"),
        ("Sí", "Hombre"),
        ("Sí", "Un grupo de personas"),
    ]
)

In [None]:
variables = [
    s
    for s in tbl_identidad.columns
    if s.startswith("sexo_") or s.startswith("parentesco_")
]

In [None]:
lista = []
for j, k in zip(tbl_identidad[variables[0]], tbl_identidad[variables[1]]):
    if j != "No le pude identificar" and j != "No":
        lista.append((j, k))
df = pd.DataFrame(lista, columns=["Parentesco", "Sexo"]).value_counts()

In [None]:
dic_sexo = {}
for i in [s for s in violencias if s != "exclusion"]:
    lista = []
    g = datos.query(f"{i} == 1")
    for j, k in zip(g[dic_violencias[i][4]], g[dic_violencias[i][5]]):
        if j != "No le pude identificar" and j != "No":
            lista.append((j, k))
    dic_sexo[i] = pd.DataFrame(lista, columns=["Parentesco", "Sexo"]).value_counts()

In [None]:
for i in [s for s in violencias if s != "exclusion"]:
    lista = []
    g = datos.query(f"{i} == 1")
    for j, k in zip(g[dic_violencias[i][4]], g[dic_violencias[i][5]]):
        if j != "No le pude identificar" and j != "No":
            lista.append((j, k))
    dic_sexo[i] = pd.DataFrame(lista, columns=["Parentesco", "Sexo"]).value_counts()

#### Sexo del agresor(a) y parentesco con la víctima por tipo de violencia

In [None]:
dic_sexo = {}
for i in [s for s in violencias if s != "exclusion"]:
    lista = []
    g = datos.query(f"{i} == 1")
    for j, k in zip(g[dic_violencias[i][4]], g[dic_violencias[i][5]]):
        if j != "No le pude identificar" and j != "No":
            lista.append((i, j, k))
    dic_sexo[i] = pd.DataFrame(
        lista, columns=["Violencia", "Parentesco", "Sexo"]
    ).value_counts()

In [None]:
lista_sexo = [
    dic_sexo[i].reset_index(level=0, drop=True)
    for i in dic_sexo
    if i
    in [
        "identidad",
        "ciberacoso",
        "doxxing",
        "ciberdifamacion",
        "stalking",
        "ciberextorsion",
        "explotacion",
        "cyberflashing",
        "deepfake",
        "clonacion",
    ]
]

In [None]:
lista_parentesco_sexo = [
    round(dic_sexo[i] / dic_sexo[i].sum() * 100, 2).reset_index()
    for i in dic_sexo
    if i
    in [
        "identidad",
        "ciberacoso",
        "doxxing",
        "ciberdifamacion",
        "stalking",
        "ciberextorsion",
        "explotacion",
        "cyberflashing",
        "deepfake",
        "clonacion",
    ]
]

In [None]:
porcentaje_parentesco_sexo = pd.concat(lista_parentesco_sexo)

In [None]:
porcentaje_parentesco_sexo.Violencia.replace(violencias_nombres, inplace=True)

In [None]:
porcentaje_parentesco_sexo.reset_index(drop=True, inplace=True)

In [None]:
fig = px.bar(
    porcentaje_parentesco_sexo,
    x="Parentesco",
    y="count",
    color="Sexo",
    barmode="group",
    facet_col="Violencia",
    facet_col_wrap=2,
    color_discrete_map={"Mujer": "rgb(39, 55, 77)", "Hombre": "rgb(82, 109, 130)"},
    width=1000,
    height=1500,
    text_auto=True,
)
fig.update_layout(
    title="Sexo del agresor y parentesco de la víctima por tipo de violencia",
    legend_title="Sexo del agresor",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    textposition="outside",
    cliponaxis=False,
    texttemplate="%{value} %",
)
fig.for_each_annotation(lambda a: a.update(text=a.text.split("=")[-1]))
fig.for_each_yaxis(lambda y: y.update(title=""))
fig.add_annotation(
    x=-0.07,
    y=0.5,
    text="Porcentaje de agresores",
    textangle=-90,
    xref="paper",
    yref="paper",
)
fig.show()
fig.write_image("img/hombres/violencia_parentesco_sexo.png")

In [None]:
tbl_parentco_sexo = (
    pd.concat(
        lista_sexo,
        join="outer",
        keys=[
            "identidad",
            "ciberacoso",
            "doxxing",
            "ciberdifamacion",
            "stalking",
            "ciberextorsion",
            "explotacion",
            "cyberflashing",
            "deepfake",
            "clonacion",
        ],
        axis=1,
    )
    .fillna(0)
    .sort_index(level=0)
    .T
)

#### Sexo del agresor(a) y parentesco con la víctima por tipo de violencia: individual

In [None]:
sp_df = []
lista_para_graficar = []
for i in lista_parentesco_sexo:
    df = i.pivot(index="Parentesco", columns="Sexo", values="count").fillna(0)
    if "Hombre" in df.columns:
        df.Hombre = df.Hombre * -1
        sp_df.append(df)
        lista_para_graficar.append(i)

In [None]:
for i, j in zip(sp_df, lista_para_graficar):
    v = j.Violencia[0]
    if len(i.columns) < 2:
        print(f"El sexo de las personas agresoras es {i.columns.values} para {v}")
    else:
        if v in violencias_nombres.keys():
            # Creating instance of the figure
            fig = go.Figure()

            # Adding Male data to the figure
            fig.add_trace(
                go.Bar(
                    y=i.index,
                    x=i.Hombre,
                    name="Hombre",
                    orientation="h",
                    text=-1 * i.Hombre.values.astype("float"),
                    marker_color="rgb(39, 55, 77)",
                )
            )

            # Adding Female data to the figure
            fig.add_trace(
                go.Bar(
                    y=i.index,
                    x=i.Mujer,
                    name="Mujer",
                    orientation="h",
                    text=i.Mujer,
                    marker_color="rgb(82, 109, 130)",
                )
            )

            # Updating the layout for our graph
            fig.update_layout(
                title=" ".join(
                    [
                        "Sexo del agresor y parentesco con la víctima de",
                        violencias_nombres[v].casefold(),
                    ]
                ),
                legend_title="Sexo del agresor",
                title_font_size=22,
                barmode="relative",
                bargap=0.0,
                bargroupgap=0.5,
                xaxis=dict(
                    title="% de hombres",
                    title_font_size=14,
                    tickvals=[-100, -50, 0, 0, 50, 100],
                    ticktext=["100", "50", "0", "0", "50", "100"],
                ),
                width=1200,
                height=400,
                margin=dict(l=30),
                font=dict(
                    family="Arial",
                    size=18,
                    color="black",
                ),
            )
            fig.update_traces(
                textfont_size=10,
                textangle=0,
                textposition="outside",
                cliponaxis=False,
                texttemplate="%{text: 4}%",
            )
            fig.show()
            fig.write_image("".join(["img/hombres/piramide_", v, ".png"]))

In [None]:
veces_violencias = [s for s in list(datos.columns) if "veces_" in s]

In [None]:
violencias_6 = [s for s in list(datos.columns) if "6_" in s]

In [None]:
r_inf = []
r_sup = []
for i in datos["edad"]:
    if i == "Más de 60":
        r_inf.append(60)
        r_sup.append(100)
    else:
        r_inf.append(int(i.split("-")[0]))
        r_sup.append(int(i.split("-")[1]))

In [None]:
datos["r_inf"] = r_inf

In [None]:
datos["r_sup"] = r_sup

#### Violencias por ocupación

In [None]:
dict_violencias_ocupaciones = {}
for i in violencias:
    df = datos.query(f"{i} == 1 and ocupacion != 'Otra'")["ocupacion"].value_counts()
    df = round(df[:10] / df.sum() * 100, 2)
    dict_violencias_ocupaciones[violencias_nombres[i]] = df

In [None]:
tbl_vo = pd.DataFrame.from_dict(dict_violencias_ocupaciones, orient="index").fillna(0)

In [None]:
fig = px.bar(
    tbl_vo.sort_values("Abogado(a)"),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Antique_r,
    width=1200,
    height=600,
)
fig.update_layout(
    title="Ocupaciones más frecuentes por violencia sufrida",
    xaxis_title="% de hombres",
    yaxis_title="Violencia",
    legend_title="Ocupaciones",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)

fig.show()
fig.write_image("img/hombres/violencia_ocupacion.png")

#### Violencias por estados

In [None]:
for i in violencias:
    df_ = datos.query(f"{i} == 1")["estado"].value_counts()
    df = df_ / df_.sum() * 100

    lista_valores = []
    for j in df_mapa.ESTADO:
        if j in df.index:
            lista_valores.append(df.loc[j])
        else:
            lista_valores.append(0)
    df_mapa[violencias_nombres[i]] = lista_valores

In [None]:
tbl_violencia_estado = df_mapa.drop(columns="Hombres")

In [None]:
tbl_ve = round(
    pd.melt(
        tbl_violencia_estado,
        id_vars=["ESTADO"],
        value_vars=[violencias_nombres[s] for s in violencias_nombres.keys()],
        var_name="violencia",
        value_name="porcentaje",
    )
    .pivot(index="violencia", columns="ESTADO", values="porcentaje")
    .sort_index(axis=0),
    2,
)

In [None]:
fig = px.bar(
    tbl_ve.sort_index(axis=1),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Antique_r,
    width=1500,
    height=800,
)
fig.update_layout(
    title="Ubicación de las víctimas por violencia sufrida",
    xaxis_title="% de hombres",
    yaxis_title="Violencia",
    legend_title="Estado",
    font=dict(
        family="Arial",
        size=17,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    cliponaxis=False,
    marker_line_color="white",
    texttemplate="%{value: 4} %",
)
fig.show()
fig.write_image("img/hombres/violencia_estado.png")

#### Promedio de incidencias

In [None]:
round(
    (tbl_numero_violencia.index * tbl_numero_violencia["count"]).sum()
    / tbl_numero_violencia.sum().iloc[0],
    2,
)

En promedio, una mujer es víctima de 3 violencias.

#### Cantidad de veces en que la víctima reporta haber sufrido la violencia

In [None]:
repeticiones = []
for j in [i for i in list(vars().keys()) if "frecuencia_" in i]:
    df = vars()[j][2].rename(columns={"count": fg.violencias_names[j.split("_")[1]]})
    df.rename(index={"Sólo una vez": "Solo una vez"}, inplace=True)
    repeticiones.append(df)

In [None]:
tbl_repeticiones = pd.concat(repeticiones, axis=1).fillna(0).T

In [None]:
fig = px.bar(
    tbl_repeticiones.sort_values("Solo una vez"),
    orientation="h",
    color_discrete_sequence=px.colors.qualitative.Antique_r,
    width=1500,
    height=800,
)
fig.update_layout(
    title="Cantidad de veces que la víctima reporta haber sufrido la violencia",
    xaxis_title="% de hombres",
    yaxis_title="Violencia",
    legend_title="Frecuencias",
    font=dict(
        family="Arial",
        size=18,
        color="black",
    ),
)
fig.update_traces(
    textfont_size=18,
    textangle=0,
    cliponaxis=False,
    marker_line_color="white",
    texttemplate="%{value: 4} %",
)
fig.show()
fig.write_image("img/hombres/repeticiones_violencia.png")

#### Patrón de uso de aplicaciones por tipo de violencias y según medio más frecuente por el que ocurrió

In [None]:
dict_medios_medios = {}
medio_frecuente = []
for i in violencias:
    df = datos.query(f"{i} == 1")
    if len(df) != 0:
        variable = [s for s in df.columns if "".join(["medio_", i]) in s]
        start_cols = list(range(23, 40))
        var_idx = df.columns.get_loc(variable[0])
        end_col = df.columns.get_loc("".join(["otraR_", i]))

        # concatenar rangos de columnas con np.r_[]
        col_range = np.r_[start_cols, var_idx + 1 : end_col]

        # seleccionar las columnas del DataFrame
        info = df.iloc[:, col_range]

        # Cálculo del valor máximo en el medio de la violencia
        medio_mas_freq = (
            info.loc[:, "".join(["twitter_", i]) :].sum().astype(int).idxmax()
        )
        medio_frecuente.append(medio_mas_freq.split("_")[0])

        df_medios = info.query(f"{medio_mas_freq} == 1")[redes]

        dicts = {}
        for red_app in redes:
            dicts[red_app.capitalize()] = (
                df_medios[[red_app]]
                .value_counts()
                .reset_index()
                .set_index(red_app)["count"]
            )

        aplicaciones = pd.DataFrame.from_dict(dicts, orient="index").fillna(0)

        dict_medios_medios[violencias_nombres[i]] = round(
            aplicaciones / len(df) * 100, 2
        )

In [None]:
for i, j in zip(dict_medios_medios.keys(), medio_frecuente):
    fig = px.bar(
        dict_medios_medios[i],
        orientation="v",
        barmode="group",
        color_discrete_sequence=px.colors.qualitative.Antique_r,
        width=1500,
        height=800,
    )
    fig.update_layout(
        title=f"Patrón de uso de aplicaciones para {i.casefold()} sufrida por {j} ",
        yaxis_title="% de hombres",
        xaxis_title="Aplicaciones o red social",
        legend_title="Frecuencia de uso",
        font=dict(
            family="Arial",
            size=18,
            color="black",
        ),
    )
    fig.update_traces(
        textfont_size=17,
        textangle=0,
        textposition="outside",
        cliponaxis=False,
        texttemplate="%{value: 4}%",
    )
    fig.show()
    fig.write_image(f"img/hombres/apps{i[:8]}.png")

#### Víctimas y conocimiento del nombre de la violencia que sufrieron

In [None]:
dict_conocimiento_frecuencia = {}
for i in violencias:
    df = datos.query(f"{i} == 1")[["vdbg"]].value_counts()
    dict_conocimiento_frecuencia[violencias_nombres[i]] = round(df / df.sum() * 100, 2)

In [None]:
df_victima_conocimiento = pd.DataFrame.from_dict(
    dict_conocimiento_frecuencia, orient="index"
).fillna(0)

df_victima_conocimiento.columns.name = "Conocimiento del nombre de la violencia"

df_victima_conocimiento

Esta tabla contiene la información de las mujeres que sufrieron las violencias y se compara con la respuesta de si conoce o no el nombre.