In [None]:
import pandas as pd

file_path = "/content/shootings.csv"

data = pd.read_csv(file_path)

In [None]:
# 1. Estados con mayor proporción de incidentes con signos de enfermedad mental
enfermedad_mental_estado = data.groupby('state').agg(
    total_incidentes=('id', 'count'),
    con_enfermedad_mental=('signs_of_mental_illness', 'sum')
)
enfermedad_mental_estado['proporcion'] = (
    enfermedad_mental_estado['con_enfermedad_mental'] / enfermedad_mental_estado['total_incidentes']
)
estados_mayor_proporcion = enfermedad_mental_estado.sort_values('proporcion', ascending=False)


estados_mayor_proporcion.head()

Unnamed: 0_level_0,total_incidentes,con_enfermedad_mental,proporcion
state,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
NH,12,6,0.5
WY,13,5,0.384615
NY,90,34,0.377778
VT,8,3,0.375
SD,14,5,0.357143


In [None]:
# 2. Relación entre edad y probabilidad de estar armado con un arma de fuego

probabilidad_armado_por_edad = data.groupby('age')['esta_armado'].mean()

probabilidad_armado_por_edad_df = probabilidad_armado_por_edad.reset_index()
probabilidad_armado_por_edad_df.columns = ['Edad', 'Probabilidad']

probabilidad_armado_por_edad_df

Unnamed: 0,Edad,Probabilidad
0,6.0,0.000000
1,12.0,0.000000
2,13.0,0.000000
3,14.0,0.333333
4,15.0,0.538462
...,...,...
71,81.0,1.000000
72,82.0,1.000000
73,83.0,0.500000
74,84.0,0.750000


In [None]:
# 3. Estados con más incidentes donde las personas intentaron huir y estaban desarmadas
incidentes_huir_desarmado = data[(data['flee'] != 'Not fleeing') & (data['arms_category'] == 'Unarmed')]
incidentes_huir_por_estado = incidentes_huir_desarmado['state'].value_counts()

incidentes_huir_por_estado.head()

Unnamed: 0_level_0,count
state,Unnamed: 1_level_1
CA,29
TX,13
FL,13
GA,8
CO,8


In [None]:
# 4. Tendencia temporal del uso de cámaras corporales
data['date'] = pd.to_datetime(data['date'])
uso_camara_anual = data.groupby(data['date'].dt.year)['body_camera'].mean()

uso_camara_anual

Unnamed: 0_level_0,body_camera
date,Unnamed: 1_level_1
2015,0.076684
2016,0.151549
2017,0.109272
2018,0.122748
2019,0.141026
2020,0.101604


In [None]:
# 5. Diferencias en "threat_level" entre géneros
amenaza_por_genero = data.groupby(['gender', 'threat_level']).size().unstack(fill_value=0)
amenaza_por_genero_normalizada = amenaza_por_genero.div(amenaza_por_genero.sum(axis=1), axis=0)

amenaza_por_genero_normalizada

threat_level,attack,other,undetermined
gender,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
F,0.59009,0.382883,0.027027
M,0.648192,0.308795,0.043013
