In [3]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import statsmodels.api as sm

In [4]:
# Lee el contenido del archivo y lo almacena en un dataframe
data = pd.read_csv('../Data-Treated/fixed_data_who_suicide.csv')

# Asigna el formato de fecha
data['year'] = pd.to_datetime(data['year'])


In [None]:
data.info() # Para ver la información general de los datos
data.head() # Para ver las primeras filas de los datos

In [None]:
# obtener una lista de todos los paises en el archivo
paises = data['country'].unique()
_sex = ['male','female']
# print(paises)

# Funcion que retorna todos los registro del un pais, de un genero en específico, en un rango de edad de 15-24 años

In [34]:
def country_sex_15_24_suicides_stats(country : str, sex : str):

    # Validacion estricta
    if country not in paises:
        raise ValueError(f"El país '{country}' no es válido. Por favor, ingresa uno existente de los datos.")

    # Validacion estricta
    if sex not in {'male', 'female'}:
        raise ValueError(" HOMBRE o MUJER!!!")

    #Se separa la data del pais y del sexo especificado por el usuario
    filtro = (data['country'] == country) & (data['sex'] == sex) & (data['init_age'] == 15) & (data['last_age'] == 24)
    data_filtrada = data[filtro]

    #Prueba para ver el contenido
    print(data_filtrada.to_string(index=False))

    # Estadistica descriptiva
    media = data_filtrada['suicides_no'].mean()
    varianza = data_filtrada['suicides_no'].var()
    desviacion_estandar = data_filtrada['suicides_no'].std()
    maximo = data_filtrada['suicides_no'].max()
    minimo = data_filtrada['suicides_no'].min()

    # Mostrar las estadísticas
    # print(f'Media: {media}')
    # print(f'Varianza: {varianza}')
    # print(f'Desviación Estándar: {desviacion_estandar}')
    # print(f'Máximo: {maximo}')
    # print(f'Mínimo: {minimo}')

    # data_filtrada['suicides_no'].describe()

    # Crear un gráfico de líneas para visualizar la evolución del número de suicidios

    gender = 'hombres' if sex == 'male' else 'mujeres'

    plt.figure(figsize=(10, 6))
    plt.plot(data_filtrada['year'], data_filtrada['suicides_no'], marker='h', linestyle='-', color='b')
    plt.title(f'Evolución del número de suicidios en {gender} (15-24 años) en {country}')
    plt.xlabel('Año')
    plt.ylabel('Número de suicidios')
    plt.xticks(rotation=45)
    plt.grid(True)
    plt.tight_layout()

    #Se guarda un nuevo CSV y PNG de los datos
    data_filtrada.to_csv(f'../Data-Stats/{country}_{sex}_15_24_suicides.csv', index=False)
    plt.savefig(f'../Graphs-Stats/{country}_{sex}_15_24_suicides.png')

    # Mostrar el gráfico
    # plt.show()
    plt.close()

In [35]:
country_sex_15_24_suicides_stats('Mexico', 'male')
country_sex_15_24_suicides_stats('Mexico', 'female')

country       year  sex  init_age  last_age  suicides_no  population
 Mexico 1979-01-01 male        15        24          316     6660647
 Mexico 1980-01-01 male        15        24          254     6841567
 Mexico 1981-01-01 male        15        24          320     7281800
 Mexico 1982-01-01 male        15        24          293     7472900
 Mexico 1983-01-01 male        15        24          255     7424000
 Mexico 1984-01-01 male        15        24          209     7603748
 Mexico 1985-01-01 male        15        24          375     8420000
 Mexico 1986-01-01 male        15        24          408     8614300
 Mexico 1987-01-01 male        15        24          405     8726000
 Mexico 1988-01-01 male        15        24          418     9021000
 Mexico 1989-01-01 male        15        24          472     9284000
 Mexico 1990-01-01 male        15        24          472     9501000
 Mexico 1991-01-01 male        15        24          560     9666000
 Mexico 1992-01-01 male        15 

# No ejecutar esta linea a menos que quieras que tu equipo se congele y llene de archivos!!!!

In [None]:
[country_sex_15_24_suicides_stats(pais, sex) for pais in paises for sex in _sex]