In [6]:
import pandas as pd
import os

In [7]:
from matplotlib import pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
%matplotlib inline
%config Inlinebackend.figure_format = 'retina'

import seaborn as sns
sns.set_context('poster')
sns.set(rc={'figure.figsize': (16., 9.)})
sns.set_style('whitegrid')
import plotly.express as px
import plotly.graph_objects as go

# Causas meses

In [31]:
causas_meses = pd.read_excel('../data/suicidio/diferenes_causas_.xlsx')

In [32]:
causas_meses.sample(5)

Unnamed: 0,Sexo,Causa de muerte,Periodo,Total
2955,Mujeres,047 Trastornos mentales debidos al uso de alc...,2020M09,0
2715,Mujeres,046-049 V.Trastornos mentales y del comportam...,1999M09,519
2716,Mujeres,046-049 V.Trastornos mentales y del comportam...,1999M08,650
3320,Mujeres,047 Trastornos mentales debidos al uso de alc...,1990M04,0
937,Hombres,047 Trastornos mentales debidos al uso de alc...,1983M11,24


In [33]:
causas_meses["year"] = causas_meses.Periodo.str[0:4].str.strip().astype('int64')
causas_meses["month"] = causas_meses.Periodo.str[-2:].str.strip().astype('int64')

In [34]:
causas_meses.columns = causas_meses.columns.str.replace(" ",'_').str.strip().str.lower()

In [35]:
causas_meses.sample(3)

Unnamed: 0,sexo,causa_de_muerte,periodo,total,year,month
4646,Mujeres,098 Suicidio y lesiones autoinfligidas,2002M10,76,2002,10
2872,Mujeres,046-049 V.Trastornos mentales y del comportam...,1986M08,119,1986,8
543,Hombres,047 Trastornos mentales debidos al uso de alc...,2016M09,15,2016,9


In [36]:
causas_meses.causa_de_muerte.unique() #drop '046-049  V.Trastornos mentales y del comportamiento' porque engloba todo

array(['046-049  V.Trastornos mentales y del comportamiento',
       '047  Trastornos mentales debidos al uso de alcohol',
       '048  Trastornos mentales debidos al uso de drogas (drogodependencia, toxicoman�a)',
       '049  Otros trastornos mentales y del comportamiento',
       '098  Suicidio y lesiones autoinfligidas'], dtype=object)

In [37]:
dropv = causas_meses[causas_meses['causa_de_muerte'] == '046-049  V.Trastornos mentales y del comportamiento' ].index

In [38]:
causas_meses.drop(dropv, inplace = True)

In [39]:
mes_ = causas_meses.groupby(['year','month','sexo']).agg({'total':'sum'}).reset_index()

In [40]:
fig = px.box(mes_, x="month", y="total", color = "sexo")
fig.show()

# Provincias causa sexo

In [69]:
provincia_causa = pd.read_excel('../data/suicidio/provincia_causa_anos.xlsx')

In [70]:
provincia_causa.sample(3) #046-049  V.Trastornos mentales y del comportamiento

Unnamed: 0,Provincias,Causa de muerte,Sexo,Periodo,Total
1803,18 Granada,046-049 V.Trastornos mentales y del comportam...,Mujeres,1980,4
1549,16 Cuenca,046-049 V.Trastornos mentales y del comportam...,Mujeres,1988,14
3075,"26 Rioja, La",046-049 V.Trastornos mentales y del comportam...,Mujeres,2020,117


In [71]:
provincia_causa.columns = provincia_causa.columns.str.replace(" ",'_').str.strip().str.lower()

In [72]:
provincia_causa.drop('causa_de_muerte',axis=1,inplace = True)

In [73]:
provincia_causa[['cod_pro', 'provincias']] = provincia_causa.provincias.str.split(' ',1,expand=True)

In [74]:
provincia_causa.provincias.fillna('Extranjero',inplace = True)

In [75]:
provincia_causa.cod_pro = provincia_causa.cod_pro.str.replace('Extranjero','53').astype('int64')

In [76]:
provincia_causa.sample(3)

Unnamed: 0,provincias,sexo,periodo,total,cod_pro
4307,Extranjero,Mujeres,2018,7,53
2675,Navarra,Mujeres,2010,105,31
2982,Pontevedra,Hombres,1990,45,36


In [121]:
provincial = provincia_causa.groupby(['periodo','sexo']).agg({'total':'sum'}).reset_index()

In [124]:
fig = px.line(provincial, x="periodo", y="total",color = 'sexo')
fig.show()

# suicidio provincia year

In [79]:
suicidio_provincia_year = pd.read_excel('../data/suicidio/provincia_Sexo_20162020.xlsx')

In [80]:
suicidio_provincia_year.sample(3)

Unnamed: 0,Provincia de defunción,Causa de muerte (lista reducida),Sexo,año,Total
329,Navarra,098 Suicidio y lesiones autoinfligidas,Mujeres,2016,8
240,Huesca,098 Suicidio y lesiones autoinfligidas,Hombres,2020,7
346,Palencia,098 Suicidio y lesiones autoinfligidas,Mujeres,2019,2


In [81]:
suicidio_provincia_year.columns = ['provincia','causa','sexo','year','total']

In [82]:
suicidio_provincia_year.causa.unique() #'098 Suicidio y lesiones autoinfligidas'

array(['098 Suicidio y lesiones autoinfligidas'], dtype=object)

In [83]:
suicidio_provincia_year.drop('causa',axis = 1,inplace = True)

In [84]:
suicidio_provincia_year.isna().sum()

provincia    0
sexo         0
year         0
total        0
dtype: int64

In [85]:
suicidio_provincia_year.total.unique()

array([6, 12, 8, 9, 3, 2, 1, 40, 48, 55, 53, 39, 16, 14, 13, 7, 19, 31,
       20, 5, '..', 30, 32, 46, 47, 18, 17, 11, 10, 22, 28, 36, 15, 113,
       109, 122, 98, 106, 49, 42, 23, 26, 34, 4, 29, 27, 25, 24, 33, 38,
       43, 52, 21, 100, 83, 104, 96, 75, 41, 45, 51, 35, 44, 73, 60, 50],
      dtype=object)

In [86]:
suicidio_provincia_year.total=suicidio_provincia_year.total.replace('..','0').astype('int64')

In [87]:
suicidio_provincia_year.sample(3)

Unnamed: 0,provincia,sexo,year,total
300,Málaga,Hombres,2020,26
63,Badajoz,Hombres,2017,10
204,Girona,Hombres,2016,17


# suicidio edad sexo_year

In [88]:
suicidio_edad_sexo = pd.read_excel('../data/suicidio/suicidios_lesiones.xlsx')

In [89]:
suicidio_edad_sexo.sample(3)

Unnamed: 0,Causa de muerte,Sexo,Edad,Periodo,Total
1487,098 Suicidio y lesiones autoinfligidas,Mujeres,De 70 a 74 a�os,2009,47
688,098 Suicidio y lesiones autoinfligidas,Hombres,De 75 a 79 a�os,1988,163
808,098 Suicidio y lesiones autoinfligidas,Hombres,De 90 a 94 a�os,1991,19


In [90]:
suicidio_edad_sexo.columns = suicidio_edad_sexo.columns.str.replace(' ','_').str.lower()

In [91]:
suicidio_edad_sexo.causa_de_muerte.unique() #'098  Suicidio y lesiones autoinfligidas'

array(['098  Suicidio y lesiones autoinfligidas'], dtype=object)

In [92]:
suicidio_edad_sexo.drop('causa_de_muerte',axis=1,inplace = True)

In [93]:
#menmos de 5 no hay, quitamos
menores = ['Menos de 1 a�o','De 1 a 4 a�os']
menores_drop = suicidio_edad_sexo[suicidio_edad_sexo['edad'].isin(menores)].index

In [94]:
suicidio_edad_sexo.drop(menores_drop,inplace = True)

In [95]:
suicidio_edad_sexo.edad = suicidio_edad_sexo.edad.str.strip()

In [96]:
suicidio_edad_sexo.edad = suicidio_edad_sexo.edad.str.extract(r'((\d+)\D*$)')[1].astype('int64')

In [97]:
suicidio_edad_sexo.sample(5)

Unnamed: 0,sexo,edad,periodo,total
711,Hombres,84,2006,180
1675,Mujeres,94,1985,6
489,Hombres,54,1982,129
385,Hombres,44,2004,230
1011,Mujeres,14,1993,2


# tasas 2020

## tasas  'Trastornos mentales y del comportamiento'

In [100]:
tasas = pd.read_excel('../data/suicidio/tasas2020.xlsx')

In [102]:
tasas.columns = ['ccaa','causa','sexo','tasa','total']

In [104]:
tasas.causa.unique() #'Trastornos mentales y del comportamiento']

array(['Trastornos mentales y del comportamiento'], dtype=object)

In [105]:
tasas.tasa.unique() #'Tasa estandarizada (tanto por cien mil)'

array(['Tasa estandarizada (tanto por cien mil)'], dtype=object)

In [110]:
tasas.drop(['causa','tasa'],axis=1,inplace = True)

In [111]:
tasas.sample(3)

Unnamed: 0,ccaa,sexo,total
1,Andalucía,Mujeres,32.18
31,País Vasco,Mujeres,55.73
35,Ceuta,Mujeres,23.85


In [116]:
fig = px.box(tasas, x="ccaa", y="total",color = 'sexo')
fig.show()

## tasas suicidio

In [113]:
suicidios = pd.read_excel('../data/suicidio/tasassuicidios2020.xlsx') 
#Tasas de suicidios por edad y sexo por 100.000 habitantes de cada grupo.

In [115]:
suicidios.sample(3)

Unnamed: 0,Edad,Sexo,Total
21,De 60 a 64 años,Mujeres,5.763
28,De 80 a 84 años,Hombres,35.012
1,Menores de 15 años,Mujeres,0.212


In [117]:
fig = px.box(suicidios, x="Edad", y="Total",color = 'Sexo')
fig.show()