<a href="https://colab.research.google.com/github/andressatheotonio/SimpleSDHC/blob/master/EuropaSuicides_LinearRegression.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [0]:
#Importando bibliotecas

import matplotlib.pyplot as plot
import pandas as pd
import numpy as np
import seaborn as sns
from sklearn import metrics
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

In [0]:
#Importando arquivos e exibindo dataframe

europa = pd.read_csv("europa2015.csv", sep=",")

europa

In [0]:
#Estatístics Descritivas do Dataframe

europa.describe().round(2)

In [0]:
#Distribuição de frequência da variável dependente (Suicídios)

sx = sns.distplot(europa['Male Suicides'])
sx.figure.set_size_inches(12,5)

In [0]:
#Matriz de Correlação

europa.corr().round(2)

In [0]:
#Visualizando as Relações

plot.figure(figsize=(12,6))
plot.plot(europa['Divorce Index'],europa['Male Suicides'], 'o')
plot.xlabel('Taxa de Divórcios a cada 1000 hab')
plot.ylabel('Suicídios a cada 100.000 hab (M)')
plot.show()

In [0]:
#Relacionando duas variáveis

def coeficientes(x,y):
  mat = x.shape[0]
  
  soma_x = np.sum(x)
  soma_x2 = np.sum(x**2)
  
  soma_y = np.sum(y)
  soma_y2 = np.sum(y**2)
  
  soma_xy = np.sum(x*y)
  
  return np.linalg.solve([[mat,soma_x],[soma_xy,soma_x2]],[soma_y,soma_xy])

In [0]:
#Relacionando a Taxa de Divórcios com a Taxa de Suicídios (M)

a1,b1 = coeficientes(europa['Divorce Index'],europa['Male Suicides'])
div = np.linspace(0,5,10)

y = a + b*div

plot.figure(figsize=(12,6))
plot.plot(div,y)
plot.plot(europa['Divorce Index'], europa['Male Suicides'], 'o')
plot.xlabel('Taxa de Divórcio a cada 1000 hab')
plot.ylabel('Taxa de Suicídios a cada 100.000 hab (M)')
plot.show()

In [0]:
#Função que recebe Taxa de Divórcios e prediz Taxa de Suícidios (M)

def SuicideDivorce(divorce_rate):
  return a+b*divorce_rate

SuicideDivorce(2).round(2)

In [0]:
#Score de previsão do modelo

taxa_prevista = SuicideDivorce(europa['Divorce Index'])
metrics.r2_score(europa['Male Suicides'],taxa_prevista).round(4)

In [0]:
#Relacionando a Taxa de Transtornos Provocados por Consumo de Drogas com a Taxa de Suicídios (M)

a2,b2 = coeficientes(europa['Drugs Rate'], europa['Male Suicides'])
drugs = np.linspace(0,700,100)

tx = a2 + b2*drugs

plot.figure(figsize=(12,6))
plot.plot(drugs,tx)
plot.plot(europa['Drugs Rate'], europa['Male Suicides'], 'o')
plot.xlabel('Transtornos pelo uso de drogas a cada 100.000 hab')
plot.ylabel('Taxa de Suicídios a cada 100.000 hab (M)')
plot.show()

In [0]:
#Função que recebe a 'Drugs Rate' e prediz a taxa de Suicídios (M)

def SuicideDrugs(drugs):
  return a2+b2*drugs

In [0]:
#Score de previsão do modelo

tx_previsto = SuicideDrugs(europa['Drugs Rate'])
metrics.r2_score(europa['Male Suicides'], tx_previsto)

In [0]:
#Série para armazenar a Taxa de Suicídios (M)

Y =  europa['Male Suicides']

#DataFrame para as variáveis a relacionar

X = europa[['HDI', 'Education Index', 'Divorce Index', 'Drugs Rate']]

#Separando dataset de treino e teste

X_train,X_test, Y_train, Y_test = train_test_split(X,Y,test_size=0.4, random_state = 37)


In [82]:
#Treinando

model = LinearRegression()

model.fit(X_train, Y_train)

#Score do treino

model.score(X_train, Y_train)

0.6397218372848041

In [83]:
#Efeito Médio na Taxa de Suicídio quando as variáveis são zeradas

model.intercept_.round(2)

-39.6

In [85]:
#Analisando os Coeficientes de Regressão

model.coef_.round(2)

array([-0.09,  0.15,  6.55, -0.01])