### Utilizando o DataSet de análise de predição de derrames e AVC
Este DataSet reune 11 características clínicas que podem influenciar um ser humano a ter um episódio de derrame
O DataSet pode ser encontrado em: https://www.kaggle.com/fedesoriano/stroke-prediction-dataset

In [None]:
import numpy as np 
import pandas as pd 
import scipy.stats

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))
        _path = os.path.join(dirname, filename)

#### Lendo o CSV como Pandas.DataFrame e coletando uma amostra aleatória de 50 linhas:

In [None]:
data = pd.read_csv(_path)
amostra = data.sample(20)
amostra.head()

#### A primeira variável a se trabalhar será a variável contínua de média de nível de glicose ***#avg_glucose_level***

In [None]:
glicose = amostra['avg_glucose_level'].values
trust = 0.95
glicose

In [None]:
t = scipy.stats.t.cdf(trust + (1 - trust) / 2, 20 - 1)
t

#### Erro com desvio padrão:

In [None]:
error = t * np.std(glicose) / np.sqrt(20)
error

### Calculando os limites:

In [None]:
inf = np.mean(glicose) - error
sup = np.mean(glicose) + error
mean = np.mean(glicose)
print("""
Limites:
Inferior: {}
Média: {}
Superior: {}
""".format(inf, mean, sup))

### Variável normal padrão com variância da população desconhecida:

In [None]:
z = scipy.stats.norm.ppf(trust + (1 - trust) / 2)
z

In [None]:
error2 = z * np.std(glicose) / np.sqrt(20)
error2

In [None]:
inf2 = np.mean(glicose) - error2
sup2 = np.mean(glicose) + error2
mean = np.mean(glicose)
print("""
Limites:
Inferior: {}
Média: {}
Superior: {}
""".format(inf2, mean, sup2))


### Trabalhando agora com a variável dicotômica:
Selecionei a variável **#heart_disease**, pois a **#stroke** tinha poucos positivos na amostragem

In [None]:
# amostra[amostra['heart_disease'] == 1]
heart = amostra['heart_disease'].values
heart

In [None]:
p = sum(heart) / 20
p

In [None]:
z2 = scipy.stats.norm.ppf(trust, (1 - trust) / 2)
z2

In [None]:
erro3 = z2 * np.sqrt(p * (1 - p) / 20)
erro3

In [None]:
inf3 = p - erro3
sup3 = p + erro3
print("""
Limites:
Inferior: {}
Média: {}
Superior: {}
""".format(inf3, np.mean(heart), sup3))