---
<h1 style="text-align: center;">Análise Estatística dos Retornos Diários do Índice Ibovespa:</h1>
<h2 style="text-align: center;">Comparação entre Distribuições Normal e t de Student</h2>

*Discente:*

    *   Gabriel D'assumpção de Carvalho

*Data:* 19/08/2024

---
---

# Introdução

| Variável    | Descrição                                                                                                                                          | Papel           | Tipo       |
|-------------|----------------------------------------------------------------------------------------------------------------------------------------------------|-----------------|------------|
| **Idade**   | Idade do paciente                                                                                                                                  | Característica  | Inteiro    |
| **Sexo**    | Sexo do paciente                                                                                                                                   | Característica  | Binário    |
| **exang**   | Angina induzida por exercício (1 = sim; 0 = não)                                                                                                   | Característica  | Binário    |
| **ca**      | Número de embarcações principais (0-3)                                                                                                             | Característica  | Inteiro    |
| **cp**      | Tipo de dor no peito                                                                                                                               | Característica  | Categórico |
|             | - Valor 1: angina típica                                                                                                                           |                 |            |
|             | - Valor 2: angina atípica                                                                                                                          |                 |            |
|             | - Valor 3: dor não anginosa                                                                                                                        |                 |            |
|             | - Valor 4: assintomático                                                                                                                           |                 |            |
| **trtbps**  | Pressão arterial em repouso (em mm Hg)                                                                                                             | Característica  | Inteiro    |
| **chol**    | Colesterol em mg/dl obtido via sensor de IMC                                                                                                       | Característica  | Inteiro    |
| **fbs**     | Glicemia em jejum > 120 mg/dl (1 = verdadeiro; 0 = falso)                                                                                          | Característica  | Binário    |
| **rest_ecg**| Resultados eletrocardiográficos em repouso                                                                                                         | Característica  | Categórico |
|             | - Valor 0: normal                                                                                                                                  |                 |            |
|             | - Valor 1: com anormalidade da onda ST-T (inversões da onda T e/ou elevação ou depressão do segmento ST de > 0,05 mV)                              |                 |            |
|             | - Valor 2: mostrando hipertrofia ventricular esquerda provável ou definitiva pelos critérios de Estes                                              |                 |            |
| **thalach** | Frequência cardíaca máxima alcançada                                                                                                               | Característica  | Inteiro    |
| **alvo**    | 0 = menos chance de ataque cardíaco, 1 = mais chance de ataque cardíaco                                                                             | Alvo            | Binário    |


## Bibliotecas Utilizadas

In [2]:
# Configurando o modo de exibição do pandas
import pandas as pd
pd.options.display.float_format = "{:.4f}".format

import numpy as np
import tensorflow as tf
from tensorflow import keras
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Desativa todos os avisos
import warnings
warnings.filterwarnings("ignore")

2024-08-21 15:36:12.555817: I tensorflow/core/platform/cpu_feature_guard.cc:193] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE4.1 SSE4.2 AVX AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.


# Coleta dos Dados

In [11]:
df = pd.read_csv("https://raw.githubusercontent.com/gabrieldadcarvalho/neural_network/main/projeto/heart.csv")

X = df.iloc[:, :-1]
y = df.iloc[:, -1]

# Exploração dos Dados

A exploração dos dados visa identificar padrões, tendências e anomalias que podem impactar a análise. Outliers são identificados e avaliados quanto à sua significância, enquanto correlações entre variáveis são analisadas para identificar relações importantes. A análise de variáveis categóricas inclui a avaliação das frequências e modas, e visualizações adicionais, como heatmaps e pair plots, são utilizadas para suportar a análise e identificar padrões mais complexos.

In [12]:
# Verificando as 5 primeiras linhas de x
print(X.head())

   age  sex  cp  trtbps  chol  fbs  restecg  thalachh  exng  oldpeak  slp  \
0   63    1   3     145   233    1        0       150     0   2.3000    0   
1   37    1   2     130   250    0        1       187     0   3.5000    0   
2   41    0   1     130   204    0        0       172     0   1.4000    2   
3   56    1   1     120   236    0        1       178     0   0.8000    2   
4   57    0   0     120   354    0        1       163     1   0.6000    2   

   caa  thall  
0    0      1  
1    0      2  
2    0      2  
3    0      2  
4    0      2  


In [13]:
# Verificando as 5 primeiras linhas de x
print(y.head())

0    1
1    1
2    1
3    1
4    1
Name: output, dtype: int64


## Variáveis Explicativas
Vamos realizar uma análise exploratória das variáveis explicativas do conjunto de dados. Abaixo estão as estatísticas descritivas e visualizações para cada variável.

### Idade

In [15]:
X['age'].describe()

count   303.0000
mean     54.3663
std       9.0821
min      29.0000
25%      47.5000
50%      55.0000
75%      61.0000
max      77.0000
Name: age, dtype: float64

In [16]:
X['age'].mode()

0    58
Name: age, dtype: int64

Ao visualizar as estatisticas da variável idade, podemos perceber que