### **Abrindo os arquivos criados no Pre-Processamento**

In [1]:
# Importando a Biblioteca
import pickle

In [2]:
alvo           = pickle.load(open('heart.pkl',  'rb'))
previsores     = pickle.load(open('heart2.pkl', 'rb'))
previsores_esc = pickle.load(open('heart3.pkl', 'rb'))
previsores2    = pickle.load(open('heart4.pkl', 'rb'))
previsores3    = pickle.load(open('heart5.pkl', 'rb'))
previsores3_esc= pickle.load(open('heart6.pkl', 'rb'))

# RESUMO DO PRE-PROCESSAMENTO

**<font color='green'> alvo </font>** = variável que se pretende atingir (tem ou não doença cardíaca).

**<font color='green'> Previsores </font>** = conjunto de variáveis previsoras com as variáveis categóricas transformadas em numéricas manualmente, sem escalonar.

**<font color='green'> Previsores_esc </font>** = conjunto de variáveis previsoras com as variáveis categóricas transformadas em numéricas, escalonada.

**<font color='green'> Previsores2 </font>** = conjunto de variáveis previsoras com as variáveis categóricas transformadas em numéricas pelo labelencoder.

**<font color='green'> Previsores3 </font>** = conjunto de variáveis previsoras transformadas pelo labelencoder e onehotencoder, sem escalonar.

**<font color='green'> Previsores3_esc </font>** = conjunto de variáveis previsoras transformadas pelo labelencoder e onehotencoder escalonada.

## **BASE DE TREINO E TESTE**

In [3]:
# Importando a biblioteca
from sklearn.model_selection import train_test_split

**Parâmetros train_test_split:**   
- **arrays:** nomes dos atributos previsores e alvo.   
- **test_size:** tamanho em porcentagem dos dados de teste. default é none.   
- **train_size:** tamanho em porcentagem dos dados de treinamento.default é none.  
- **random_state:** nomeação de um estado aleatório.   
- **shuffle:** embaralhamento dos dados aleatórios. Associado com o random_state ocorre o mesmo embaralhamento sempre. Default é True.  
- **stratify:** Possibilidade de dividir os dados de forma estratificada. Default é None (nesse caso é mantido a proporção, isto é, se tem 30% de zeros e 70% de 1 no dataframe, na separação em treinamento e teste se manterá essa proporção).

In [4]:
# Separando teste e treino
x_treino, x_test, y_treino, y_test = train_test_split(previsores3_esc, alvo, test_size = 0.3, random_state=10)

In [5]:
# Shape de x
x_treino.shape, x_test.shape

((641, 20), (276, 20))

In [6]:
# Shape de y
y_treino.shape, y_test.shape

((641,), (276,))

# **MÁQUINAS DE VETORES DE SUPORTE (SVM)**

**Documentação**: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html

In [7]:
# Improt da SVM
from sklearn.svm import SVC

In [8]:
# Renomeando o nome
# Kernels = 'rbf', 'linear', 'poly', 'sigmoid'
# Quanto maior o C maior o tempo computacional posso utiliza de 0 a 50 quanto maior mais chances de overfiting
# random_state trabalha de 1 a 20


svm = SVC(kernel='rbf', random_state=1, C = 2)
svm.fit(x_treino, y_treino)

In [9]:
# Criando a variavel previsores
previsoes_svm = svm.predict(x_test)
previsoes_svm[:100]

array([1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1,
       0, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0,
       1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0,
       1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1,
       1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0], dtype=int64)

In [10]:
# Analise do y_test
y_test[:100]

array([1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1,
       0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0,
       0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0,
       1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1], dtype=int64)

In [11]:
# Importando a biblioteca para analsie das metricas
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

In [12]:
print(f'Acuracia: {accuracy_score(y_test, previsoes_svm)*100:.2f}')

Acuracia: 86.59


In [13]:
# MAtriz de confusao
confusion_matrix(y_test, previsoes_svm)

array([[107,  17],
       [ 20, 132]], dtype=int64)

In [14]:
# Imprimindo o resultado
print(classification_report(y_test, previsoes_svm))

              precision    recall  f1-score   support

           0       0.84      0.86      0.85       124
           1       0.89      0.87      0.88       152

    accuracy                           0.87       276
   macro avg       0.86      0.87      0.86       276
weighted avg       0.87      0.87      0.87       276



**Analise dos dados de Treino**

In [15]:
# Criando a variavel treino
previsoes_treino = svm.predict(x_treino)
previsoes_treino[:100]

array([1, 0, 0, 1, 0, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1,
       1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1,
       1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0,
       1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1,
       1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0], dtype=int64)

In [16]:
# Accuracia
accuracy_score(y_treino, previsoes_treino)

0.9204368174726989

In [17]:
# Matrix de confusao
confusion_matrix(y_treino, previsoes_treino)

array([[250,  36],
       [ 15, 340]], dtype=int64)

In [18]:
# Imprimindo o resultado
print(classification_report(y_treino, previsoes_treino))

              precision    recall  f1-score   support

           0       0.94      0.87      0.91       286
           1       0.90      0.96      0.93       355

    accuracy                           0.92       641
   macro avg       0.92      0.92      0.92       641
weighted avg       0.92      0.92      0.92       641



### Validação Cruzada

In [19]:
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score

In [20]:
# Separando os dados em folds
kfold = KFold(n_splits=30, shuffle=True, random_state=5)

In [21]:
# Criando o Modelo
modelo = SVC(kernel='rbf', random_state=1, C=2)
resultado = cross_val_score(modelo, previsores3_esc, alvo, cv =kfold)

# Utilizamos a Media e o desvio padrao
print(f'Acuracia Media: {resultado.mean()*100:.3f}')

Acuracia Media: 85.724


# Altomoção do Algoritmo

In [22]:
# Lista dos Previsores
from random import choice
lista_previsores = [['Previsores',previsores], ['Previsores_Esc',previsores_esc], 
                    ['Previsores2', previsores2], ['Previsores3',previsores3], ['Previsores3_Esc',previsores3_esc]]
previsor = choice(lista_previsores)
print(f'O Previsor Selecionado Foi: \33[33m{previsor[0]}\33[0m')
print(f'{previsor[1]}')

O Previsor Selecionado Foi: [33mPrevisores[0m
[[40.   0.   1.  ...  0.   0.   0. ]
 [49.   1.   2.  ...  0.   1.   1. ]
 [37.   0.   1.  ...  0.   0.   0. ]
 ...
 [57.   0.   3.  ...  1.   1.2  1. ]
 [57.   1.   1.  ...  0.   0.   1. ]
 [38.   0.   2.  ...  0.   0.   0. ]]


In [23]:
# Renomeando o nome
# Kernels = 'rbf', 'linear', 'poly', 'sigmoid'
# Quanto maior o C maior o tempo computacional posso utiliza de 0 a 50 quanto maior mais chances de overfiting
# random_state trabalha de 1 a 20
from random import randint

lista = ['rbf', 'linear', 'poly', 'sigmoid']
kernels = choice(lista)
random_s = randint(1, 20)
cs = randint(1, 10)

svm = SVC(kernel=kernels, random_state=random_s, C = cs)
svm.fit(x_treino, y_treino)

In [24]:
'''from random import choice, randint
acuracia_test   = 0
acuracia_treino = 0
contador        = 0

# Criando a variavel previsores
previsoes_svm = svm.predict(x_test)


while True:
    previsor = choice(lista_previsores)
    x_treino, x_test, y_treino, y_test = train_test_split(previsor[1], alvo, test_size=0.3, random_state=10)
    svm = SVC(kernel='rbf', random_state=1, C = 2)
    svm.fit(x_treino, y_treino)
    print(f'Acuracia teste: {accuracy_score(y_test, previsoes_svm)*100:.3f}')
    # Imprimindo o resultado
    print(classification_report(y_test, previsoes_svm))
    
    # Criando a variavel treino
    previsoes_treino = svm.predict(x_treino)
    # Accuracia
    print(f'Acuracia Treino: {accuracy_score(y_treino, previsoes_treino)*100:.3f}')
    # Imprimindo o resultado
    print(classification_report(y_treino, previsoes_treino))'''
    
    

"from random import choice, randint\nacuracia_test   = 0\nacuracia_treino = 0\ncontador        = 0\n\n# Criando a variavel previsores\nprevisoes_svm = svm.predict(x_test)\n\n\nwhile True:\n    previsor = choice(lista_previsores)\n    x_treino, x_test, y_treino, y_test = train_test_split(previsor[1], alvo, test_size=0.3, random_state=10)\n    svm = SVC(kernel='rbf', random_state=1, C = 2)\n    svm.fit(x_treino, y_treino)\n    print(f'Acuracia teste: {accuracy_score(y_test, previsoes_svm)*100:.3f}')\n    # Imprimindo o resultado\n    print(classification_report(y_test, previsoes_svm))\n    \n    # Criando a variavel treino\n    previsoes_treino = svm.predict(x_treino)\n    # Accuracia\n    print(f'Acuracia Treino: {accuracy_score(y_treino, previsoes_treino)*100:.3f}')\n    # Imprimindo o resultado\n    print(classification_report(y_treino, previsoes_treino))"