# SVM
'''dataset: https://archive.ics.uci.edu/ml/datasets/Statlog+%28Heart%29'''

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn import metrics
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay

In [None]:
def leerDatos():
  '''
  pd.read_table lee las tablas del dataset heart.dat.
  delim_whitespace es estado True para no pasar nada por parámetro.
  
            Retornos:
            df(str): almacena las tablas del dataset heart.dat.
  '''
  df = pd.read_table("heart.dat",delim_whitespace=True )
  return df
print(leerDatos.__doc__)

In [None]:
def obtenerInformacion(df):
  '''
  Toma los datos del dataset e imprime las características, tamaño y los cinco mejores registros.
  
            Parametros:
            df(str): Se utiliza para obtener la informacion del dataset heart.dat.
  '''
  print("Caracteristicas:\n", df.columns)
  print("Tamaño:\n", df.shape)
  print("Los cinco mejores registros:\n", df.head())
print(obtenerInformacion.__doc__)

In [None]:
def dividirEntrenamientoTest(df):
  '''
  Se divide el conjunto de datos en 70% de entrenamiento y 30 % de prueba. 
  
  Se selecciona registros al azar con el uso del parámetro random_state.
  
            Parametros:
            df (str): Se utiliza para obtener la informacion del dataset heart.dat.
            
            Retornos:
            X_train(array): Contiene las X de entrenamiento. 
            X_test(array): Contiene las Y de testeo.
            y_train(array): Contiene las Y de entrenamiento.
            y_test(array): Contiene las Y de testeo.
  '''

  X_train, X_test, y_train, y_test = train_test_split(df.iloc[:,0:13], df.iloc[:,-1], test_size=0.3, random_state=109)
  return  X_train, X_test, y_train, y_test
print(dividirEntrenamientoTest.__doc__)

In [None]:
def entrenarModelo(X_test, X_train, y_train):
  '''
  Se tienen 3 parametros los cuales son X_test, X_train, y_train.
  
  Se retorna la predicción de y_pred y el clasificador svm clf.
  
  Se entrena al modelo con el uso del método fit.
  
  Se predice la respuesta para el conjunto de datos de prueba utilizando el método predict.
  
            Parametros:
            clf (str): Se crear un clasificador svm con kernel de tipo lineal dentro del atributo clf.
            
            Retornos:
            y_pred(array): Contiene las Y de predicción.
            clf: Contiene el modelo de entrenamiento.
  '''

  clf = svm.SVC(kernel='linear')
  clf.fit(X_train, y_train)
  y_pred = clf.predict(X_test)
  return y_pred, clf
print(entrenarModelo.__doc__)

In [None]:
def matrizConfusion(y_test, y_pred, clf):
  '''
  
  El metodo plot se utiliza para dibuja un polígono, plt.show sirve para mostrar los graficos

  plt.show() se utiliza para mostrar el resultado en forma gráfica utilizando figuras
  
   Parametros:
            y_test(array): Contiene las Y de testeo.
            y_pred(array): Contiene las Y de predicción.
            clf: Contiene el modelo de entrenamiento.
            
  '''

  cm = confusion_matrix(y_test, y_pred, labels=clf.classes_)
  disp = ConfusionMatrixDisplay(confusion_matrix=cm,
                                display_labels=clf.classes_)
  disp.plot()
  plt.show()
print(matrizConfusion.__doc__)

In [None]:
def evaluarModelo(y_test, y_pred):

In [None]:
def main():

In [None]:
main()