In [None]:
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
import seaborn as sn
import warnings
warnings.filterwarnings('ignore')
from sklearn.metrics import classification_report, confusion_matrix  

In [None]:
df = pd.read_csv("Iris.csv")

In [None]:
df.head()

In [None]:
y = np.array(df[['Species']])
x = np.array(df.drop(['Id','Species'], axis=1))

In [None]:
print("y")
print(y[0:5])
print("x")
print(x[0:5])

In [None]:
#Split Data
from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x,y, test_size=0.33, stratify=y)

In [None]:
# Para treinar o kernel SVM, usamos a mesma classe SVC da biblioteca svm do Scikit-Learn. 
# A diferença está no valor do parâmetro do kernel da classe SVC. 
# No caso do SVM simples, usamos "linear" como o valor para o parâmetro do kernel. 
# No entanto, para SVM do kernel você pode usar o kernel Gaussiano, polinomial, sigmóide ou computável.

In [None]:
#Linear SVM

#Fit The plot
from sklearn.svm import LinearSVC

model = LinearSVC()
model.fit(x_train, y_train.ravel())


#Calculate Test Prediction
y_pred = model.predict(x_test)
print(model.score(x_test,y_test.ravel()))

#Plot Confusion Matrix

cm = confusion_matrix(y_test, y_pred)

df_cm = pd.DataFrame(cm, index = [i for i in np.unique(y)],
                  columns = [i for i in np.unique(y)])
plt.figure(figsize = (5,5))
sn.heatmap(df_cm, annot=True)

print(classification_report(y_test, y_pred))  

In [None]:
# No caso do kernel polinomial, você também precisa passar um valor para o parâmetro degree da classe SVC. 
# Isso basicamente é o grau do polinômio. 

In [None]:
#Fit The plot
from sklearn.svm import SVC

model = SVC(kernel='poly', degree=8)
model.fit(x_train, y_train.ravel())


#Calculate Test Prediction
y_pred = model.predict(x_test)
print(model.score(x_test,y_test.ravel()))

#Plot Confusion Matrix
cm = confusion_matrix(y_test, y_pred)


df_cm = pd.DataFrame(cm, index = [i for i in np.unique(y)],
                  columns = [i for i in np.unique(y)])
plt.figure(figsize = (5,5))
sn.heatmap(df_cm, annot=True)
print(classification_report(y_test, y_pred))  

In [None]:
# Vamos usar um kernel sigmoid para implementar o Kernel SVM.

In [None]:
#Fit The plot
from sklearn.svm import SVC

model = SVC(kernel='sigmoid')
model.fit(x_train, y_train.ravel())

#Calculate Test Prediction
y_pred = model.predict(x_test)
print(model.score(x_test,y_test.ravel()))

#Plot Confusion Matrix
cm = confusion_matrix(y_test, y_pred)

df_cm = pd.DataFrame(cm, index = [i for i in np.unique(y)],
                  columns = [i for i in np.unique(y)])
plt.figure(figsize = (5,5))
sn.heatmap(df_cm, annot=True)

In [None]:
# Para usar o kernel gaussiano, você precisa especificar 'rbf' 
# como valor para o parâmetro Kernel da classe SVC.

In [None]:
#Non-linear SVM

#Fit The plot
from sklearn.svm import SVC

model = SVC(kernel='rbf')
model.fit(x_train, y_train.ravel())


#Calculate Test Prediction
y_pred = model.predict(x_test)
print(model.score(x_test,y_test.ravel()))

#Plot Confusion Matrix
cm = confusion_matrix(y_test, y_pred)

df_cm = pd.DataFrame(cm, index = [i for i in np.unique(y)],
                  columns = [i for i in np.unique(y)])
plt.figure(figsize = (5,5))
sn.heatmap(df_cm, annot=True)

In [None]:
# Comparação do desempenho do kernel

# Se compararmos o desempenho dos diferentes tipos de kernels, podemos ver claramente que o kernel sigmóide 
# executa o pior. 
# Isso se deve ao motivo pelo qual a função sigmóide retorna dois valores, 0 e 1, portanto, é mais adequado 
# para problemas de classificação binária. No entanto, no nosso caso, tivemos três classes de saída.

# Entre o kernel gaussiano e o núcleo polinomial, podemos ver que o kernel gaussiano alcançou uma taxa de 
# previsão próximo de 100%, enquanto o kernel polinomial classificou erroneamente uma instância. 

# Portanto, o kernel gaussiano teve um desempenho um pouco melhor. 

# No entanto, não existe uma regra rígida quanto ao melhor desempenho do kernel em todos os cenários. 
# É tudo sobre como testar todos os kernels e selecionar aquele com os melhores resultados no seu conjunto 
# de dados de teste.