In [2]:
import numpy as np
from sklearn.model_selection import cross_val_score, train_test_split #Essa função é usada para avaliar o desempenho de um modelo usando a validação cruzada
from sklearn import datasets #Este módulo contém vários conjuntos de dados de exemplo que podem ser usados para treinar e testar modelos
from sklearn import svm #fornece ferramentas para criar e treinar máquinas de vetor de suporte

iris = datasets.load_iris() ## Carrega um conjunto de dados Iris, que contém informações sobre diferentes espécies de flores Iris

In [3]:
#Divide o conjunto de dados em conjuntos de treinamentos e testes
X_train, X_test, Y_train, Y_test = train_test_split(iris.data, iris.target, test_size=0.4, random_state=0)
# train_test_split divide o conjunto de dados em dois subconjuntos: 
# X_train e y_train: Usados para treinar o modelo 
# X_test e y_test: Usados para testar o modelo 
# test_size=0.4 significa que 40% dos dados são usados para teste, e 60% para treinamento
# random_state=0 garante que a divisão dos dados seja sempre a mesma cada vez que o código é executado, permitindo a reprodutibilidade


#Cria um classificador SVM com kerne linear
clf = svm.SVC(kernel='linear', C=1).fit(X_train, Y_train)
# svm.SVC cria um classificador de Máquina de Vetores de Suporte (SVM) com um kernel linear
# kernel='linear' especifica que o kernel usado é linear 
# C=1 é o parâmetro de regularização, que controla a penalidade para erros de classificação
# fit(X_train, y_train) treina o modelo usando os dados de treinamento


# Avalia o modelo no conjunto de teste
clf.score(X_test, Y_test)
# score(X_test, y_test) avalia a performance do modelo treinado nos dados de teste
# Retorna a acurácia do modelo, que é a proporção de previsões corretas em relação ao total de previsões

0.9666666666666667

In [4]:
# Realiza a validação cruzada de 5 folds no classificador SVM usando o conjunto de dados Iris
scores = cross_val_score(clf, iris.data, iris.target, cv=5)
# cross_val_score realiza a validação cruzada:
# clf é o classificador a ser validado
# iris.data são os dados de entrada (características das flores)
# iris.target são as etiquetas de classe (espécies das flores)
# cv=5 especifica que será utilizada uma validação cruzada de 5 folds


# Imprime as acurácias de cada fold da validação cruzada
print (scores)
# Exibe as acurácias do modelo em cada fold da validação cruzada


# Imprime a acurácia média do modelo
print (scores.mean())

[0.96666667 1.         0.96666667 0.96666667 1.        ]
0.9800000000000001


In [5]:
# Cria um classificador SVM com kernel polinomial 
# svm.SVC cria um classificador de Máquina de Vetores de Suporte (SVM) com um kernel polinomial 
# kernel='poly' especifica que o kernel usado é polinomial
# C=1 é o parâmetro de regularização, que controla a penalidade para erros de classificação
clf = svm.SVC(kernel='poly', C=1).fit(X_train, Y_train)


# Realiza a validação cruzada de 5 folds no classificador SVM usando o conjunto de dados Iris 
# cross_val_score realiza a validação cruzada: # clf é o classificador a ser validado
# iris.data são os dados de entrada (características das flores) 
# iris.target são as etiquetas de classe (espécies das flores)
# cv=5 especifica que será utilizada uma validação cruzada de 5 folds
scores = cross_val_score(clf, iris.data, iris.target, cv=5)


# Imprime as acurácias de cada fold da validação cruzada
print (scores)

# Imprime a acurácia média do modelo
print (scores.mean())

[0.96666667 1.         0.96666667 0.96666667 1.        ]
0.9800000000000001


In [6]:
clf = svm.SVC(kernel ='poly', C=1).fit(X_train, Y_train)

clf.score(X_test, Y_test)

0.9

In [7]:
# Cria um classificador SVM com kernel polinomial e treina o modelo
clf = svm.SVC(kernel='poly', C=1).fit(X_train, Y_train)
# svm.SVC cria um classificador de Máquina de Vetores de Suporte (SVM) com um kernel polinomial.
# kernel='poly' especifica que o kernel usado é polinomial.
# C=1 é o parâmetro de regularização, que controla a penalidade para erros de classificação.
# .fit(X_train, Y_train) treina o classificador SVM usando os dados de treinamento (X_train e Y_train).



# Avalia o modelo no conjunto de teste e retorna a acurácia
accuracy = clf.score(X_test, Y_test)
# .score(X_test, Y_test) avalia a performance do modelo treinado nos dados de teste.
# Retorna a acurácia do modelo, que é a proporção de previsões corretas feitas pelo modelo em relação ao total de previsões.

Activity

Esse código treina dois modelos SVM diferentes (um com kernel polinomial de grau 2 e outro com kernel linear) para classificar dados do conjunto de dados Iris. Depois avalia e compara a acurácia desses modelos nos dados de teste.

In [None]:
import numpy as np  # Importa a biblioteca NumPy para manipulação de arrays
from sklearn import svm  # Importa o módulo SVM da biblioteca Scikit-Learn para criar e treinar o modelo SVM
from sklearn.model_selection import train_test_split  # Importa a função para dividir os dados em conjuntos de treino e teste
from sklearn.datasets import load_iris  # Importa um conjunto de dados de exemplo (Iris)

data = load_iris()  # Carrega o conjunto de dados Iris
X = data.data  # Extrai as características dos dados
y = data.target  # Extrai as etiquetas correspondentes às espécies de íris

# Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Divide os dados em conjuntos de treinamento (70%) e teste (30%), garantindo a reprodutibilidade com random_state=42

# Tentando um kernel polinomial de grau 2 e comparando com o kernel linear:

# SVM com kernel polinomial de grau 2
clf_poly_2 = svm.SVC(kernel='poly', degree=2, C=1).fit(X_train, y_train)
# Cria um classificador SVM com kernel polinomial de grau 2 e parâmetro de regularização C=1, e treina o classificador com os dados de treinamento X_train e y_train

# Acurácia com dados de teste usando o kernel polinomial de grau 2
accuracy_poly_2 = clf_poly_2.score(X_test, y_test)
print(f"Acurácia com kernel polinomial de grau 2: {accuracy_poly_2}")
# Calcula a acurácia do classificador nos dados de teste X_test e y_test, e exibe a acurácia do classificador com kernel polinomial de grau 2

# SVM com kernel linear
clf_linear = svm.SVC(kernel='linear', C=1).fit(X_train, y_train)
# Cria um classificador SVM com kernel linear e parâmetro de regularização C=1, e treina o classificador com os dados de treinamento X_train e y_train

# Acurácia com dados de teste usando o kernel linear
accuracy_linear = clf_linear.score(X_test, y_test)
print(f"Acurácia com kernel linear: {accuracy_linear}")
# Calcula a acurácia do classificador nos dados de teste X_test e y_test, e exibe a acurácia do classificador com kernel linear


Acurácia com kernel polinomial de grau 2: 1.0
Acurácia com kernel linear: 1.0
