In [1]:
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.model_selection import GridSearchCV

In [10]:
# Carregar o conjunto de dados MNIST
mnist = fetch_openml('mnist_784', version=1)

# Dividir o conjunto de dados em conjuntos de treinamento e teste
# X_train, X_test, y_train, y_test = train_test_split(mnist.data, mnist.target, train_size=0.4, test_size=0.05, random_state=42)


X_train, X_remaining, y_train, y_remaining = train_test_split(mnist.data, mnist.target, train_size=0.2, random_state=42)

# Descartar o restante dos dados (50% que não serão usados)
# Não precisamos do X_remaining e y_remaining se estamos usando apenas 50% dos dados
del X_remaining, y_remaining

# Agora, dividir os dados de treinamento e teste normalmente, usando 80% para treinamento e 20% para teste
X_train_amostra, X_test, y_train_amostra, y_test = train_test_split(X_train, y_train, train_size=0.8, test_size=0.2, random_state=42)


In [11]:
# Definir os parâmetros a serem testados
param_grid = {
    'C': [0.1, 1, 10],
    'gamma': [0.001, 0.01, 0.1],
}

# Testar diferentes kernels
kernels = ['linear', 'poly', 'rbf']

In [None]:
for kernel in kernels:
    print(f"Kernel: {kernel}")
    
    # Criar o classificador SVC
    svc = SVC(kernel=kernel)
    
    # Realizar a busca em grade para encontrar os melhores parâmetros
    grid_search = GridSearchCV(svc, param_grid, cv=3, n_jobs=4)
    grid_search.fit(X_train_amostra, y_train_amostra)
    
    # Avaliar o modelo com os melhores parâmetros
    best_svc = grid_search.best_estimator_
    y_pred = best_svc.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    print(f"Acurácia com os melhores parâmetros: {accuracy}")
    print(f"Melhores parâmetros encontrados: {grid_search.best_params_}")