In [None]:
# 1. Importando as bibliotecas necessárias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.svm import SVR
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error

In [None]:
# 2. Carregando o conjunto de dados
# O dataset será baixado automaticamente
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv'
df = pd.read_csv(url, sep=';')

In [None]:
# Exibindo as primeiras 5 linhas para inspeção
print("Primeiras 5 linhas do dataset:")
print(df.head())

Primeiras 5 linhas do dataset:
   fixed acidity  volatile acidity  citric acid  residual sugar  chlorides  \
0            7.4              0.70         0.00             1.9      0.076   
1            7.8              0.88         0.00             2.6      0.098   
2            7.8              0.76         0.04             2.3      0.092   
3           11.2              0.28         0.56             1.9      0.075   
4            7.4              0.70         0.00             1.9      0.076   

   free sulfur dioxide  total sulfur dioxide  density    pH  sulphates  \
0                 11.0                  34.0   0.9978  3.51       0.56   
1                 25.0                  67.0   0.9968  3.20       0.68   
2                 15.0                  54.0   0.9970  3.26       0.65   
3                 17.0                  60.0   0.9980  3.16       0.58   
4                 11.0                  34.0   0.9978  3.51       0.56   

   alcohol  quality  
0      9.4        5  
1      9.8 

In [None]:
# 3. Preparando os dados
# X são as características (todas as colunas exceto 'quality')
# y é a variável alvo ('quality')
X = df.drop('quality', axis=1)
y = df['quality']

In [None]:
# Dividindo os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
# Normalizando as características (um passo importante para o SVR)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [None]:
# 4. Treinando o modelo de SVR
# Usando o kernel 'rbf' (Radial Basis Function) para um problema não-linear
svr_model = SVR(kernel='rbf', C=100, gamma=0.1, epsilon=.1)
svr_model.fit(X_train_scaled, y_train)

In [None]:
# 5. Fazendo previsões e avaliando o modelo
y_pred = svr_model.predict(X_test_scaled)

In [None]:
# Arredondando as previsões para a nota inteira mais próxima (já que a qualidade é um valor discreto)
y_pred_rounded = np.round(y_pred)

In [None]:
# Avaliando o desempenho do modelo usando o Erro Quadrático Médio
mse = mean_squared_error(y_test, y_pred)
print("\nErro Quadrático Médio (MSE):", mse)


Erro Quadrático Médio (MSE): 0.5136520483627351


In [None]:
# Exibindo algumas previsões e os valores reais para comparação
print("\nComparando Previsões com Valores Reais:")
comparison_df = pd.DataFrame({'Real': y_test, 'Previsto': y_pred_rounded})
print(comparison_df.head(10))


Comparando Previsões com Valores Reais:
      Real  Previsto
803      6       6.0
124      5       5.0
350      6       4.0
682      5       6.0
1326     6       6.0
976      5       5.0
1493     5       5.0
706      5       5.0
613      5       6.0
1587     6       6.0
