<a href="https://colab.research.google.com/github/Dormundo/Teste-Data-ICMC/blob/master/C%C3%B3pia_de_Data_ICMC_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.svm import SVC
from sklearn.linear_model import LinearRegression
from sklearn.metrics import accuracy_score, mean_squared_error, classification_report
from sklearn.preprocessing import LabelEncoder

class Modelo:
    def __init__(self):
        self.df = None
        self.model = None
        self.X_test = None
        self.y_test = None

    def CarregarDataset(self, path):
        """
        Carrega o conjunto de dados a partir de um arquivo CSV.
        """
        colunas = ['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm', 'Species']
        self.df = pd.read_csv(path, names=colunas)
        print("Dataset carregado com sucesso!")
        print(self.df.head())

    def TratamentoDeDados(self):
        """
        Realiza o pré-processamento dos dados carregados.
        """
        # Exibe as primeiras linhas do dataset
        print("\nVisualizando os dados iniciais:")
        print(self.df.head())

        # Tratar valores ausentes
        if self.df.isnull().values.any():
            print("Tratando valores ausentes.")
            self.df.fillna(self.df.mean(numeric_only=True), inplace=True)

        # Codifica a coluna 'Species' para valores numéricos, se existir
        if 'Species' in self.df.columns:
            label_encoder = LabelEncoder()
            self.df['Species'] = label_encoder.fit_transform(self.df['Species'])
            self.label_encoder = label_encoder

        # Define features (X) e rótulo (y)
        self.X = self.df[['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm']]
        self.y = self.df['Species']

    def Treinamento(self, modelo_escolhido="SVC"):
        """
        Treina o modelo de machine learning.
        """
        # Divide os dados em conjuntos de treino e teste
        X_train, X_test, y_train, y_test = train_test_split(self.X, self.y, test_size=0.2, random_state=42)

        # Escolha e treinamento do modelo
        if modelo_escolhido == "SVC":
            self.model = SVC(kernel='linear')
        elif modelo_escolhido == "LinearRegression":
            self.model = LinearRegression()
        else:
            raise ValueError("Modelo não suportado. Escolha 'SVC' ou 'LinearRegression'.")

        self.model.fit(X_train, y_train)
        print(f"Modelo {modelo_escolhido} treinado com sucesso.")

        # Validação cruzada para SVC
        if modelo_escolhido == "SVC":
            scores = cross_val_score(self.model, X_train, y_train, cv=5)
            print(f"Acurácia média na validação cruzada: {scores.mean():.2f}")

        # Guarda o conjunto de teste para avaliação
        self.X_test, self.y_test = X_test, y_test

    def Teste(self):
        """
        Avalia o desempenho do modelo treinado nos dados de teste.
        """
        y_pred = self.model.predict(self.X_test)

        if isinstance(self.model, SVC):
            accuracy = accuracy_score(self.y_test, y_pred)
            print(f"Acurácia do modelo SVC: {accuracy:.2f}")
            print("\nRelatório de Classificação:\n", classification_report(self.y_test, y_pred, target_names=self.label_encoder.classes_))

        elif isinstance(self.model, LinearRegression):
            mse = mean_squared_error(self.y_test, y_pred)
            print(f"Erro Médio Quadrático (MSE) da Regressão Linear: {mse:.2f}")

    def Train(self, path="iris.data", modelo_escolhido="SVC"):
        """
        Função principal para o fluxo de treinamento do modelo.
        """
        self.CarregarDataset(path)
        self.TratamentoDeDados()
        self.Treinamento(modelo_escolhido)
        self.Teste()




In [None]:
# Exemplo de uso:
modelo = Modelo()
modelo.Train(path="/content/drive/MyDrive/python usp/iris.data", modelo_escolhido="SVC")  # Altere para "LinearRegression" se quiser comparar

Dataset carregado com sucesso!
   SepalLengthCm  SepalWidthCm  PetalLengthCm  PetalWidthCm      Species
0            5.1           3.5            1.4           0.2  Iris-setosa
1            4.9           3.0            1.4           0.2  Iris-setosa
2            4.7           3.2            1.3           0.2  Iris-setosa
3            4.6           3.1            1.5           0.2  Iris-setosa
4            5.0           3.6            1.4           0.2  Iris-setosa

Visualizando os dados iniciais:
   SepalLengthCm  SepalWidthCm  PetalLengthCm  PetalWidthCm      Species
0            5.1           3.5            1.4           0.2  Iris-setosa
1            4.9           3.0            1.4           0.2  Iris-setosa
2            4.7           3.2            1.3           0.2  Iris-setosa
3            4.6           3.1            1.5           0.2  Iris-setosa
4            5.0           3.6            1.4           0.2  Iris-setosa
Modelo SVC treinado com sucesso.
Acurácia média na validação