<a href="https://colab.research.google.com/github/Dormundo/Teste-Data-ICMC/blob/master/ML_iris.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [5]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

class ProcessoML:
    def __init__(self, pergunta, path_dados):
        """
        Inicializa o processo de Machine Learning com uma pergunta e um caminho para o dataset.
        """
        self.pergunta = pergunta
        self.path_dados = path_dados
        self.df = None
        self.model = None
        self.X_train, self.X_test, self.y_train, self.y_test = None, None, None, None
        self.scaler = None
        print(f"Pergunta inicial: {self.pergunta}")

    def coletar_dados(self):
        """
        Carrega os dados do dataset.
        """
        print("\nColetando dados...")
        self.df = pd.read_csv(self.path_dados)
        print("Dados carregados com sucesso!")
        print(self.df.head())

    def limpar_dados(self):
        """
        Limpa os dados tratando valores ausentes e outros problemas.
        """
        print("\nLimpando dados...")
        if self.df.isnull().values.any():
            self.df.fillna(self.df.mean(numeric_only=True), inplace=True)
        print("Dados limpos com sucesso!")

    def criar_atributos(self):
        """
        Define os atributos e o alvo.
        """
        print("\nCriando atributos...")
        self.X = self.df.iloc[:, :-1]  # Todas as colunas menos a última
        self.y = self.df.iloc[:, -1]   # Última coluna como variável alvo
        print("Atributos criados.")

    def normalizar_dados(self):
        """
        Normaliza os dados para melhorar o desempenho do modelo.
        """
        print("\nNormalizando dados...")
        self.scaler = StandardScaler()
        self.X = self.scaler.fit_transform(self.X)
        print("Dados normalizados.")

    def dividir_amostras(self):
        """
        Divide os dados em conjuntos de treino e teste.
        """
        print("\nDividindo dados em treino e teste...")
        self.X_train, self.X_test, self.y_train, self.y_test = train_test_split(self.X, self.y, test_size=0.2, random_state=42)
        print("Divisão concluída.")

    def criar_modelo(self):
        """
        Cria e treina o modelo.
        """
        print("\nCriando o modelo...")
        self.model = SVC(kernel='linear')
        self.model.fit(self.X_train, self.y_train)
        print("Modelo treinado.")

    def avaliar_modelo(self):
        """
        Avalia o desempenho do modelo usando o conjunto de teste.
        """
        print("\nAvaliando o modelo...")
        y_pred = self.model.predict(self.X_test)
        accuracy = accuracy_score(self.y_test, y_pred)
        print(f"Acurácia do modelo: {accuracy:.2f}")
        print("\nRelatório de classificação:")
        print(classification_report(self.y_test, y_pred))
        print("Matriz de Confusão:\n", confusion_matrix(self.y_test, y_pred))

        # Retorna True se a acurácia for satisfatória, caso contrário, False
        return accuracy > 0.7

    def implantar_modelo(self):
        """
        Implanta o modelo, neste caso apenas simula a implantação com uma mensagem.
        """
        print("\nImplantando o modelo...")
        print("Modelo implantado com sucesso!")

    def mudar_pergunta(self, nova_pergunta):
        """
        Muda a pergunta e reinicia o processo.
        """
        print("\nMudando a pergunta...")
        self.pergunta = nova_pergunta
        print(f"Nova pergunta: {self.pergunta}")
        self.executar()

    def executar(self):
        """
        Executa todo o processo de Machine Learning.
        """
        print("\nIniciando o processo de Machine Learning...")
        self.coletar_dados()
        self.limpar_dados()
        self.criar_atributos()
        self.normalizar_dados()
        self.dividir_amostras()
        self.criar_modelo()
        if self.avaliar_modelo():
            self.implantar_modelo()
        else:
            self.mudar_pergunta("Como posso melhorar a acurácia do modelo?")




In [3]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
# Exemplo de uso
caminho_dataset = "/content/drive/MyDrive/python usp/iris.data"
processo_ml = ProcessoML(pergunta="Qual é a espécie da flor com base nas medidas?", path_dados=caminho_dataset)
processo_ml.executar()

Pergunta inicial: Qual é a espécie da flor com base nas medidas?

Iniciando o processo de Machine Learning...

Coletando dados...
Dados carregados com sucesso!
   5.1  3.5  1.4  0.2  Iris-setosa
0  4.9  3.0  1.4  0.2  Iris-setosa
1  4.7  3.2  1.3  0.2  Iris-setosa
2  4.6  3.1  1.5  0.2  Iris-setosa
3  5.0  3.6  1.4  0.2  Iris-setosa
4  5.4  3.9  1.7  0.4  Iris-setosa

Limpando dados...
Dados limpos com sucesso!

Criando atributos...
Atributos criados.

Normalizando dados...
Dados normalizados.

Dividindo dados em treino e teste...
Divisão concluída.

Criando o modelo...
Modelo treinado.

Avaliando o modelo...
Acurácia do modelo: 0.93

Relatório de classificação:
                 precision    recall  f1-score   support

    Iris-setosa       1.00      1.00      1.00        10
Iris-versicolor       1.00      0.78      0.88         9
 Iris-virginica       0.85      1.00      0.92        11

       accuracy                           0.93        30
      macro avg       0.95      0.93      