<a href="https://colab.research.google.com/github/alexcpass/python_ad/blob/main/Machine_learning_isis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Modelo simples de projeto de machine learning utilizando Python no Google Colab

Criaremos um modelo de classificação usando o conjunto de dados Iris, que é um conjunto de dados clássico frequentemente utilizado para fins de aprendizado de máquina.

Etapa 1: Importar bibliotecas e carregar o conjunto de dados

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"
columns = ["sepal_length", "sepal_width", "petal_length", "petal_width", "class"]
df = pd.read_csv(url, names=columns)

df.head()

Etapa 2: Pré-processamento dos dados.

---



---


Etapas básicas de pré-processamento antes de construir o modelo. Neste caso, não há muitos dados faltantes ou inconsistentes no conjunto de dados Iris, então faremos apenas a codificação das classes em formato numérico.

In [None]:
# Codificar as classes (rótulos) em formato numérico
le = LabelEncoder()
df['class_encoded'] = le.fit_transform(df['class'])

# Separar recursos (features) e rótulos (labels)
X = df.drop(['class', 'class_encoded'], axis=1)
y = df['class_encoded']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


Etapa 3: Treinamento e avaliação do modelo.
Usaremos o algoritmo RandomForestClassifier para criar o modelo de classificação. Em seguida, avaliaremos a precisão do modelo utilizando o conjunto de teste.

In [None]:
# Criar o modelo
model = RandomForestClassifier(random_state=42)

# Treinar o modelo
model.fit(X_train, y_train)

# Fazer previsões com os dados de teste
y_pred = model.predict(X_test)

# Avaliar precisão
accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia do modelo: {accuracy:.2f}")

# Relatório de classificação e a matriz de confusão
print("\nRelatório de Classificação:")
print(classification_report(y_test, y_pred))

print("\nMatriz de Confusão:")
print(confusion_matrix(y_test, y_pred))


Passo 4: Visualização dos resultados.
Por fim, vamos visualizar a matriz de confusão para verificar as previsões do modelo em relação aos rótulos reais.

In [None]:
# Visualizar a matriz de confusão
labels = le.classes_
conf_matrix = confusion_matrix(y_test, y_pred)

plt.figure(figsize=(6, 4))
plt.imshow(conf_matrix, interpolation='nearest', cmap=plt.cm.Blues)
plt.title('Matriz de Confusão')
plt.colorbar()
tick_marks = np.arange(len(labels))
plt.xticks(tick_marks, labels, rotation=45)
plt.yticks(tick_marks, labels)
plt.xlabel('Rótulo Previsto')
plt.ylabel('Rótulo Real')
plt.show()
