In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline

In [4]:
# ==============================================================================
# Exercício 1: Previsão de Aprovação de Aluno
# ==============================================================================
print("="*50)
print("Executando Exercício 1: Previsão de Aprovação de Aluno")
print("="*50)

# Criando o dataset
dados_alunos = pd.DataFrame({
    "horas_estudo": [5, 2, 7, 8, 1, 10, 3, 6],
    "frequencia": [80, 60, 90, 95, 50, 98, 65, 85],
    "curso": ["ADS", "Mecatrônica", "Engenharia", "ADS", "Mecatrônica", "Engenharia", "ADS", "Mecatrônica"],
    "resultado": [1, 0, 1, 1, 0, 1, 0, 1] # 1 = passa, 0 = reprova
})

print("Dataset de Alunos:")
print(dados_alunos)
print("\n")

# Preparação dos dados
# Separando as features (X) e o target (y)
X_alunos = dados_alunos.drop("resultado", axis=1)
y_alunos = dados_alunos["resultado"]

# Identificando as colunas categóricas e numéricas
categorical_features_alunos = ["curso"]
numerical_features_alunos = ["horas_estudo", "frequencia"]

# Criando um transformador para aplicar One-Hot Encoding nas colunas categóricas
# O restante das colunas (numéricas) será mantido (passthrough)
preprocessor_alunos = ColumnTransformer(
    transformers=[
        ('cat', OneHotEncoder(), categorical_features_alunos)
    ],
    remainder='passthrough'
)

# Dividindo os dados em treino e teste
# Usamos uma proporção de 30% para teste e um random_state para reprodutibilidade
X_train_alunos, X_test_alunos, y_train_alunos, y_test_alunos = train_test_split(
    X_alunos, y_alunos, test_size=0.3, random_state=42
)

# Criando e treinando o modelo de Regressão Logística
# Usamos um Pipeline para encadear o pré-processamento e o modelo
model_alunos = Pipeline(steps=[('preprocessor', preprocessor_alunos),
                               ('classifier', LogisticRegression(random_state=42))])

# Treinando o modelo com os dados de treino
model_alunos.fit(X_train_alunos, y_train_alunos)

# Fazendo previsões e avaliando o modelo
y_pred_alunos = model_alunos.predict(X_test_alunos)

# Calculando a acurácia
accuracy_alunos = accuracy_score(y_test_alunos, y_pred_alunos)
print(f"Acurácia do modelo de alunos: {accuracy_alunos:.2f}")

# Exibindo o relatório de classificação completo
print("\nRelatório de Classificação (Alunos):")
print(classification_report(y_test_alunos, y_pred_alunos))

# Exemplo de previsão para um novo aluno
novo_aluno = pd.DataFrame({
    "horas_estudo": [6],
    "frequencia": [88],
    "curso": ["Engenharia"]
})

predicao_novo_aluno = model_alunos.predict(novo_aluno)
probabilidade_novo_aluno = model_alunos.predict_proba(novo_aluno)

print("--- Exemplo de Previsão ---")
print("Dados do novo aluno:")
print(novo_aluno)
print(f"Previsão: {'Passa' if predicao_novo_aluno[0] == 1 else 'Reprova'}")
print(f"Probabilidades: Reprovar = {probabilidade_novo_aluno[0][0]:.2f}, Passar = {probabilidade_novo_aluno[0][1]:.2f}")

Dataset de Alunos:
   horas_estudo  frequencia        curso  resultado
0             5          80          ADS          1
1             2          60  Mecatrônica          0
2             7          90   Engenharia          1
3             8          95          ADS          1
4             1          50  Mecatrônica          0
5            10          98   Engenharia          1
6             3          65          ADS          0
7             6          85  Mecatrônica          1


Acurácia do modelo de alunos: 1.00

Relatório de Classificação (Alunos):
              precision    recall  f1-score   support

           0       1.00      1.00      1.00         1
           1       1.00      1.00      1.00         2

    accuracy                           1.00         3
   macro avg       1.00      1.00      1.00         3
weighted avg       1.00      1.00      1.00         3

--- Exemplo de Previsão ---
Dados do novo aluno:
   horas_estudo  frequencia       curso
0             6       

In [5]:
# ==============================================================================
# Exercício 2: Previsão de Falha de Máquina
# ==============================================================================
print("\n\n" + "="*50)
print("Executando Exercício 2: Previsão de Falha de Máquina")
print("="*50)

# Criando o dataset
dados_maquinas = pd.DataFrame({
    "temperatura": [65, 80, 90, 72, 85, 95, 60, 88, 70, 92],
    "turno": ["manhã", "tarde", "noite", "manhã", "tarde", "noite", "manhã", "tarde", "noite", "manhã"],
    "manutencao": ["nenhuma", "preventiva", "corretiva", "nenhuma", "preventiva", "corretiva", "nenhuma", "nenhuma", "preventiva", "corretiva"],
    "falha": [0, 0, 1, 0, 0, 1, 0, 1, 0, 1] # 0 = não falhou, 1 = falhou
})

print("Dataset de Máquinas:")
print(dados_maquinas)
print("\n")

# Preparação dos dados
# Separando as features (X) e o target (y)
X_maquinas = dados_maquinas.drop("falha", axis=1)
y_maquinas = dados_maquinas["falha"]

# Identificando as colunas categóricas e numéricas
categorical_features_maquinas = ["turno", "manutencao"]
numerical_features_maquinas = ["temperatura"]

# Criando o transformador
preprocessor_maquinas = ColumnTransformer(
    transformers=[
        ('cat', OneHotEncoder(), categorical_features_maquinas)
    ],
    remainder='passthrough'
)

# Dividindo os dados em treino e teste
X_train_maquinas, X_test_maquinas, y_train_maquinas, y_test_maquinas = train_test_split(
    X_maquinas, y_maquinas, test_size=0.3, random_state=42
)

# Criando e treinando o modelo de Regressão Logística
model_maquinas = Pipeline(steps=[('preprocessor', preprocessor_maquinas),
                                 ('classifier', LogisticRegression(random_state=42))])

model_maquinas.fit(X_train_maquinas, y_train_maquinas)

# Fazendo previsões e avaliando o modelo
y_pred_maquinas = model_maquinas.predict(X_test_maquinas)

accuracy_maquinas = accuracy_score(y_test_maquinas, y_pred_maquinas)
print(f"Acurácia do modelo de máquinas: {accuracy_maquinas:.2f}")

print("\nRelatório de Classificação (Máquinas):")
print(classification_report(y_test_maquinas, y_pred_maquinas, zero_division=0))

# Exemplo de previsão para uma nova situação da máquina
nova_maquina = pd.DataFrame({
    "temperatura": [93],
    "turno": ["noite"],
    "manutencao": ["nenhuma"]
})

predicao_nova_maquina = model_maquinas.predict(nova_maquina)
probabilidade_nova_maquina = model_maquinas.predict_proba(nova_maquina)

print("--- Exemplo de Previsão ---")
print("Dados da nova máquina:")
print(nova_maquina)
print(f"Previsão: {'Vai falhar' if predicao_nova_maquina[0] == 1 else 'Não vai falhar'}")
print(f"Probabilidades: Não Falhar = {probabilidade_nova_maquina[0][0]:.2f}, Falhar = {probabilidade_nova_maquina[0][1]:.2f}")



Executando Exercício 2: Previsão de Falha de Máquina
Dataset de Máquinas:
   temperatura  turno  manutencao  falha
0           65  manhã     nenhuma      0
1           80  tarde  preventiva      0
2           90  noite   corretiva      1
3           72  manhã     nenhuma      0
4           85  tarde  preventiva      0
5           95  noite   corretiva      1
6           60  manhã     nenhuma      0
7           88  tarde     nenhuma      1
8           70  noite  preventiva      0
9           92  manhã   corretiva      1


Acurácia do modelo de máquinas: 1.00

Relatório de Classificação (Máquinas):
              precision    recall  f1-score   support

           0       1.00      1.00      1.00         2
           1       1.00      1.00      1.00         1

    accuracy                           1.00         3
   macro avg       1.00      1.00      1.00         3
weighted avg       1.00      1.00      1.00         3

--- Exemplo de Previsão ---
Dados da nova máquina:
   temperatura  