# Exemplo prático do OneR. 
Temos aqui uma implementação manual do algoritmo. 

### Dependências 

In [None]:
# pip install pandas scikit-learn
# pip install sklearn-one-r

#### Bibliotecas

In [1]:
# Importando bibliotecas necessárias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, accuracy_score

### Base de dados

In [10]:
# Criando uma base de dados fictícia
data = {
    "Temperatura": ["Quente", "Quente", "Quente", "Frio", "Frio", "Frio", "Moderada", "Moderada", "Moderada", "Quente"],
    "Umidade": ["Alta", "Alta", "Normal", "Alta", "Normal", "Normal", "Alta", "Normal", "Alta", "Normal"],
    "Vento": ["Fraco", "Forte", "Fraco", "Fraco", "Fraco", "Forte", "Forte", "Fraco", "Fraco", "Forte"],
    "Jogar": ["Não", "Não", "Sim", "Sim", "Sim", "Não", "Sim", "Sim", "Sim", "Não"],
}

# Convertendo para um DataFrame
df = pd.DataFrame(data)

df.head()


Unnamed: 0,Temperatura,Umidade,Vento,Jogar
0,Quente,Alta,Fraco,Não
1,Quente,Alta,Forte,Não
2,Quente,Normal,Fraco,Sim
3,Frio,Alta,Fraco,Sim
4,Frio,Normal,Fraco,Sim


### Divisão da Base de dados

In [11]:
# Dividindo os dados em recursos (X) e rótulos (y)
X = df[["Temperatura", "Umidade", "Vento"]]
y = df["Jogar"]

# Dividindo entre treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


### Algoritmo 

In [12]:
# Implementando o OneR manualmente
def train_one_r(X, y):
    rules = {}
    best_accuracy = 0
    best_feature = None

    # Itera por cada coluna (atributo)
    for column in X.columns:
        rule = {}
        # Cria regras baseadas na maior frequência por atributo e classe
        for value in X[column].unique():
            most_common_class = y[X[column] == value].mode()[0]
            rule[value] = most_common_class
        # Calcula a precisão da regra
        predictions = X[column].map(rule)
        accuracy = accuracy_score(y, predictions)
        if accuracy > best_accuracy:
            best_accuracy = accuracy
            best_feature = column
            rules = rule

    return best_feature, rules, best_accuracy

### Treinando o modelo OneR

In [13]:
# Treinando o modelo OneR
best_feature, rules, accuracy = train_one_r(X_train, y_train)

print(f"Melhor atributo: {best_feature}")
print(f"Regras geradas: {rules}")
print(f"Acurácia no treino: {accuracy:.2f}")

Melhor atributo: Temperatura
Regras geradas: {'Quente': 'Não', 'Moderada': 'Sim', 'Frio': 'Sim'}
Acurácia no treino: 0.86


### Aplicando as regras no conjunto de teste

In [14]:
X_test["Prediction"] = X_test[best_feature].map(rules)
test_accuracy = accuracy_score(y_test, X_test["Prediction"])

print("\n--- Resultados no conjunto de teste ---")
print(f"Acurácia no teste: {test_accuracy:.2f}")
print("\nRelatório de classificação:")
print(classification_report(y_test, X_test["Prediction"]))


--- Resultados no conjunto de teste ---
Acurácia no teste: 0.67

Relatório de classificação:
              precision    recall  f1-score   support

         Não       1.00      0.50      0.67         2
         Sim       0.50      1.00      0.67         1

    accuracy                           0.67         3
   macro avg       0.75      0.75      0.67         3
weighted avg       0.83      0.67      0.67         3

