# Reguły decyzyjne

In [5]:
import pandas as pd
from helpers import sequential_covering, predict

In [6]:
# użycie zbioru danych z owocami i generowanie reguł decyzyjnych
plik = "data/owoce_dataset.txt"

df = pd.read_csv(plik, sep=",", header=None)
df.columns = ["Kolor","Kształt", "Waga", "Decyzja"]
df.head(10)

Unnamed: 0,Kolor,Kształt,Waga,Decyzja
0,czerwony,okrągły,lekka,jabłko
1,zielony,okrągły,lekka,jabłko
2,żółty,wydłużony,średnia,banan
3,żółty,wydłużony,średnia,banan
4,zielony,podłużny,lekka,cytryna
5,żółty,podłużny,lekka,cytryna
6,żółty,okrągły,średnia,cytryna
7,czerwony,okrągły,średnia,jabłko
8,żółty,wydłużony,lekka,banan
9,zielony,okrągły,średnia,jabłko


In [7]:
df["Decyzja"] = df["Decyzja"].map({"jabłko": 0, "banan":1,"cytryna": 2}) # mapowanie do numerycznych wartości

X = df.drop("Decyzja", axis=1)
y = df["Decyzja"]

rules = sequential_covering(X, y, max_rules=5)

print("Wygenerowane reguły decyzyjne:")
for rule, rule_class, count in rules:
    print (" AND ".join([f"{atr} = {value}" for atr, value in rule]), f" -> Klasa: {rule_class}, Pokrycie: {count}")

Wygenerowane reguły decyzyjne:
Kolor = czerwony  -> Klasa: 0, Pokrycie: 2
Kształt = wydłużony  -> Klasa: 1, Pokrycie: 3
Kształt = podłużny  -> Klasa: 2, Pokrycie: 2
Kolor = zielony AND Kształt = okrągły  -> Klasa: 0, Pokrycie: 2
Kształt = okrągły AND Kolor = żółty  -> Klasa: 2, Pokrycie: 1


In [8]:
# Testowanie modelu na zbiorze oryginalnym
predictions = predict(X, rules)
df["Predykcja"] = predictions
print(df)

# Obliczenie dokładności
accuracy = (df["Decyzja"] == df["Predykcja"]).mean()
print(f"Dokładność klasyfikacji: {accuracy * 100:.2f}%")

      Kolor    Kształt     Waga  Decyzja  Predykcja
0  czerwony    okrągły    lekka        0          0
1   zielony    okrągły    lekka        0          0
2     żółty  wydłużony  średnia        1          1
3     żółty  wydłużony  średnia        1          1
4   zielony   podłużny    lekka        2          2
5     żółty   podłużny    lekka        2          2
6     żółty    okrągły  średnia        2          2
7  czerwony    okrągły  średnia        0          0
8     żółty  wydłużony    lekka        1          1
9   zielony    okrągły  średnia        0          0
Dokładność klasyfikacji: 100.00%
