In [1]:
import pandas as pd
from sklearn.tree import DecisionTreeClassifier, export_text
from sklearn.preprocessing import LabelEncoder

# Dane
data = {
    'wiek': [25, 28, 29, 31, 35, 38, 38, 39, 41, 42, 45, 48, 56, 56],
    'status': ['kawaler', 'żonaty', 'kawaler', 'kawaler', 'żonaty', 'rozwiedziony',
               'rozwiedziony', 'rozwiedziony', 'żonaty', 'rozwiedziony', 'żonaty',
               'żonaty', 'żonaty', 'rozwiedziony'],
    'dochód': ['niski', 'niski', 'wysoki', 'niski', 'średni', 'wysoki', 'niski',
               'wysoki', 'średni', 'średni', 'średni', 'średni', 'wysoki', 'wysoki'],
    'dzieci': [0, 1, 0, 0, 1, 2, 2, 0, 1, 4, 2, 1, 2, 2],
    'ryzyko': ['wysokie', 'wysokie', 'niskie', 'wysokie', 'niskie', 'niskie',
               'wysokie', 'wysokie', 'niskie', 'wysokie', 'niskie', 'niskie',
               'niskie', 'niskie']
}

df = pd.DataFrame(data)

# Kodowanie kategorycznych danych
le_status = LabelEncoder()
le_dochod = LabelEncoder()
le_ryzyko = LabelEncoder()

df['status_enc'] = le_status.fit_transform(df['status'])
df['dochód_enc'] = le_dochod.fit_transform(df['dochód'])
df['ryzyko_enc'] = le_ryzyko.fit_transform(df['ryzyko'])

# Dane wejściowe do modelu
X = df[['wiek', 'status_enc', 'dochód_enc', 'dzieci']]
y = df['ryzyko_enc']

# Inicjalizacja i trenowanie modelu
clf = DecisionTreeClassifier(criterion='gini', max_depth=3, random_state=0)
clf.fit(X, y)

# Wyświetlenie drzewa decyzyjnego w formie tekstowej
feature_names = ['wiek', 'status', 'dochód', 'dzieci']
tree_rules = export_text(clf, feature_names=feature_names)
print(tree_rules)

# Przewidywanie na przykładzie całego zbioru danych (opcjonalne)
y_pred = clf.predict(X)
print("\nPredykcje na podstawie danych treningowych:")
print(le_ryzyko.inverse_transform(y_pred))


|--- dochód <= 0.50
|   |--- class: 1
|--- dochód >  0.50
|   |--- dzieci <= 3.00
|   |   |--- dzieci <= 0.50
|   |   |   |--- class: 0
|   |   |--- dzieci >  0.50
|   |   |   |--- class: 0
|   |--- dzieci >  3.00
|   |   |--- class: 1


Predykcje na podstawie danych treningowych:
['wysokie' 'wysokie' 'niskie' 'wysokie' 'niskie' 'niskie' 'wysokie'
 'niskie' 'niskie' 'wysokie' 'niskie' 'niskie' 'niskie' 'niskie']
