In [2]:
# Load libraries
import numpy as np
import pandas as pd
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report

In [3]:
col_names = ['Class Name', 'Left-Weight', 'Left-Distance', 'Right-Weight', 'Right-Distance']
# load dataset
data = pd.read_csv("./dataset/balance-scale.data", header=None, names=col_names)


In [4]:
data.head()

Unnamed: 0,Class Name,Left-Weight,Left-Distance,Right-Weight,Right-Distance
0,B,1,1,1,1
1,R,1,1,1,2
2,R,1,1,1,3
3,R,1,1,1,4
4,R,1,1,1,5


In [5]:
#split dataset in features and target variable
feature_cols = ['Class Name', 'Left-Weight', 'Left-Distance']
Z = data[feature_cols]
X = data.values[:, 1:5]
Y = data.values[:, 0]

In [6]:
# Splitting the dataset into train and test
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size = 0.3, random_state = 100)

In [7]:
X

array([[1, 1, 1, 1],
       [1, 1, 1, 2],
       [1, 1, 1, 3],
       ...,
       [5, 5, 5, 3],
       [5, 5, 5, 4],
       [5, 5, 5, 5]], dtype=object)

In [8]:
Y

array(['B', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R',
       'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'L',
       'B', 'R', 'R', 'R', 'B', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R',
       'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'L', 'L',
       'B', 'R', 'R', 'L', 'R', 'R', 'R', 'R', 'B', 'R', 'R', 'R', 'R',
       'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'L', 'L', 'L',
       'B', 'R', 'L', 'B', 'R', 'R', 'R', 'L', 'R', 'R', 'R', 'R', 'B',
       'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'L', 'L', 'L', 'L',
       'B', 'L', 'L', 'R', 'R', 'R', 'L', 'R', 'R', 'R', 'R', 'L', 'R',
       'R', 'R', 'R', 'B', 'R', 'R', 'R', 'R', 'L', 'B', 'R', 'R', 'R',
       'B', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R', 'R',
       'R', 'R', 'R', 'R', 'R', 'R', 'R', 'L', 'L', 'L', 'B', 'R', 'L',
       'B', 'R', 'R', 'R', 'L', 'R', 'R', 'R', 'R', 'B', 'R', 'R', 'R',
       'R', 'R', 'R', 'R', 'R', 'R', 'L', 'L', 'L', 'L', 'L', 'L

In [9]:
X_train

array([[3, 5, 1, 4],
       [3, 1, 3, 5],
       [1, 3, 1, 2],
       ...,
       [3, 5, 1, 1],
       [1, 4, 1, 5],
       [5, 1, 5, 1]], dtype=object)

In [10]:
y_train

array(['L', 'R', 'L', 'L', 'L', 'L', 'L', 'B', 'L', 'L', 'B', 'R', 'L',
       'R', 'B', 'R', 'L', 'R', 'L', 'R', 'L', 'R', 'L', 'R', 'R', 'L',
       'L', 'L', 'L', 'R', 'R', 'R', 'R', 'B', 'R', 'B', 'R', 'L', 'R',
       'L', 'L', 'L', 'L', 'L', 'R', 'L', 'R', 'R', 'R', 'B', 'L', 'R',
       'L', 'L', 'L', 'R', 'R', 'L', 'L', 'L', 'L', 'R', 'L', 'R', 'B',
       'R', 'L', 'L', 'R', 'L', 'L', 'L', 'R', 'L', 'L', 'R', 'L', 'R',
       'B', 'L', 'R', 'R', 'R', 'R', 'R', 'L', 'R', 'L', 'L', 'L', 'R',
       'L', 'L', 'R', 'L', 'R', 'R', 'R', 'L', 'L', 'L', 'R', 'R', 'L',
       'L', 'L', 'R', 'R', 'R', 'L', 'R', 'L', 'L', 'L', 'L', 'B', 'R',
       'R', 'R', 'L', 'R', 'R', 'L', 'L', 'R', 'R', 'R', 'L', 'L', 'L',
       'L', 'R', 'L', 'L', 'L', 'R', 'L', 'R', 'R', 'L', 'L', 'R', 'R',
       'L', 'L', 'R', 'L', 'L', 'L', 'R', 'L', 'R', 'L', 'B', 'L', 'L',
       'R', 'L', 'R', 'L', 'L', 'R', 'R', 'B', 'L', 'R', 'L', 'R', 'R',
       'L', 'L', 'L', 'R', 'R', 'R', 'B', 'R', 'R', 'L', 'R', 'R

In [11]:
X_test

array([[4, 4, 3, 3],
       [2, 4, 1, 1],
       [4, 1, 5, 3],
       [1, 4, 1, 1],
       [3, 1, 2, 5],
       [3, 1, 3, 1],
       [5, 1, 3, 4],
       [4, 3, 1, 3],
       [4, 1, 1, 2],
       [2, 2, 2, 3],
       [4, 4, 5, 3],
       [4, 1, 2, 1],
       [5, 1, 4, 2],
       [2, 4, 2, 2],
       [1, 3, 4, 5],
       [2, 2, 5, 2],
       [4, 5, 3, 3],
       [5, 3, 3, 1],
       [4, 2, 2, 4],
       [5, 5, 3, 5],
       [5, 1, 3, 2],
       [4, 4, 4, 3],
       [2, 3, 4, 2],
       [5, 4, 1, 3],
       [2, 2, 5, 4],
       [4, 5, 2, 5],
       [5, 1, 2, 1],
       [4, 3, 2, 4],
       [4, 3, 5, 5],
       [4, 2, 1, 3],
       [2, 2, 1, 3],
       [3, 4, 3, 1],
       [3, 4, 3, 5],
       [3, 4, 2, 1],
       [2, 4, 2, 3],
       [5, 3, 2, 3],
       [2, 1, 4, 1],
       [1, 5, 1, 4],
       [2, 2, 2, 1],
       [3, 1, 4, 1],
       [3, 1, 1, 4],
       [5, 3, 1, 3],
       [1, 1, 1, 4],
       [3, 3, 3, 1],
       [1, 2, 5, 4],
       [4, 2, 4, 3],
       [5, 4, 2, 3],
       [2, 3,

In [12]:
y_test

array(['L', 'L', 'R', 'L', 'R', 'B', 'R', 'L', 'L', 'R', 'L', 'L', 'R',
       'L', 'R', 'R', 'L', 'L', 'B', 'L', 'R', 'L', 'R', 'L', 'R', 'L',
       'L', 'L', 'R', 'L', 'L', 'L', 'R', 'L', 'L', 'L', 'R', 'L', 'L',
       'R', 'R', 'L', 'R', 'L', 'R', 'R', 'L', 'R', 'R', 'L', 'L', 'R',
       'L', 'L', 'R', 'L', 'R', 'R', 'L', 'L', 'R', 'R', 'L', 'R', 'B',
       'B', 'R', 'R', 'R', 'L', 'L', 'B', 'R', 'L', 'R', 'L', 'L', 'R',
       'R', 'L', 'R', 'L', 'L', 'L', 'B', 'B', 'R', 'L', 'R', 'L', 'R',
       'R', 'L', 'L', 'L', 'R', 'R', 'L', 'R', 'L', 'B', 'L', 'B', 'R',
       'L', 'R', 'R', 'R', 'L', 'L', 'R', 'L', 'R', 'R', 'L', 'L', 'B',
       'R', 'R', 'R', 'L', 'R', 'R', 'R', 'L', 'L', 'L', 'L', 'L', 'R',
       'R', 'R', 'R', 'L', 'R', 'R', 'R', 'L', 'L', 'R', 'L', 'L', 'L',
       'R', 'L', 'L', 'R', 'L', 'R', 'R', 'L', 'L', 'L', 'R', 'R', 'R',
       'L', 'R', 'B', 'L', 'R', 'R', 'R', 'L', 'R', 'R', 'L', 'R', 'R',
       'R', 'R', 'B', 'R', 'R', 'L', 'R', 'B', 'L', 'R', 'R', 'R

In [13]:
Z

Unnamed: 0,Class Name,Left-Weight,Left-Distance
0,B,1,1
1,R,1,1
2,R,1,1
3,R,1,1
4,R,1,1
...,...,...,...
620,L,5,5
621,L,5,5
622,L,5,5
623,L,5,5
