# Beyond Bluetooth with alternate encoding (Extra Trees)

In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
cd ..

C:\Users\mtom7\Documents\_PhD\Bootcamp\Group Project\ml-labs-bootcamp-group-5


## Combine with Categorical Features

In [3]:
from src.features.beyond import sensor_summary
from src.features.common import postproc_categorical, read_non_sensor_data, postproc_default
from src.dataset.tc4tl import make_datasets
from src.featutils import combine
import category_encoders as ce
from src.models.evaluate_extra_trees import dual_evaluation
import pandas as pd
from src.ndcf import compute_ndcf

In [4]:
def run_with_encoder(encoder):
    
    (trainset, devset, testset), pipe = make_datasets(combine(sensor_summary, read_non_sensor_data),
                                          postproc_categorical, verbose=True, testing=0,
                                          tunables={ 
                                              "CategoricalEncoder" : encoder
                                          })
    
    predictors = []
    for col in trainset.columns:
        if "Rssi" in col or "Coarse" in col or "_" in col:
            predictors.append(col)
            
    report, sysout = dual_evaluation(pd.concat([trainset, devset]), testset,
                        predictors=predictors,
                        target="Distance")
    ndcf = compute_ndcf(sysout)
    print(ndcf["nDCF"].mean())
    print(ndcf)
    print(report["cg=1"])
    print(report["cg=0"])

## BackwardDifferenceEncoder

In [5]:
run_with_encoder(ce.BackwardDifferenceEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [18:00<00:00, 14.40it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [01:02<00:00, 15.06it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [09:25<00:00, 14.91it/s]


Pipe input given!
0.07471405856890928
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.073205  0.015267  0.088473
1    fine_grain       1.8  0.044760  0.022629  0.067390
2    fine_grain       3.0  0.023095  0.045747  0.068842
3  coarse_grain       1.8  0.050597  0.023555  0.074152
              precision    recall  f1-score   support

         1.2       0.95      0.93      0.94      1407
         1.8       0.94      0.92      0.93      1408
         3.0       0.93      0.95      0.94      1385
         4.5       0.93      0.95      0.94      1399

    accuracy                           0.94      5599
   macro avg       0.94      0.94      0.94      5599
weighted avg       0.94      0.94      0.94      5599

              precision    recall  f1-score   support

         1.8       0.98      0.95      0.96      1423
         4.5       0.95      0.98      0.96      1401

    accuracy                           0.96      2824
   macro avg       0.96      

## BaseNEncoder

In [6]:
run_with_encoder(ce.BaseNEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [14:10<00:00, 18.28it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:49<00:00, 18.73it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [08:16<00:00, 16.98it/s]


Pipe input given!
0.08899372566839929
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.078181  0.016698  0.094879
1    fine_grain       1.8  0.050444  0.025503  0.075947
2    fine_grain       3.0  0.024762  0.070050  0.094812
3  coarse_grain       1.8  0.065355  0.024982  0.090337
              precision    recall  f1-score   support

         1.2       0.95      0.92      0.94      1407
         1.8       0.93      0.91      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.93      0.93      0.93      1399

    accuracy                           0.93      5599
   macro avg       0.93      0.93      0.93      5599
weighted avg       0.93      0.93      0.93      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.94      0.98      0.96      1401

    accuracy                           0.95      2824
   macro avg       0.96      

## BinaryEncoder

In [7]:
run_with_encoder(ce.BinaryEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [14:34<00:00, 17.79it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:52<00:00, 17.73it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [08:06<00:00, 17.30it/s]


Pipe input given!
0.08899372566839929
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.078181  0.016698  0.094879
1    fine_grain       1.8  0.050444  0.025503  0.075947
2    fine_grain       3.0  0.024762  0.070050  0.094812
3  coarse_grain       1.8  0.065355  0.024982  0.090337
              precision    recall  f1-score   support

         1.2       0.95      0.92      0.94      1407
         1.8       0.93      0.91      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.93      0.93      0.93      1399

    accuracy                           0.93      5599
   macro avg       0.93      0.93      0.93      5599
weighted avg       0.93      0.93      0.93      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.94      0.98      0.96      1401

    accuracy                           0.95      2824
   macro avg       0.96      

## CatBoostEncoder

In [8]:
run_with_encoder(ce.CatBoostEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [14:27<00:00, 17.92it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [01:03<00:00, 14.69it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [08:33<00:00, 16.41it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## CountEncoder

In [9]:
run_with_encoder(ce.CountEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [13:51<00:00, 18.71it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:50<00:00, 18.35it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [08:02<00:00, 17.47it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## GLMMEncoder

In [10]:
run_with_encoder(ce.GLMMEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [13:10<00:00, 19.68it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:40<00:00, 22.96it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [07:06<00:00, 19.75it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## HashingEncoder

In [11]:
run_with_encoder(ce.HashingEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [12:31<00:00, 20.70it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:47<00:00, 19.73it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [07:15<00:00, 19.33it/s]


Pipe input given!
0.09045532127290033
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.084577  0.017891  0.102468
1    fine_grain       1.8  0.055062  0.024066  0.079128
2    fine_grain       3.0  0.030476  0.063617  0.094093
3  coarse_grain       1.8  0.060436  0.025696  0.086132
              precision    recall  f1-score   support

         1.2       0.94      0.92      0.93      1407
         1.8       0.94      0.91      0.92      1408
         3.0       0.91      0.94      0.92      1385
         4.5       0.91      0.94      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.93      0.92      0.92      5599
weighted avg       0.93      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.94      0.96      1423
         4.5       0.94      0.97      0.96      1401

    accuracy                           0.96      2824
   macro avg       0.96      

## HelmertEncoder

In [12]:
run_with_encoder(ce.HelmertEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [11:23<00:00, 22.74it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:40<00:00, 23.16it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [06:26<00:00, 21.77it/s]


Pipe input given!
0.08021839488588642
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.073916  0.011927  0.085844
1    fine_grain       1.8  0.047602  0.021193  0.068795
2    fine_grain       3.0  0.023571  0.062187  0.085759
3  coarse_grain       1.8  0.056922  0.023555  0.080477
              precision    recall  f1-score   support

         1.2       0.96      0.93      0.94      1407
         1.8       0.94      0.93      0.94      1408
         3.0       0.91      0.95      0.93      1385
         4.5       0.93      0.94      0.93      1399

    accuracy                           0.94      5599
   macro avg       0.94      0.94      0.94      5599
weighted avg       0.94      0.94      0.94      5599

              precision    recall  f1-score   support

         1.8       0.98      0.94      0.96      1423
         4.5       0.94      0.98      0.96      1401

    accuracy                           0.96      2824
   macro avg       0.96      

## JamesSteinEncoder

In [13]:
run_with_encoder(ce.JamesSteinEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [11:02<00:00, 23.46it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:47<00:00, 19.69it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [06:39<00:00, 21.06it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## LeaveOneOutEncoder

In [14]:
run_with_encoder(ce.LeaveOneOutEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [11:14<00:00, 23.04it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:45<00:00, 20.48it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [06:30<00:00, 21.55it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## MEstimateEncoder

In [15]:
run_with_encoder(ce.MEstimateEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [12:07<00:00, 21.38it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:51<00:00, 18.31it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [07:06<00:00, 19.75it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## OneHotEncoder

In [16]:
run_with_encoder(ce.OneHotEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [16:12<00:00, 15.99it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [01:05<00:00, 14.34it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [10:05<00:00, 13.90it/s]


Pipe input given!
0.08474520038917836
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.078891  0.020515  0.099407
1    fine_grain       1.8  0.049378  0.024425  0.073804
2    fine_grain       3.0  0.025238  0.061472  0.086711
3  coarse_grain       1.8  0.056219  0.022841  0.079060
              precision    recall  f1-score   support

         1.2       0.94      0.92      0.93      1407
         1.8       0.94      0.91      0.92      1408
         3.0       0.91      0.94      0.92      1385
         4.5       0.93      0.94      0.93      1399

    accuracy                           0.93      5599
   macro avg       0.93      0.93      0.93      5599
weighted avg       0.93      0.93      0.93      5599

              precision    recall  f1-score   support

         1.8       0.98      0.94      0.96      1423
         4.5       0.94      0.98      0.96      1401

    accuracy                           0.96      2824
   macro avg       0.96      

## OrdinalEncoder

In [17]:
run_with_encoder(ce.OrdinalEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [14:50<00:00, 17.46it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:43<00:00, 21.73it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [07:15<00:00, 19.33it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## SumEncoder

In [18]:
run_with_encoder(ce.SumEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [13:13<00:00, 19.60it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:56<00:00, 16.44it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [07:09<00:00, 19.61it/s]


Pipe input given!
0.08485704052289003
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.077470  0.012643  0.090113
1    fine_grain       1.8  0.049023  0.021911  0.070934
2    fine_grain       3.0  0.025714  0.069335  0.095050
3  coarse_grain       1.8  0.056922  0.026410  0.083332
              precision    recall  f1-score   support

         1.2       0.96      0.92      0.94      1407
         1.8       0.93      0.92      0.93      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.93      1399

    accuracy                           0.93      5599
   macro avg       0.93      0.93      0.93      5599
weighted avg       0.93      0.93      0.93      5599

              precision    recall  f1-score   support

         1.8       0.97      0.94      0.96      1423
         4.5       0.94      0.97      0.96      1401

    accuracy                           0.96      2824
   macro avg       0.96      

## TargetEncoder

In [19]:
run_with_encoder(ce.TargetEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [11:08<00:00, 23.26it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [00:56<00:00, 16.68it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [07:29<00:00, 18.73it/s]


Pipe input given!
0.09462685425199394
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.082445  0.025763  0.108208
1    fine_grain       1.8  0.052575  0.023348  0.075923
2    fine_grain       3.0  0.027619  0.070765  0.098384
3  coarse_grain       1.8  0.068869  0.027123  0.095992
              precision    recall  f1-score   support

         1.2       0.92      0.92      0.92      1407
         1.8       0.95      0.90      0.92      1408
         3.0       0.90      0.94      0.92      1385
         4.5       0.92      0.93      0.92      1399

    accuracy                           0.92      5599
   macro avg       0.92      0.92      0.92      5599
weighted avg       0.92      0.92      0.92      5599

              precision    recall  f1-score   support

         1.8       0.97      0.93      0.95      1423
         4.5       0.93      0.97      0.95      1401

    accuracy                           0.95      2824
   macro avg       0.95      

## WOEEncoder

In [20]:
run_with_encoder(ce.WOEEncoder)
# only works with binary variables

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [11:18<00:00, 22.91it/s]


NO Pipe input given!


ValueError: The target column y must be binary. But the target contains 4 unique value(s).

## QuantileEncoder

In [25]:
run_with_encoder(ce.QuantileEncoder)

AttributeError: module 'category_encoders' has no attribute 'QuantileEncoder'

## PolynomialEncoder

In [26]:
run_with_encoder(ce.PolynomialEncoder)

100%|████████████████████████████████████████████████████████████████████████████| 15552/15552 [16:26<00:00, 15.77it/s]


NO Pipe input given!


  elif pd.api.types.is_categorical(cols):
100%|████████████████████████████████████████████████████████████████████████████████| 935/935 [01:14<00:00, 12.49it/s]


Pipe input given!


100%|██████████████████████████████████████████████████████████████████████████████| 8423/8423 [10:11<00:00, 13.77it/s]


Pipe input given!
0.0760169447615214
         Subset  Distance    P_miss      P_fa      nDCF
0    fine_grain       1.2  0.066809  0.012643  0.079452
1    fine_grain       1.8  0.040853  0.019397  0.060249
2    fine_grain       3.0  0.023095  0.063617  0.086712
3  coarse_grain       1.8  0.054814  0.022841  0.077655
              precision    recall  f1-score   support

         1.2       0.96      0.93      0.95      1407
         1.8       0.94      0.93      0.94      1408
         3.0       0.91      0.95      0.93      1385
         4.5       0.93      0.94      0.93      1399

    accuracy                           0.94      5599
   macro avg       0.94      0.94      0.94      5599
weighted avg       0.94      0.94      0.94      5599

              precision    recall  f1-score   support

         1.8       0.98      0.95      0.96      1423
         4.5       0.95      0.98      0.96      1401

    accuracy                           0.96      2824
   macro avg       0.96      0