# `auditor` - diagnostyka modeli uczenia maszynowego
### Alicja Gosiewska

Notebook zawierający przykłady z prezentacji wygłoszonej w ramach Warszawskich Spotkań Entuzjastów R.

Kod uruchama się poprzez ustawienie się na odpowiedniej komórce, a następnie wybranie kombinacji klawiszy `Shift + Enter`.

* Repozytorium zawierające pakiet `auditor`:
https://github.com/MI2DataLab/auditor

* Preprint artykułu na arxiv:
https://arxiv.org/abs/1809.07763

![](https://github.com/agosiewska/examples/blob/master/Przechwytywanie2.PNG?raw=true)

In [None]:
library(auditor)
library(randomForest)
library(e1071)

In [None]:
lm.SR <- lm(sr ~ pop15 + pop75 + dpi + ddpi, data = LifeCycleSavings)
par(mfrow = c(2,3))
plot(lm.SR, ask = FALSE, which =1:6)

![](https://github.com/agosiewska/examples/blob/master/Przechwytywanie.PNG?raw=true)

In [None]:
model_rf <- randomForest(y~., auditorData) 

In [None]:
au_rf <- audit(model_rf, data = auditorData, y = auditorData$y, label = "rf")

In [None]:
mp_rf <- modelResiduals(au_rf)
plot(mp_rf, type ="ResidualDensity")

In [None]:
head(mp_rf)

In [None]:
plot(au_rf, type = "ResidualDensity")

# Porównanie trzech modeli

In [None]:
set.seed(1994)
model_rf <- randomForest(y~., auditorData) 
model_svm <- svm(y~., auditorData) 
model_lm <- lm(y~., auditorData) 

In [None]:
au_rf <- audit(model_rf, data = auditorData, y = auditorData$y, label = "rf")
au_svm <- audit(model_svm, data = auditorData, y = auditorData$y, label = "svm")
au_lm <- audit(model_lm, data = auditorData, y = auditorData$y, label = "lm")

In [None]:
plot(au_rf, au_svm, au_lm, type = "ModelRanking")

In [None]:
plot(au_rf, au_svm, au_lm, type = "Prediction", variable = "Observed response")

In [None]:
plot(au_rf, au_svm, au_lm, type = "Residual", variable = "y", nlabel = 6)

## Usunięcie obserwacji odstających i utworzenie nowych obiektów do audytu

In [None]:
auditorData_clean <- auditorData[-c(1999, 2000), ]

model_lm <- lm(y ~ ., auditorData_clean)
set.seed(1994)
model_rf <- randomForest(y~., auditorData_clean)
model_svm <- svm(y ~ ., auditorData_clean)

au_lm <- audit(model_lm, data = auditorData_clean, y = auditorData_clean$y)
au_rf <- audit(model_rf, data = auditorData_clean, y = auditorData_clean$y, label = "rf")
au_svm <- audit(model_svm, data = auditorData_clean, y = auditorData_clean$y, label = "svm")


In [None]:
plot(au_rf, au_svm, au_lm, type = "ModelRanking")

In [None]:
plot(au_rf, au_svm, au_lm, type = "Prediction", variable = "Observed response", split = "model") 

In [None]:
plot(au_rf, au_svm, au_lm, type = "ResidualBoxplot", split = "model") 

In [None]:
plot(au_rf, au_svm, au_lm, type = "ResidualDensity") 

In [None]:
plot(au_rf, au_svm, au_lm, type = "ResidualDensity", variable = "X4") 

# Co dalej?
Na stronie https://mi2datalab.github.io/auditor/index.html w zakładce Articles znajdują się winietki z większą liczbą przykładów.
Zachęcam do eksperymentowania z innymi typami wykresów, które można tam znaleźć. Na przykład `type = "Autocorrelation"`, `type = "ModelCorrelation"` lub `type = "ScaleLocation"`

In [None]:
plot(au_rf, au_svm, au_lm, type = ...) 