# Leave One Out Cross Validation


In [1]:
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import LeaveOneOut, cross_val_score

In [2]:
df = pd.read_csv("../Datasets/SocialNetworkAds.csv")
df.head()

Unnamed: 0,Gender,Age,EstimatedSalary,Purchased
0,1,19,19000,0
1,1,35,20000,0
2,2,26,43000,0
3,2,27,57000,0
4,1,19,76000,0


In [3]:
df.columns

Index(['Gender', 'Age', 'EstimatedSalary', 'Purchased'], dtype='object')

In [4]:
df.shape

(400, 4)

In [5]:
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values

`LeaveOneOut` is a cross-validation technique in scikit-learn that creates a split for each sample in the dataset, with one sample in the test set and the remaining samples in the training set. It is useful for small datasets, but can be computationally expensive for larger datasets.

The `LeaveOneOut` function takes no parameters. Here's an example of how to use it:


In [6]:
loo = LeaveOneOut()
loo.get_n_splits(X)

400

In this example, we are creating a `LeaveOneOut` object called `loo`. We then use the `split` method of the `loo` object to generate the training and test indices for each split. We use these indices to split the data into training and test sets, and then train and evaluate the model on this split.

Note that because `LeaveOneOut` generates a split for each sample in the dataset, it can be computationally expensive for larger datasets. If you have a large dataset, you may want to consider using a different cross-validation technique, such as `KFold` or `StratifiedKFold`.


In [7]:
scores = cross_val_score(
    RandomForestClassifier(n_estimators=10), X, y.tolist(), scoring="accuracy", cv=loo
)
scores

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 0., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
       1., 0., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1., 1., 1.,
       1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 0., 1., 1.,
       1., 0., 1., 0., 1., 0., 1., 1., 0., 1., 0., 1., 1., 1., 0., 1., 1.,
       0., 1., 1., 1., 1.

In [8]:
print("%f accuracy with a standard deviation of %f" % (scores.mean(), scores.std()))

0.902500 accuracy with a standard deviation of 0.296637
