In [10]:
from Datos import Datos
from ValidacionBootstrap import ValidacionBootstrap
from ValidacionCruzada import ValidacionCruzada
from ValidacionSimple import ValidacionSimple

balloons = Datos('ConjuntosDatos/balloons.data')
tic_tac_toe = Datos('ConjuntosDatos/tic-tac-toe.data')

validaciones = [ValidacionSimple(70), ValidacionCruzada(6), ValidacionBootstrap()]

for val in validaciones:
    val.creaParticiones(tic_tac_toe.datos)
    
    print("\nÍndices de ", val.nombre_estrategia, " para tic-tac-toe: ", sep='')
    for particion in val.particiones:
        print("\tTrain: ", sorted(particion.indicesTrain)[:20], "...", sep='')
        print("\tTest: ", sorted(particion.indicesTest)[:20], "...", sep='')

print("\n\n")
for val in validaciones:
    val.creaParticiones(balloons.datos)
    
    print("\nÍndices de ", val.nombre_estrategia, " para balloons: ", sep='')
    for particion in val.particiones:
        print("\tTrain: ", sorted(particion.indicesTrain), sep='')
        print("\tTest: ", sorted(particion.indicesTest), sep='')



Índices de Validación Simple para tic-tac-toe: 
	Train: [0, 1, 2, 3, 5, 7, 8, 9, 11, 12, 13, 14, 17, 19, 20, 22, 23, 24, 28, 29]...
	Test: [4, 6, 10, 15, 16, 18, 21, 25, 26, 27, 34, 43, 44, 49, 58, 60, 62, 65, 67, 73]...

Índices de Validación cruzada para tic-tac-toe: 
	Train: [0, 1, 2, 3, 4, 5, 6, 7, 10, 11, 13, 14, 16, 17, 18, 19, 21, 22, 23, 24]...
	Test: [8, 9, 12, 15, 20, 28, 39, 45, 56, 58, 65, 68, 70, 72, 77, 87, 90, 91, 101, 104]...
	Train: [1, 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 17, 18, 19, 20, 22, 23]...
	Test: [0, 6, 16, 21, 44, 47, 48, 50, 53, 73, 85, 86, 92, 105, 118, 119, 124, 126, 129, 132]...
	Train: [0, 1, 2, 4, 5, 6, 8, 9, 10, 11, 12, 15, 16, 17, 18, 20, 21, 22, 23, 25]...
	Test: [3, 7, 13, 14, 19, 24, 30, 40, 46, 55, 74, 78, 81, 88, 94, 96, 99, 127, 133, 144]...
	Train: [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20]...
	Test: [1, 22, 25, 27, 35, 38, 43, 49, 52, 54, 57, 62, 71, 75, 76, 79, 95, 111, 116, 117]...
	Train: [0, 1, 2, 3, 

## Descripcción de los índices de train y test

Hemos imprimido los índices ordenados para que sean más fáciles de analizar a simple vista.

Vemos que para validación simple, cogemos todos los índices y aleatoriamente tomamos un porcentaje para test y el resto son de test.

Para validación cruzados vemos cómo se crean las 6 particiones (folds) que hemos especificado, y que en cada una de las particiones los índices de test son diferentes hasta completar todos los índices. Los índices de train de cada partición son los que no hemos tomado para test.

En validación por Bootstrap tomamos como train tantos índices aleatorios como datos haya, permitiendo que haya repeticiones, y los datos de test son aquellos índices que no hemos cogido.


## Ventajas/desventajas de cada una de las validaciones

In [11]:
import numpy as np

from ClasificadorNaiveBayes import ClasificadorNaiveBayes

german = Datos('ConjuntosDatos/german.data')
clasificador = ClasificadorNaiveBayes()
validacion_cruzada = ValidacionCruzada(6)

print("Sin corrección de Laplace")
errores, tasa_de_error = clasificador.validacion(validacion_cruzada, tic_tac_toe, clasificador,
                                                 aplicar_correccion_de_laplace=False)
print("\tTasa de error de tic-tac-toe:", tasa_de_error)
print("\tDesviación típica del error de tic-tac-toe:", np.std(errores))

errores, tasa_de_error = clasificador.validacion(validacion_cruzada, german, clasificador,
                                                 aplicar_correccion_de_laplace=False)
print("\n\tTasa de error de german:", tasa_de_error)
print("\tDesviación típica del error de german:", np.std(errores))

print("\n\nCon corrección de Laplace")
errores, tasa_de_error = clasificador.validacion(validacion_cruzada, tic_tac_toe, clasificador)
print("\tTasa de error de tic-tac-toe:", tasa_de_error)
print("\tDesviación típica del error de tic-tac-toe:", np.std(errores))

errores, tasa_de_error = clasificador.validacion(validacion_cruzada, german, clasificador)
print("\n\tTasa de error de german:", tasa_de_error)
print("\tDesviación típica del error de german:", np.std(errores))


Sin corrección de Laplace
	Tasa de error de tic-tac-toe: 0.3058455114822547
	Desviación típica del error de tic-tac-toe: 0.46076461950589553



	Tasa de error de german: 0.25
	Desviación típica del error de german: 0.4330127018922193


Con corrección de Laplace


	Tasa de error de tic-tac-toe: 0.2954070981210856
	Desviación típica del error de tic-tac-toe: 0.4562255412630521

	Tasa de error de german: 0.254
	Desviación típica del error de german: 0.4352975993501457


## Análisis de los resultados