# Entorno de pruebas automatizadas

## Configuración del entorno

In [2]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
from packages.importer import *
from packages.c45 import *
from packages.binaryTree import *
import packages.classifier as cl
import statistics as stats
import time

## Importar datos

In [3]:
def import_problem(path, sep, lineTerminator, testPer):
    problem = import_csv(path, sep, lineTerminator, testPer)
    return problem

## Construir árbol de decisión

In [4]:
def build_tree(problem, threshold, gainFunc):    
    data = problem.data
    testData = problem.testData
    attributes = problem.attributes
    classes = problem.classes
    classcolumn = problem.classcolumn
    tree = decisionTree(data, attributes, classes, classcolumn, BinaryTree(), threshold = threshold, gainFunc = gainFunc)
    return tree

## Calcular precisión

In [5]:
def calc_accuracy(tree, attributes, testData):
    classifier = cl.Classifier(attributes)
    accuracy = classifier.classifyDataFrame(tree, testData)
    return accuracy

## Ejecutar pruebas

In [6]:
def test_exe(path, sep, lineTerminator, testPer, threshold, gainFunc, n):
    accuracy_array = []
    start = time.time()
    for i in range(n):
        problem = import_problem(path, sep, lineTerminator, testPer)
        tree = build_tree(problem, threshold, gainFunc)
        accuracy = calc_accuracy(tree, problem.attributes, problem.testData)
        accuracy_array.append(accuracy)
        print('Corrida ' + str(i + 1) + ' | Precisión: ' + str(accuracy))
    end = time.time()
    totalTime = end - start
    maxAcc = max(accuracy_array)
    minAcc = min(accuracy_array)
    meanAcc = stats.mean(accuracy_array)
    stDevAcc = stats.pstdev(accuracy_array)
    dic = {
        'results': accuracy_array,
        'max': maxAcc,
        'min': minAcc,
        'mean': meanAcc,
        'stDev': stDevAcc,
        'time': totalTime
    }
    return dic

## Ejecuciones paralelas

### Prueba 1

In [6]:
dic1 = test_exe(
    path = 'datasets/test_1.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.1,
    threshold = 0.1,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic1.items():
    print(key, ':', value)

Corrida 1 | Precisión: 1.0
Corrida 2 | Precisión: 0.99
Corrida 3 | Precisión: 1.0
Corrida 4 | Precisión: 0.98
Corrida 5 | Precisión: 1.0
Corrida 6 | Precisión: 1.0
Corrida 7 | Precisión: 1.0
Corrida 8 | Precisión: 1.0
Corrida 9 | Precisión: 1.0
Corrida 10 | Precisión: 0.99
Corrida 11 | Precisión: 1.0
Corrida 12 | Precisión: 0.99
Corrida 13 | Precisión: 1.0
Corrida 14 | Precisión: 0.99
Corrida 15 | Precisión: 1.0
Corrida 16 | Precisión: 1.0
Corrida 17 | Precisión: 1.0
Corrida 18 | Precisión: 1.0
Corrida 19 | Precisión: 1.0
Corrida 20 | Precisión: 1.0
Corrida 21 | Precisión: 1.0
Corrida 22 | Precisión: 0.99
Corrida 23 | Precisión: 1.0
Corrida 24 | Precisión: 1.0
Corrida 25 | Precisión: 1.0
Corrida 26 | Precisión: 1.0
Corrida 27 | Precisión: 1.0
Corrida 28 | Precisión: 1.0
Corrida 29 | Precisión: 1.0
Corrida 30 | Precisión: 1.0
Corrida 31 | Precisión: 1.0
Corrida 32 | Precisión: 1.0
Corrida 33 | Precisión: 1.0
Corrida 34 | Precisión: 1.0
Corrida 35 | Precisión: 1.0
Corrida 36 | Precisión:

### Prueba 2

In [7]:
dic2 = test_exe(
    path = 'datasets/test_2.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.1,
    threshold = 0.1,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic2.items():
    print(key, ':', value)

Corrida 1 | Precisión: 0.97
Corrida 2 | Precisión: 0.97
Corrida 3 | Precisión: 0.98
Corrida 4 | Precisión: 0.96
Corrida 5 | Precisión: 0.95
Corrida 6 | Precisión: 0.98
Corrida 7 | Precisión: 0.98
Corrida 8 | Precisión: 0.95
Corrida 9 | Precisión: 0.97
Corrida 10 | Precisión: 0.95
Corrida 11 | Precisión: 0.95
Corrida 12 | Precisión: 0.96
Corrida 13 | Precisión: 1.0
Corrida 14 | Precisión: 0.96
Corrida 15 | Precisión: 0.93
Corrida 16 | Precisión: 0.97
Corrida 17 | Precisión: 0.98
Corrida 18 | Precisión: 0.93
Corrida 19 | Precisión: 0.95
Corrida 20 | Precisión: 0.97
Corrida 21 | Precisión: 1.0
Corrida 22 | Precisión: 0.95
Corrida 23 | Precisión: 0.96
Corrida 24 | Precisión: 0.95
Corrida 25 | Precisión: 0.98
Corrida 26 | Precisión: 0.99
Corrida 27 | Precisión: 0.97
Corrida 28 | Precisión: 0.93
Corrida 29 | Precisión: 0.98
Corrida 30 | Precisión: 0.99
Corrida 31 | Precisión: 0.95
Corrida 32 | Precisión: 0.96
Corrida 33 | Precisión: 0.97
Corrida 34 | Precisión: 0.94
Corrida 35 | Precisión: 0

### Prueba 3

In [8]:
dic3 = test_exe(
    path = 'datasets/test_3.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.1,
    threshold = 0.1,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic3.items():
    print(key, ':', value)

Corrida 1 | Precisión: 0.68
Corrida 2 | Precisión: 0.81
Corrida 3 | Precisión: 0.69
Corrida 4 | Precisión: 0.72
Corrida 5 | Precisión: 0.7
Corrida 6 | Precisión: 0.73
Corrida 7 | Precisión: 0.71
Corrida 8 | Precisión: 0.69
Corrida 9 | Precisión: 0.78
Corrida 10 | Precisión: 0.77
Corrida 11 | Precisión: 0.71
Corrida 12 | Precisión: 0.67
Corrida 13 | Precisión: 0.75
Corrida 14 | Precisión: 0.82
Corrida 15 | Precisión: 0.67
Corrida 16 | Precisión: 0.72
Corrida 17 | Precisión: 0.74
Corrida 18 | Precisión: 0.82
Corrida 19 | Precisión: 0.5
Corrida 20 | Precisión: 0.69
Corrida 21 | Precisión: 0.64
Corrida 22 | Precisión: 0.7
Corrida 23 | Precisión: 0.74
Corrida 24 | Precisión: 0.74
Corrida 25 | Precisión: 0.43
Corrida 26 | Precisión: 0.68
Corrida 27 | Precisión: 0.63
Corrida 28 | Precisión: 0.7
Corrida 29 | Precisión: 0.74
Corrida 30 | Precisión: 0.67
Corrida 31 | Precisión: 0.66
Corrida 32 | Precisión: 0.79
Corrida 33 | Precisión: 0.69
Corrida 34 | Precisión: 0.73
Corrida 35 | Precisión: 0.6

### Prueba 4

In [7]:
dic4 = test_exe(
    path = 'datasets/test_1.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.1,
    threshold = 0.01,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic4.items():
    print(key, ':', value)

Corrida 1 | Precisión: 1.0
Corrida 2 | Precisión: 1.0
Corrida 3 | Precisión: 1.0
Corrida 4 | Precisión: 1.0
Corrida 5 | Precisión: 1.0
Corrida 6 | Precisión: 1.0
Corrida 7 | Precisión: 1.0
Corrida 8 | Precisión: 1.0
Corrida 9 | Precisión: 1.0
Corrida 10 | Precisión: 1.0
Corrida 11 | Precisión: 1.0
Corrida 12 | Precisión: 1.0
Corrida 13 | Precisión: 1.0
Corrida 14 | Precisión: 1.0
Corrida 15 | Precisión: 1.0
Corrida 16 | Precisión: 1.0
Corrida 17 | Precisión: 1.0
Corrida 18 | Precisión: 0.99
Corrida 19 | Precisión: 1.0
Corrida 20 | Precisión: 1.0
Corrida 21 | Precisión: 1.0
Corrida 22 | Precisión: 1.0
Corrida 23 | Precisión: 1.0
Corrida 24 | Precisión: 1.0
Corrida 25 | Precisión: 1.0
Corrida 26 | Precisión: 1.0
Corrida 27 | Precisión: 0.99
Corrida 28 | Precisión: 1.0
Corrida 29 | Precisión: 1.0
Corrida 30 | Precisión: 1.0
Corrida 31 | Precisión: 1.0
Corrida 32 | Precisión: 1.0
Corrida 33 | Precisión: 1.0
Corrida 34 | Precisión: 1.0
Corrida 35 | Precisión: 0.98
Corrida 36 | Precisión: 1.

### Prueba 5

In [8]:
dic5 = test_exe(
    path = 'datasets/test_2.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.1,
    threshold = 0.01,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic5.items():
    print(key, ':', value)

Corrida 1 | Precisión: 0.97
Corrida 2 | Precisión: 0.97
Corrida 3 | Precisión: 0.94
Corrida 4 | Precisión: 0.95
Corrida 5 | Precisión: 0.91
Corrida 6 | Precisión: 0.94
Corrida 7 | Precisión: 0.95
Corrida 8 | Precisión: 0.95
Corrida 9 | Precisión: 0.94
Corrida 10 | Precisión: 0.97
Corrida 11 | Precisión: 0.96
Corrida 12 | Precisión: 0.88
Corrida 13 | Precisión: 0.94
Corrida 14 | Precisión: 0.94
Corrida 15 | Precisión: 0.94
Corrida 16 | Precisión: 0.93
Corrida 17 | Precisión: 0.95
Corrida 18 | Precisión: 0.94
Corrida 19 | Precisión: 0.96
Corrida 20 | Precisión: 0.93
Corrida 21 | Precisión: 0.91
Corrida 22 | Precisión: 0.94
Corrida 23 | Precisión: 0.97
Corrida 24 | Precisión: 0.96
Corrida 25 | Precisión: 0.94
Corrida 26 | Precisión: 0.97
Corrida 27 | Precisión: 0.94
Corrida 28 | Precisión: 0.93
Corrida 29 | Precisión: 0.95
Corrida 30 | Precisión: 0.93
Corrida 31 | Precisión: 0.94
Corrida 32 | Precisión: 0.97
Corrida 33 | Precisión: 0.93
Corrida 34 | Precisión: 0.96
Corrida 35 | Precisión:

### Prueba 6

In [9]:
dic6 = test_exe(
    path = 'datasets/test_3.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.1,
    threshold = 0.01,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic6.items():
    print(key, ':', value)

Corrida 1 | Precisión: 0.72
Corrida 2 | Precisión: 0.74
Corrida 3 | Precisión: 0.72
Corrida 4 | Precisión: 0.78
Corrida 5 | Precisión: 0.73
Corrida 6 | Precisión: 0.79
Corrida 7 | Precisión: 0.76
Corrida 8 | Precisión: 0.77
Corrida 9 | Precisión: 0.76
Corrida 10 | Precisión: 0.71
Corrida 11 | Precisión: 0.74
Corrida 12 | Precisión: 0.75
Corrida 13 | Precisión: 0.77
Corrida 14 | Precisión: 0.76
Corrida 15 | Precisión: 0.76
Corrida 16 | Precisión: 0.71
Corrida 17 | Precisión: 0.82
Corrida 18 | Precisión: 0.74
Corrida 19 | Precisión: 0.7
Corrida 20 | Precisión: 0.71
Corrida 21 | Precisión: 0.8
Corrida 22 | Precisión: 0.72
Corrida 23 | Precisión: 0.76
Corrida 24 | Precisión: 0.75
Corrida 25 | Precisión: 0.81
Corrida 26 | Precisión: 0.73
Corrida 27 | Precisión: 0.75
Corrida 28 | Precisión: 0.8
Corrida 29 | Precisión: 0.76
Corrida 30 | Precisión: 0.76
Corrida 31 | Precisión: 0.72
Corrida 32 | Precisión: 0.73
Corrida 33 | Precisión: 0.81
Corrida 34 | Precisión: 0.79
Corrida 35 | Precisión: 0.

### Prueba 7

In [10]:
dic7 = test_exe(
    path = 'datasets/test_1.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.3,
    threshold = 0.01,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic7.items():
    print(key, ':', value)

Corrida 1 | Precisión: 1.0
Corrida 2 | Precisión: 1.0
Corrida 3 | Precisión: 0.99
Corrida 4 | Precisión: 1.0
Corrida 5 | Precisión: 1.0
Corrida 6 | Precisión: 1.0
Corrida 7 | Precisión: 1.0
Corrida 8 | Precisión: 1.0
Corrida 9 | Precisión: 1.0
Corrida 10 | Precisión: 1.0
Corrida 11 | Precisión: 1.0
Corrida 12 | Precisión: 1.0
Corrida 13 | Precisión: 1.0
Corrida 14 | Precisión: 1.0
Corrida 15 | Precisión: 1.0
Corrida 16 | Precisión: 0.99
Corrida 17 | Precisión: 1.0
Corrida 18 | Precisión: 1.0
Corrida 19 | Precisión: 1.0
Corrida 20 | Precisión: 0.99
Corrida 21 | Precisión: 1.0
Corrida 22 | Precisión: 1.0
Corrida 23 | Precisión: 1.0
Corrida 24 | Precisión: 0.99
Corrida 25 | Precisión: 1.0
Corrida 26 | Precisión: 1.0
Corrida 27 | Precisión: 1.0
Corrida 28 | Precisión: 1.0
Corrida 29 | Precisión: 1.0
Corrida 30 | Precisión: 1.0
Corrida 31 | Precisión: 0.99
Corrida 32 | Precisión: 1.0
Corrida 33 | Precisión: 1.0
Corrida 34 | Precisión: 1.0
Corrida 35 | Precisión: 1.0
Corrida 36 | Precisión: 

### Prueba 8

In [11]:
dic8 = test_exe(
    path = 'datasets/test_2.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.3,
    threshold = 0.01,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic8.items():
    print(key, ':', value)

Corrida 1 | Precisión: 0.96
Corrida 2 | Precisión: 0.94
Corrida 3 | Precisión: 0.95
Corrida 4 | Precisión: 0.97
Corrida 5 | Precisión: 0.94
Corrida 6 | Precisión: 0.93
Corrida 7 | Precisión: 0.94
Corrida 8 | Precisión: 0.95
Corrida 9 | Precisión: 0.95
Corrida 10 | Precisión: 0.94
Corrida 11 | Precisión: 0.95
Corrida 12 | Precisión: 0.94
Corrida 13 | Precisión: 0.96
Corrida 14 | Precisión: 0.9
Corrida 15 | Precisión: 0.93
Corrida 16 | Precisión: 0.94
Corrida 17 | Precisión: 0.95
Corrida 18 | Precisión: 0.93
Corrida 19 | Precisión: 0.93
Corrida 20 | Precisión: 0.95
Corrida 21 | Precisión: 0.93
Corrida 22 | Precisión: 0.93
Corrida 23 | Precisión: 0.94
Corrida 24 | Precisión: 0.95
Corrida 25 | Precisión: 0.94
Corrida 26 | Precisión: 0.95
Corrida 27 | Precisión: 0.94
Corrida 28 | Precisión: 0.91
Corrida 29 | Precisión: 0.94
Corrida 30 | Precisión: 0.94
Corrida 31 | Precisión: 0.95
Corrida 32 | Precisión: 0.96
Corrida 33 | Precisión: 0.94
Corrida 34 | Precisión: 0.95
Corrida 35 | Precisión: 

### Prueba 9

In [12]:
dic9 = test_exe(
    path = 'datasets/test_3.csv',
    sep = ',',
    lineTerminator = '\n',
    testPer = 0.3,
    threshold = 0.01,
    gainFunc = 'gain',
    n = 100
)
for key, value in dic9.items():
    print(key, ':', value)

Corrida 1 | Precisión: 0.78
Corrida 2 | Precisión: 0.78
Corrida 3 | Precisión: 0.71
Corrida 4 | Precisión: 0.75
Corrida 5 | Precisión: 0.72
Corrida 6 | Precisión: 0.75
Corrida 7 | Precisión: 0.77
Corrida 8 | Precisión: 0.76
Corrida 9 | Precisión: 0.76
Corrida 10 | Precisión: 0.8
Corrida 11 | Precisión: 0.74
Corrida 12 | Precisión: 0.77
Corrida 13 | Precisión: 0.77
Corrida 14 | Precisión: 0.73
Corrida 15 | Precisión: 0.77
Corrida 16 | Precisión: 0.76
Corrida 17 | Precisión: 0.73
Corrida 18 | Precisión: 0.71
Corrida 19 | Precisión: 0.71
Corrida 20 | Precisión: 0.76
Corrida 21 | Precisión: 0.74
Corrida 22 | Precisión: 0.76
Corrida 23 | Precisión: 0.73
Corrida 24 | Precisión: 0.74
Corrida 25 | Precisión: 0.75
Corrida 26 | Precisión: 0.75
Corrida 27 | Precisión: 0.76
Corrida 28 | Precisión: 0.77
Corrida 29 | Precisión: 0.8
Corrida 30 | Precisión: 0.74
Corrida 31 | Precisión: 0.75
Corrida 32 | Precisión: 0.76
Corrida 33 | Precisión: 0.76
Corrida 34 | Precisión: 0.73
Corrida 35 | Precisión: 0