# Ejercicio 10

El archivo Semillas.csv contiene información de granos que pertenecen a tres variedades diferentes de
trigo.
Entrene una neurona no lineal para determinar si una semilla es de “TIPO 2” o no.
Utilice el 60% de los ejemplos para entrenar y el 40% para realizar el testeo.
Realice 30 ejecuciones independientes de la configuración seleccionada para respaldar sus afirmaciones
referidas a la precisión obtenida tanto para el conjunto de entrenamiento como para el de testeo. Utilice
un máximo de 200 iteraciones y una cota de error de 1𝑒 − 03.

a) Utilizando ‘sigmoid’ como función de activación.

b) Utilizando ‘tanh’ como función de activación.

- Iteraciones es la cantidad promedio de iteraciones realizadas en las 30 ejecuciones
- Accuracy train es el promedio de las 30 tasas de acierto obtenidas en las distintas ejecuciones.
- Ite accuracy es el número de iteración promedio en el que se encontró el máximo accuracy por
primera vez.
- Veces (datos train) indica cuántas de las 30 ejecuciones alcanzaron el 100% de acierto durante el
entrenamiento.
- Accuracy test y Veces (datos Test) contienen lo mismo que Accuracy train y “Veces (datos train)
pero sobre los datos de testeo, respectivamente.

In [2]:
import pandas as pd      # para trabajar con archivos de datos csv, excel, etc: https://pandas.pydata.org/docs/getting_started/tutorials.html
import chardet           # para detectar la codificación de texto en archivos
import numpy as np
from sklearn import preprocessing, model_selection
from matplotlib import pyplot as plt
from ClassNeuronaGral import NeuronaGradiente

In [3]:
def open_file(path):
    # open the path with automatic encoding
    with open(path, 'rb') as file:
        encoding = chardet.detect(file.read())
    
    return pd.read_csv(path, encoding=encoding['encoding'])

df = open_file("../Datos/Semillas.csv")

In [4]:

X_raw = np.array(df.iloc[:,0:-1])  # recupera todas las columnas salvo la última (es la clase)
T_raw = np.array(df.iloc[:,-1])    # recupera solo la última columna (es la clase)

clases = np.unique(T_raw)  # obtiene las clases sin repeticiones
print('Las clases del dataset son :', clases)

# Normalizacion con media y desviacion
scaler = preprocessing.StandardScaler()
# scaler = preprocessing.MinMaxScaler()
X = scaler.fit_transform(X_raw)

Las clases del dataset son : ['Tipo1' 'Tipo2' 'Tipo3']


In [5]:
###############################################################################
# neurona no lineal sigmoid
ERROR = 1e-03
ALFA = 0.1
FUN = 'sigmoid'
MAX_ITE = 200

print('\nNeurona con %s' %FUN)


# hace entrenamiento por cada clase
for cls_name in clases:
    # Establece resultado esperado según la clase. 1=clase esperada, 0=otra clase

    T = 1 * (T_raw == cls_name) ### T TOMA LOS VALORES POR CADA CLASE
    # Entrena perceptrón
    modelo = NeuronaGradiente(alpha=ALFA, n_iter=MAX_ITE, FUN=FUN, cotaE=ERROR)
    modelo.fit(X, T)
    (W, b, iteraciones) = (modelo.w_, modelo.b_, len(modelo.errors_))
    
    Y = modelo.predict(X) 
    ### T --> LO QUE DEBERIA PREDECIR
    ### Y --> LO QUE SE PREDIJO
    
    efectividad = 100.0*np.sum(Y==T)/len(Y)

    print("Clase %s con %6.2f%% de efectividad con %d iteraciones" % (cls_name, efectividad, iteraciones ))




Neurona con sigmoid
Clase Tipo1 con  93.33% de efectividad con 200 iteraciones
Clase Tipo2 con  98.57% de efectividad con 200 iteraciones
Clase Tipo3 con  97.14% de efectividad con 200 iteraciones


In [20]:
###############################################################################
# neurona no lineal sigmoid

TABLA = [["Funcion", "Alfa", "Iteraciones","Accuracy train", "Ite accuracy","Veces (datos Train)", "Accuracy test", "Veces (Datos Test)"]]
TABLA = [["Funcion", "Alfa", "Iteraciones","Accuracy train","Veces (datos Train)", "Accuracy test", "Veces (Datos Test)"]]

for FUN in ['sigmoid', 'tanh']:
    for ALFA in [0.1, 0.2, 0.3]:
        ERROR = 1e-03
        MAX_ITE = 200
        CORRIDAS = 30
        TEST_SIZE = .4
        
        # print('\nNeurona con %s' %FUN)
        
        # hace entrenamiento por cada clase
        cls_name = 'Tipo2'
        prom_ite = 0
        prom_acc_train = 0
        prom_acc_test = 0
        veces_train = 0
        veces_test = 0
        if FUN=='sigmoid':
            T = 1*(T_raw==cls_name)
        else:
            T = 2*(T_raw==cls_name)-1
  
        for nro_ite in range(CORRIDAS):
            # Establece resultado esperado según la clase. 1=clase esperada, 0=otra clase
        
            X_train, X_test, Y_train, Y_test = model_selection.train_test_split(X, T, test_size=TEST_SIZE)#, random_state=42)
            # Entrena perceptrón
            modelo = NeuronaGradiente(alpha=ALFA, n_iter=MAX_ITE, FUN=FUN, cotaE=ERROR)
            modelo.fit(X_train, Y_train)
        
            (W, b, iteraciones) = (modelo.w_, modelo.b_, len(modelo.errors_))
        
            prom_ite = prom_ite + iteraciones
        
            # efectividad entrenamiento
            Y_pred = modelo.predict(X_train)
            efectividad = 100.0*np.sum(Y_train==Y_pred)/len(Y_pred)
            prom_acc_train = prom_acc_train + efectividad
            if (100-efectividad>0.0000001):
                veces_train = veces_train + 1
        
            # efectividad entrenamiento
            Y_pred = modelo.predict(X_test)
            efectividad = 100.0*np.sum(Y_test==Y_pred)/len(Y_pred)
            prom_acc_test = prom_acc_test + efectividad
            if (100-efectividad>0.0000001):
              veces_test = veces_test + 1
        
            # print("Clase %s con %6.2f%% de efectividad con %d iteraciones" % (cls_name, efectividad, iteraciones ))
        TABLA.append([FUN, ALFA, (prom_ite/CORRIDAS), (prom_acc_train/CORRIDAS), veces_train, (prom_acc_test/CORRIDAS), veces_test])
        print(f'30 ejec con {FUN} y con alfa = {ALFA} ejecutadas correctamente')


print('Codigo ejecutado correctamente')

30 ejec con sigmoid y con alfa = 0.1 ejecutadas correctamente
30 ejec con sigmoid y con alfa = 0.2 ejecutadas correctamente
30 ejec con sigmoid y con alfa = 0.3 ejecutadas correctamente
30 ejec con tanh y con alfa = 0.1 ejecutadas correctamente
30 ejec con tanh y con alfa = 0.2 ejecutadas correctamente
30 ejec con tanh y con alfa = 0.3 ejecutadas correctamente
Codigo ejecutado correctamente


In [21]:
from tabulate import tabulate
table = tabulate(TABLA, headers="firstrow", tablefmt="grid")
print(table)

+-----------+--------+---------------+------------------+-----------------------+-----------------+----------------------+
| Funcion   |   Alfa |   Iteraciones |   Accuracy train |   Veces (datos Train) |   Accuracy test |   Veces (Datos Test) |
| sigmoid   |    0.1 |       199.267 |          98.6508 |                    26 |         97.2222 |                   28 |
+-----------+--------+---------------+------------------+-----------------------+-----------------+----------------------+
| sigmoid   |    0.2 |       193.9   |          99.127  |                    21 |         97.5794 |                   28 |
+-----------+--------+---------------+------------------+-----------------------+-----------------+----------------------+
| sigmoid   |    0.3 |       197.8   |          99.3386 |                    22 |         97.8571 |                   28 |
+-----------+--------+---------------+------------------+-----------------------+-----------------+----------------------+
| tanh      |   