In [1]:
import matplotlib.pyplot as plt
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D
import cv2
import imageio.v2 as imageio
import numpy as np
import pandas as pd
from IPython.display import display, Math, Video
import os
from os import listdir
from os.path import isfile, isdir, join
import time

startInstantTime = time.time()

In [2]:
#Parametros de ejecucion del programa
nombreArchivoInformacion = "InformacionEjercicioRegresion.txt"
nombreArchivoDataset = "DatasetRegresion.csv"
nombreArchivoAnimacion = "Animación del ADALINE"
tasaAprendizaje = 0.001
tiempoPausaAnimacion = 0.001

searchFolderPath = "./Figuras/"
imageFileExtension = ".jpg"
animationFileExtension = ".mp4"
framesPorSegundoAnimacion = 20

colorTextoVerde = (35, 155, 86)
colorTextoRojo = (176, 58, 46)

In [3]:
def printColouredText(text, foregroundColor = (0, 0, 0), backgroundColor = (255, 255, 255)):
    return "\033[48;2;{};{};{}m\033[38;2;{};{};{}m{}\033[38;2;0;0;0m\033[48;2;255;255;255m".format(backgroundColor[0], backgroundColor[1], backgroundColor[2], foregroundColor[0], foregroundColor[1], foregroundColor[2], text)

def obtenerListasCoordenadasRespectivas(listaPuntos, numeroDimensiones):
    diccionarioPuntosPorCoordenadas = {}
    for indice in range(numeroDimensiones):
        diccionarioPuntosPorCoordenadas[indice] = []
    
    for puntoActual in listaPuntos:
        for indice in range(numeroDimensiones):
            coordenadaActual = puntoActual[indice]
            diccionarioPuntosPorCoordenadas[indice].append(coordenadaActual)
    return diccionarioPuntosPorCoordenadas

def crearTextoEcuacionHiperplano(listaCoeficientesHiperplano):
    numeroDimensionesEspacio = len(listaCoeficientesHiperplano) - 1
    diccionarioCoeficientesPrincipalesNoNulos = {}
    for indice in range(numeroDimensionesEspacio):
        if listaCoeficientesHiperplano[indice] != 0.0:
            diccionarioCoeficientesPrincipalesNoNulos[indice] = listaCoeficientesHiperplano[indice]
    
    textoEcuacionHiperplano = ''
    indiceNuevoCoeficienteNoNulo = 0
    if numeroDimensionesEspacio <= 3:
        for indice in diccionarioCoeficientesPrincipalesNoNulos.keys():
            if indiceNuevoCoeficienteNoNulo == 0:
                if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                    textoEcuacionHiperplano = r'' + chr(indice + 120)
                elif diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                    textoEcuacionHiperplano = r'-' + chr(indice + 120)
                else:
                    textoEcuacionHiperplano = r'{}'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + chr(indice + 120)
            else:
                if diccionarioCoeficientesPrincipalesNoNulos[indice] > 0.0:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                        textoEcuacionHiperplano += ' + ' + chr(indice + 120)
                    else:
                        textoEcuacionHiperplano += ' + {}'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + chr(indice + 120)
                else:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                        textoEcuacionHiperplano += ' - ' + chr(indice + 120)
                    else:
                        textoEcuacionHiperplano += ' - {}'.format(-diccionarioCoeficientesPrincipalesNoNulos[indice]) + chr(indice + 120)
            indiceNuevoCoeficienteNoNulo += 1
    else:
        for indice in diccionarioCoeficientesPrincipalesNoNulos.keys():
            if indiceNuevoCoeficienteNoNulo == 0:
                if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                    textoEcuacionHiperplano = r'x_{' + str(indice + 1) + '}'
                elif diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                    textoEcuacionHiperplano = r'-x_{' + str(indice + 1) + '}'
                else:
                    textoEcuacionHiperplano = r'{}x'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + '_{' + str(indice + 1) + '}'
            else:
                if diccionarioCoeficientesPrincipalesNoNulos[indice] > 0.0:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                        textoEcuacionHiperplano += ' + x_{' + str(indice + 1) + '}'
                    else:
                        textoEcuacionHiperplano += ' + {}x'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + '_{' + str(indice + 1) + '}'
                else:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                        textoEcuacionHiperplano += ' - x_{' + str(indice + 1) + '}'
                    else:
                        textoEcuacionHiperplano += ' - {}x'.format(-diccionarioCoeficientesPrincipalesNoNulos[indice]) + '_{' + str(indice + 1) + '}'
            indiceNuevoCoeficienteNoNulo += 1

    if listaCoeficientesHiperplano[numeroDimensionesEspacio] > 0.0:
        textoEcuacionHiperplano += ' + {}'.format(listaCoeficientesHiperplano[numeroDimensionesEspacio])
    elif listaCoeficientesHiperplano[numeroDimensionesEspacio] < 0.0:
        textoEcuacionHiperplano += ' - {}'.format(-listaCoeficientesHiperplano[numeroDimensionesEspacio])
    textoEcuacionHiperplano += ' = 0'
    return textoEcuacionHiperplano

def crearTextoFuncionLineal(listaCoeficientesFuncionLineal):
    numeroDimensionesEspacio = len(listaCoeficientesFuncionLineal)
    diccionarioCoeficientesPrincipalesNoNulos = {}
    for indice in range(numeroDimensionesEspacio - 1):
        if listaCoeficientesFuncionLineal[indice] != 0.0:
            diccionarioCoeficientesPrincipalesNoNulos[indice] = listaCoeficientesFuncionLineal[indice]
    
    textoEncabezadoFuncion = r'f \left('
    if numeroDimensionesEspacio <= 3:
        for indice in range(numeroDimensionesEspacio - 1):
            if indice == numeroDimensionesEspacio - 2:
                textoEncabezadoFuncion += chr(indice + 120)
            else:
                textoEncabezadoFuncion += chr(indice + 120) + ', '
    else:
        for indice in range(numeroDimensionesEspacio - 1):
            if indice == numeroDimensionesEspacio - 2:
                textoEncabezadoFuncion += r'x_{' + str(indice + 1) + '}'
            else:
                textoEncabezadoFuncion += r'x_{' + str(indice + 1) + '}, '
    textoEncabezadoFuncion += r' \right) = '
    
    textoFuncionLineal = ''
    if listaCoeficientesFuncionLineal[0:(numeroDimensionesEspacio - 1)] == [0.0] * (numeroDimensionesEspacio - 1):
        textoFuncionLineal = '{}'.format(listaCoeficientesFuncionLineal[numeroDimensionesEspacio - 1])
    else:
        indiceNuevoCoeficienteNoNulo = 0
        if numeroDimensionesEspacio <= 3:
            for indice in diccionarioCoeficientesPrincipalesNoNulos.keys():
                if indiceNuevoCoeficienteNoNulo == 0:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                        textoFuncionLineal = r'' + chr(indice + 120)
                    elif diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                        textoFuncionLineal = r'-' + chr(indice + 120)
                    else:
                        textoFuncionLineal = r'{}'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + chr(indice + 120)
                else:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] > 0.0:
                        if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                            textoFuncionLineal += ' + ' + chr(indice + 120)
                        else:
                            textoFuncionLineal += ' + {}'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + chr(indice + 120)
                    else:
                        if diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                            textoFuncionLineal += ' - ' + chr(indice + 120)
                        else:
                            textoFuncionLineal += ' - {}'.format(-diccionarioCoeficientesPrincipalesNoNulos[indice]) + chr(indice + 120)
                indiceNuevoCoeficienteNoNulo += 1
        else:
            for indice in diccionarioCoeficientesPrincipalesNoNulos.keys():
                if indiceNuevoCoeficienteNoNulo == 0:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                        textoFuncionLineal = r'x_{' + str(indice + 1) + '}'
                    elif diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                        textoFuncionLineal = r'-x_{' + str(indice + 1) + '}'
                    else:
                        textoFuncionLineal = r'{}x'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + '_{' + str(indice + 1) + '}'
                else:
                    if diccionarioCoeficientesPrincipalesNoNulos[indice] > 0.0:
                        if diccionarioCoeficientesPrincipalesNoNulos[indice] == 1.0:
                            textoFuncionLineal += ' + x_{' + str(indice + 1) + '}'
                        else:
                            textoFuncionLineal += ' + {}x'.format(diccionarioCoeficientesPrincipalesNoNulos[indice]) + '_{' + str(indice + 1) + '}'
                    else:
                        if diccionarioCoeficientesPrincipalesNoNulos[indice] == -1.0:
                            textoFuncionLineal += ' - x_{' + str(indice + 1) + '}'
                        else:
                            textoFuncionLineal += ' - {}x'.format(-diccionarioCoeficientesPrincipalesNoNulos[indice]) + '_{' + str(indice + 1) + '}'
                indiceNuevoCoeficienteNoNulo += 1
        
        if listaCoeficientesFuncionLineal[numeroDimensionesEspacio - 1] > 0.0:
            textoFuncionLineal += ' + {}'.format(listaCoeficientesFuncionLineal[numeroDimensionesEspacio - 1])
        elif listaCoeficientesFuncionLineal[numeroDimensionesEspacio - 1] < 0.0:
            textoFuncionLineal += ' - {}'.format(-listaCoeficientesFuncionLineal[numeroDimensionesEspacio - 1])
    return textoEncabezadoFuncion + textoFuncionLineal

In [4]:
numeroDimensiones = None
listaCoeficientesFuncionLineal = []
etiquetaCoordenadaPuntos = None
nombreColumnaValorFuncion = None

inputStream = open(nombreArchivoInformacion, "r")
lineasTextoArchivo = inputStream.readlines()
for numeroLineaActual in range(len(lineasTextoArchivo)):
    if numeroLineaActual == 0:
        numeroDimensiones = int(lineasTextoArchivo[numeroLineaActual].strip())
    elif numeroLineaActual == 1:
        lineaTextoActual = lineasTextoArchivo[numeroLineaActual].strip()
        lineaTextoActual = lineaTextoActual[1:(len(lineaTextoActual) - 1)]
        datosCoeficientesHiperplano = lineaTextoActual.split(", ")
        for coeficiente in datosCoeficientesHiperplano:
            listaCoeficientesFuncionLineal.append(float(coeficiente))
    elif numeroLineaActual == 2:
        etiquetaCoordenadaPuntos = lineasTextoArchivo[numeroLineaActual].strip()
    elif numeroLineaActual == 3:
        nombreColumnaValorFuncion = lineasTextoArchivo[numeroLineaActual].strip()
inputStream.close()

print("Se ha extraído la información del archivo", printColouredText(nombreArchivoInformacion, colorTextoVerde))
print("Se está trabajando sobre", printColouredText(str(numeroDimensiones) + " dimension(es)", colorTextoVerde))
print("Los coeficientes del hiperplano (Función lineal) sobre el cual se generó el dataset de puntos para regresión son:", printColouredText(str(listaCoeficientesFuncionLineal), colorTextoRojo))

Se ha extraído la información del archivo [48;2;255;255;255m[38;2;35;155;86mInformacionEjercicioRegresion.txt[38;2;0;0;0m[48;2;255;255;255m
Se está trabajando sobre [48;2;255;255;255m[38;2;35;155;86m3 dimension(es)[38;2;0;0;0m[48;2;255;255;255m
Los coeficientes del hiperplano (Función lineal) sobre el cual se generó el dataset de puntos para regresión son: [48;2;255;255;255m[38;2;176;58;46m[-2.9518965737290266, 5.158182648635917, 8.531018655731607][38;2;0;0;0m[48;2;255;255;255m


In [5]:
datasetFile = pd.read_csv(nombreArchivoDataset)

listaAbscisasPuntosMuestra = []
listaPuntosMuestra = []
for indicefilaActual, filaActual in datasetFile.iterrows():
    puntoActual = []
    for indice in range(numeroDimensiones - 1):
        nombreColumnaActual = "Coordenada $" + etiquetaCoordenadaPuntos + "_{" + str(indice + 1) + "}$"
        puntoActual.append(filaActual[nombreColumnaActual])
    listaAbscisasPuntosMuestra.append(puntoActual)
    valorFuncionPuntoActual = filaActual[nombreColumnaValorFuncion]
    listaPuntosMuestra.append(puntoActual + [valorFuncionPuntoActual])

print("Se ha extraído la información del archivo", printColouredText(nombreArchivoDataset, colorTextoVerde))
print("Se tiene un total de", printColouredText(str(len(listaPuntosMuestra)) + " punto(s)", colorTextoVerde))

Se ha extraído la información del archivo [48;2;255;255;255m[38;2;35;155;86mDatasetRegresion.csv[38;2;0;0;0m[48;2;255;255;255m
Se tiene un total de [48;2;255;255;255m[38;2;35;155;86m2500 punto(s)[38;2;0;0;0m[48;2;255;255;255m


In [6]:
#Esta parte se puede comentar para que no se proponga inicialmente un hiperplano de coeficientes aleatorios sino para que el hiperplano propuesto inicialmente separe perfectamente las muestras de las 2 clases y por lo tanto no se realizaran iteraciones del algoritmo del perceptron simple
listaCoeficientesFuncionLineal = list(np.random.uniform(low = -10.0, high = 10.0, size = numeroDimensiones))

listaCoeficientesHiperplanoRegresion = []
for indice in range(numeroDimensiones):
    if indice == numeroDimensiones - 1:
        listaCoeficientesHiperplanoRegresion.append(1.0)
    listaCoeficientesHiperplanoRegresion.append(-listaCoeficientesFuncionLineal[indice])
textoEcuacionHiperplanoBase = crearTextoEcuacionHiperplano(listaCoeficientesHiperplanoRegresion)
if numeroDimensiones == 2:
    print("La recta propuesta inicialmente para ejecutar el algoritmo ADALINE, está dada por la ecuación:")
elif numeroDimensiones == 3:
    print("El plano propuesto inicialmente para ejecutar el algoritmo ADALINE, está dado por la ecuación:")
elif numeroDimensiones >= 4:
    print("El hiperplano propuesto inicialmente para ejecutar el algoritmo ADALINE, está dado por la ecuación:")
display(Math(textoEcuacionHiperplanoBase))

textoFuncionLineal = crearTextoFuncionLineal(listaCoeficientesFuncionLineal)
if numeroDimensiones == 2:
    print("Como función, la recta propuesta inicialmente para ejecutar el algoritmo ADALINE, es:")
elif numeroDimensiones == 3:
    print("Como función, el plano propuesto inicialmente para ejecutar el algoritmo ADALINE, es:")
elif numeroDimensiones >= 4:
    print("Como función, el hiperplano propuesto inicialmente para ejecutar el algoritmo ADALINE, es:")
display(Math(textoFuncionLineal))

El plano propuesto inicialmente para ejecutar el algoritmo ADALINE, está dado por la ecuación:


<IPython.core.display.Math object>

Como función, el plano propuesto inicialmente para ejecutar el algoritmo ADALINE, es:


<IPython.core.display.Math object>

In [7]:
%matplotlib notebook

listaPuntosPorCoordenadasRespectivas = obtenerListasCoordenadasRespectivas(listaPuntosMuestra, numeroDimensiones)
valoresCoordenadasXPuntos = listaPuntosPorCoordenadasRespectivas[0]
valoresCoordenadasYPuntos = listaPuntosPorCoordenadasRespectivas[1]
valoresCoordenadasZPuntos = None
minimoEjeX = np.min(valoresCoordenadasXPuntos) - 1
maximoEjeX = np.max(valoresCoordenadasXPuntos) + 1
minimoEjeY = np.min(valoresCoordenadasYPuntos) - 1
maximoEjeY = np.max(valoresCoordenadasYPuntos) + 1
minimoEjeZ = None
maximoEjeZ = None

numeroMuestrasHiperplanoRegresion = 10
if numeroDimensiones == 2:
    listaValoresCoordenadaXHiperplanoBase = np.linspace(minimoEjeX, maximoEjeX, num = numeroMuestrasHiperplanoRegresion)
    listaValoresCoordenadaYHiperplanoBase = listaCoeficientesFuncionLineal[numeroDimensiones - 2] * listaValoresCoordenadaXHiperplanoBase + listaCoeficientesFuncionLineal[numeroDimensiones - 1]
    
    plt.figure(num = 1, figsize = (9, 8))
    plt.plot(valoresCoordenadasXPuntos, valoresCoordenadasYPuntos, 'ro', label = "Puntos de Muestra")
    plt.plot(listaValoresCoordenadaXHiperplanoBase, listaValoresCoordenadaYHiperplanoBase, 'b-', label = "Recta de Regresión Lineal Propuesto Inicialmente (Algoritmo Adaline)")
    plt.legend(loc = 'upper left')
    plt.xlabel("Eje X")
    plt.ylabel("Eje Y")
    plt.title("Visualización de la Recta de Regresión que proporciona el Algoritmo Adaline")
    plt.grid(True)
    plt.show()
elif numeroDimensiones == 3:
    valoresCoordenadasZPuntos = listaPuntosPorCoordenadasRespectivas[2]
    minimoEjeZ = np.min(valoresCoordenadasZPuntos) - 1
    maximoEjeZ = np.max(valoresCoordenadasZPuntos) + 1
    
    listaValoresCoordenadaXHiperplanoBase = np.linspace(minimoEjeX, maximoEjeX, num = numeroMuestrasHiperplanoRegresion)
    listaValoresCoordenadaYHiperplanoBase = np.linspace(minimoEjeY, maximoEjeY, num = numeroMuestrasHiperplanoRegresion)
    listaValoresCoordenadaXHiperplanoBase, listaValoresCoordenadaYHiperplanoBase = np.meshgrid(listaValoresCoordenadaXHiperplanoBase, listaValoresCoordenadaYHiperplanoBase)
    listaValoresCoordenadaZHiperplanoBase = listaCoeficientesFuncionLineal[numeroDimensiones - 3] * listaValoresCoordenadaXHiperplanoBase + listaCoeficientesFuncionLineal[numeroDimensiones - 2] * listaValoresCoordenadaYHiperplanoBase + listaCoeficientesFuncionLineal[numeroDimensiones - 1]
    
    currentFigure = plt.figure(num = 1, figsize = (9, 8))
    ax = currentFigure.gca(projection = '3d')
    ax.view_init(elev = 8, azim = 10)
    ax.scatter(valoresCoordenadasXPuntos, valoresCoordenadasYPuntos, valoresCoordenadasZPuntos, c = 'r', marker = 'o')
    etiquetaLeyendaPuntos = mpl.lines.Line2D([0], [0], linestyle = "none", c = 'r', marker = 'o')
    ax.plot_surface(listaValoresCoordenadaXHiperplanoBase, listaValoresCoordenadaYHiperplanoBase, listaValoresCoordenadaZHiperplanoBase, color = 'b', alpha = 0.35)
    etiquetaLeyendaPlano = mpl.lines.Line2D([0], [0], linestyle = "-", c = 'b')
    ax.set_xlabel("Eje X")
    ax.set_ylabel("Eje Y")
    ax.set_zlabel("Eje Z")
    ax.set_title("Visualización del Plano de Regresión que proporciona el Algoritmo Adaline")
    ax.legend([etiquetaLeyendaPuntos, etiquetaLeyendaPlano], ["Puntos de Muestra", "Plano de Regresión Lineal Propuesto Inicialmente (Algoritmo Adaline)"], numpoints = 1)
    plt.tight_layout()
    plt.show()

<IPython.core.display.Javascript object>

  ax = currentFigure.gca(projection = '3d')
