In [32]:
import csv
import random
import numpy as np
from scipy import spatial
import matplotlib.pyplot as plt

class LVQ(): 
    dados = []
    def __init__(self, nome_arquivo):    
        dados = self.carregar("IRIS.csv", "numeros")
        
    def carregar(self, arquivo_csv: str="IRIS.csv", tipo_caracteristicas: str="numeros"):
        """
        Carrega os dados iniciais da classe através de um arquivo csv
        :param arquivo_csv: nome do arquivo csv
        :param tipo_caracteristicas: Tipo das caracteristicas do conjunto de dados
        """
        with open(arquivo_csv, 'r') as arquivo_csv:
            arquivo = csv.reader(arquivo_csv)
            if tipo_caracteristicas == "numeros":
                for index, linha in enumerate(arquivo):
                    if linha:
                        self.dados += [list(map(float, linha[0:-1]))]
                        self.dados[index] += [linha[-1]]
            elif tipo_caracteristicas == "string":
                for index, linha in enumerate(arquivo):
                    if linha:
                        dados = 1
                        self.dados += linha
    
    def triagem(self, split: float=0.65):
        """
        Divide aleatoriament os elementos do conjunto de dados em dois subconjuntos: teste e treino
        :param split: de 0 a 1 -> 'porcentagem' dos elementos que serao do conjunto de treino
        """        
        self.treino, self.teste = [], []
        for elemento in self.dados:
            if random.random() < split:
                self.treino += [elemento]
            else:
                self.teste += [elemento]
    
    def resumir(self, n: float=10,  e: float=10, t: float=0.4):
        """
        Retorna o codebook dos dados, ou seja, os elementos que melhor representam o todo
        :param t: taxa de aprendizado inicial
        :param e: numero de epocas
        :param n: numero de elementos do coodbook 
        """
        self.qtd_caracteristicas = len(self.dados[0])-1
        #Geracacao aleatorio dos elementos iniciais do codebook         
        self.codebook = [[]]*n
        for i in range(n):
            self.codebook[i] = [0] * (self.qtd_caracteristicas + 1)
            for caracteristica in range(self.qtd_caracteristicas + 1):
                self.codebook[i][caracteristica] = random.choice(self.dados)[caracteristica]
        
        for epoca in range(e):
            taxa = 0.3 - (0.02*epoca)
            for representante in self.codebook: 
                for elemento in self.treino:
                    o = -1
                    if representante[-1] == elemento[-1]:
                        o = 1
                    for caracteristica in range(self.qtd_caracteristicas):
                        erro = (elemento[caracteristica]-representante[caracteristica]) * o
                        representante[caracteristica] += erro * taxa
                        print(taxa)
        
    def testar(self):
        """
        Retorna o codebook dos dados, ou seja, os elementos que melhor representam o todo
        :param t: taxa de aprendizado inicial
        :param e: numero de epocas
        :param n: numero de elementos do coodbook 
        """
        qtd_teste = len(self.teste)
        precisao = 100.0
        for elemento in self.teste: 
            bmu = self.encontrar_mais_proximo(elemento, self.codebook)
            if bmu[-1] != elemento[-1]:
                print(elemento)
                print(self.codebook)
                break
                precisao -= (1/qtd_teste)*100
 
        return precisao
    
    def encontrar_mais_proximo(self, elemento, lista): 
        resposta = [lista[0], spatial.distance.euclidean(elemento[0:-1], lista[0][0:-1])]
        for i in lista:
            distancia = spatial.distance.euclidean(elemento[0:-1], i[0:-1])
            if distancia < resposta[1]: 
                resposta = [i, distancia]
        return resposta[0]

    
hugo = LVQ("IRIS.csv")
hugo.triagem(0.9)
hugo.resumir(n=5, e=10, t=0.5)
print(hugo.testar())



[[1.0, 2.0, 3.0, 4.0]]
[[1.0, 2.0, 3.0, 4.0, ' A'], [2.0, 2.0, 4.0, 5.0]]
[[1.0, 2.0, 3.0, 4.0, ' A'], [2.0, 2.0, 4.0, 5.0, ' A'], [8.0, 10.0, 10.0, 11.0]]
[[1.0, 2.0, 3.0, 4.0, ' A'], [2.0, 2.0, 4.0, 5.0, ' A'], [8.0, 10.0, 10.0, 11.0, ' B'], [12.0, 11.0, 11.0, 12.0]]
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999999999997
0.27999999