# Aproximação de uma função (Regressão)

Para este trabalho a biblioteca `anfis-pytorch` foi utilizada.


In [1]:
import sys
import itertools
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import torch
import anfis
from matplotlib.ticker import FormatStrFormatter
from torch.utils.data import TensorDataset, DataLoader
from membership import BellMembFunc, make_bell_mfs, GaussMembFunc, make_gauss_mfs
from experimental import train_anfis, test_anfis

dtype = torch.float

%matplotlib inline


ModuleNotFoundError: No module named 'torch'

Abaixo, as funções que serão utilizadas para fazer as manipulações dos dados e avaliarmos variações de entrada. Faremos um comparativo das funções encontradas na biblioteca anfis-pytorch.

*   A função seno_com_ou_sem_ruido(x), equivale a função sinc(x,y); Parametrizamos a função para receber um ruído
*   A função valores_seno_x() equivale a função make_sinc_xy(); esta função gera N valores para a função objetivo (seno(x))
*   A função seno_modelo_entrada() equivale a função ex1_model(); Definimos quais serão as variáveis de entrada, qual a função de pertinência que será utilizada (no caso, a gaussiana) e, os parâmetros de entrada para a função de pertinência (sigma e mu para a gaussiana). 
*   A função plot() tem apenas o objetivo de plotar os valores passados para ela


A função `plot` criada abaixo, apenas faz o gráfico com pontos vermelhos (caso não sejam dados outros parâmetros) de um dado conjuntos de pares ordenados. Na verdade, os pares são feitos a partir de dois arrays, o primeiro com os valores das abscissas e o segundo com o das ordenadas.

In [None]:
def plot(x, y, plot_color = 'red', plot_label = 'Dados de entrada'):
    plt.plot(x,y,'o', color = plot_color, label = plot_label)
    plt.legend(loc="upper right")
    plt.show()

A função `seno` apenas aplica a função seno da biblioteca `numpy` com ou sem um dado ruído.

In [None]:
def seno(x, r = 0):
    y = np.sin(x)
    if (r != 0):
      y = y + np.random.normal(0, r, y.shape)
    return y

A seguinte função devolve um `DataLoader` ou seja, um objeto iterável da biblioteca `torch` que guarda os dados sobre as entradas e saídas de uma dada função $f(\cdot)$.

In [None]:
def cria_dados(f, batch_size=1024, ruido = 0, inicio =0, fim=2*np.pi):
    pts = torch.arange(inicio, fim, 0.1)
    x = torch.tensor(list(itertools.product(pts)), dtype=dtype)
    y = [[f(p, ruido)] for p in x]
    y = torch.tensor(y, dtype=dtype)
    plot(x,y)
    td = TensorDataset(x, y)
    return DataLoader(td, batch_size=batch_size, shuffle=True)

A função abaixo gera o modelo inicial de

In [None]:
def seno_modelo_entrada(sigma = 0.1, mu_list = [1.0, 2.0]):
    definicoes_entrada = [('x0', make_gauss_mfs(sigma, mu_list))]
    variavel_saida = ['y0']
    anf_inicial = anfis.AnfisNet('Jang\'s example 1', invardefs = definicoes_entrada, outvarnames= variavel_saida)
    return anf_inicial

In [None]:
##Teste 1: ruído = 0 (Sem ruído), com um sigma pequeno (0.1) e com três funções de pertinência, 
##podemos considerar que seria um ótimo caso, já que o erro é praticamente zero.
modelo = seno_modelo_entrada(0.1, [1.0, 2.0, 3.0])
train_data = cria_dados(seno, batch_size=10, ruido = 0, inicio=0, fim=2*np.pi)
train_anfis(modelo, train_data, 100, True) 

In [None]:
##Teste 2: ruído = 0.1; sigma = 10; duas funções de pertinência, 
##Ao adicionar um ruído de 0.1, a função seno continua com o seu formato, porém
##ao deixar o sigma com um número médio, a porcentagem de erro fica alto e constante.
##e além disso, o resultado final não fica muito bom e, podemos destacar que utilizamos 
##apenas duas funções de pertinência.
modelo = seno_modelo_entrada(10, [1.0, 2.0])
train_data = cria_dados(seno, batch_size=10, ruido = 0.1, inicio=0, fim=2*np.pi)
train_anfis(modelo, train_data, 100, True) 

In [None]:
##Teste 3: ruído = 0.1; sigma = 1000; duas funções de pertinência, 
##Ao adicionar um ruído de 0.1, a função de entrada seno continua com o seu formato, porém
##ao deixar o sigma com um número grande, a porcentagem de erro fica alto e constante.
##E o resultado final não é nada satisfatório, já que "expandimos" muito a "base" da gaussiana
## fazendo com que o formato do seno ficasse perdido
modelo = seno_modelo_entrada(1000, [1.0, 2.0])
train_data = cria_dados(seno, batch_size=10, ruido = 0.1, inicio=0, fim=2*np.pi)
train_anfis(modelo, train_data, 100, True) 

In [None]:
##Teste 4: ruído = 0.1; sigma = 10; cinco funções de pertinência, 
##Ao adicionar um ruído de 0.1, a função seno continua com o seu formato, porém
##ao deixar o sigma com um número médio, mas agora, aumentando as funções de pertinência,
##temos um caso interessante, onde a função treinada se aproxima um pouco mais da função
##original. 
modelo = seno_modelo_entrada(10, [1.0, 2.0, 2.5, 3.20, 7.0])
train_data = cria_dados(seno, batch_size=10, ruido = 0.1, inicio=0, fim=2*np.pi)
train_anfis(modelo, train_data, 100, True) 

No entanto, para os casos testados, podemos concluir que, devido a função seno poder ser representada por três retas, se utilizarmos apenas duas funções de pertinência, o resultado não será tão bom, e foi possível confirmar no caso de teste 3. E, caso adicionarmos mais funções de pertinência e com um sigma considerado "médio" nos casos testados, os resultados tendem a ser mais satisfatórios, conseguindo visualizar a função seno. 