## Ajuste de curvas:

O ajuste de curvas é um procedimento no qual uma fórmula matemática é usada pra produzir uma curva que melhor represente um conjunto de dados. A função não tem que fornecer o valor exato em cada ponto, mas sim representar o conjunto de dados de forma satisfatória como um todo.

O ajuste de curvas é tipicamente utilizado quando os valores dos dados medidos apresentam algum erro ou dispersão.

#### Ajuste de curvas com equações lineares:

O ajuste de curvas usando uma equação linear (polinômio de primeiro grau) é o processo pelo qual uma equação na forma:

$$
    y = a_1 x + a_0 \hspace1cm (1)
$$

É usada pra promover o melhor ajuste de um conjunto de pontos. Isso é feito com a determinação das constantes a1 e a0 que fornecem o menor erro quando os pontos medidos são substituíudos na Eq. (1).

##### Medição da qualidade de um ajuste:

Um critério que mede o quão bem uma função pode representar de forma aproximada um conjunto de dados é um número que quantifica a concordância geral entre os pontos pertencentes a esse conjunto de dados e a função utilizada. Ela pode ser usado para comparar duas funções diferentes usadas no ajuste do mesmo conjunto de dados e pode ser usado para determinar os coeficientes da função que levem ao melhor ajuste.

O ajuste entre um conjunto de dados e uma função linear aproximada é determinado primeiramente com o cálculo do erro (Resíduo), a diferença entre cada ponto pertecente ao conjunto de dados e o valor da função aproximada. Os resíduos são usados para calcular o erro total em todos os pontos,

O resíduo ri em um ponto (xi,yi) é a diferença entre o valor yi do ponto medido e do valor da função f(xi) usada para aproximar o conjunto de dados:

$$
    r_i = y_i - f(x_i) \hspace1cm (2)
$$

Uma definição para o erro gloval E que fornece uma boa medida do erro total e que também pode ser usada para determinar uma única função linear que leve ao melhor ajuste é obtida fazendo com que E seja igual à soma dos quadrados dos resíduos:

$$
    E = \sum^{n}_{i=1} r^{2}_{i} = \sum^{n}_{i=1}[y_i - (a_1 x_i + a_0)]^{2} \hspace1cm (3)
$$

##### Regressão linear por mínimos quadrados:

A regressão linear por mínimos quadrados é um procedimento no qual os coeficientes a1 e a0 da função linear y = a1x + a0 são determinados de tal forma que essa função leve ao melhor ajuste de um determinado conjunto de pontos. O melhor ajuste é definido como o menor erro total calculado com a soma dos quadrados dos resíduos.

Para um dado conjunto de n ponto (xi,yi), o erro gloval calculado é:

$$
    E = \sum^{n}_{i=1}[y_i - (a_1 x_i + a_0)]^{2} \hspace1cm (4)
$$

A função E tem um mínimo nos valores de a1 e a0 nos quais as derivadas parciais de E em relação a cada variável são iguais a zero. Calculando as derivadas parciais e as igualando a zero, obtém-se:

$$
    \frac{\delta E}{\delta a_0} = -2 \sum^{n}_{i=1} (y_i - a_1 x_i - a_0) = 0 \hspace1cm (5)
$$

$$
    \frac{\delta E}{\delta a_1} = -2 \sum^{n}_{i=1} (y_i - a_1 x_i - a_0)x_i = 0 \hspace1cm (6)
$$

As equações (5) e (6) formam um sistema de duas equações lineares com incógnitas a1 e a0 e podem ser escritas na forma:

$$
    n a_0 + (\sum^{n}_{i=1}x_i)a_1 = \sum^{n}_{i=1} y_i \hspace1cm (7)
$$

$$
    (\sum^{n}_{i=1}x_i)a_0 + (\sum^{n}_{i=1}x^{2}_{i})a_1 = \sum^{n}_{i=1} x_i y_i \hspace1cm (8)
$$

A solução do sistema contêm somas idênticas, é conveniente calculá-las primeiramente para então substituí-las nas equações. Tais somas são definidas como:

$$
    S_x = \sum^{n}_{i=1} x_i,\hspace0.5cmS_y = \sum^{n}_{i=1} y_i,\hspace0.5cmS_{xy} = \sum^{n}_{i=1} x_i y_i,\hspace0.5cmS_{xx} = \sum^{n}_{i=1} x^{2}_{i}\hspace0.5cm (9)
$$

Com essas definições, as equações dos coeficientes a1 e a0 são:

$$
    a_1 = \frac{nS_{xy}-S_x S_y}{nS_{xx} - (S_x)^2} \hspace1cm a_0 = \frac{S_{xx}S_y - S_{xy}S_x}{nS_{xx}-(S_x)^2}
$$

##### Escrevendo uma equação não-linear em uma forma linear:

Para que a regressão linear possa ser utilizada, a equação não-linear de duas variáveis deve ser modificada de tal forma que a nova equação seja linear com termos contendo as variáveis originais.

<img src='img/img-1.png'>


#### Regressão polinomial:

A regressão polinomial é um procedimento usado na determinação dos coeficiente de um polinômio de segundo grau, ou de ordem maior, de forma que esse polinômio produza o melhor ajuste de um determinado conjunto de dados. A dedução das equações utilizadas para determinar os coeficientes se baseia na minimização do erro total.

Se o polinômio de ordem _m_ usado no ajuste da curva é:

$$
    f(x) = a_m x^m + a_{m-1}x^{m-1} + ... + a_1 x^i + a_0 \hspace1cm (10)
$$

Então, para um dado conunto de n ponto (xi, yi) (m é menor que n-1), o erro total calculado é:

$$
    E = \sum^{n}_{i=1} [y_i - (a_m x^m + a_{m-1}x^{m-1} + ... + a_1 x^i + a_0)]^2 \hspace1cm (11)
$$

Como todos os valores de xi e yi são conhecidos, o erro E é um função não linear das m + 1 variáveis (a0 a am). A função E tem um mínimo nos valores de a0 a am nos quais as derivadas parciais de E em relação a cada uma das variáveis são iguais a zero. Calculando as derivadas parciais de E e as igualando a zero, obtém-se um conjunto de m+1 equações lineares para os coeficientes.

Como exemplo, para o caso m=2:

$$
    E = \sum^{n}_{i=1} [y_i - (a_2 x^2_i + a_1 x_i + a_0)]^2 \hspace1cm (12)
$$

Calculando as derivadas parviais em relação a a0, a1 e a2 e igualando os resultados a zero, obtém-se:

$$
    \frac{\delta E}{\delta a_0} = -2 \sum^{n}_{i=1} (y_i - a_2 x^2_i - a_1 x_i - a0) = 0 \hspace1cm (13)
$$

$$
    \frac{\delta E}{\delta a_1} = -2 \sum^{n}_{i=1} (y_i - a_2 x^2_i - a_1 x_i - a_0)x_i = 0 \hspace1cm (14)
$$

$$
    \frac{\delta E}{\delta a_2} = -2 \sum^{n}_{i=1} (y_i - a_2 x^2_i - a_1 x_i - a_0)x^2_i = 0 \hspace1cm (15)
$$

As equações 13 a 15 formam um sistema de três equações lineares em função das incógnitas a0, a1 e a2, que pode ser reescrito na forma:

$$
    Sa = s \rightarrow \begin{pmatrix} n & S_x & S_{x^2} \\ S_x & S_{x^2} & S_{x^3} \\ S_{x^2} & S_{x^3} & S_{x^4} \end{pmatrix} \times \begin{pmatrix} a_0 \\ a_1 \\ a_2 \end{pmatrix} = \begin{pmatrix} S_x \\ S_{xy} \\ S_{x^2y} \end{pmatrix}
$$

A solução do sistema de equações fornece os valores dos coeficientes a0, a1 e a2 do polinômio que melhor se ajusta aos n ponto (xi, yi).

#### Algoritmos:

- Importações:

In [None]:
%matplotlib notebook

import numpy as np
import matplotlib.pyplot as plt
import math

- Algoritmos auxiliares:

In [None]:
def gaussJordan(A, b, dim, rec=True):
    
    # Imprimindo dados de entrada:
    print('Matriz A com dimensão: {0}'.format(dim))
    print(A, '\n')
    print('Vetor b:\n{0}\n'.format(b))
    
    # Unindo as matrizes no formato [A b]
    A = np.insert(A, dim, b, axis=1)
    print('Nova matriz no formato [A b]:')
    print(A, '\n')
    
    # Pivôtação:
    for i in range(0, dim):
        if A[i,i] == 0:
            print('A linha {0} ( {1} ) não pode ser a linha pivô (coeficiente zero)'.format(i, A[i]))
            for j in range(i + 1, dim):
                if A[j][i] != 0:
                    print('Troca: linha {0} ({1}) -> linha {2} ({3})\n'.format(i,A[i],j,A[j]))
                    linhaTemp = A[i].copy()
                    A[i] = A[j]
                    A[j] = linhaTemp
                    print('Nova matriz pós pivôtação:')
                    print(A, '\n\n')
                    break
        
        # Fim da pivotação
        print('Operações em linhas:\n\n')
        A[i] = A[i]/A[i,i]
        print('A[{0}] = A[{0}]/A[{0},{0}] = {1}\n'.format(i, A[i]))
        for k in range(0, dim):
            if k != i and A[k,i] != 0:
                A[k] = A[k] - A[i]*A[k,i]
                print('A[{0}] = A[{0}] - A[{1}]*A[{0},{1}] = {2}'.format(k, i, A[k]))
        print('\nNova Matriz: \n', A, '\n\n')
                
            
    # Recuperando os valores de b e A
    if rec :
        for i in range(0, dim):
            b[i] = A[i][dim]
        
        A = np.delete(A, dim, 1)
    
        return b

- Regressão linear:

In [None]:
def regLin(x,y):
    
    #Definindo o tamanho dos vetores:
    if x.size != y.size:
        print('Vetores de tamanhos diferentes!')
        print('xn: {0}\nyn: {1}'.format(x.size,y.size))
        return None, None
    else:
        n = x.size
    
    # Definindo os somatórios:
    Sx, Sy, Sxy, Sxx = np.sum(x), np.sum(y), np.sum(x*y), np.sum(x**2)
    print('\nSomatórios:')
    print('Sx: {}\nSy: {}\nSxy: {}\nSxx: {}\n'.format(Sx,Sy,Sxy,Sxx))
    
    # Definindo os coeficiente a0 e a1:
    
    dem = n*Sxx - Sx**2
    
    a1 = (n*Sxy - Sx*Sy)/dem
    a0 = (Sxx*Sy - Sxy*Sx)/dem
    
    print('a1 = {:.4f}*{:.4f} - {:.4f}*{:.4f} / {:.4f}*{:.4f} - {:.4f}^2 = {:.4f}'.format(n,Sxy,Sx,Sy,n,Sxx,Sx,a1))
    print('a0 = {:.4f}*{:.4f} - {:.4f}*{:.4f} / {:.4f}*{:.4f} - {:.4f}^2 = {:.4f}'.format(Sxx,Sy,Sxy,Sx,n,Sxx,Sx,a0))
    
    return a1, a0

In [None]:
# Teste do algoritmo:

# Determinar os coeficientes m e b da equação y = mx/b + x

x=np.array([0.34440,0.42975,0.48713,0.70243,0.77597]);
y=np.array([142, 147, 153, 149, 153]);

a1, a0 = regLin(x,y)

n = a1/10

- Regressão polinômial (segunda ordem):

In [None]:
def regPoli2(x,y):
    
    #Definindo o tamanho dos vetores:
    if x.size != y.size:
        print('Vetores de tamanhos diferentes!')
        print('xn: {0}\nyn: {1}'.format(x.size,y.size))
        return None, None, None
    else:
        n = x.size
    
    # Definindo somatórios necessários:
    Sx, Sy, Sx2, Sx3, Sx4, Sxy, Sx2y = np.sum(x), np.sum(y), np.sum(x**2), np.sum(x**3), np.sum(x**4), np.sum(x*y), np.sum((x**2)*y)
    print('Definindo elementos das matrizes:')
    print('- Matriz S:')
    print('n: {}\nSx: {}\nSx2: {}\nSx3: {}\nSx4: {}\n'.format(n,Sx,Sx2,Sx3,Sx4))
    print('- Vetor s:')
    print('Sy: {}\nSxy: {}\nSx2y: {}\n'.format(Sy,Sxy,Sx2y))
    
    # Monstando as matrizes de equações:
    S = np.array([
        [n, Sx, Sx2],
        [Sx, Sx2, Sx3],
        [Sx2, Sx3,Sx4]
    ])
    
    print('Matriz S:')
    print(S,'\n')
    
    s = np.array([Sy, Sxy, Sx2y])
    
    print('Array s:')
    print(s,'\n')
    
    # Calculando os coeficientes:
    
    a = gaussJordan(S, s, 3)
    #a = np.linalg.inv(S)@s
    
    return a

In [None]:
# Teste do algoritmo:

x=np.array([1., 3, 5, 7, 10]);
y=np.array([2.2, 5, 5.5, 6.1, 6.6]);

regPoli2(x,y)