# Implementação do Método dos Míninos quadrados

Instruções: 
Implemente o Método dos Míninos quadrados em Python:
- Básico - Linear
- Quadrático.
- Robusto (com peso).<br>
<br>
Teste o funcionamento usando:
- “Alps Water”
- “Books x Grades”
- “US Census Dataset”

Não é permitido usar bibliotecas prontas. Proibidas: Sklearn, NumPy, SciPy.

## Básico - Linear

$ β = (X^t.X)^{-1}.X^T.y $

### Definição das funções

In [1]:
#Função para calcular a matriz transposta:

def transposta(X):
    """Retorna a transposta da matriz de entrada"""
    return [[X[j][i] for j in range(len(X))] for i in range(len(X[0]))] 

In [2]:
#Multiplicação de duas matrizes:

def multiply_matrix_matrix(mult1,mult2):
    """Retorna o produto escalar de duas matrizes"""
    x = []
    for i in range(0,len(mult1)):
        y=[]
        for j in range(0,len(mult2[0])):
            total = 0
            for k in range(0,len(mult1[0])):
                total = total + mult1[i][k]*mult2[k][j]
            y.append(total)
        x.append(y)

    return x

In [3]:
#Multiplicação da matriz transposta por um vetor:

def multiply_matrix_vector(mult1,mult2):
    """Retorna o produto escalar de uma matriz com um vetor"""
    x=[]
    total = 0
    for i in range(len(mult1)):
        total=0
        for j in range(len(mult2)):
            total = total + mult1[i][j] * mult2[j]
        x.append(total)
    return x

In [4]:
#Cálculo da inversa:

def Determinante(matriz):
    """Cálculo do determinante da matriz inserida"""
    #Determinante da matriz 2x2
    if len(matriz) == 2:
        return (matriz[0][0]*matriz[1][1])-(matriz[0][1]*matriz[1][0])

    determinant = 0
    for c in range(len(matriz)):
        determinant = determinant + ((-1)**c)*matriz[0][c]*Determinante([row[:c] + row[c+1:] for 
                                                                         row in (matriz[:0]+matriz[0+1:])])
    return determinant

def matriz_inversa(m):
    """Cálculo da matriz inversa através do método dos cofatores."""
    determinant = Determinante(m)
    
    #Fórmula para cáculo da matriz 2x2:
    if len(m) == 2:
        a = m[0][0]
        b = m[0][1]
        c = m[1][0]
        d = m[1][1]

        inverse= [d, -b, -c, a]
        calc_inverse=[]
        for i in inverse:
            x = (1/(a*d-b*c)) * i
            calc_inverse.append(x)
        col = 2 
        inverse_matrix = [calc_inverse[i:i+col] for i in range(0, len(calc_inverse), col)]
        return inverse_matrix
    
    else:
    #Para os demais tamanho, matriz de cofatores:
        cofactors = []
        for r in range(len(m)):
            cofactorRow = []
            for c in range(len(m)):
                minor = [row[:c] + row[c+1:] for row in (m[:r]+m[r+1:])]
                cofactorRow.append(((-1)**(r+c)) * Determinante(minor))
            cofactors.append(cofactorRow)
        cofactors = transposta(cofactors)
        for r in range(len(cofactors)):
            for c in range(len(cofactors)):
                cofactors[r][c] = cofactors[r][c]/determinant
        return cofactors

#Obs: Para construir a matriz de cofatores, consultei o site: 
#https://stackoverflow.com/questions/32114054/matrix-inversion-without-numpy

### Testando nos Datasets:

In [5]:
#Biblioteca Pandas - para carregar os arquivos txt disponibilizados no Moodle
import pandas as pd

#### Alps Water

- **Input:** Boiling
- **Output:** Pressure

Variáveis relevantes:

Xl_alps - Input X para o método dos mínimos quadrados linear;<br>
Y_alps - Saída Y (igual para todos os métodos);<br>
Xlt_alps - Transposta da input Xl_alps;<br>
ml_alps - multiplicação  $(Xt.X)$  para o método dos mínimos quadrados linear;<br>
p1l_alps -  $(Xt.X)^{−1}$  para o método dos mínimos quadrados linear;<br>
p2l_alps -  $(Xt.y)$  para o método dos mínimos quadrados linear;<br>
betthal_alps - Resposta do exercício, coeficientes β0 e β1.

In [6]:
#Importando o dataset
alps_water = pd.read_csv('DataSets/alpswater1.txt',sep='\t',header=None)
alps_water.columns= ['Row','Pressure','Boiling']
alps_water.drop(columns='Row', inplace=True)
alps_water.head()

Unnamed: 0,Pressure,Boiling
0,20.79,194.5
1,20.79,194.3
2,22.4,197.9
3,22.67,198.4
4,23.15,199.4


In [7]:
# Defining input
x_input = [i for i in alps_water['Boiling']]
Xl_alps = [[1,i] for i in x_input]
#Defining output
Y_alps = alps_water['Pressure']

In [8]:
Xlt_alps = transposta(Xl_alps)
Xlt_alps

[[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
 [194.5,
  194.3,
  197.9,
  198.4,
  199.4,
  199.9,
  200.9,
  201.1,
  201.4,
  201.3,
  203.6,
  204.6,
  209.5,
  208.6,
  210.7,
  211.9,
  212.2]]

In [9]:
ml_alps = multiply_matrix_matrix(Xlt_alps,Xl_alps)
ml_alps

[[17, 3450.2], [3450.2, 700759.02]]

In [10]:
p1l_alps = matriz_inversa(ml_alps)
p1l_alps

[[77.6610574845059, -0.382365653364037],
 [-0.382365653364037, 0.0018840113927275604]]

In [11]:
#Multiplicação da matriz X transposta pelo vetor y
p2l_alps= multiply_matrix_vector(Xlt_alps,Y_alps)
p2l_alps

[426.00000000000006, 86735.49500000001]

In [12]:
#Resultado final
print('Método Linear - Alps Water:')
betthal_alps = multiply_matrix_vector(p1l_alps,p2l_alps)
print('Coeficiente β0 =', betthal_alps[0])
print('Coeficiente β1 =', betthal_alps[1])

Método Linear - Alps Water:
Coeficiente β0 = -81.06372712864686
Coeficiente β1 = 0.522892400784599


#### Books, attend and grade 

- **Inputs:** Books and Attend
- **Output:** Grade

Variáveis relevantes:

Xl_books - Input X para o método dos mínimos quadrados linear;<br>
Y_books - Saída Y (igual para todos os métodos);<br>
Xlt_books - Transposta da input Xl_books;<br>
ml_books - multiplicação  $(Xt.X)$  para o método dos mínimos quadrados linear;<br>
p1l_books -  $(Xt.X)^{−1}$  para o método dos mínimos quadrados linear;<br>
p2l_books-  $(Xt.y)$  para o método dos mínimos quadrados linear;<br>
betthal_books - Resposta do exercício, coeficientes β0, β1 e β2.<br>

In [13]:
books_attend_grade = pd.read_csv('DataSets/Books_attend_grade.txt',sep='\t',header=None)
books_attend_grade.columns=['Books', 'Attend', 'Grade']
books_attend_grade.head()

Unnamed: 0,Books,Attend,Grade
0,0,9,45
1,1,15,57
2,0,10,45
3,2,16,51
4,4,10,65


In [14]:
#Cálculo da matriz X
x_input = [i for i in books_attend_grade['Books']]
Xl_books=[[1,i,j] for i, j in zip(x_input, books_attend_grade['Attend'])]
Xl_books

[[1, 0, 9],
 [1, 1, 15],
 [1, 0, 10],
 [1, 2, 16],
 [1, 4, 10],
 [1, 4, 20],
 [1, 1, 11],
 [1, 4, 20],
 [1, 3, 15],
 [1, 0, 15],
 [1, 2, 8],
 [1, 1, 13],
 [1, 4, 18],
 [1, 1, 10],
 [1, 0, 8],
 [1, 1, 10],
 [1, 3, 16],
 [1, 0, 11],
 [1, 1, 19],
 [1, 4, 12],
 [1, 4, 11],
 [1, 0, 19],
 [1, 2, 15],
 [1, 3, 15],
 [1, 1, 20],
 [1, 0, 6],
 [1, 3, 15],
 [1, 3, 19],
 [1, 2, 14],
 [1, 2, 13],
 [1, 3, 17],
 [1, 2, 20],
 [1, 2, 11],
 [1, 3, 20],
 [1, 4, 20],
 [1, 4, 20],
 [1, 3, 9],
 [1, 1, 8],
 [1, 2, 16],
 [1, 0, 10]]

In [15]:
#Cálculo da matriz Y
Y_books = [i for i in books_attend_grade['Grade']]
Y_books

[45,
 57,
 45,
 51,
 65,
 88,
 44,
 87,
 89,
 59,
 66,
 65,
 56,
 47,
 66,
 41,
 56,
 37,
 45,
 58,
 47,
 64,
 97,
 55,
 51,
 61,
 69,
 79,
 71,
 62,
 87,
 54,
 43,
 92,
 83,
 94,
 60,
 56,
 88,
 62]

In [16]:
#Cálculo da matrix X transposta
Xlt_books = transposta(Xl_books)
Xlt_books

[[1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1],
 [0,
  1,
  0,
  2,
  4,
  4,
  1,
  4,
  3,
  0,
  2,
  1,
  4,
  1,
  0,
  1,
  3,
  0,
  1,
  4,
  4,
  0,
  2,
  3,
  1,
  0,
  3,
  3,
  2,
  2,
  3,
  2,
  2,
  3,
  4,
  4,
  3,
  1,
  2,
  0],
 [9,
  15,
  10,
  16,
  10,
  20,
  11,
  20,
  15,
  15,
  8,
  13,
  18,
  10,
  8,
  10,
  16,
  11,
  19,
  12,
  11,
  19,
  15,
  15,
  20,
  6,
  15,
  19,
  14,
  13,
  17,
  20,
  11,
  20,
  20,
  20,
  9,
  8,
  16,
  10]]

In [17]:
#Multiplicação de X transposta pela entrada X
ml_books = multiply_matrix_matrix(Xlt_books,Xl_books)
ml_books 

[[40, 80, 564], [80, 240, 1234], [564, 1234, 8666]]

In [18]:
#Cálculo da inversa da matrix 3x3 (Inversa da Multiplicação de X transposta por X)
p1l_books = matriz_inversa(ml_books)
p1l_books

[[0.30374029486172904, 0.001469946785309256, -0.019977318328535287],
 [0.001469946785309256, 0.015563116112710459, -0.0023117857454418565],
 [-0.019977318328535287, -0.0023117857454418565, 0.0017447439588240425]]

In [19]:
#Multiplicação da matriz X transposta pelo vetor y
p2l_books = multiply_matrix_vector(Xlt_books,Y_books)
p2l_books

[2542, 5543, 37186]

In [20]:
#Resultado final
print('Método Linear - Books, Attend and Grade:')
betthal_books = multiply_matrix_vector(p1l_books,p2l_books)
print('Coeficiente β0 =', betthal_books[0])
print('Coeficiente β1 =', betthal_books[1])
print('Coeficiente β2 =', betthal_books[2])

Método Linear - Books, Attend and Grade:
Coeficiente β0 = 37.379185204571286
Coeficiente β1 = 4.036892611009321
Coeficiente β2 = 1.2834772747099308


#### US-Census

- **Input:** x
- **Output:** y


Variáveis relevantes:

Xl_us - Input X para o método dos mínimos quadrados linear;<br>
Y_us - Saída Y (igual para todos os métodos);<br>
Xlt_us - Transposta da input Xl_us;<br>
ml_us - multiplicação  $(Xt.X)$  para o método dos mínimos quadrados linear;<br>
p1l_us -  $(Xt.X)^{−1}$  para o método dos mínimos quadrados linear;<br>
p2l_us-  $(Xt.y)$  para o método dos mínimos quadrados linear;<br>
betthal_us - Resposta do exercício, coeficientes β0 e β1.<br>

In [67]:
us_census = pd.read_csv('DataSets/US-Census.txt', sep='\t', header=None)
us_census.columns = ['x','y'] #atribuição de nomes às colunas
us_census 

Unnamed: 0,x,y
0,1900,75.995
1,1910,91.972
2,1920,105.711
3,1930,123.203
4,1940,131.669
5,1950,150.697
6,1960,179.323
7,1970,203.212
8,1980,226.505
9,1990,249.633


In [68]:
#Definindo a matriz de entrada (X)
x_input = [i for i in us_census['x']]
Xl_us = [[1,i] for i in x_input]
Xl_us 

[[1, 1900],
 [1, 1910],
 [1, 1920],
 [1, 1930],
 [1, 1940],
 [1, 1950],
 [1, 1960],
 [1, 1970],
 [1, 1980],
 [1, 1990],
 [1, 2000]]

In [69]:
#Definindo a matriz de saída(y)
Y_us = [i for i in us_census['y']]
Y_us

[75.995,
 91.972,
 105.711,
 123.203,
 131.669,
 150.697,
 179.323,
 203.212,
 226.505,
 249.633,
 281.422]

In [70]:
#Cálculo da matriz X transposta
Xlt_us = transposta(Xl_us)
Xlt_us

[[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
 [1900, 1910, 1920, 1930, 1940, 1950, 1960, 1970, 1980, 1990, 2000]]

In [71]:
#Multiplicação de X transposta pela entrada X
ml_us = multiply_matrix_matrix(Xlt_us,Xl_us)
ml_us

[[11, 21450], [21450, 41838500]]

In [72]:
#Cálculo da inversa da matrix 2x2 (Inversa da Multiplicação de X transposta por X)
p1l_us = matriz_inversa(ml_us)
p1l_us

[[345.7727272727273, -0.17727272727272728],
 [-0.17727272727272728, 9.090909090909092e-05]]

In [73]:
#Multiplicação da matriz X transposta pelo vetor y
p2l_us = multiply_matrix_vector(Xlt_us,Y_us)
p2l_us 

[1819.3419999999999, 3569995.23]

In [74]:
#Resultado final
print('Método Linear - US-Census:')
betthal_us = multiply_matrix_vector(p1l_us,p2l_us)
print('Coeficiente β0 =', betthal_us[0])
print('Coeficiente β1 =', betthal_us[1])

Método Linear - US-Census:
Coeficiente β0 = -3783.9455909089884
Coeficiente β1 = 2.025302727272731


## Quadrático

X = [1 x ${x^2}$] <br>
$ β = (X^t.X)^{-1}.X^T.y $

### Testando nos Datasets:

#### Alps Water
Variáveis relevantes:<br>
- Xq_alps  - Input X para o método dos mínimos quadrados quadrático; 
- Y_alps - Saída Y (igual para todos os métodos);
<br>
- Xqt_alps -  Transposta da input Xq_alps;
- mq_alps - multiplicação $(X^t.X)$ para o método dos mínimos quadrados quadrático;
- p1q_alps - $(X^t.X)^{-1}$ para o método dos mínimos quadrados quadrático;
- p2q_alps - $(X^t.y)$  para o método dos mínimos quadrados quadrático;
- betthaq_alps - Resposta do exercício, coeficientes  β0, β1 e  β2.

In [22]:
#Dataset já foi importado anteriormente 
alps_water

#Definição da matriz X, incluindo x^2
x_input= [i for i in alps_water['Boiling']]
Xq_alps = [[1,i,i**2] for i in x_input]
Xq_alps

[[1, 194.5, 37830.25],
 [1, 194.3, 37752.490000000005],
 [1, 197.9, 39164.41],
 [1, 198.4, 39362.560000000005],
 [1, 199.4, 39760.36],
 [1, 199.9, 39960.01],
 [1, 200.9, 40360.810000000005],
 [1, 201.1, 40441.21],
 [1, 201.4, 40561.96],
 [1, 201.3, 40521.69],
 [1, 203.6, 41452.96],
 [1, 204.6, 41861.159999999996],
 [1, 209.5, 43890.25],
 [1, 208.6, 43513.96],
 [1, 210.7, 44394.49],
 [1, 211.9, 44901.61],
 [1, 212.2, 45028.84]]

In [23]:
#Definição do output
Y_alps = [i for i in alps_water['Pressure']]
Y_alps 

[20.79,
 20.79,
 22.4,
 22.67,
 23.15,
 23.35,
 23.89,
 23.99,
 24.02,
 24.01,
 25.14,
 26.57,
 28.49,
 27.76,
 29.04,
 29.88,
 30.06]

In [24]:
#Cálculo da transposta de X
Xqt_alps = transposta(Xq_alps)
Xqt_alps

[[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
 [194.5,
  194.3,
  197.9,
  198.4,
  199.4,
  199.9,
  200.9,
  201.1,
  201.4,
  201.3,
  203.6,
  204.6,
  209.5,
  208.6,
  210.7,
  211.9,
  212.2],
 [37830.25,
  37752.490000000005,
  39164.41,
  39362.560000000005,
  39760.36,
  39960.01,
  40360.810000000005,
  40441.21,
  40561.96,
  40521.69,
  41452.96,
  41861.159999999996,
  43890.25,
  43513.96,
  44394.49,
  44901.61,
  45028.84]]

In [25]:
#Transposta de X escalar X
mq_alps = multiply_matrix_matrix(Xqt_alps,Xq_alps)
mq_alps

[[17, 3450.2, 700759.02],
 [3450.2, 700759.02, 142437417.332],
 [700759.02, 142437417.332, 28974240616.761]]

In [26]:
#Matriz inversa da (transposta de X escalar X)
p1q_alps = matriz_inversa(mq_alps)
p1q_alps

[[120606.80723388986, -1184.2938772932332, 2.905044322456221],
 [-1184.2938772932332, 11.630992088921097, -0.02853513464758402],
 [2.905044322456221, -0.02853513464758402, 7.001860365542048e-05]]

In [27]:
#Multiplicação da matriz X transposta pelo vetor y
p2q_alps = multiply_matrix_vector(Xqt_alps,Y_alps)
p2q_alps

[426.00000000000006, 86735.49500000001, 17673346.4007]

In [28]:
#Resultado final
print('Método Quadrático - Alps Water:')
betthaq_alps = multiply_matrix_vector(p1q_alps,p2q_alps)
print('Intercept β0 =', betthaq_alps[0])
print('Linear Coeficiente β1 =', betthaq_alps[1])
print('Quadratic Coeficiente β2 =', betthaq_alps[2])

Método Quadrático - Alps Water:
Intercept β0 = 38.82929486036301
Linear Coeficiente β1 = -0.6547706308192573
Quadratic Coeficiente β2 = 0.002889712064870764


#### Books, attend and grade
Variáveis relevantes:
<br>
- Xq_books - Input X para o método dos mínimos quadrados quadrático;<br>
- Y_books - Saída Y (igual para todos os métodos);
- Xqt_books - Transposta da input Xq_books;<br>
- mq_books - multiplicação $(Xt.X)$  para o método dos mínimos quadrados quadrático;<br>
- p1q_books - $(Xt.X)^{-1}$  para o método dos mínimos quadrados quadrático;<br>
- p2q_books -  $(Xt.y)$  para o método dos mínimos quadrados quadrático;<br>
- betthaq_books- Resposta do exercício, coeficientes β0, β1, β2, β3 e β4.<br>

In [29]:
#Dataset already imported
books_attend_grade

#Definição da matriz X, incluindo x^2
x_input = [i for i in books_attend_grade['Books']]
Xq_books = [[1,i,j,i**2,j**2] for i, j in zip(x_input, books_attend_grade['Attend'])]
Xq_books

[[1, 0, 9, 0, 81],
 [1, 1, 15, 1, 225],
 [1, 0, 10, 0, 100],
 [1, 2, 16, 4, 256],
 [1, 4, 10, 16, 100],
 [1, 4, 20, 16, 400],
 [1, 1, 11, 1, 121],
 [1, 4, 20, 16, 400],
 [1, 3, 15, 9, 225],
 [1, 0, 15, 0, 225],
 [1, 2, 8, 4, 64],
 [1, 1, 13, 1, 169],
 [1, 4, 18, 16, 324],
 [1, 1, 10, 1, 100],
 [1, 0, 8, 0, 64],
 [1, 1, 10, 1, 100],
 [1, 3, 16, 9, 256],
 [1, 0, 11, 0, 121],
 [1, 1, 19, 1, 361],
 [1, 4, 12, 16, 144],
 [1, 4, 11, 16, 121],
 [1, 0, 19, 0, 361],
 [1, 2, 15, 4, 225],
 [1, 3, 15, 9, 225],
 [1, 1, 20, 1, 400],
 [1, 0, 6, 0, 36],
 [1, 3, 15, 9, 225],
 [1, 3, 19, 9, 361],
 [1, 2, 14, 4, 196],
 [1, 2, 13, 4, 169],
 [1, 3, 17, 9, 289],
 [1, 2, 20, 4, 400],
 [1, 2, 11, 4, 121],
 [1, 3, 20, 9, 400],
 [1, 4, 20, 16, 400],
 [1, 4, 20, 16, 400],
 [1, 3, 9, 9, 81],
 [1, 1, 8, 1, 64],
 [1, 2, 16, 4, 256],
 [1, 0, 10, 0, 100]]

In [30]:
#Cálculo da matriz Y
Y_books = [i for i in books_attend_grade['Grade']]
Y_books

[45,
 57,
 45,
 51,
 65,
 88,
 44,
 87,
 89,
 59,
 66,
 65,
 56,
 47,
 66,
 41,
 56,
 37,
 45,
 58,
 47,
 64,
 97,
 55,
 51,
 61,
 69,
 79,
 71,
 62,
 87,
 54,
 43,
 92,
 83,
 94,
 60,
 56,
 88,
 62]

In [31]:
#Cálculo da matrix X transposta
Xqt_books = transposta(Xq_books)
Xqt_books

[[1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1,
  1],
 [0,
  1,
  0,
  2,
  4,
  4,
  1,
  4,
  3,
  0,
  2,
  1,
  4,
  1,
  0,
  1,
  3,
  0,
  1,
  4,
  4,
  0,
  2,
  3,
  1,
  0,
  3,
  3,
  2,
  2,
  3,
  2,
  2,
  3,
  4,
  4,
  3,
  1,
  2,
  0],
 [9,
  15,
  10,
  16,
  10,
  20,
  11,
  20,
  15,
  15,
  8,
  13,
  18,
  10,
  8,
  10,
  16,
  11,
  19,
  12,
  11,
  19,
  15,
  15,
  20,
  6,
  15,
  19,
  14,
  13,
  17,
  20,
  11,
  20,
  20,
  20,
  9,
  8,
  16,
  10],
 [0,
  1,
  0,
  4,
  16,
  16,
  1,
  16,
  9,
  0,
  4,
  1,
  16,
  1,
  0,
  1,
  9,
  0,
  1,
  16,
  16,
  0,
  4,
  9,
  1,
  0,
  9,
  9,
  4,
  4,
  9,
  4,
  4,
  9,
  16,
  16,
  9,
  1,
  4,
  0],
 [81,
  225,
  100,
  256,
  100,
  400,
  121,
  400,
  225,
  225,
  64,
  169,
  324,
  100,
  64,
  100,
  256,
  121,
  361,
  144,
  121,
  361,
  2

In [32]:
#Multiplicação de X transposta pela entrada X
mq_books = multiply_matrix_matrix(Xqt_books,Xq_books)
mq_books

[[40, 80, 564, 240, 8666],
 [80, 240, 1234, 800, 20256],
 [564, 1234, 8666, 3788, 142260],
 [240, 800, 3788, 2832, 63470],
 [8666, 20256, 142260, 63470, 2451362]]

In [33]:
#Cálculo da inversa da matrix 3x3 (Inversa da Multiplicação de X transposta por X)
p1q_books = matriz_inversa(mq_books)
p1q_books

[[4.005600140848931,
  0.2241330204971903,
  -0.6155675942481291,
  -0.050409152500737,
  0.021015886508468636],
 [0.2241330204971903,
  0.18409838945742982,
  -0.049086371990312946,
  -0.04129962744168894,
  0.0016043656141310697],
 [-0.6155675942481291,
  -0.049086371990312946,
  0.09834186623602252,
  0.010811349535702569,
  -0.003405253048296229],
 [-0.050409152500737,
  -0.04129962744168894,
  0.010811349535702569,
  0.010125553102763493,
  -0.0003701128072276588],
 [0.021015886508468636,
  0.0016043656141310697,
  -0.003405253048296229,
  -0.0003701128072276588,
  0.00012005597547939996]]

In [34]:
#Multiplicação da matriz X transposta pelo vetor y
p2q_books = multiply_matrix_vector(Xqt_books,Y_books)
p2q_books

[2542, 5543, 37186, 17065, 589680]

In [35]:
#Resultado final
betthaq_books = multiply_matrix_vector(p1q_books,p2q_books)
print('Método Quadrático - Books, attend and grades:')
print('Coeficiente β0 =', betthaq_books[0])
print('Coeficiente β1 =', betthaq_books[1])
print('Coeficiente β2 =', betthaq_books[2])
print('Coeficiente β3 =', betthaq_books[3])
print('Coeficiente β4 =', betthaq_books[4])

Método Quadrático - Books, attend and grades:
Coeficiente β0 = 66.52409983168764
Coeficiente β1 = 6.161855083001456
Coeficiente β2 = -3.4318843608712086
Coeficiente β3 = -0.48861319886634647
Coeficiente β4 = 0.1662748150648099


#### US-Census

Variáveis relevantes:<br>
- Xq_us  - Input X para o método dos mínimos quadrados quadrático; <br>
- Y_us - Saída Y (igual para todos os métodos);
- Xqt_us -  Transposta da input Xq_us;
- mq_us - multiplicação $(X^t.X)$ para o método dos mínimos quadrados quadrático;
- p1q_us - $(X^t.X)^{-1}$ para o método dos mínimos quadrados quadrático;
- p2q_us - $(X^t.y)$  para o método dos mínimos quadrados quadrático;
- betthaq_us - Resposta do exercício, coeficientes  β0, β1 e  β2.

In [36]:
#Dataset already imported
us_census 
#Definição da matriz de entrada (X), incluindo x^2
x_input = [i for i in us_census['x']]
Xq_us = [[1,i,i**2] for i in x_input]
Xq_us

[[1, 1900, 3610000],
 [1, 1910, 3648100],
 [1, 1920, 3686400],
 [1, 1930, 3724900],
 [1, 1940, 3763600],
 [1, 1950, 3802500],
 [1, 1960, 3841600],
 [1, 1970, 3880900],
 [1, 1980, 3920400],
 [1, 1990, 3960100],
 [1, 2000, 4000000]]

In [37]:
#Definindo a matrix de saída(y)
Y_us = [i for i in us_census['y']]
Y_us

[75.995,
 91.972,
 105.711,
 123.203,
 131.669,
 150.697,
 179.323,
 203.212,
 226.505,
 249.633,
 281.422]

In [38]:
#Cálculo da matrix X transposta
Xqt_us = transposta(Xq_us)
Xqt_us

[[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
 [1900, 1910, 1920, 1930, 1940, 1950, 1960, 1970, 1980, 1990, 2000],
 [3610000,
  3648100,
  3686400,
  3724900,
  3763600,
  3802500,
  3841600,
  3880900,
  3920400,
  3960100,
  4000000]]

In [39]:
#Multiplicação de X transposta pela entrada X
mq_us= multiply_matrix_matrix(Xqt_us,Xq_us)
mq_us

[[11, 21450, 41838500],
 [21450, 41838500, 81627975000],
 [41838500, 81627975000, 159300053330000]]

In [40]:
#Cálculo da inversa da matrix 2x2 (Inversa da Multiplicação de X transposta por X)
p1q_us = matriz_inversa(mq_us)
p1q_us

[[1684658.3892773893, -1728.1318181818183, 0.4430652680652681],
 [-1728.1318181818183, 1.7728181818181818, -0.00045454545454545455],
 [0.4430652680652681, -0.00045454545454545455, 1.1655011655011655e-07]]

In [41]:
#Multiplicação da matriz X transposta pelo vetor y
p2q_us = multiply_matrix_vector(Xqt_us,Y_us)
p2q_us

[1819.3419999999999, 3569995.23, 7006834212.1]

In [42]:
#Resultado final
betthaq_us = multiply_matrix_vector(p1q_us,p2q_us)
print('Método Quadrático - US-Census:')
print('Coeficiente β0 =', betthaq_us[0])
print('Coeficiente β1 =', betthaq_us[1])
print('Coeficiente β2 =', betthaq_us[2])

Método Quadrático - US-Census:
Coeficiente β0 = 32294.01736307144
Coeficiente β1 = -34.98747000005096
Coeficiente β2 = 0.009490454545471039


## Robusto (com peso)

- $ β = ({X^T} $x$ W .X)^{-1}.{X^T} $x$ W .y $<br>
<br>Critério adotado para cálculo do peso:
- $ W= abs({1} / {(yobs-ypred)})$

#### Alps Water

Variáveis relevantes:<br>
- Xr_alps  - Input X para o método dos mínimos quadrados robustos; 
- Xrt_alps -  Transposta da input Xr_alps;
- Y_alps - Saída Y (igual para todos os métodos);
<br>
- W_alps - Peso para $W= abs({1} / {(yobs-(β0+β1*X1)})$<br>
*Obs: coeficientes obtidos através do método linear (betthal_alps[0] e betthal_alps[1])*
- XtW_alps - Cálculo do produto vetorial entre ${X^T} $x$ W$
- mr_alps - multiplicação $({X^T} $x$ W .X)$ para o método dos mínimos quadrados robustos;
- p1r_alps - $({X^T} $x$ W .X)$ para o método dos mínimos quadrados robustos;
- p2r_alps - ${X^T} $x$ W .y$  para o método dos mínimos quadrados robustos;
- betthar_alps - Resposta do exercício, coeficientes robustos  β0 e β1.

In [43]:
alps_water

Unnamed: 0,Pressure,Boiling
0,20.79,194.5
1,20.79,194.3
2,22.4,197.9
3,22.67,198.4
4,23.15,199.4
5,23.35,199.9
6,23.89,200.9
7,23.99,201.1
8,24.02,201.4
9,24.01,201.3


In [44]:
#A entrada para o método dos mínimos quadrados robustos é igual à entrada do método linear
Xr_alps = Xl_alps

#A saída do dataset é a mesma
Y_alps

[20.79,
 20.79,
 22.4,
 22.67,
 23.15,
 23.35,
 23.89,
 23.99,
 24.02,
 24.01,
 25.14,
 26.57,
 28.49,
 27.76,
 29.04,
 29.88,
 30.06]

In [45]:
#Cálculo do peso W
W_alps=[]
for i in range(len(Y_alps)):
    w=1/(Y_alps[i]-(betthal_alps[0]*Xr_alps[i][0]+betthal_alps[1]*Xr_alps[i][1]))
    if w<0:
        w=-w
    W_alps.append(w)
W_alps

[6.615717874720793,
 3.91031831657218,
 59.95568090952846,
 123.07409021305531,
 19.60108352980896,
 8.891750989844958,
 10.48699628945288,
 10.006537357313336,
 4.409124625060843,
 5.4196679414565665,
 3.888543893640207,
 1.5385989989840607,
 128.713972933644,
 3.9741256597416235,
 14.346848941484716,
 7.001457586319023,
 6.025559864993501]

In [46]:
Xrt_alps = transposta(Xr_alps)
Xrt_alps

[[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
 [194.5,
  194.3,
  197.9,
  198.4,
  199.4,
  199.9,
  200.9,
  201.1,
  201.4,
  201.3,
  203.6,
  204.6,
  209.5,
  208.6,
  210.7,
  211.9,
  212.2]]

In [47]:
#X transposta vetorial W_alps
Z=[]
for i,j in zip(Xrt_alps[0],W_alps):
    Z.append(i*j)

for i,j in zip(Xrt_alps[1],W_alps):
    Z.append(i*j)

XtW_alps = [Z[:len(Z)//2],Z[len(Z)//2:]]
XtW_alps

[[6.615717874720793,
  3.91031831657218,
  59.95568090952846,
  123.07409021305531,
  19.60108352980896,
  8.891750989844958,
  10.48699628945288,
  10.006537357313336,
  4.409124625060843,
  5.4196679414565665,
  3.888543893640207,
  1.5385989989840607,
  128.713972933644,
  3.9741256597416235,
  14.346848941484716,
  7.001457586319023,
  6.025559864993501],
 [1286.7571266331943,
  759.7748489099747,
  11865.229251995683,
  24417.899498270173,
  3908.4560558439066,
  1777.4610228700071,
  2106.837554551084,
  2012.3146625557117,
  887.9976994872538,
  1090.9791566152069,
  791.7075367451462,
  314.7973551921388,
  26965.577329598415,
  829.0026126221027,
  3022.8810719708295,
  1483.608862541001,
  1278.6238033516208]]

In [48]:
#(X transposta vetorial W_alps) escalar com a entrada X
mr_alps = multiply_matrix_matrix(XtW_alps,Xr_alps)
mr_alps

[[417.86007592562146, 84799.90544975345],
 [84799.90544975345, 17222035.54376511]]

In [49]:
#Inversa de do resultado anterior
p1r_alps = matriz_inversa(mr_alps)
p1r_alps

[[3.2028389841368288, -0.015770519247587718],
 [-0.015770519247587718, 7.771082214340651e-05]]

In [50]:
#Cálculo do segundo elemento do produto escalar total
p2r_alps = multiply_matrix_vector(XtW_alps,Y_alps)
p2r_alps

[10462.930974138351, 2130078.9159631673]

In [51]:
# Cálculo do Bettha através do método robusto
betthar_alps = multiply_matrix_vector(p1r_alps,p2r_alps)

#Respostas

print('Método Robusto - Alps Water:')

print('Coeficiente β0 =', betthar_alps[0])
print('Coeficiente β1 =', betthar_alps[1])

Método Robusto - Alps Water:
Coeficiente β0 = -81.36733077487588
Coeficiente β1 = 0.5243294760032597


#### Books, attend and grade

Variáveis relevantes:<br>
- Xr_books  - Input X para o método dos mínimos quadrados robustos; 
- Xrt_books -  Transposta da input Xr_books;
- Y_books - Saída Y (igual para todos os métodos);
<br>
- W_books - Peso para $W= abs({1} / {(yobs-(β0+β1*X1+β2*X2)})$<br>
*Obs: coeficientes obtidos através do método linear (betthal_books[0] e betthal_books[1] e betthal_books[2])*
- XtW_books - Cálculo do produto vetorial entre ${X^T} $x$ W$
- mr_books - multiplicação $({X^T} $x$ W .X)$ para o método dos mínimos quadrados robustos;
- p1r_books - $({X^T} $x$ W .X)^{-1}$ para o método dos mínimos quadrados robustos;
- p2r_books - ${X^T} $x$ W .y$  para o método dos mínimos quadrados robustos;
- betthar_books - Resposta do exercício, coeficientes robustos  β0, β1 e β2.

In [52]:
#Definição da matriz X do método robusto (igual ao método linear)
Xr_books=Xl_books

#Transposta de X
Xrt_books = transposta(Xr_books)

#Definição da matriz Y (igual para todos os métodos)
Y_books

[45,
 57,
 45,
 51,
 65,
 88,
 44,
 87,
 89,
 59,
 66,
 65,
 56,
 47,
 66,
 41,
 56,
 37,
 45,
 58,
 47,
 64,
 97,
 55,
 51,
 61,
 69,
 79,
 71,
 62,
 87,
 54,
 43,
 92,
 83,
 94,
 60,
 56,
 88,
 62]

In [53]:
#Cálculo da matriz W
W_books=[]
for i in range(len(Y_books)):
    w=1/(Y_books[i]-(betthal_books[0]*Xr_books[i][0]+betthal_books[1]*Xr_books[i][1]+betthal_books[2]*Xr_books[i][2]))
    if w<0:
        w=-w
    W_books.append(w)
W_books

[0.2544218079640258,
 0.2726105258151234,
 0.19179287774647127,
 0.06671734150338997,
 0.734468706750758,
 0.11358861953609173,
 0.08669772648202224,
 0.12814436055259634,
 0.04936326852618996,
 0.42218039989834494,
 0.097283727656483,
 0.14495447647951382,
 0.04847463275063433,
 0.13791485445128246,
 0.054487014950061925,
 0.07546685363854524,
 0.0712987088110479,
 0.06897771808494317,
 0.048071963263508995,
 0.09150400883828357,
 0.04843786511683539,
 0.44747803208037473,
 0.030964669806083815,
 0.07276949407331455,
 0.062167314299350275,
 0.06281426310644295,
 3.876301907208429,
 0.19515741301934358,
 0.13195488462149368,
 7.237199318140946,
 0.0637307064918253,
 0.058402632219830164,
 0.06034558547536571,
 0.059380337198260996,
 0.2629019902847974,
 0.06755068511233059,
 0.9604685457653549,
 0.23169043263837652,
 0.04543101801466875,
 0.08484612526405702]

In [54]:
#Produto vetorial: X transposto x W
Z=[]
for i,j in zip(Xrt_books[0],W_books):
    Z.append(i*j)

for i,j in zip(Xrt_books[1],W_books):
    Z.append(i*j)

for i,j in zip(Xrt_books[2],W_books):
    Z.append(i*j)

n = 3 #separando a lista em 03 partes para representar a matriz
XtW_books = [Z[i::n] for i in range(n)]
XtW_books 

[[0.2544218079640258,
  0.06671734150338997,
  0.08669772648202224,
  0.42218039989834494,
  0.04847463275063433,
  0.07546685363854524,
  0.048071963263508995,
  0.44747803208037473,
  0.062167314299350275,
  0.19515741301934358,
  0.0637307064918253,
  0.059380337198260996,
  0.9604685457653549,
  0.08484612526405702,
  0.0,
  0.4543544781443669,
  0.14808980557856988,
  0.14495447647951382,
  0.0,
  0.0,
  0.19375146046734157,
  0.21830848221994364,
  11.628905721625287,
  14.474398636281892,
  0.12069117095073142,
  0.27020274044932235,
  0.0908620360293375,
  4.089157887226851,
  7.34468706750758,
  2.562887211051927,
  0.778269821251864,
  1.3791485445128246,
  1.1407793409767664,
  1.0980481060594027,
  0.4644700470912572,
  0.3768855786386577,
  1.8473683847009115,
  1.1680526443966033,
  5.258039805695947,
  1.8535234611070122],
 [0.2726105258151234,
  0.734468706750758,
  0.12814436055259634,
  0.097283727656483,
  0.13791485445128246,
  0.0712987088110479,
  0.09150400883828

In [55]:
#Multiplicação da transposta de X pelo produto vetorial
mr_books  = multiply_matrix_matrix(XtW_books,Xr_books)
mr_books 

[[59.981096108062935, 139.6358982322551, 892.0195215308138],
 [171.35130135557162, 549.7333708264584, 2274.7729792437785],
 [56.7939604972647, 116.09634324188411, 877.6836130129986]]

In [56]:
#Inversa do elemento 01 do produto escalar
p1r_books = matriz_inversa(mr_books)

In [57]:
#Cálculo do elemento 02 do produto escalar 
p2r_books = multiply_matrix_vector(XtW_books,Y_books)

In [58]:
#Cálculo do coeficiente bettha
betthar_books = multiply_matrix_vector(p1r_books,p2r_books)

In [59]:
#Resposta - coeficientes método robusto dataset Books, attend and grade
print('Método Robusto - Books, attend and grade:')

print('Coeficiente β0 =', betthar_books[0])
print('Coeficiente β1 =', betthar_books[1])
print('Coeficiente β2 =', betthar_books[2])

Método Robusto - Books, attend and grade:
Coeficiente β0 = -818.8498826007017
Coeficiente β1 = 85.33311830852267
Coeficiente β2 = 46.5306542633009


#### US-Census

Variáveis relevantes:<br>
- Xr_us - Input X para o método dos mínimos quadrados robustos; 
- Xrt_us-  Transposta da input Xr_us;
- Y_us - Saída Y (igual para todos os métodos);
<br>
- W_us - Peso para $W= abs({1} / {(yobs-(β0+β1*X1)})$<br>
*Obs: coeficientes obtidos através do método linear (betthal_us[0] e betthal_us[1])*
- XtW_us - Cálculo do produto vetorial entre ${X^T} $x$ W$
- mr_us - multiplicação $({X^T} $x$ W .X)$ para o método dos mínimos quadrados robustos;
- p1r_us - $({X^T} $x$ W .X)^{-1}$ para o método dos mínimos quadrados robustos;
- p2r_us - ${X^T} $x$ W .y$  para o método dos mínimos quadrados robustos;
- betthar_us - Resposta do exercício, coeficientes robustos  β0 e β1.

In [60]:
#Entrada igual ao método linear
Xr_us=Xl_us

#Transposta da entrada
Xrt_us= transposta(Xr_us)

#Saída é a mesma para todos os métodos
Y_us

[75.995,
 91.972,
 105.711,
 123.203,
 131.669,
 150.697,
 179.323,
 203.212,
 226.505,
 249.633,
 281.422]

In [61]:
#Cálculo do coeficiente W
W_us=[]
for i in range(len(Y_us)):
    w= (1/(Y_us[i]-(betthal_us[0]*Xr_us[i][0]+betthal_us[1]*Xr_us[i][1])))
    if w<0: #módulo não pode ser negativo
        w=-w 
    W_us.append(w)
W_us

[0.08427859438705773,
 0.13176303735552444,
 0.9299258596420059,
 0.5932349641516997,
 0.07422417184320074,
 0.06803773001340926,
 0.15810890253462162,
 0.37191563599440197,
 2.847454118050622,
 0.3099656783563451,
 0.06774087268769137]

In [62]:
#Produto vetorial: X transposto x W
Z=[]
for i,j in zip(Xrt_us[0],W_us):
    Z.append(i*j)

for i,j in zip(Xrt_us[1],W_us):
    Z.append(i*j)

XtW_us  = [Z[:len(Z)//2],Z[len(Z)//2:]]
XtW_us 

[[0.08427859438705773,
  0.13176303735552444,
  0.9299258596420059,
  0.5932349641516997,
  0.07422417184320074,
  0.06803773001340926,
  0.15810890253462162,
  0.37191563599440197,
  2.847454118050622,
  0.3099656783563451,
  0.06774087268769137],
 [160.1293293354097,
  251.6674013490517,
  1785.4576505126513,
  1144.9434808127805,
  143.99489337580943,
  132.67357352614806,
  309.8934489678584,
  732.6738029089719,
  5637.959153740232,
  616.8316999291267,
  135.48174537538273]]

In [63]:
mr_us  = multiply_matrix_matrix(XtW_us,Xr_us)

In [64]:
p1r_us = matriz_inversa(mr_us)
p1r_us

[[904.2995026861969, -0.46112512543630385],
 [-0.46112512543630385, 0.00023518547230758305]]

In [65]:
p2r_us = multiply_matrix_vector(XtW_us,Y_us)
p2r_us

[1055.2753979899692, 2077665.7025045797]

In [66]:
betthar_us = multiply_matrix_vector(p1r_us,p2r_us)

#Resultado, coeficiente bettha robusto
print('Método Robusto - US-Census:')
print('Coeficiente β0 =', betthar_us[0])
print('Coeficiente β1  =', betthar_us[1])

Método Robusto - US-Census:
Coeficiente β0 = -3778.840082823066
Coeficiente β1  = 2.022789272835894


## Summary: Results
> Aprentação do resultado de β por datasets.
Comparação dos resultados de cada método.

#### Alps Water

In [79]:
#Resultado final
print('Método Linear - Alps Water:')
betthal_alps = multiply_matrix_vector(p1l_alps,p2l_alps)
print('Coeficiente β0 =', betthal_alps[0])
print('Coeficiente β1 =', betthal_alps[1])
print('\n')
print('Método Quadrático - Alps Water:')
betthaq_alps = multiply_matrix_vector(p1q_alps,p2q_alps)
print('Intercept β0 =', betthaq_alps[0])
print('Linear Coeficiente β1 =', betthaq_alps[1])
print('Quadratic Coeficiente β2 =', betthaq_alps[2])
print('\n')
print('Método Robusto - Alps Water:')
print('Coeficiente β0 =', betthar_alps[0])
print('Coeficiente β1 =', betthar_alps[1])

Método Linear - Alps Water:
Coeficiente β0 = -81.06372712864686
Coeficiente β1 = 0.522892400784599


Método Quadrático - Alps Water:
Intercept β0 = 38.82929486036301
Linear Coeficiente β1 = -0.6547706308192573
Quadratic Coeficiente β2 = 0.002889712064870764


Método Robusto - Alps Water:
Coeficiente β0 = -81.36733077487588
Coeficiente β1 = 0.5243294760032597


#### Books, attend and grade 

In [83]:
#Resultado final
print('Método Linear - Books, Attend and Grade:')
betthal_books = multiply_matrix_vector(p1l_books,p2l_books)
print('Coeficiente β0 =', betthal_books[0])
print('Coeficiente β1 =', betthal_books[1])
print('Coeficiente β2 =', betthal_books[2])
print('\n')
betthaq_books = multiply_matrix_vector(p1q_books,p2q_books)
print('Método Quadrático - Books, attend and grades:')
print('Coeficiente β0 =', betthaq_books[0])
print('Coeficiente β1 =', betthaq_books[1])
print('Coeficiente β2 =', betthaq_books[2])
print('Coeficiente β3 =', betthaq_books[3])
print('Coeficiente β4 =', betthaq_books[4])
print('\n')
print('Método Robusto - Books, attend and grade:')

print('Coeficiente β0 =', betthar_books[0])
print('Coeficiente β1 =', betthar_books[1])
print('Coeficiente β2 =', betthar_books[2])

Método Linear - Books, Attend and Grade:
Coeficiente β0 = 37.379185204571286
Coeficiente β1 = 4.036892611009321
Coeficiente β2 = 1.2834772747099308


Método Quadrático - Books, attend and grades:
Coeficiente β0 = 66.52409983168764
Coeficiente β1 = 6.161855083001456
Coeficiente β2 = -3.4318843608712086
Coeficiente β3 = -0.48861319886634647
Coeficiente β4 = 0.1662748150648099


Método Robusto - Books, attend and grade:
Coeficiente β0 = -818.8498826007017
Coeficiente β1 = 85.33311830852267
Coeficiente β2 = 46.5306542633009


#### US-Census

In [85]:
#Resultado final
print('Método Linear - US-Census:')
betthal_us = multiply_matrix_vector(p1l_us,p2l_us)
print('Coeficiente β0 =', betthal_us[0])
print('Coeficiente β1 =', betthal_us[1])
print('\n')

print('Método Quadrático - US-Census:')
print('Coeficiente β0 =', betthaq_us[0])
print('Coeficiente β1 =', betthaq_us[1])
print('Coeficiente β2 =', betthaq_us[2])

print('\n')
print('Método Robusto - US-Census:')
print('Coeficiente β0 =', betthar_us[0])
print('Coeficiente β1  =', betthar_us[1])

Método Linear - US-Census:
Coeficiente β0 = -3783.9455909089884
Coeficiente β1 = 2.025302727272731


Método Quadrático - US-Census:
Coeficiente β0 = 32294.01736307144
Coeficiente β1 = -34.98747000005096
Coeficiente β2 = 0.009490454545471039


Método Robusto - US-Census:
Coeficiente β0 = -3778.840082823066
Coeficiente β1  = 2.022789272835894
