# <b>Álgebra Linear</b>
---

## <b>Introdução</b>

### <i>Existe algo mais inútil ou menos útil que álgebra?</i>
    — Billy Connolly

### Álgebra linear é o ramo da matemática que lida com espaços vetoriais. Mesmo que não seja possível juntar todo o conteúdo desse tópico em um capítulo curto, ela é necessária para um grande números de conceitos e técnicas da ciência de dados. O que for aprendido nesse capítulo será intensamente utilizado no resto do livro.

## <b>Vetores</b>

### De maneira abstrata, vetores são objetos que podem ser adicionados para formar novos vetores e que podem ser multiplicados por escalares (números) para formar, também, novos vetores.

### De maneira concreta (nesse escopo), vetores são pontos em algum espaço com dimensões finitas. Mesmo que você não pense nos seus dados como vetores, eles são frequentemente uma boa maneira de representar dados numéricos

### Por exemplo, se você tiver a altura, peso e idade de um grande número de pessoas, você pode tratar seus dados como um vetor tri-dimensional: [altura, peso, idade]. Se você estiver ensinando uma turma que têm 4 provas, você pode tratar as notas dos estudantes como um vetor quadri-dimensional: [prova1, prova2, prova3, prova4].

### O approach mais simples para representar vetores é uma lista de números. Uma lista de 3 números corresponde a um vetor tri-dimensional, uma lista de 4 números corresponde a um vetor quadri-dimensional, etc.

### Nesse contexto, vamos interpretar isso dizendo que um Vetor é somente uma lista de floats

In [3]:
from typing import List

Vetor = List[float]

altura_peso_idade = [1.80, # metros
                     80,   # quilos 
                     40 ]  # anos

notas = [95,  # prova 1
         80,  # prova 2
         75,  # prova 3
         62 ] # prova 4

### Nós também queremos fazer aritmética com vetores. Como listas python não são vetores (e não provém auxílio para realizar aritmética vetorial), nós precisamos construir essas operações nós mesmos.

### Pra começar, nós frequentemente vamos ter de adicionar dois vetores. Vetores adicionam via componentes. Isso significa que, se 2 vetores v e w tem o mesmo tamanho, a soma deles será o vetor cujo primeiro elemento é v[0] + w[0], cujo segundo será v[1] + w[1] e assim por diante.

### Por exemplo, adicionar os vetores [1, 2] e [2, 1] resulta em [3, 3], como mostrado na figura

![Alt text](imagens/image.png)

### Podemos facilmente implementar isso zipando os vetores e utilizando uma list comprehension para adicioná-los

In [4]:
def adicionar(v: Vetor, w: Vetor) -> Vetor:
    """adiciona os elementos correspondentes"""
    assert len(v) == len(w), "vetores devem ter o mesmo tamanho"

    return [v_i + w_i for v_i, w_i in zip(v, w)]

assert adicionar([1, 2, 3], [4, 5, 6]) == [5, 7 ,9]

### De maneira similar, para subtrair dois vetores nós só subtraímos os elementos correspondentes

In [5]:
def subtrair(v: Vetor, w: Vetor) -> Vetor:
    """adiciona os elementos correspondentes"""
    assert len(v) == len(w), "vetores devem ter o mesmo tamanho"

    return [v_i - w_i for v_i, w_i in zip(v, w)]


assert subtrair([5, 7, 9], [4, 5, 6]) == [1, 2, 3]

### Algumas vezes também vamos querer fazer uma soma orientada à componentes de uma lista de vetores; isto é, criar um novo vetor cujo primeiro elemento é a soma de todos os primeiros elementos, cujo segundo elemento é a soma de todos os segundo elementos, etc.

In [6]:
def soma_vetorial(vetores: List[Vetor]) -> Vetor:
    """soma todos os elementos correspondentes"""
    assert vetores, "nenhum vetor foi informado"
    num_elementos = len(vetores[0])
    assert all(len(v) == num_elementos for v in vetores), "tamanhos diferentes"
    # cada elemento de indice i é somado e adicionado em uma lista
    return [sum(vetor[i] for vetor in vetores) 
                for i in range(num_elementos)] 

assert soma_vetorial([[1, 2], [3, 4], [5, 6], [7, 8]]) == [16, 20]


### Nós também precisamos ser capazes de multiplicar um vetor por um escalar, o qual fazemos simplesmente multiplicando cada elemento do vetor por aquele número.

In [7]:
def multiplicacao_escalar(c: float, v: Vetor) -> Vetor:
    """multiplica todos os elementos por c"""
    return list(map(lambda x: x * c, v))

assert multiplicacao_escalar(2, [1, 2, 3]) == [2, 4, 6]

### Isso nos permite as médias orientada à componentes de uma lista de vetores [de mesmo tamanho]:

In [8]:
def media_vetorial(vetores: List[Vetor]) -> Vetor:
    """computa a média orientada à componente"""
    n = len(vetores)
    return multiplicacao_escalar(1/n, soma_vetorial(vetores))

assert media_vetorial([[1, 2], [3, 4], [5, 6]]) == [3, 4]

### Uma ferramenta menos óbvia é o produto escalar. O produto escalar (produto interno) de dois vetores é a soma dos seus produtos orientados à componentes:

In [9]:
def dot(v: Vetor, w: Vetor) -> float:
    """"computa o produto escalar"""
    assert len(v) == len(w), "os tamanhos devem ser iguais"
    return sum(v_i * w_i for v_i, w_i in zip(v, w))

assert dot([1, 2, 3], [4, 5, 6]) == 32 # 1 * 4 + 2 * 5 + 3 * 6



### Se w tem magnitude 1, o produto escalar mede quão longe o vetor v estende na direção do w. Por exemplo, se w = [1, 0], então dot(v, w) é o primeiro componente de v. Outra maneira de dizer isso é que é o comprimento do vetor que você conseguiria se projetasse v em w.

![Alt text](imagens/image2.png)

### Usando isso, é fácil computar uma soma de quadrados de um vetor:

In [10]:
def soma_de_quadrados(v: Vetor) -> float:
    return dot(v, v)

assert soma_de_quadrados([1, 2, 3]) == 14

### A qual nós podemos utilizar para computar sua magnitude (ou comprimento)

In [11]:
import math

def magnitude(v: Vetor) -> float:
    return math.sqrt(soma_de_quadrados(v))

assert magnitude([3, 4]) == 5

### Agora temos todas as peças necessárias para computar a distância entre dois vetores, definida pela raiz da soma dos quadrados da subtração dos elementos.

![Alt text](imagens/image3.png)

### Em código:

In [12]:
def distancia_ao_quadrado(v: Vetor, w: Vetor) -> float:
    return soma_de_quadrados(subtrair(v, w))


def distancia(v: Vetor, w: Vetor) -> float:
    return math.sqrt(distancia_ao_quadrado(v, w))


### É provavelmente mais claro se escrevermos como (de forma equivalente):

In [13]:
def distancia (v: Vetor, w: Vetor) -> float:
    return magnitude(subtrair(v, w))

### Isso deve ser mais que o suficiente para um começo. Essas funções serão altamente utilizadas pelo livro.

### <b>Nota</b>
### Utilizar listas é ótimo para exposição, mas terrível para performance.
### Em código de produção, você vai querer utilizar a lib Numpy, que inclui classes de array de alta performance e todos os tipos de operações aritméticas inclusas.

## <b>Matrizes</b>

### Uma matriz é uma estrutura de números bidimensional. Serão representadas como listas de listasm, tal que cada lista interna possui o mesmo tamanho e representa uma linha da matriz. Por convenção matemática, serão utilizadas letras maiúsculas para nomear matrizes.

In [14]:
from typing import List

Matriz = List[List[float]]

A = [[1, 2, 3],  # A tem duas linhas e três colunas
     [4, 5, 6]]

B = [[1, 2],  # B tem três linhas e duas colunas
     [3, 4],
     [5, 6]]



### Aqui farei um código para melhor visualização de matrizes. Instalarei, também, o módulo tabulate.

In [21]:
from typing import List
from IPython.display import display
from IPython.core.display import Markdown
from tabulate import tabulate

def mostrar_matriz(matriz: List[List[float]]) -> None:
    display(Markdown(tabulate(matriz, tablefmt="pipe", headers="firstrow", stralign="center")))



### <b>Nota</b>
### Em matemática, os primeiros elementos das linhas e colunas de uma matriz começariam pelo número 1. Como listas python começam por index 0, nossa representação será utilizando índice 0.

### Já que é uma matriz é representada, nesse contexto, por uma lista de listas; uma matriz A tem len(A) linhas e len(A[0]) colunas, o qual consideramos seu formato (shape).

In [15]:
from typing import Tuple

def shape(A: Matriz) -> Tuple[int, int]:
    numero_linhas = len(A)
    numero_colunas = len(A[0]) if A else 0 # caso a matriz esteja vazia, retorna 0
    return numero_linhas, numero_colunas


assert shape([[1, 2, 3], [4, 5, 6]]) == (2, 3) # 2 linhas, 3 colunas

### Se uma matriz tem n linhas e k colunas, nos referimos à ela como uma matriz n x k. Além disso, podemos querer os vetores individuais de cada linha e de cada coluna.

In [18]:
def get_row(A: Matriz, i: int) -> Vetor:
    return A[i] # A[i] já retorna a linha i a matriz

def get_column(A: Matriz, j: int) -> Vetor:
    return [A_i[j]
            for A_i in A]

### Também queremos criar uma matriz dado seu formato e uma função para gerar seus elementos. Podemos fazer isso utilizando uma list comprehension aninhada.

In [30]:
from typing import Callable

def make_matrix(numero_linhas: int,
                numero_colunas: int,
                funcao_entrada: Callable[[int, int], float]) -> Matriz:
    return [[funcao_entrada(i, j)
             for j in range(numero_colunas)]
             for i in range(numero_linhas)]


def matriz_identidade(n:int) -> Matriz:
    return make_matrix(n, n, lambda i, j: 1 if i == j else 0)


def matriz_multiplicacao_indices(n: int) -> Matriz:
    return make_matrix(n, n, lambda i, j: i * j)


def matriz_soma_indices(n: int) -> Matriz:
    return make_matrix(n, n, lambda i, j: i + j)


mostrar_matriz(matriz_identidade(5))
mostrar_matriz(matriz_multiplicacao_indices(5))
mostrar_matriz(matriz_soma_indices(5))

assert matriz_identidade(5) == [[1, 0, 0, 0, 0], 
                                [0, 1, 0, 0, 0], 
                                [0, 0, 1, 0, 0], 
                                [0, 0, 0, 1, 0], 
                                [0, 0, 0, 0, 1]]

|   1 |   0 |   0 |   0 |   0 |
|----:|----:|----:|----:|----:|
|   0 |   1 |   0 |   0 |   0 |
|   0 |   0 |   1 |   0 |   0 |
|   0 |   0 |   0 |   1 |   0 |
|   0 |   0 |   0 |   0 |   1 |

|   0 |   0 |   0 |   0 |   0 |
|----:|----:|----:|----:|----:|
|   0 |   1 |   2 |   3 |   4 |
|   0 |   2 |   4 |   6 |   8 |
|   0 |   3 |   6 |   9 |  12 |
|   0 |   4 |   8 |  12 |  16 |

|   0 |   1 |   2 |   3 |   4 |
|----:|----:|----:|----:|----:|
|   1 |   2 |   3 |   4 |   5 |
|   2 |   3 |   4 |   5 |   6 |
|   3 |   4 |   5 |   6 |   7 |
|   4 |   5 |   6 |   7 |   8 |

### Existem vários contextos que podemos utilizar matrizes.

### Por exemplo, podemos utilizar uma matriz para representar um dataset de múltiplos vetores, simplesmente considerando cada vetor como uma linha da matriz. Se você tivesse as alturas, pesos e idades de 1000 pessoas, você poderia guardar essa informação em uma matriz 1000x3

### Além disso, podemos usar matrizes n x k para representar uma função linear que mapeia vetores k-dimensionais em vetores n-dimensionais. Várias técnicas utilizam esse conceito.

### Por fim, você pode utilizar matrizes para representar relacionamentos binários. No capítulo 1, representamos as relações como uma coleção de pares (i, j). Uma representação alternativa seria criar uma matriz A tal que A[i][j] é 1 se os elementos i e j estão conectados e 0 caso contrário.

### Antes tínhamos:

In [32]:
amizades = [(0, 1), (0, 2), (1, 2), (1, 3), (2, 3), (3, 4), 
               (4, 5), (5, 6), (5, 7), (6, 8), (7, 8), (8, 9)]

### Poderíamos representar como:

In [34]:
#            user 0  1  2  3  4  5  6  7  8  9
matriz_amigos = [[0, 1, 1, 0, 0, 0, 0, 0, 0, 0],  # user 0 
                 [1, 0, 1, 1, 0, 0, 0, 0, 0, 0],  # user 1 
                 [1, 1, 0, 1, 0, 0, 0, 0, 0, 0],  # user 2 
                 [0, 1, 1, 0, 1, 0, 0, 0, 0, 0],  # user 3 
                 [0, 0, 0, 1, 0, 1, 0, 0, 0, 0],  # user 4 
                 [0, 0, 0, 0, 1, 0, 1, 1, 0, 0],  # user 5 
                 [0, 0, 0, 0, 0, 1, 0, 0, 1, 0],  # user 6 
                 [0, 0, 0, 0, 0, 1, 0, 0, 1, 0],  # user 7 
                 [0, 0, 0, 0, 0, 0, 1, 1, 0, 1],  # user 8 
                 [0, 0, 0, 0, 0, 0, 0, 0, 1, 0]]  # user 9

assert matriz_amigos[0][1] == 1

### Se existem poucas conexões, essa forma de representação é muito ineficiente, visto que você acaba guardando diversos zeros na memória. Porém, com a representação em matriz é muito mais rápido de checar se dois usuários estão conectados, você só precisa checar índices ao invés de iterar sobre as conexões.

In [36]:
assert matriz_amigos[0][2] == 1, "0 e 2 são amigos"
assert matriz_amigos[0][8] == 0, "0 e 8 não são amigos"


### De maneira similar, para achar as conexões de alguém, você só precisa inspecionar a coluna (ou a linha) correspondente à pessoa:

In [39]:
def checar_amigos(n: int) -> List[int]:
    return [i
            for i, e_amigo in enumerate(matriz_amigos[n])
            if e_amigo]

print(checar_amigos(5))
print(checar_amigos(3))
print(checar_amigos(0))

[4, 6, 7]
[1, 2, 4]
[1, 2]


### Com um gráfico pequeno você poderia adicionar uma lista de conexões para cada objeto para acelerar esse processo. Com um gráfico maior e evolutivo, esse processo seria provavelmente muito caro e difícil de manter.

### Tudo que foi construído nesse módulo (e muito mais) é acessado via a library NumPy, com uma performance muito superior.

### Nesse momento foi instalada a library numpy no env