### Fatora√ß√£o de matrizes

Objetivo: explorar  como  as ferramentas de √Ålgebra Linear podem desvendar as informa√ß√µes ocultas nas intera√ß√µes dos   usu√°rios   com   sistemas   de   recomenda√ß√£o.

Nos sistemas de recomenda√ß√£o, frequentemente utilizamos a **matriz de avalia√ß√µes** ou **matrizes de intera√ß√µes** para representar as intera√ß√µes dos usu√°rios com os itens. A matriz √© composta por linhas (usu√°rios) e colunas (itens), e suas c√©lulas cont√™m as avalia√ß√µes dos usu√°rios para os itens. 

No entanto, essas matrizes costumam ser esparsas, ou seja, **muitos valores est√£o vazios porque nem todos os usu√°rios avaliam todos os itens**. A partir dessa matriz, as t√©cnicas matem√°ticas s√£o aplicadas para encontrar padr√µes e realizar as recomenda√ß√µes.


**Recomenda√ß√£o por similaridade (seja por perfis de pessoas ou por vizinhan√ßa)**

Os vetores de correla√ß√£o e similaridade s√£o estruturas fundamentais para capturar as prefer√™ncias em matrizes de recomenda√ß√£o. Calcular essas m√©tricas entre os vetores de intera√ß√£o de diferentes usu√°rios possibilitam a identifica√ß√£o de comportamento similares.

Ao aplicar essas m√©tricas, sistemas de recomenda√ß√£o podem agrupar usu√°rios com gostos semelhantes e sugerir itens que foram bem avaliados por um usu√°rio a outro com perfil similar.

## Introdu√ß√£o

In [1]:
#Observe o c√≥digo-fonte a seguir, que traz um exemplo de opera√ß√µes matriciais com Python e Numpy:

import numpy as np

# Definindo duas matrizes
A = np.array([[1, 2], [3, 4]])
B = np.array([[2, 0], [1, 2]])

# Multiplicando as matrizes
C = np.dot(A, B)
print("Resultado da Multiplica√ß√£o de Matrizes:\n", C)

Resultado da Multiplica√ß√£o de Matrizes:
 [[ 4  4]
 [10  8]]


In [4]:
#Prosseguiremos  com  a  Fatora√ß√£o  de  Matrizes  N√£o-Negativas,  
# um  m√©todo poderoso para decompor uma matriz em componentes que capturam 
# a estrutura dos dados de maneira eficiente e intuitiva:

from sklearn.decomposition import NMF

# Dados exemplo
V = np.array([[1, 2], [3, 4], [5, 6]])
model = NMF(n_components=1, init='random', random_state=0)
W = model.fit_transform(V)
H = model.components_
print("Matriz W (Base):\n", W)
print("Matriz H (Coeficientes):\n", H)

Matriz W (Base):
 [[0.50424333]
 [1.15119452]
 [1.79814571]]
Matriz H (Coeficientes):
 [[2.69041988 3.40799721]]


In [20]:
#Vamos explorar os mecanismos de explora√ß√£o e explota√ß√£o atrav√©s de  exemplos  de  c√≥digo  em  Python
import numpy as np
import random

# Definindo um simples conjunto de recomenda√ß√µes
recomendacoes  =  [1,  2,  3,  4,  5]    #  Representa  ids  de  itens recomend√°veis
epsilon = 0.1  # 10% de chance de explorar

# Escolha entre explorar ou explotar
if random.random() < epsilon:
    # Explorar: escolher um item aleat√≥rio
    item_recomendado = random.choice(recomendacoes)
else:
    # Explotar: escolher o melhor item, assumindo que o item 5 √© o melhor
    item_recomendado = 5
print("Item Recomendado:", item_recomendado)

Item Recomendado: 5


## Fundamentos

Exploraremos os fundamentos matem√°ticos e estat√≠sticos que sustentam os algoritmos de recomenda√ß√£o. Iremos discutir como diferentes m√©todos de fatora√ß√£o, como SVD (Decomposi√ß√£o em Valores Singulares) e NMF (Fatora√ß√£o de Matrizes N√£o-Negativas), s√£o aplicados para descobrir padr√µes latentes  em  grandes  conjuntos  de  dados,  facilitando  assim  recomenda√ß√µes  mais precisas e personalizadas.

**√Ålgebra  linear**  √©  um  ramo  fundamental  da  matem√°tica  que  trata  de  vetores, espa√ßos  vetoriais  (tamb√©m  conhecidos  como  espa√ßos  lineares),  transforma√ß√µes lineares e sistemas de equa√ß√µes lineares. Em particular, as matrizes, que s√£o arranjos retangulares  de  n√∫meros,  desempenham  um  papel  central  na  √°lgebra  linear,  pois facilitam a manipula√ß√£o de grandes conjuntos de equa√ß√µes lineares. 

Uma matriz √© definida por suas linhas (horizontais) e colunas (verticais), cada entrada  na  matriz  sendo  um  elemento que pode  ser  um  n√∫mero  real  ou  complexo. Formalmente, Uma matriz √© uma representa√ß√£o retangular de elementos arranjados em linhas e colunas.Assim, uma matriz A de dimens√£o mxn sobre o conjunto dos n√∫meros reais ‚Ñù√© uma cole√ß√£o ordenada de n√∫meros reais dispostos em m linhas e n colunas. 

### Autovalores e Autovetores

Autovalores e autovetores s√£o conceitos fundamentais em √°lgebra linear e desempenham um papel importante em v√°rias √°reas da matem√°tica e da computa√ß√£o, incluindo sistemas de recomenda√ß√£o e an√°lise de dados.

De forma simplificada, autovalores e autovetores surgem quando queremos entender as propriedades de uma matriz. Quando aplicamos uma transforma√ß√£o (como uma multiplica√ß√£o) a um vetor (um conjunto de n√∫meros), o vetor geralmente muda ‚Äî ele pode ser esticado, encolhido, ou at√© rotacionado. Por√©m, h√° casos em que a transforma√ß√£o n√£o muda a dire√ß√£o do vetor, apenas seu comprimento. Esses vetores, que n√£o mudam de dire√ß√£o ap√≥s a transforma√ß√£o, s√£o chamados de autovetores. E o fator pelo qual o vetor √© esticado ou encolhido √© chamado de autovalor.

Seja uma matriz ùê¥ e um vetor ùë£, a multiplica√ß√£o da matriz pelo vetor pode ser representada como:
ùê¥‚ãÖùë£=ùúÜ‚ãÖùë£

Onde:

* ùê¥ √© a matriz de transforma√ß√£o.
* ùë£ √© o autovetor.
* ùúÜ √© o autovalor.

A ideia √© que, quando multiplicamos a matriz ùê¥ pelo vetor ùë£, o vetor ùë£ n√£o muda de dire√ß√£o ‚Äî ele apenas √© esticado ou encolhido pela constante ùúÜ (o autovalor).

Um exemplo pr√°tico de onde autovalores e autovetores s√£o usados √© na redu√ß√£o de dimensionalidade em sistemas de recomenda√ß√£o, como no SVD (Decomposi√ß√£o em Valores Singulares). Quando se tem uma grande matriz de intera√ß√µes de usu√°rios com itens, pode ser dif√≠cil encontrar padr√µes diretamente devido √† grande quantidade de dados. Uma maneira de resolver isso √© decompor a matriz em componentes menores, representados por autovetores e autovalores. Esses componentes podem revelar as dimens√µes latentes dos dados, ou seja, as caracter√≠sticas subjacentes que n√£o s√£o diretamente vis√≠veis, mas que s√£o importantes para entender as prefer√™ncias dos usu√°rios ou as caracter√≠sticas dos itens.

Por exemplo, no caso de filmes, um autovetor pode representar uma caracter√≠stica latente, como o "g√™nero do filme", e o autovalor correspondente pode indicar a for√ßa dessa caracter√≠stica (quanto ela influencia na prefer√™ncia do usu√°rio). A decomposi√ß√£o em autovalores e autovetores ajuda a reduzir a dimensionalidade dos dados, tornando os c√°lculos mais eficientes e revelando padr√µes que poderiam ser dif√≠ceis de identificar em uma grande matriz cheia de dados.

### Diagonaliza√ß√£o da matriz

Diagonaliza√ß√£o de matriz √© um processo que envolve transformar uma matriz quadrada ùê¥ em uma matriz diagonal ùê∑ que √© similar √† matriz original. Esse processo √© √∫til porque as matrizes diagonais s√£o muito mais f√°ceis de lidar, especialmente quando se trata de calcular pot√™ncias de matrizes ou de realizar decomposi√ß√µes, o que pode ser essencial em v√°rias aplica√ß√µes, como na resolu√ß√£o de sistemas diferenciais, na an√°lise de sistemas din√¢micos e em algoritmos de aprendizado de m√°quina.

O que √© a diagonaliza√ß√£o?

Para entender a diagonaliza√ß√£o, primeiro √© importante saber que uma matriz diagonal √© uma matriz em que todos os elementos fora da diagonal principal (a linha que vai do canto superior esquerdo ao canto inferior direito) s√£o zero.

A diagonaliza√ß√£o de uma matriz ùê¥ consiste em encontrar uma matriz invert√≠vel ùëÉ e uma matriz diagonal ùê∑ tal que:
ùê¥=ùëÉ‚ãÖùê∑‚ãÖùëÉ^(‚àí1)

Aqui, ùëÉ √© uma matriz cujas colunas s√£o os autovetores de A, e ùê∑ √© a matriz diagonal cujos elementos s√£o os autovalores de ùê¥.

Como funciona?

A ideia principal da diagonaliza√ß√£o √© que uma matriz ùê¥ pode ser "quase transformada" em uma matriz diagonal ùê∑ se houver um conjunto suficiente de autovetores e autovalores associados a ela.

Quando uma matriz √© diagonaliz√°vel?

Nem todas as matrizes podem ser diagonalizadas. Para uma matriz ùê¥ ser diagonaliz√°vel, ela precisa satisfazer as seguintes condi√ß√µes:

* N√∫mero suficiente de autovetores linearmente independentes: A matriz precisa ter ùëõ autovetores linearmente independentes, onde ùëõ √© o n√∫mero de linhas (ou colunas) da matriz. Isso garante que a matriz ùëÉ, formada pelos autovetores, seja invert√≠vel.
* Autovalores distintos (em muitos casos): Se a matriz tem autovalores distintos, ela pode ser diagonalizada facilmente. No entanto, at√© mesmo matrizes com autovalores repetidos podem ser diagonalizadas, desde que ainda possuam o n√∫mero adequado de autovetores linearmente independentes.

## Aprofundamento

* "Breve  introdu√ß√£o  √† √Ålgebra Linear" e "Espa√ßos latentes" podem ser explorados detalhadamente no livro de   John   A.   Lee   e   Michel   Verleysen.
* "Nonlinear   Dimensionality   Reduction", particularmente √∫til para entender as bases matem√°ticas necess√°rias.
* Para  "Fatora√ß√£o  de  Matrizes  N√£o-Negativas",  o  texto  de Kim  Falk,  "Practical Recommender Systems", oferece uma explana√ß√£o pr√°tica da implementa√ß√£o dessa t√©cnica  em  sistemas  de  recomenda√ß√£o. 
*  "Recommender  Systems:  The  Textbook", Charu  C.  Aggarwal.
* "Practical  Recommender  Systems"  de  Kim  Falk  
