# <center>__MÉTODOS NUMÉRICOS__</center>
## <center>__SISTEMAS DE RECOMENDAÇÃO COM SVD__</center>
#### <center>__Aluno:__ Cefras Mandú</center>

In [1]:
import numpy as np
import pandas as pd
from scipy.sparse.linalg import svds

<div class="alert alert-block alert-info">
1. INTRODUÇÃO
</div>

Neste relatório, exploramos a aplicação de Álgebra Linear Computacional na construção de motores de recomendação. Focamos na técnica de filtragem colaborativa baseada em modelos, utilizando decomposição matricial para identificar padrões latentes em dados de avaliações de usuários.

<div class="alert alert-block alert-info">
2. DESCRIÇÃO DO PROBLEMA
</div>

O problema central de um sistema de recomendação é a **predição de avaliações**. Temos uma matriz de dados esparsa onde as linhas representam usuários e as colunas representam itens (filmes, produtos, etc.). A maioria das entradas é desconhecida (vazia).

O objetivo é preencher essas lacunas prevendo a nota que um usuário daria a um item que ele ainda não consumiu, baseando-se no histórico de avaliações dele e de usuários similares. Aplicações incluem sugestões da Netflix, Amazon e Spotify.

<div class="alert alert-block alert-info">
3. MÉTODOS APLICADOS À SOLUÇÃO
</div>

Utilizamos a **Decomposição de Valor Singular (SVD)**. O SVD fatora a matriz de avaliações $R$ em três componentes: $U$, $\Sigma$ e $V^T$.
$$R \approx U \Sigma V^T$$

Ao selecionar apenas os $k$ maiores valores singulares (SVD Truncado), reduzimos a dimensionalidade dos dados.
* **Por que é útil?** A redução de dimensionalidade remove o "ruído" e força a matriz a capturar apenas as principais tendências (gêneros de filmes preferidos, características fortes dos itens). A reconstrução da matriz preenche os valores vazios com as melhores estimativas baseadas nessas tendências latentes.

Explicação do código:


1. Dados de Entrada (Matriz Usuários x Filmes)

0 representa "não assistido"

        R = np.array([
            [5, 3, 0, 1],
            [4, 0, 0, 1],
            [1, 1, 0, 5],
            [1, 0, 0, 4],
            [0, 1, 5, 4],
        ])
        users = ["User A", "User B", "User C", "User D", "User E"]
        movies = ["Matrix", "Star Wars", "Amelie", "Titanic"]

2. Normalização

Subtrair a média de cada usuário (centralizar dados)

    R_mean = np.mean(R, axis=1)
    R_demeaned = R - R_mean.reshape(-1, 1)

3. Decomposição SVD

k=2 fatores latentes

    U, sigma, Vt = svds(R_demeaned, k=2)
    sigma = np.diag(sigma)

4. Predição

Reconstrução: (U * Sigma * Vt) + Média Original

    all_user_predicted_ratings = np.dot(np.dot(U, sigma), Vt) + R_mean.reshape(-1, 1)
    preds_df = pd.DataFrame(all_user_predicted_ratings, columns=movies, index=users)

    print("Matriz de Predições (Notas estimadas):")
    print(preds_df.round(2))

In [None]:
R = np.array([
    [5, 3, 0, 1],
    [4, 0, 0, 1],
    [1, 1, 0, 5],
    [1, 0, 0, 4],
    [0, 1, 5, 4],
])
users = ["User A", "User B", "User C", "User D", "User E"]
movies = ["Matrix", "Star Wars", "Amelie", "Titanic"]

R_mean = np.mean(R, axis=1)
R_demeaned = R - R_mean.reshape(-1, 1)

U, sigma, Vt = svds(R_demeaned, k=2)
sigma = np.diag(sigma)

all_user_predicted_ratings = np.dot(np.dot(U, sigma), Vt) + R_mean.reshape(-1, 1)
preds_df = pd.DataFrame(all_user_predicted_ratings, columns=movies, index=users)

print("Matriz de Predições (Notas estimadas):")
print(preds_df.round(2))

Matriz de Predições (Notas estimadas):
        Matrix  Star Wars  Amelie  Titanic
User A    5.10       2.82    0.09     0.99
User B    3.24       1.35   -0.71     1.11
User C    1.30       0.47    0.28     4.96
User D    0.92       0.15   -0.08     4.01
User E   -0.45       1.81    4.58     4.07
