Sistemas de Recomendação: Filtragem Baseada em Conteúdo
o	Implemente um sistema de recomendação baseado em conteúdo usando um conjunto de dados de produtos (como artigos de e-commerce). 

In [2]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

In [5]:
# 1. Carregar o conjunto de dados (exemplo fictício)
data = {
    'product_id': [1, 2, 3, 4, 5],
    'product_name': [
        'Camiseta Azul',
        'Camiseta Verde',
        'Calça Jeans',
        'Jaqueta de Couro',
        'Camiseta Branca'
    ],
    'description': [
        'Camiseta 100% algodão azul, ideal para o verão.',
        'Camiseta leve verde, perfeita para atividades ao ar livre.',
        'Calça jeans com corte reto e confortável.',
        'Jaqueta de couro sintético, estilosa e resistente.',
        'Camiseta branca básica, fácil de combinar.'
    ]
}

products = pd.DataFrame(data)
display(products)

Unnamed: 0,product_id,product_name,description
0,1,Camiseta Azul,"Camiseta 100% algodão azul, ideal para o verão."
1,2,Camiseta Verde,"Camiseta leve verde, perfeita para atividades ..."
2,3,Calça Jeans,Calça jeans com corte reto e confortável.
3,4,Jaqueta de Couro,"Jaqueta de couro sintético, estilosa e resiste..."
4,5,Camiseta Branca,"Camiseta branca básica, fácil de combinar."


In [6]:
# 2. Pré-processamento
# Usar TF-IDF para transformar as descrições em um formato que o modelo pode usar
tfidf = TfidfVectorizer(stop_words='english')
tfidf_matrix = tfidf.fit_transform(products['description'])

In [7]:
# 3. Calcular a Similaridade
cosine_sim = cosine_similarity(tfidf_matrix, tfidf_matrix)

In [8]:
# Função para recomendar produtos semelhantes
def get_recommendations(product_name, num_recommendations=3):
    # Obter o índice do produto
    idx = products[products['product_name'] == product_name].index[0]
    
    # Obter as similaridades
    sim_scores = list(enumerate(cosine_sim[idx]))
    
    # Ordenar os produtos com base na similaridade
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)
    
    # Obter os índices dos produtos mais semelhantes
    sim_scores = sim_scores[1:num_recommendations + 1]  # Exclui o próprio produto
    product_indices = [i[0] for i in sim_scores]
    
    # Retornar os produtos recomendados
    return products.iloc[product_indices]

In [9]:
# Testar as recomendações
recommended_products = get_recommendations('Camiseta Azul')
print("Produtos recomendados para 'Camiseta Azul':")
print(recommended_products[['product_name', 'description']])

Produtos recomendados para 'Camiseta Azul':
      product_name                                        description
1   Camiseta Verde  Camiseta leve verde, perfeita para atividades ...
4  Camiseta Branca         Camiseta branca básica, fácil de combinar.
2      Calça Jeans          Calça jeans com corte reto e confortável.
