In [1]:
import pandas as pd
from unidecode import unidecode
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import sigmoid_kernel
import spacy
import warnings

warnings.filterwarnings("ignore")


data = {
    'DescricaoProduto': ['Geladeira da marca Electrolux, Inox, gela bem, leitor digital de temperatura',
                         'celular Iphone aple em ótimo estado, semi-novo, vermelho com tela em perfeito estado', 
                         'Celular samsung cinza nunca levou uma queda, em ótimo estado', 
                         'Frigobar que gela bem e nunca teve problema', 
                         'Sofá confortável em estofado sem furos mas desbotado', 
                         'Poltrona de couro', 
                         'celular Iphone de última geração branco quase não foi usado', 
                         'video game PS4 sony pouco utilizado preto versão slim', 
                         'video game Xbox one primeira versão, antigo mas funciona bem',
                        'Geladeira Electrolux Frost Free Prata Geladeira moderna da marca Electrolux, modelo Frost Free, na cor prata, com amplo espaço de armazenamento e congelador de fácil acesso',
                        'PlayStation 5 Pro O mais recente console de videogame da Sony, o PlayStation 5 Pro, oferece gráficos avançados e desempenho aprimorado para jogos de última geração',
                        'Sofá Reclinável em Couro Preto: Sofá espaçoso e elegante com estofamento de couro genuíno na cor preta. Possui assentos reclináveis para máximo conforto',
                        'Samsung Galaxy S21 Ultra O celular Samsung Galaxy S21 Ultra é um dispositivo premium com uma tela grande e vívida, múltiplas câmeras de alta resolução e excelente desempenho',
                        'Geladeira LG French Door Inox A geladeira LG French Door apresenta design sofisticado em aço inoxidável, sistema de resfriamento avançado e prateleiras ajustáveis',
                        'Xbox Series X Halo Edition  A edição especial do Xbox Series X, inspirada no jogo Halo, oferece gráficos impressionantes e uma experiência de jogo única',
                        'Sofá-cama Confortável em Tecido Cinza Este sofá-cama versátil em tecido cinza é perfeito para ambientes pequenos. Ele se converte facilmente em uma cama para hóspedes',
                        'iPhone 13 Pro Max O iPhone 13 Pro Max é um celular da apple, com uma poderosa câmera, desempenho rápido e tela de alta resolução',
                        'Xbox Series S All-Digital Edition O Xbox Series S é uma versão compacta e sem disco do console Xbox Series, perfeito para jogadores que preferem downloads digitais',
                        'Sofá de Canto de Couro Branco Um sofá de canto elegante em couro branco, perfeito para criar um ambiente sofisticado na sala de estar',
                        'PlayStation 4 Pro Limited Edition A edição limitada do PlayStation 4 Pro oferece desempenho aprimorado e um design personalizado inspirado em jogos populares',
                        'Sofá de Veludo Azul-petróleo com Pés de Madeira Este sofá de veludo luxuoso na cor azul-petróleo possui pés de madeira elegantes e é uma adição elegante para qualquer sala de estar',
                        'Google Pixel 6 XL O Google Pixel 6 XL é um celular Android com uma excelente câmera, atualizações rápidas e uma tela impressionante para visualização de mídia']
}

df = pd.DataFrame(data)

In [2]:
prods = {
    'DescricaoProduto': ['Geladeira Electrolux',
                         'celular Iphone 15 apple', 
                         'Celular samsung s20', 
                         'Frigobar Midea', 
                         'Sofá confortável', 
                         'Poltrona de couro', 
                         'celular Iphone 14', 
                         'video game PS4 sony', 
                         'video game Xbox one',
                        'Geladeira Electrolux Frost Free',
                        'PlayStation 5 Pro',
                        'Sofá Reclinável em Couro Preto',
                        'Samsung Galaxy S21 Ultra',
                        'Geladeira LG French Door',
                        'Xbox Series X Halo Edition',
                        'Sofá-cama Confortável',
                        'iPhone 13 Pro Max',
                        'Xbox Series S',
                        'Sofá de Canto de Couro',
                        'PlayStation 4 Pro',
                        'Sofá de Veludo Azul-petróleo',
                        'Google Pixel 6 XL']
}

df_desc = pd.DataFrame(prods)

In [3]:
def remover_acentos_e_minuscular(texto):
    texto_sem_acentos = unidecode(texto)
    texto_minusculo = texto_sem_acentos.lower()
    return texto_minusculo

In [4]:
df['DescricaoProduto'] = df['DescricaoProduto'].apply(remover_acentos_e_minuscular)

In [5]:
df_desc['DescricaoProduto'] = df_desc['DescricaoProduto'].apply(remover_acentos_e_minuscular)

In [6]:
tfv = TfidfVectorizer(min_df = 3, max_features=None, strip_accents='unicode',
           analyzer='word',  token_pattern=r'\w{1,}', ngram_range=(1,3), stop_words=None)

tfv_matrix = tfv.fit_transform(df['DescricaoProduto'])

In [7]:
tfv_matrix.shape

(22, 34)

In [8]:
sig = sigmoid_kernel(tfv_matrix, tfv_matrix)

sig[0]

array([0.77367231, 0.76159416, 0.76159416, 0.7676485 , 0.76159416,
       0.7629536 , 0.76307643, 0.76159416, 0.7655891 , 0.7691678 ,
       0.76451442, 0.76214633, 0.76225849, 0.76800417, 0.7622486 ,
       0.76159416, 0.76351536, 0.76159416, 0.76342149, 0.76159416,
       0.76403048, 0.76223973])

In [9]:
produtos = pd.Series(df_desc.index, index=df_desc['DescricaoProduto'])

In [10]:
list(enumerate(sig[produtos['geladeira electrolux']]))

[(0, 0.7736723113266252),
 (1, 0.7615941559557649),
 (2, 0.7615941559557649),
 (3, 0.7676484991953881),
 (4, 0.7615941559557649),
 (5, 0.7629535961823549),
 (6, 0.7630764307439657),
 (7, 0.7615941559557649),
 (8, 0.7655890965567376),
 (9, 0.7691677965881055),
 (10, 0.7645144180508388),
 (11, 0.7621463270460132),
 (12, 0.7622584910754807),
 (13, 0.7680041730718746),
 (14, 0.7622485969733842),
 (15, 0.7615941559557649),
 (16, 0.7635153590039832),
 (17, 0.7615941559557649),
 (18, 0.7634214884837746),
 (19, 0.7615941559557649),
 (20, 0.7640304833096829),
 (21, 0.7622397304591423)]

In [11]:
filtered_products = df[df['DescricaoProduto'].str.contains('video game', case=False, regex=False, na=False)]

In [24]:
max_similarity = -1
top_match = None
lista_v = []
input_user = str(input("O que você deseja? "))
for produto_descricao in df['DescricaoProduto']:
    query_doc = nlp(input_user)
    product_doc = nlp(produto_descricao)
    similarity = query_doc.similarity(product_doc) # calcula a similaridade entre a entrada e os dados existentes

    if similarity > 0.51:
        max_similarity = similarity
        top_match = produto_descricao
        lista_v.append(top_match)

print("Este produto tem a sua cara!")
for item in lista_v:
    print(f"{item} CONFIRA AGORA")

O que você deseja? quero um playstation 4 slim
Este produto tem a sua cara!
playstation 5 pro o mais recente console de videogame da sony, o playstation 5 pro, oferece graficos avancados e desempenho aprimorado para jogos de ultima geracao CONFIRA AGORA
playstation 4 pro limited edition a edicao limitada do playstation 4 pro oferece desempenho aprimorado e um design personalizado inspirado em jogos populares CONFIRA AGORA


In [None]:
def give_rec0(desc, sig=sig):
    prd = produtos[desc]
    sig_scores = list(enumerate(sig[prd]))
    sig_scores = sorted(sig_scores, key=lambda x: x[1], reverse=True)
    sig_scores = sig_scores[1:3]
    prods_index = [i[0] for i in sig_scores]
    recommended_products = df['DescricaoProduto'].iloc[prods_index]
    message = "Essas são as melhores recomendações para você:"
    return print(f"{message} \n{recommended_products.to_string(index=False)}")

entrada = str(input("Olá! Qual produto você deseja comprar? "))
give_rec0(entrada)

In [None]:
from fuzzywuzzy import fuzz

def give_rec2(desc, sig=sig):
    max_score = -1
    top_match = None
    
    try:
        for produto_descricao in df['DescricaoProduto']:
            score = fuzz.ratio(desc, produto_descricao)
            if score > max_score:
                max_score = score
                top_match = produto_descricao
                return max_score, top_match
        if max_score >= 45:
            prd = produtos[top_match]
            print(prd)
            sig_scores = list(enumerate(sig[prd]))
            sig_scores = sorted(sig_scores, key=lambda x: x[1], reverse=True)
            sig_scores = sig_scores[1:4]
            print(sig_scores)
            prods_index = [i[0] for i in sig_scores]
            return df['DescricaoProduto'].iloc[prods_index]
        else:
            return "Nenhum produto correspondente encontrado."
        
    except KeyError:
        return "Nenhum produto correspondente encontrado."

# Exemplo de uso
user_query = "sofa"
recomendacoes = give_rec2(user_query)
print(recomendacoes)

In [None]:
score = fuzz.ratio('samsung em otimo estado', df['DescricaoProduto'][2])