# Recomendação de produtos O Boticario

Esse projeto é derivado de um dos desafios da **Maratona Behind the code** da **IBM**, o desafio tem como objetivo recomendar produtos com base em habitos e gostos dos clientes.

O Dataset usado é o mesmo presente no desafio da maratona. Mais detalhes sobre o desafio original podem ser acessados neste [link](https://maratona.dev/desafios/desafio-4-boticario-inteligencia-artificial-para-recomendacao-do-melhor-presente/)

In [1]:
#importando bibliotecas nescessárias
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.naive_bayes import GaussianNB
from IPython.display import display
from ipywidgets import interact
import ipywidgets as widgets

In [2]:
#Lendo o dataset
data = pd.read_csv('assets/dataset.csv')

#Breve visualização do dataset
data.head()
#as cinco primeiras amostras

Unnamed: 0,genero,hobby,viagem,bebida,produto
0,n,netflix,campo,suco_detox,boticollection_boticario
1,n,balada,praia,suco_detox,nativaspa_boticario
2,n,museu,praia,café,impression_eudora
3,f,parque,campo,suco_detox,boticollection_boticario
4,f,netflix,praia,milk_shake,batom_liquido_mate_quemdisseberenice


Separando a base de dados em dados de **Entrada (previsores)** e dados de **Saida (classes)**

In [3]:
#entrada recebe o conteudo de data(base de dados) e saída recebe a coluna 'produto' da base de dados
entrada,saida = data,data['produto']

#no momento a entrada possue os mesmos valores da base de dados, por isso é excluida a coluna 'produto'
# par que permanessa apenas os dados de entrada
entrada = entrada.drop(['produto'],axis=1)

O algoritmo escolido para a predição foi o **Naive Bayes**, uma caracteristica comum nos algoritmos de machine learning é que eles fazem a leitura da entrada com dados numéricos, dessa forma uma base de dados que possue dados categóricos deve ser convertida. A biblioteca **scikit-learn** possue o método **LabelEncoder** que desempenha essa função

In [4]:
#convertendo os dados de entrada categóricos para dados numéricos
g_encoder = LabelEncoder()
h_encoder = LabelEncoder()
v_encoder = LabelEncoder()
b_encoder = LabelEncoder()
entrada['genero'] = g_encoder.fit_transform(entrada['genero'])
entrada['hobby'] = h_encoder.fit_transform(entrada['hobby'])
entrada['viagem'] = v_encoder.fit_transform(entrada['viagem'])
entrada['bebida'] = b_encoder.fit_transform(entrada['bebida'])
entrada.head(2)

Unnamed: 0,genero,hobby,viagem,bebida
0,2,3,0,3
1,2,0,3,3


In [5]:
# treinadno modelo
classificador = GaussianNB()
classificador.fit(entrada,saida)

GaussianNB(priors=None, var_smoothing=1e-09)

In [6]:
genero = widgets.Dropdown(
        options = [('n',g_encoder.transform(['n'])[0]),
                   ('m',g_encoder.transform(['m'])[0]),
                   ('f',g_encoder.transform(['f'])[0])
                  ],
        description = 'Genero: ',
        disabled=False,
        )
hobby = widgets.Dropdown(
        options = [('balada',h_encoder.transform(['balada'])[0]), 
                   ('bar',h_encoder.transform(['bar'])[0]), 
                   ('museu',h_encoder.transform(['museu'])[0]), 
                   ('netflix',h_encoder.transform(['netflix'])[0]), 
                   ('parque',h_encoder.transform(['parque'])[0])
                  ],
        description = 'Hobby: ',
        disabled=False,
    )
viagem = widgets.Dropdown(
        options = [('campo',v_encoder.transform(['campo'])[0]), 
                   ('cidade',v_encoder.transform(['cidade'])[0]), 
                   ('floresta',v_encoder.transform(['floresta'])[0]), 
                   ('praia',v_encoder.transform(['praia'])[0])
                  ],
        description = 'Viagem: ',
        disabled=False,
    )
bebida = widgets.Dropdown(
        options = [('café',b_encoder.transform(['café'])[0]),
                   ('chope',b_encoder.transform(['chope'])[0]), 
                   ('milk_shake',b_encoder.transform(['milk_shake'])[0]), 
                   ('suco_detox',b_encoder.transform(['suco_detox'])[0]), 
                   ('vinho',b_encoder.transform(['vinho'])[0])
                  ],
        description = 'Bebida: ',
        disabled=False,
    )

#resposta = widgets.Text()
#resposta.value = 'Sua indicação aqui'

file = open("assets/o-boticario.jpg", "rb")
image = file.read()
resposta = widgets.Image(
    value=image,
    format='jpg',
    width=300,
    height=400,
)

def update(change):
    entrada = [genero.value,hobby.value,viagem.value,bebida.value]
    classe = classificador.predict([entrada])[0]
    file = open('assets/'+classe+'.jpg','rb')
    image = file.read()
    resposta.value = image

genero.observe(update,'value')
hobby.observe(update,'value')
viagem.observe(update,'value')
bebida.observe(update,'value')


display(genero,hobby,viagem,bebida)
display(resposta)

Dropdown(description='Genero: ', options=(('n', 2), ('m', 1), ('f', 0)), value=2)

Dropdown(description='Hobby: ', options=(('balada', 0), ('bar', 1), ('museu', 2), ('netflix', 3), ('parque', 4…

Dropdown(description='Viagem: ', options=(('campo', 0), ('cidade', 1), ('floresta', 2), ('praia', 3)), value=0…

Dropdown(description='Bebida: ', options=(('café', 0), ('chope', 1), ('milk_shake', 2), ('suco_detox', 3), ('v…

Image(value=b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x00\x00\x01\x00\x01\x00\x00\xff\xe1\x0b\xd7Exif\x00\x00…