# Consumindo dados do nosso BD

Importando algumas bibliotecas que serão utilizadas para demonstrar os resultados.

In [1]:
import pymongo
import numpy as np
import pandas as pd
import re
from ipywidgets import interact, widgets, Layout
import plotly.subplots
import dash_html_components as html
import dash_core_components as dcc
import dash
import dash_table
from jupyter_dash import JupyterDash
import plotly.graph_objects as go

Conexão com o banco de dados.

In [2]:
# Conectando ao cluster
STR_MONGO_CONECT = "mongodb+srv://public_user:KiwhjUOdauK06lzg@cluster-desafiobirdie.43lqn.mongodb.net/links_ofertas?retryWrites=true&w=majority"
cluster = pymongo.MongoClient(STR_MONGO_CONECT)

# Selecionando qual banco de dados deve ser utilizado
db = cluster['links_ofertas']

# Definindo o nome da colecao que vai conter os dados
collection = db['dados_links']

Definindo função de busca de produtos. Devolve um dataframe contendo os produtos encontrados. Note que as palavras separadas por espaços não precisam estar em sequência no campo.

In [3]:
def busca_nome_produto(search_string,case_sensitive=False):
    filter={
        '$text':
        {
            '$search':search_string,
            '$caseSensitive':case_sensitive,
        }
    }

    result = collection.find(filter=filter)

    return pd.DataFrame(list(result))

Utilizando a função de busca de nome de produtos  para encontrar todos os produtos que possuem a string "Redmi" e "Note" no nome do produto.

In [4]:
busca_nome_produto("Redmi Note")

Unnamed: 0,_id,url,titulo,nome_produto,preco_produto,dcr_produto,vendedor_produto,numero_vendas_vendedor,redirecionado
0,605b4d92e6abd3f893a7a91f,https://produto.mercadolivre.com.br/MLB-126190...,produto.mercadolivre,Redmi Note 7 64gb + Nota Fiscal + 1 Ano Garantia,1400.00,1 ano de garantia!! Versão global. ESPECIFICAÇ...,BITTENCOURTRODNEY,,False
1,605b4d92e6abd3f893a7a656,https://produto.mercadolivre.com.br/MLB-124223...,produto.mercadolivre,Xiaomi Redmi Note 7 64gb Versão Global Capa + ...,1019.00,PROCESSADOR QUALCOMM® SNAPDRAGON™ 660O Process...,DRUDI SHOP,5275.0,False
2,605b4d93e6abd3f893a7cd00,https://produto.mercadolivre.com.br/MLB-127674...,produto.mercadolivre,Xiaomi Note 7 128gb + 4gb Ram Global Capa E Pe...,1319.99,"O Redmi Note 7 é, sem dúvida, um dos smartphon...",REI ELETRONICS,8682.0,False
3,605b4d93e6abd3f893a7c2d7,https://produto.mercadolivre.com.br/MLB-130923...,produto.mercadolivre,Xiaomi Redmi Note 7 64gb Versão Global Capa + ...,1558.80,PROCESSADOR QUALCOMM® SNAPDRAGON™ 660O Process...,TRUST WEB,1067.0,False
4,605b4d93e6abd3f893a7b5d5,https://produto.mercadolivre.com.br/MLB-130777...,produto.mercadolivre,Xiaomi Note 7 128gb + 4gb Ram Global Capa E Pe...,1199.78,"O Redmi Note 7 é, sem dúvida, um dos smartphon...",SHOPCEL ATACADO,500.0,False
...,...,...,...,...,...,...,...,...,...
1495,605b4d92e6abd3f893a78f74,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Smartphone Xiaomi Redmi 7 32GB Tela de 6.26 Ca...,,"O Redmi 7 um smartphone Android de bom nvel, ...",,,False
1496,605b4d92e6abd3f893a78ccc,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Smartphone Xiaomi Redmi 7 64GB Tela de 6.26 Ca...,,REDMI 7O Redmi 7 é um smartphone Android de bo...,,,False
1497,605b4d92e6abd3f893a78cc8,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Smartphone Xiaomi Redmi 7 32GB Tela de 6.26 Ca...,,REDMI 7O Redmi 7 é um smartphone Android de bo...,,,False
1498,605b4d93e6abd3f893a7b09b,https://produto.mercadolivre.com.br/MLB-127657...,produto.mercadolivre,Celular Xiaomi Redmi 7a 16gb Rom | 2gb Ram | 1...,789.00,Xiaomi Redmi 7A Chipset Qualcomm Snapdragon 43...,MCCX INFO,265.0,False


Neste caso as palavras precisam estar em sequência. Esta operação utiliza regex, que é um pouco mais custosa.

In [5]:
def busca_nome_produto_exato(search_string):
    filter={
        'nome_produto':{'$regex':re.compile(r"(?i)" + search_string + r"")}
    }

    result = collection.find(filter=filter)
    return pd.DataFrame(list(result))

Exemplo do uso da função acima para buscar todos os produtos que possuem a string "Redmi Note"  no nome.  Assim, menos resultados são retornados do que no exemplo anterior, que retornou ofertas com "Redmi" e "Note" no nome, mas não necessariamente juntas. 

In [6]:
busca_nome_produto_exato("Redmi Note")

Unnamed: 0,_id,url,titulo,nome_produto,preco_produto,dcr_produto,vendedor_produto,numero_vendas_vendedor,redirecionado
0,605b4d92e6abd3f893a77ce3,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Celular Smartphone Redmi Note 8 Pro Dual 128Gb...,2399.00,"O Redmi Note 8 Pro é, sem dúvida, um dos smart...",Megatecshop,,False
1,605b4d92e6abd3f893a77cee,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Celular Xiaomi Redmi Note 5 64Gb 4Gb Ram Tela ...,,Nome da marca: xiaomi\nModelo: m1803e7sh\nTama...,,,False
2,605b4d92e6abd3f893a77cef,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Celular Xiaomi Redmi Note 6 Pro 32gb/3gb Globa...,,Celular Xiaomi Redmi Note 6 Pro 32gb/3gb Envio...,,,False
3,605b4d92e6abd3f893a77cf0,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Celular Xiaomi Redmi Note 7 64GB - 4GB Preto,,Caractersticas\nProcessador octa-core Qualcomm...,,,False
4,605b4d92e6abd3f893a77d10,https://www.casasbahia.com.br/TelefoneseCelula...,casasbahia,Redmi Note 7 6.3 4gb/64gb Dual Sim – Preto,,Smartphone Redmi Note 7 64GB (O Novo Vai lhe S...,,,False
...,...,...,...,...,...,...,...,...,...
568,605b4d93e6abd3f893a7d93d,https://produto.mercadolivre.com.br/MLB-134733...,produto.mercadolivre,Smartphone Xiaomi Redmi Note 7 32gb 3gb Ram pt...,1269.95,Smartphone Xiaomi Redmi Note 7 32GB 3GB RAM Pr...,Web Continental,9414.0,True
569,605b4d93e6abd3f893a7d9c3,https://produto.mercadolivre.com.br/MLB-134495...,produto.mercadolivre,Xiaomi Redmi Note 8 64gb Versão Global,1500.00,SistemaSistema operacional: MIUI 10 (Base no s...,ANACAROLINEGONCALVES715,,False
570,605b4d93e6abd3f893a7d9f7,https://produto.mercadolivre.com.br/MLB-130606...,produto.mercadolivre,Celular Xiaomi Redmi Note 7(branco) 64gb 4gb R...,1279.00,***NÃO FAZEMOS RETIRADA NO LOCAL*** CORREIOS O...,HOME-BIT COMERCIO,895.0,False
571,605b4d93e6abd3f893a7db72,https://produto.mercadolivre.com.br/MLB-124614...,produto.mercadolivre,Redmi Note 7 128gb 4gb Ram Global +capa+pelic...,1283.00,**** A T E N Ç Ã O: NÃO ENVIAMOS PARA OS SEGUI...,GREAT JOB,,False


Agora para fazer um query mais completa. Esta query aceita múltiplos filtros, para permitir a um usuário especificar qual tipo de produto que ele deseja buscar. Note que o usuário pode especificar até mesmo a descrição do produto. 

In [7]:
def filtrar_oferta(nome_produto='',preco_min=0,preco_max=1000000, dcr='',nome_vendedor='',nome_sites=["casasbahia","produto.mercadolivre","mercadolivre",'magazineluiza']):
   
    filter={}
    
    if(dcr!=''):
        dcr_filter={'dcr_produto':{'$regex':re.compile(r"(?i)" + dcr + r"")}}
        filter['dcr_produto'] = {'$regex':re.compile(r"(?i)" + dcr + r"")}
    if(nome_vendedor!=''):  
        vendedor_filter = {'vendedor_produto':{'$regex':re.compile(r"(?i)" + nome_vendedor + r"")}}
        filter['vendedor_produto'] = {'$regex':re.compile(r"(?i)" + nome_vendedor + r"")}
    if(nome_produto!=''):
        nome_produto_filter = {'$text': {'$search':nome_produto}}
        filter['$text'] = {'$search':nome_produto}
    
    if((preco_min!= 0) or (preco_max!=1000000)):
        #'preco_produto':{'$ne':np.nan, '$lte':preco_max, '$gte':preco_min},
        filter['preco_produto'] = {'$ne':np.nan, '$lte':preco_max, '$gte':preco_min}
    
    if((nome_sites != ["casasbahia","produto.mercadolivre","mercadolivre",'magazineluiza']) and (nome_sites!="") and (nome_sites !=[])):

        if((type(nome_sites) is list)and (len(nome_sites)>=2)):
            nome_sites = {"$in":nome_sites}
        filter['titulo'] = nome_sites
        
    result = collection.find(filter=filter)

    return pd.DataFrame(list(result))

Em seguidas, definimos um bloco para uma simples interface com Widgets. Basta executar o bloco de código abaixo que os campos de filtro aparecem logo em baixo. Uma vez digitado o conteúdo do filtro,  basta executar o segundo bloco de código que vai abrir uma aplicação com o dash, que mostra o resultado retornado da consulta. Toda vez que o usuário mudar a sua entrada, o bloco do dash deve ser reexecutado. 

In [13]:
nome_produto = widgets.Text(value='', placeholder="Nome do produto",style={'description_width': 'initial'})
nome_vendedor = widgets.Text(value='',placeholder="Nome do vendedor",style={'description_width': 'initial'})
dcr_produto = widgets.Text(value='' ,placeholder="Descricao do produto",style={'description_width': 'initial'})
preco_min = widgets.BoundedFloatText(value=0,min=0,max=1000000,description="Preco Minimo",style={'description_width': 'initial'})
preco_max = widgets.BoundedFloatText(value=1000000,min=0,max=1000000,description="Preco Maximo",style={'description_width': 'initial'})
casasbahia= widgets.Checkbox(value=False,description='Casas Bahia',disabled=False)
magazineluiza = widgets.Checkbox(value=False,description='Magazine Luiza',disabled=False)
mercadolivre = widgets.Checkbox(value=True,description='Mercado Livre',disabled=False)
lojamercadolivre = widgets.Checkbox(value=False,description='Loja Mercado Livre',disabled=False)
query= widgets.Button(description='Query', disabled=False,button_style='info',  tooltip='Query')

a = widgets.VBox([nome_produto,nome_vendedor,dcr_produto])

b = widgets.VBox([preco_min,preco_max])
c = widgets.VBox([casasbahia,magazineluiza,mercadolivre,lojamercadolivre])

ui = widgets.HBox([a,b,c])
empty_lst = []
df = []


def f(nome_produto, nome_vendedor,dcr_produto,preco_min,preco_max,casasbahia,magazineluiza,mercadolivre,lojamercadolivre):
    global empty_lst
    df = []
    
    empty_lst = []
   
    if(casasbahia):
        empty_lst.append("casasbahia")
    if(lojamercadolivre):
        empty_lst.append("produto.mercadolivre")
    if(mercadolivre):
        empty_lst.append("mercadolivre")
    if(magazineluiza):
        empty_lst.append("magazineluiza")
        
    if(len(empty_lst)==0):
        empty_lst = ""
    elif(len(empty_lst)==1):
        empty_lst = empty_lst[0]
    
out = widgets.interactive_output(f, {'nome_produto':nome_produto, 
                                     'nome_vendedor':nome_vendedor,
                                     'dcr_produto':dcr_produto,
                                     'preco_min':preco_min,
                                     'preco_max':preco_max,
                                     'casasbahia':casasbahia,
                                     'magazineluiza':magazineluiza,
                                     'mercadolivre':mercadolivre,
                                     'lojamercadolivre':lojamercadolivre,
                                      })
 
display(ui, out)

HBox(children=(VBox(children=(Text(value='', placeholder='Nome do produto', style=DescriptionStyle(description…

Output()

Para ver os resultados do filtro do usuário, basta executar o próximo bloco de código. Ressaltamos que toda vez que o filtro for alterado, é necessário reexecutar o bloco.

In [14]:
df = filtrar_oferta(nome_produto=nome_produto.value,preco_min=preco_min.value,preco_max=preco_max.value, dcr=dcr_produto.value,nome_vendedor=nome_vendedor.value, nome_sites=empty_lst)
df.url = df.url.apply(lambda x:"[" + x + "](" + x + ")")
df = df.drop(['_id'],axis=1)

app = JupyterDash(__name__,external_stylesheets=['https://codepen.io/chriddyp/pen/bWLwgP.css'])

server = app.server

app.layout = dash_table.DataTable(
    id='table',
    columns=[{"name": i, "id": i,'presentation':'markdown'} for i in df.columns],
    data=df.to_dict('records'),
    export_format='csv',
    export_headers='display',
    merge_duplicate_headers=True,
    filter_action='native',
    sort_action='native',
    style_cell={'textAlign': 'left', 'padding':'5px', 'overflow': 'hidden',
        'textOverflow': 'ellipsis',
        'maxWidth': 10},
    tooltip_data=[
        {
            column: {'value': str(value), 'type': 'markdown'}
            for column, value in row.items()
        } for row in df.to_dict('records')
    ],
    tooltip_duration=3000
)

app.run_server(mode="jupyterlab",port=8056)

Função para busca de preços de produtos. Dado o nome do produto, retorna o número de ofertas nos diferentes sites, o valor médio por produto, valor total das ofertas, mínimo e máximo.

In [15]:
def preco_nome_produto(search_string,case_sensitive=False,preco_min=0,preco_max=1000000):
    pipeline=[
        {'$match':{
                  '$text':{'$search':search_string,'$caseSensitive':case_sensitive},'preco_produto':{'$ne':np.nan, '$lte':preco_max, '$gte':preco_min},
                 }},
        {'$group':{
                  '_id': '$titulo',
                  'preco_medio':{'$avg':'$preco_produto'},
                  'preco_min':{'$min':'$preco_produto'},
                  'preco_max':{'$max':'$preco_produto'},
                  'preco_total':{'$sum':'$preco_produto'}, 
                  'ofertas':{'$sum':1},
                }},
        {'$sort':{'_id':1}}
    ]

    result = collection.aggregate(pipeline)
    return pd.DataFrame(list(result))

Em seguida, vamos buscar algumas informações básicas sobre os produtos que possuem "Redmi" e "Note" no nome. Estas informações seriam úteis para compreender quantos registros temos para um determinado produto, e como os dados são distribuídos. Note que utilizamos apenas produtos que possuem preços numéricos. 

In [16]:
preco_nome_produto("redmi note")

Unnamed: 0,_id,preco_medio,preco_min,preco_max,preco_total,ofertas
0,casasbahia,2008.922,260.0,5726.9,100446.1,50
1,mercadolivre,1170.354839,780.0,1750.0,36281.0,31
2,produto.mercadolivre,1466.894372,119.9,5799.88,1670792.69,1139


Produzimos uma aplicação dash que permite visualizar gráficos com informações sobre os preços de produtos que contém certas strings no nome. Note no topo da página que é possível trocar entre os nomes dos produtos. 

In [17]:
samsung = preco_nome_produto("samsung")
xiaomi = preco_nome_produto("xiaomi")
apple = preco_nome_produto("apple")
df = samsung
app = JupyterDash(__name__,external_stylesheets=['https://codepen.io/chriddyp/pen/bWLwgP.css'])
figure1 = {'data': [ go.Bar(x=df._id, y=df.preco_min, name='Mínimo'),go.Bar(x=df._id, y=df.preco_medio, name='Médio'), go.Bar(x=df._id, y=df.preco_max, name='Máximo')],
              'layout': {'title': 'Dash Data Visualization'}}
server = app.server

app.layout = html.Div(children=[ 
        dcc.Dropdown(
            id='demo-dropdown',
            options=[
                {'label': 'Samsung', 'value': 'Samsung'},
                {'label': 'Xioami', 'value': 'Xiaomi'},
                {'label': 'Apple', 'value': 'Apple'}
            ],
            searchable=False
        ),
        html.Div(id='dd-output-container') ]
)

@app.callback(
    dash.dependencies.Output('dd-output-container', 'children'),
    [dash.dependencies.Input('demo-dropdown', 'value')])
def update_output(value):
    global df
    global figure1
    
    if(value == "Samsung"):
        df = samsung
    elif(value == "Xiaomi"):
        df = xiaomi
    elif(value == "Apple"):
        df = apple
    if(not(value)):
        value = "Samsumg"
    figure1 = {'data': [ go.Bar(x=df._id, y=df.preco_min, name='Mínimo'),go.Bar(x=df._id, y=df.preco_medio, name='Médio'), go.Bar(x=df._id, y=df.preco_max, name='Máximo')],
              'layout': {'title': "Consulta de preços para produtos com "+ str(value) + " no nome"}}

    figure1 = dcc.Graph(
                id='example-graph',
                figure=figure1
              )

    return figure1

app.run_server(mode="jupyterlab",port=8057)