# Importando Bibliotecas

In [6]:
import requests
import pandas as pd
from bs4 import BeautifulSoup
import re
import datetime

# Mostrando todas as linhas

In [15]:
pd.set_option('display.max_rows', None)

# Lista de Remédios Populares para Gripe

Com uma rápida pesquisa no Google, peguei o nome de 5 remédios muito usados por pessoas que estão gripadas

In [16]:
lst_med = ['ibuprofeno', 'dipirona', 'paracetamol', 'diclofenaco', 'nimesulida']

# Extraindo informações da Drogasil

In [17]:
def create_df(med: str):
    
    '''
    A função recebe o nome de um remédio (med) e retorna um pandas dataframe com o nome do
    produto, EAN, quantidade, marca e princípio ativo.
    
    med : string
    '''
    
    url = f'https://busca.drogasil.com.br/search?w={med}&cnt=100'
    response = requests.get(url)
    html = response.content
    soup = BeautifulSoup(html)
    df = pd.DataFrame()

    produtos = soup.find_all('li', {'class': 'products-card-v2__item-card'})
    produtos = [produto for produto in produtos]
    
    lst_url_produto = [item.find_all('a')[1]['title'] for item in produtos]
    
    lst_nome = [produto.find_all('a', {'data-tb-sid':'st_title-link'})[0].text.strip() for produto in produtos]
        
    lst_ean = []
    lst_qtde = []
    lst_marca = []
    lst_p_ativo = []
    
    for i in range(len(lst_url_produto)):
        
        url = lst_url_produto[i]
        mini_df_drogasil = pd.read_html(url, index_col=0)[-2]
        
        try:
            ean = mini_df_drogasil.loc['EAN',1]
            lst_ean.append(int(ean))

        except:
            pass
        try:
            qtde = mini_df_drogasil.loc['Quantidade',1]
            lst_qtde.append(qtde)
        except:
            pass
        try:
            marca = mini_df_drogasil.loc['Marca',1]
            lst_marca.append(marca)
        except:
            pass
        try:
            p_ativo = mini_df_drogasil.loc['Princípio Ativo',1]
            lst_p_ativo.append(p_ativo)

        except:
            pass
        
    df['Produto'] = lst_nome
    df['EAN'] = lst_ean
    df['Quantidade'] = lst_qtde
    df['Marca'] = lst_marca 
    df['Princípio Ativo'] = lst_p_ativo

    return df

In [18]:
def create_df_preco(med):
    
    '''
    A função recebe o nome de um remédio (med) e retorna um pandas dataframe com o
    EAN do produto, preço e data do dia em que a informação foi coletada.
    
    med : string
    '''
    
    url = f'https://busca.drogasil.com.br/search?w={med}&cnt=100'
    response = requests.get(url)
    html = response.content
    soup = BeautifulSoup(html)
    df_remedio_preco = pd.DataFrame()
    
        
    lst_price = []
    lst_ean = []
    
    produtos = soup.find_all('li', {'class': 'products-card-v2__item-card'})
    produtos = [produto for produto in produtos]
        
    lst_url_produto = [item.find_all('a')[1]['title'] for item in produtos]

    for url_produto in lst_url_produto:
        response = requests.get(url_produto)
        html = response.content
        soup = BeautifulSoup(html)
        price = soup.find_all('span', {'class':'price'})[-1].text.strip().replace('R$\n', '').replace('R$','').replace(',','.')
        lst_price.append(float(price))
        
    for i in range(len(lst_url_produto)):
        url = lst_url_produto[i]
        mini_df_drogasil = pd.read_html(url, index_col=0)[-2]
        try:
            ean = mini_df_drogasil.loc['EAN',1]
            lst_ean.append(int(ean))
        except:
            pass

    df_remedio_preco['EAN'] = lst_ean
    df_remedio_preco['Preço'] = lst_price
    df_remedio_preco['Data'] = datetime.date.today()

    return df_remedio_preco

# Criando DataFrames

Para criar cada DataFrame é preciso percorrer a lista de remédios, aplicando as funções criadas para cada um.

In [19]:
dfs = []

for med in lst_med:
    df = create_df(med)
    dfs.append(df)

In [20]:
dfs_preco = []

for med in lst_med:
    df_remedio_preco = create_df_preco(med)
    dfs_preco.append(df_remedio_preco)

# Concatenando os Dataframes criados para cada remédio

In [21]:
df_remedio = pd.concat(dfs)

In [22]:
df_remedio_preco = pd.concat(dfs_preco)

In [23]:
df_remedio_preco

Unnamed: 0,EAN,Preço,Data
0,7898148295159,12.29,2020-03-31
1,7896181919698,9.4,2020-03-31
2,7896112160298,10.42,2020-03-31
3,7896714211275,13.29,2020-03-31
4,7896004732930,10.53,2020-03-31
5,7896422519793,14.39,2020-03-31
6,7891045043762,42.95,2020-03-31
7,7896422519830,14.29,2020-03-31
8,7896112140924,14.59,2020-03-31
9,7891142201676,6.63,2020-03-31


In [24]:
df_remedio

Unnamed: 0,Produto,EAN,Quantidade,Marca,Princípio Ativo
0,Ibuprofeno 600mg,7898148295159,20 Comprimidos Revestidos,Farmaco Prati,IBUPROFENO
1,Ibuprofeno 100mg,7896181919698,20ml Suspensão,Aché,IBUPROFENO
2,Ibupril 400mg,7896112160298,10 Cápsulas Gelatinosas Moles,Ibupril,IBUPROFENO
3,Ibuprofeno 400 mg,7896714211275,10 Comprimidos,Neo Química,IBUPROFENO
4,Ibuflex 400mg,7896004732930,8 Cápsulas,Legrand,IBUPROFENO
5,Ibuprofeno 50mg/ml,7896422519793,30ml Suspensão Oral,Medley,IBUPROFENO
6,Advil Extra Alívio 400mg,7891045043762,20 Cápsulas Gelatinosas,Pfizer,IBUPROFENO
7,Ibuprofeno 100mg/ml,7896422519830,20ml suspensão Oral,Medley,IBUPROFENO
8,Ibupril 600mg,7896112140924,20 Comprimidos,Teuto,IBUPROFENO
9,Alivium 400mg,7891142201676,3 Cápsulas,Hypera,IBUPROFENO


# Criando a DataBase

In [25]:
import sqlalchemy as db

In [9]:
def create_table(title: str, df):
    '''
    A função recebe o dataframe desejado para se transformar em uma tabela no banco 
    de dados. 
    
    title: nome da tabela a ser criada no bando de dados
    df: pandas dataframe a ser transformado
    
    '''
    engine = db.create_engine('postgresql://postgres:admin@localhost/farmacia_tempo')
    conn = engine.connect()
    df.to_sql(title, con=conn, if_exists = 'replace', index=False)
    conn.close()

In [None]:
create_table('ean_preco', df_remedio_preco)

In [None]:
create_table('remedio', df_remedio)

# Atualizando Database

In [9]:
def update_table(title, df):
    '''
    A função recebe o dataframe que será adicionado à tabela já existente no banco 
    de dados. 
    
    title: nome da tabela a ser adicionada
    df: pandas dataframe a ser adicionado
    
    '''
    engine = db.create_engine('postgresql://postgres:admin@localhost/farmacia_tempo')
    conn = engine.connect()
    df.to_sql(title, con=conn, if_exists='append', index = False)
    conn.close()

In [10]:
update_table('ean_preco', df_remedio_preco)