### Seguimiento precios CANIFARMA

Este código tiene como objetivo dar seguimiento de los medicamentos con precios máximos publicados por la Secretaría de Economía a través de la Dirección General de Industrias Ligeras (DGIL). Los precios de estos medicamentos se buscarán en 7 farmacias mexicanas, a saber: Farmalisto, Farmacias San Pablo, Farmacias Especializadas, Farmacias del Ahorro, Farmacias Guadalajara, Farmacon y Farmacias Benavides. 

In [1]:
import pandas as pd
import time
import random
from medscraper import medsearch
from sqlalchemy import create_engine
import schedule

In [2]:
#Archivo DGIL
dgil=pd.read_excel('Lista de precios de medicamentos_Diciembre_2022.xlsx',skiprows=(4), usecols=(range(5)))
dgil = dgil.iloc[:-2]
dgil.columns=dgil.columns.str.lower()
#Renmbrar penúltima y última columna
fourth_column_name = dgil.columns[3]
fifth_column_name = dgil.columns[4]
dgil.rename(columns={fourth_column_name:'pres',fifth_column_name:'precio'}, inplace=True)
#Eliminar filas vacías
dgil=dgil.dropna()
#Eliminar espacios en blanco
dgil['producto']=dgil['producto'].str.strip()
dgil

Unnamed: 0,empresa,producto,principio activo,pres,precio
0,"Abbvie Famacéuticos, S.A. de C.V.",VENCLEXTA,Venetoclax,Caja con un frasco con 120 tabletas de 100 mg.,149594.00
1,"Abbvie Famacéuticos, S.A. de C.V.",VENCLEXTA,Venetoclax,Tratamiento de inicio. Caja con 4 carteras sem...,32287.00
2,"Abbvie Famacéuticos, S.A. de C.V.",MAVYRET,Glecaprevir / Pribrenstavir,Caja con 4 cajas individuales con 7 blisters c...,96912.00
3,"Abbvie Famacéuticos, S.A. de C.V.",RIM-VOQ,Upadacitinib,Caja de cartón con 28 tabletas de 15 mg en env...,22612.88
4,"Abbvie Famacéuticos, S.A. de C.V.",SKYRIZI,Risankizumab,Caja de cartón con 2 jeringas prellenadas 0.83...,90600.00
...,...,...,...,...,...
375,"Takeda México, S.A. de C.V.",TURAZIVE,Febuxostat,Frasco con 30 tabletas 80 mg,917.00
377,"UCB de México, S.A de C.V",BRIVIACT,Brivaracetam,Caja con 28 tabletas de 25 mg,2060.00
378,"UCB de México, S.A de C.V",BRIVIACT,Brivaracetam,Caja con 28 tabletas de 50 mg,2060.00
379,"UCB de México, S.A de C.V",BRIVIACT,Brivaracetam,Caja con 28 tabletas de 100 mg,2060.00


In [3]:
#Eliminar duplicados
dgil=dgil.drop_duplicates(subset=['producto'], keep='first')
lista=dgil['producto'].tolist()
print("El número de búsquedas es de: ",len(lista))

El número de búsquedas es de:  157


### Funciones

In [4]:
def carga_sql(df):
    engine = create_engine('postgresql://webscraping:UdRW2604t$@10.100.30.36:5432/db_labdatos')

    df.to_sql('canifarma_pruebas', engine, if_exists='append', index=False)
    print("Carga exitosa")

In [5]:
#Función de búsqueda

def buscamed(lista):
    farmacias=["farmalisto_mx", "fsanpablo", 
               "fespecializadas", "farmacon",
                 "fahorro", "fguadalajara",
                 "fbenavides"]
    df=pd.DataFrame()
    for medicamento in lista:
        for farm in farmacias:
            try:
                buscador=medsearch.scraper(farm, medicamento)
                df=pd.concat([df, buscador.show_dataframe()], axis=0)
                df=df.reset_index(drop=True)
                time.sleep(random.randint(5, 10))
            except:
                print("Error en: ", medicamento)
                pass
    #Insertar tabla final en SQL
    carga_sql(df)
    print("Se ha cargado la tabla en SQL con", len(df), "registros a las", time.strftime("%H:%M:%S"))
    return df

### Ejecución de la búsqueda

In [None]:
schedule.every().day.at("00:05").do(buscamed, lista)

# Inicio de tiempo
start_time = time.time()

try:
    while True:
        # Checa el límite establecido de tiempo para correr el código
        if time.time() - start_time > 1 * 24 * 60 * 60:  
            print("Tiempo del proceso completado. Deteniendo...")
            schedule.clear()
            break

        # Corre las tareas programdas
        schedule.run_pending()

        # Espera por el while antes de checar el schedule nuevamente
        time.sleep(1)
except Exception as e:
    print(f"Ocurrió un error: {e}")