# Modulos

In [1]:
import time
import requests
import numpy as np
import pandas as pd

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service

# Funciones

In [2]:
def extract_results(driver):
    dc= {"Title":[], "Link":[], "Description":[]}
    results = driver.find_elements(By.XPATH, "//td[@class='bmtextview']")
    
    for result in results:
        link_element = result.find_element(By.TAG_NAME, "a")
        description_element = result.find_element(By.CLASS_NAME, "bbm_result_fieldvalue")

        title = link_element.text
        link = link_element.get_attribute("href")
        description = description_element.text

        dc["Title"].append(title)
        dc["Link"].append(link)
        dc["Description"].append(description)

    return pd.DataFrame(dc)        

In [17]:
def download_file(url, file_name):

    response = requests.get(url)
    if response.status_code == 200:
        
        with open(file_name, 'wb') as file:
            file.write(response.content)
            print(f"Archivo descargado: {file_name}")
    else:
        print(f"Error al descargar el archivo: {response.status_code}")

# Lectura de datos

## Resultados Pagina Web

In [21]:
url = "https://www.banxico.org.mx/AplBusquedasBM2/bgenwww_es.jsp"
search_term = "tpv"

In [22]:
driver = webdriver.Chrome()
driver.get(url)
time.sleep(5)

search_bar = driver.find_element(By.NAME, "_userquery")
search_bar.send_keys(search_term)
search_bar.send_keys(Keys.RETURN)
time.sleep(5)

ls_data = []
ls_data.append(extract_results(driver))

while True:
    try:
        next_button = driver.find_element(By.XPATH, "//a[contains(text(), 'Siguiente')]")
        next_button.click()
        time.sleep(5)  # Esperar a que los resultados carguen
        ls_data.append(extract_results(driver))
    except:
        break  # Salir del bucle si no hay más páginas

driver.quit()

In [37]:
all_searchs = pd.concat(ls_data, ignore_index=True)

### Procesamiento

In [38]:
all_searchs["Type"] = all_searchs["Title"].apply(lambda x: (x.split(",")[-1]).strip())
all_searchs["Title"] = all_searchs["Title"].apply(lambda x: " ".join(x.split(",")[:-1]))
all_searchs.Type.unique()

array(['SIE', 'pdf', 'html'], dtype=object)

In [47]:
all_searchs.sample(5)

Unnamed: 0,Title,Link,Description,Type
54,Hoteles,https://www.banxico.org.mx/servicios/tasas-de-...,Hoteles. Hoteles. Tasas de descuento por giro ...,pdf
110,Peaje,https://www.banxico.org.mx/servicios/tasas-de-...,Peaje. Peaje. Tasas de descuento por giro de n...,pdf
129,2011-09 Regulación de comisiones de cajero en ...,https://www.banxico.org.mx/publicaciones-y-pre...,2011-09 Regulación de comisiones de cajero en ...,pdf
49,Informe anual de cumplimiento de la Ley para l...,https://www.banxico.org.mx/publicaciones-y-pre...,Informe anual de cumplimiento de la Ley para l...,pdf
105,Modificaciones a las Reglas conjuntas Banco de...,https://www.banxico.org.mx/marco-normativo/nor...,Modificaciones a las Reglas conjuntas Banco de...,pdf


In [56]:
all_searchs[all_searchs.Title=='Hoteles'].iloc[0,1]

'https://www.banxico.org.mx/servicios/tasas-de-descuento-para-tarjetas-de-credito-por-gi/%7B4B7FCB63-8D2C-F86D-578D-130144A51CD5%7D.pdf'

In [62]:
all_searchs["Download"] = all_searchs["Link"].apply(lambda x: 1 if "tasas-de-descuento" in x else 0)
all_searchs["Card"] = np.where(all_searchs["Download"]==1,
                               np.where(all_searchs["Link"].str.contains("credito"),"Credito","Debito"),"No Aplica")

In [13]:
all_searchs["File_name"] = np.where(all_searchs["Download"]==1,"Descuento " +all_searchs["Card"] +" " +all_searchs["Title"] +"."+ all_searchs["Type"], '' )

In [20]:
all_searchs[all_searchs.Download==1]

Unnamed: 0,Title,Link,Description,Type,Download,Card,File_name
0,Agencias de viajes,https://www.banxico.org.mx/servicios/tasas-de-...,Agencias de viajes. Agencias de viajes. Tasas ...,pdf,1,Credito,Descuento Credito Agencias de viajes.pdf
1,Agencias de viajes,https://www.banxico.org.mx/servicios/tasas-de-...,Agencias de viajes. Agencias de viajes. Tasas ...,pdf,1,Debito,Descuento Debito Agencias de viajes.pdf
2,Agregadores,https://www.banxico.org.mx/servicios/tasas-de-...,Agregadores. Agregadores. Tasas de descuento p...,pdf,1,Credito,Descuento Credito Agregadores.pdf
3,Agregadores,https://www.banxico.org.mx/servicios/tasas-de-...,Agregadores. Agregadores. Tasas de descuento p...,pdf,1,Debito,Descuento Debito Agregadores.pdf
4,Aseguradoras,https://www.banxico.org.mx/servicios/tasas-de-...,Aseguradoras. Aseguradoras. Tasas de descuento...,pdf,1,Credito,Descuento Credito Aseguradoras.pdf
5,Aseguradoras,https://www.banxico.org.mx/servicios/tasas-de-...,Aseguradoras. Aseguradoras. Tasas de descuento...,pdf,1,Debito,Descuento Debito Aseguradoras.pdf
6,Beneficencia,https://www.banxico.org.mx/servicios/tasas-de-...,Beneficencia. Beneficencia. Tasas de descuento...,pdf,1,Credito,Descuento Credito Beneficencia.pdf
7,Beneficencia,https://www.banxico.org.mx/servicios/tasas-de-...,Beneficencia. Beneficencia. Tasas de descuento...,pdf,1,Debito,Descuento Debito Beneficencia.pdf
8,Colegios y universidades,https://www.banxico.org.mx/servicios/tasas-de-...,Colegios y universidades. Colegios y universid...,pdf,1,Credito,Descuento Credito Colegios y universidades.pdf
9,Colegios y universidades,https://www.banxico.org.mx/servicios/tasas-de-...,Colegios y universidades. Colegios y universid...,pdf,1,Debito,Descuento Debito Colegios y universidades.pdf


### Salida

In [15]:
all_searchs.sort_values(by=["Download", "Title"], ascending=[False,True]).to_csv("all_searchs_banxico.csv", index=False)

## Descarga PDF's

In [18]:
folder = "PDFs/"
for index,row in all_searchs[all_searchs.Download==1].iterrows():
    
    url = row["Link"]
    file_name = folder + row["File_name"]
    download_file(url, file_name)

Archivo descargado: Descargas/Descuento Credito Agencias de viajes.pdf
Archivo descargado: Descargas/Descuento Debito Agencias de viajes.pdf
Archivo descargado: Descargas/Descuento Credito Agregadores.pdf
Archivo descargado: Descargas/Descuento Debito Agregadores.pdf
Archivo descargado: Descargas/Descuento Credito Aseguradoras.pdf
Archivo descargado: Descargas/Descuento Debito Aseguradoras.pdf
Archivo descargado: Descargas/Descuento Credito Beneficencia.pdf
Archivo descargado: Descargas/Descuento Debito Beneficencia.pdf
Archivo descargado: Descargas/Descuento Credito Colegios y universidades.pdf
Archivo descargado: Descargas/Descuento Debito Colegios y universidades.pdf
Archivo descargado: Descargas/Descuento Credito Comida rápida.pdf
Archivo descargado: Descargas/Descuento Debito Comida rápida.pdf
Archivo descargado: Descargas/Descuento Credito Educación básica.pdf
Archivo descargado: Descargas/Descuento Debito Educación básica.pdf
Archivo descargado: Descargas/Descuento Credito Entre