# Web Scraping Examples
This notebook contains examples of web scraping using `requests`, `BeautifulSoup`, and `Selenium` as described in the provided PDF.

In [None]:
# Importar las bibliotecas necesarias
import requests
import csv
import matplotlib.pyplot as plt
from bs4 import BeautifulSoup
from selenium import webdriver

# Ejemplo 1: Descargar un archivo usando requests
def download_file():
    url = "http://www.mambiente.munimadrid.es/opendata/horario.txt"
    response = requests.get(url)
    if response.status_code == 200:
        with open('horario.txt', 'wb') as output:
            output.write(response.content)
    return response.status_code

# Ejemplo 2: Analizar datos descargados con csv y matplotlib
def analyze_data():
    path = 'horario.txt'
    with open(path) as csvfile:
        readCSV = csv.reader(csvfile, delimiter=',')
        for row in readCSV:
            if (row[0]+row[1]+row[2]=='28079004' and row[3]=='12'):
                plt.title("Óxido de nitrógeno: " + row[8] + "/" + row[7] + "/" + row[6])
                hora = 0
                desp = 9
                vs = []
                horas = []
                while hora <= 23:
                    if row[desp + 2*hora + 1] == 'V':
                        vs.append(row[desp + 2*hora])
                        horas.append(hora)
                    hora += 1
                plt.plot(horas, vs)
                plt.show()

# Ejemplo 3: Web scraping estático con BeautifulSoup
def static_web_scraping():
    html_content = '''
    <!DOCTYPE html>
    <html>
      <head>
        <title>
          Un mini ejemplo
        </title>
      </head>
      <body>
        <div id="date"> Fecha 25/03/2035 </div>
        <div id="content"> Un poco de texto </div>
      </body>
    </html>
    '''
    soup = BeautifulSoup(html_content, "html.parser")
    print(soup.prettify())
    print(soup.find("div", id="date").get_text())

# Ejemplo 4: Web scraping dinámico con Selenium
def dynamic_web_scraping():
    driver = webdriver.Chrome()  # Ensure ChromeDriver is in the PATH
    url = "https://www1.sedecatastro.gob.es/CYCBienInmueble/OVCBusqueda.aspx"
    driver.get(url)
    coord = driver.find_element_by_link_text("COORDENADAS")
    coord.click()
    lat = driver.find_element_by_id("ctl00_Contenido_txtLatitud")
    lon = driver.find_element_by_id("ctl00_Contenido_txtLongitud")
    latitud = "28.2723368"
    longitud = "-16.6600606"
    lat.send_keys(latitud)
    lon.send_keys(longitud)
    datos = driver.find_element_by_id("ctl00_Contenido_btnDatos")
    datos.click()
    # Add any additional steps to extract data as needed
    driver.quit()
    

## Llamar a las funciones para probar los ejemplos

In [None]:
# Llamar a las funciones para probar los ejemplos (excepto download_file y dynamic_web_scraping que requieren acceso a la red y un navegador)
static_web_scraping()
# analyze_data()  # Run this after download_file() is executed successfully and horario.txt is available
    

## Instrucciones de ejecución local
1. **Instalar las dependencias**:
```bash
pip install requests beautifulsoup4 matplotlib selenium
```
Asegúrate de tener ChromeDriver instalado y en tu PATH. Puedes descargarlo desde [aquí](https://sites.google.com/a/chromium.org/chromedriver/downloads).

2. **Ejecutar el notebook**:
- Descarga el archivo `horario.txt` ejecutando `download_file()`.
- Ejecuta `analyze_data()` para analizar los datos descargados.
- Ejecuta `static_web_scraping()` para ver cómo funciona BeautifulSoup.
- Ejecuta `dynamic_web_scraping()` para realizar web scraping dinámico con Selenium.