## Ejemplo

- Organizar el código **optimizando la legibilidad y manteniendo siempre el nivel de complejidad de cada función por debajo de cierto umbral**. En el ejemplo, la complejidad se mide empleando la complejidad ciclomática y el umbral es 7.


- Preservar el nivel de abstracción: evitar mezclar, en la misma función, llamadas a funciones que indican *qué* hace una tarea con código que muestra *cómo* se realiza una tarea. **Los nombres de las funciones y variables deben reflejar su propósito**. A mayor cantidad de líneas en la función, más difícil encontrar un nombre adecuado.


- Aplicar el [**principio de responsabilidad única**](https://es.wikipedia.org/wiki/Principio_de_responsabilidad_%C3%BAnica): toda función debe tener solo una razón para ser modificada.


- Preferir un enfoque funcional (para evitar ciclos y estructuras condicionales lo más que se pueda).


```
radon cc --include-ipynb -s 02_extraccion/03_web_scraping_and_webservices/02_web_scraping_ejemplo.ipynb
```

In [1]:
import csv
import re
import requests
from bs4 import BeautifulSoup

In [2]:
def extraer_nombre(div_automovil):
    return div_automovil.find('span', class_='car_name').text

In [3]:
def extraer_cilindros(div_automovil):
    str_cilindros = div_automovil.find('span', class_='cylinders').text
    return int(str_cilindros)

In [4]:
def extraer_peso(div_automovil):
    str_peso = div_automovil.find('span', class_='weight').text
    return int(str_peso.replace(',', ''))

In [5]:
def extraer_aceleracion(div_automovil):
    return float(div_automovil.find('span', class_='acceleration').text)

In [6]:
#Funciones que realizan más de una tarea deben ser la excepción, NO la regla
def extraer_territorio_anio(div_automovil):
    str_from = div_automovil.find("span", attrs={"class":"from"}).text
    anio, territorio = str_from.strip('()').split(',')
    anio = int(anio.strip())
    territorio = territorio.strip()
    return territorio, anio

In [7]:
def extraer_mpg(div_automovil):
    mpg_str = div_automovil.find("span", attrs={"class":"mpg"}).text
    try:
        mpg = float(mpg_str.split(' ')[0])
    except ValueError:
        mpg = "NULL"
    return mpg

In [8]:
def extraer_caballos_potencia(div_automovil):
    caballos_potencia_str = div_automovil.find('span', class_='horsepower').text
    try:
        caballos_potencia = float(caballos_potencia_str)
    except ValueError:
        caballos_potencia = "NULL"
    return caballos_potencia

In [9]:
def extraer_desplazamiento(div_automovil_text):
    str_desplazamiento = re.findall(r'.* (\d+.\d+) cubic inches', div_automovil_text)[0]
    desplazamiento = float(str_desplazamiento)
    return desplazamiento  

In [10]:
#Nivel de abstracción 3
def extraer_datos(div_automovil):
    nombre = extraer_nombre(div_automovil)
    cilindros = extraer_cilindros(div_automovil)
    peso = extraer_peso(div_automovil)
    territorio, anio = extraer_territorio_anio(div_automovil)
    # territorio = extraer_territorio(div_automovil)
    # anio = extraer_anio(div_automovil)
    aceleracion = extraer_aceleracion(div_automovil)
    mpg = extraer_mpg(div_automovil)
    caballos_potencia = extraer_caballos_potencia(div_automovil)
    desplazamiento = extraer_desplazamiento(div_automovil.text)
    
    return dict(nombre=nombre, 
               cilindros=cilindros,
               peso=peso,
               anio=anio,
               territorio=territorio,
               aceleracion=aceleracion,
               mpg=mpg,
               caballos_potencia=caballos_potencia,
               desplazamiento=desplazamiento)

In [11]:
def obtener_pagina(url):
    respuesta = requests.get(url)
    return BeautifulSoup(respuesta.text, "html.parser" )

In [12]:
def obtener_divs_automoviles(pagina):
    return pagina.body.find_all(name="div", attrs={"class":"car_block"})

In [13]:
def extraer_datos_automoviles(divs_automoviles):
    #Este bloque es equivalente al list comprehension
#     datos_automoviles = []
#     for div_automovil in divs_automoviles:
#         datos_automoviles.add(extraer_datos(div_automovil))
    
#     return datos_automoviles

    return [extraer_datos(div_automovil) for div_automovil in divs_automoviles]

In [14]:
def guardar_datos_automoviles_en_archivo_csv(datos_automoviles):
    with open("datos_automoviles.csv", "w", encoding="utf-8", newline="") as file_writer:
        writer = csv.DictWriter(file_writer, fieldnames=datos_automoviles[0].keys())
        writer.writeheader()
        writer.writerows(datos_automoviles)

In [15]:
#Nivel de abstracción 2
def extraer_datos_automoviles_en_archivo_csv(pagina):
    divs_automoviles = obtener_divs_automoviles(pagina)
    datos_automoviles = extraer_datos_automoviles(divs_automoviles)
    guardar_datos_automoviles_en_archivo_csv(datos_automoviles)

In [16]:
#Nivel de abstracción 1
pagina = obtener_pagina("http://localhost:8000/auto_mpg.html")
extraer_datos_automoviles_en_archivo_csv(pagina)