# Sección 1: Programación Básica

El objetivo de esta sección es aprender a utilizar las funciones básicas de Python, aprender la lógica general en la que funciona el programa y los tipos de items que están dentro del programa.

## Variables

Saber definir variables es lo más esencial del manejo de Python. Esto permite generar items con propiedades específicas, que nos permiten hacer todo tipo de cosas. Desde calcular información básica, hasta la navegación compleja de sitios web y otras tareas de alta especialización.

#### Parte 1: Variables numéricas y de texto.

##### 1.1 Variables numéricas

Este tipo de variables, como lo indica su nombre, son números. Nos permiten hacer cálculos exactos y manipular métricas que dependen de números. Desde cálculos complejos hasta número de iteraciones repetidas. Existen dos tipos fundamentales de variables numéricas: Floats e Integers.

Los Floats son números que pueden tomar formas fraccionarias (decimales). Mientras que los integers son números enteros y solo se manejan en cantidades discretas.

Existen cuatro operaciones fundamentales con estas variables: Suma, resta, multiplicación y exponenciación. Estas operaciones pueden realizarse con cantidades fijas determinadas por el usuario, pero también pueden hacerse entre otras variables diferentes.

##### 1.2 Variables de texto

Al igual que las variables numéricas, el nombre lo dice todo: Son variables que se expresan como texto, es decir, letras o palabras concatenadas en oraciones. Pueden utilizarse para dar outputs de texto cuando algo específico ocurre en nuestro código, para guardar nombres de observaciones, encontrar rutas de archivos, y muchas cosas más. Se definen con comillas " " y tienen múltiples operaciones disponibles para su uso. Las más representativas son: " ".replace, " ".split, y len(" ")

Estas variables también pueden ser concatenadas con un +, o pueden tener maneras de ser expresadas, como f" " y r" ".

Existen caracteres especiales que cumplen ciertas funciones. Los más importantes son "\n" y "\t" que son, respectivamente, saltos de línea y sangría.

Las variables de texto pueden contener caracteres numéricos, pero estos no se comportan como números.

##### 1.3 Boolean

Las variables Boolean pueden tomar uno de dos valores: Verdadero, o Falso. Sirven muchísimo para comprobar que una o múltiples condiciones se cumplen y nos permiten tomar ciertas medidas en caso de que ocurran.

In [None]:
#Variables Numéricas
a = 2 #Int
b = 2.4 #Float
#Variable de texto
c = "¡Hola a todos!"
d = "123456" #Caracteres numéricos, pero no se comporta como un número.
#Varialbe Boolean
e = 2 + 2 == 4
f = 2 + 2 == 5
print(e)
print(f)

In [None]:
###### Método Print
print(a)
print(b)
print(c)
print(d)
#Toda la información en un solo print
print(f"\nToda la información en un solo print:\n{a}\n{b}\n{c}\n{d}")
#Última forma de hacer print
print(f"""
Última forma de hacer print:
{a}
{b}
{c}
{d}""")

In [None]:
#Operaciones matemáticas con números
x = 23 + 3*4
print(x)
x = 24/12
print(x)
#Operaciones matemáticas con variables
x = a+b
print(x)
#Operaciones con la misma variable
#Suma
x = x + 1
print(x)
x += 4.6
print(x)
#Multiplicación
x = x*4
print(x)
#División
x = x/4
print(x)
#Exponenciación
x = x**2
print(x)
x = x**(1/2)
print(x)

#### Parte 2: Tipos de item básicos para el curso

Existe una gran multitud y variedad de items sobre los que se puede trabajar en Python. Los más básicos, y que vienen ya construidos en el mismo lenguaje son: listas, tuples, sets y diccionarios.

Cada uno de estos objetos tiene métodos (funciones) específicos que permiten hacer operaciones específicas con ellos. Por ejemplo, los números pueden sumarse o utilizarse como argumentos; las listas pueden guardar elementos específicos, expandirse y mezclarse con otras listas; los diccionarios pueden organizar información en base a palabras clave.

##### 1.1 Listas:

Uno de los objetivos más importantes del manejo de Python, nos permiten guardar información de manera organizada y referirnos a sus elementos cuando sea necesario. El orden de la información está expresado en índices que van desde el cero hasta el número máximo de elementos menos 1. Las listas se definen con corchetes [1,2,3...] y sus elementos están separados por comas.

Tienen una gran variedad de métodos que permiten realizar operaciones con ellos tales como: Agregar elementos al final, agregar elementos en un índice específico, expandir todos sus elementos a partir de otra lista, encontrar el elemento que tiene un índice específico, convertir sus elementos en texto, entre otros.

##### 1.2 Tuples

Los tuples cumplen la misma función que las listas, pero son inmutables y no pueden recibir transformaciones en sus elementos, a diferencia de las listas. Estos objetos se definen con paréntesis (1,2,3...) y sus elementos están separados por comas.

##### 1.3 Sets

Los sets también cumplen la función de guardar información, pero -a diferencia de las listas y los tuples- no guardan la información con un orden o un índice específico. Sus elementos también son inmutables y no pueden cambiar una vez dentro del set. La diferencia fundamental, sin embargo, es que las listas y tuples pueden tener elementos idénticos duplicados y los sets no. Están definidos por llaves {1,2,3,...} y sus elementos están separados por comas.

##### 1.4 Diccionarios

Los diccionarios, al igual que los objetos anteriores, son capaces de guardar información. Pero en este caso, la información guardada en ellos no es inmutable y no está organizada con índices, sino con palabras clave definidas por el usuario. Están definidos por llaves, sus elementos también se separan por comas, pero cada elemento están definidos por la palabra clave, dos puntos y el valor correspondiente. 

{"Palabra clave 1":"Valor 1","Palabra clave 2":"Valor 2", ...}

In [None]:
#Listas
x = ["a","b","c","d"]
y = [1,2,3,4]
z = [("cavayo","cerpiente","poyo"),("caballo","serpiente","pollo")]
#Encontrar el tipo de elemento de la variable x
print(f"La variable x es: {type(x)}")

#Contar el número de elementos dentro de la lista
print(f"El tamaño de la lista x = {len(x)}")

#Encontrar elementos dentro de la lista
num_elemento = 2
elemento = x[num_elemento-1]
print(f"El elemento número {num_elemento} de la lista x es: {elemento}")

#Encontrar elementos dentro de la lista, pero desde el último elemento para atrás
second_last = y[-2]
print("El penúltimo elemento de la lista x es: " + str(second_last))

#Encontrar el índice de un elemento específico dentro de una lista:
i = y.index(3)
print(i)
i = x.index("c")
print(i)

#Hacer una subilista:
#De principio hasta el penúltimo elemento
x_prima = x[:-1]
print(x_prima)
#Desde el elemento 2 hasta el último elemento
x_prima = x[1:]
print(x_prima)

#Extraer el elemento i de una lista y eliminarlo de la misma
print(x_prima)
w = x_prima.pop(0)
print(w)
print(x_prima)

#Añadir elementos al final de una lista
print("Añadir elementos a la lista")
a = 1200
print(x)
x.append(a)
print(x)
print(y)
y.append("x")
print(y)

#Retirar un elemento específico de una lista
print(x)
x.remove(a)
print(x)

#Añadir elementos en el índice i de una lista
print(x)
x.insert(2,"t")
print(x)

#Extender los elementos de una lista en otra lista
#Ejemplo falso:
print(x)
x.append(y)
print(x)
x.remove(y)
#Ejemplo Verdadero
print(x)
x.extend(y)
print(x)
x.extend(z)
print(x)

In [None]:
#sets
x = [1,2,3,3,4,6,1,2,3,5,5,6,7,8,10,122,32,3,32,122]
y = set(x)
print(x)
print(len(x))
print(y)
print(list(y))
#Diccionarios
z = {"Edad":23,"Nombre":"Jorge","Estudios":"Secundaria"}
print(z["Edad"])
print(z["Nombre"])
print(z["Estudios"])
z["Estado Civil"] = "Soltero"
print(z)

#### Parte 3: Loops

Los loops son las herramientas más importantes de la programación en Python. Permiten generar procesos iterativos que repien ciertas acciones de manera consistente y veloz. Es lo principal detrás de la automatización.

Existen dos tipos de loops: for y while. Los *for loops* están diseñados para iterar para los elementos de un item de python, las letras de un texto, los números en una lista, las palabras clave de un diccionario, etc. Los *while loops* están diseñados para iterar de manera infinita, hasta que se cumpla una condición específica.

El loop que vaya a ser utilizado depende de lo que se pretenda hacer. Si se conoce el número exacto de elementos sobre los que se quiere iterar, entonces un for loop es lo más acertado. Por otra parte, si no se sabe cuántas iteraciones se necesita hacer, pero sí se conoce el objetivo que se quiere conseguir, un While loop sería la mejor opción.

#### For Loop:
![image.png](attachment:image.png)


#### Ejemplos de for loops

In [None]:
#For loops
numbers = [1,2,3,4,5]
#Iniciar el loop
for num in numbers:
    #Acción que se repetirá en cada iteración
    print(num)

In [None]:
#Usar for loops para hacer una lista de números pares
demo = []
for num in range(200):
    pair = num*2
    demo.append(pair)
print(demo)

#### If, elif, else statements.

A veces, cuando se realiza un loop, queremos que se realicen ciertas acciones cuando ocurren ciertas condiciones. Para esto se utilizan los if, elif y else statements.

if le da una condición al programa que, en caso de cumplirse, hace que realice ciertas acciones específicas. Si esta condición no se cumple, evalúa otras condiciones expresadas en un elif statement; finalmente, si ninguna de estas condiciones se cumple, ejecuta el fragmento de código presente en el else statement.

![image.png](attachment:image.png)

Después de evaluar las tres condiciones, se sigue corriendo el fragmento del programa por debajo de los statements; esto ocurre tanto cuanto se cumplen las condiciones, como cuando no lo hacen.

In [1]:
#For loop para generar una lista de números pares e impares
pares = []
impares = []
other = []
a = list(range(200))
a.extend(["B","C","E",4.24,1.234,1.356,12.45])

for item in a:
    print(type(item))
    #Comprobar si no es un número entero
    if type(item) != int:
        print(f"{item} es de tipo: {type(item)}")
        other.append(item)
        #Saltar a la siguiente iteración
    #Comprobar si es par
    elif item % 2 == 0:
        print(str(item) + " es un número par")
        pares.append(item)
        #Saltar a la siguiente iteración
    else:
        print(str(item) + " es un número impar")
        impares.append(item)
    print("Esto debe salir independientemente del tipo de elemento")  

<class 'int'>
0 es un número par
Esto debe salir independientemente del tipo de elemento
<class 'int'>
1 es un número impar
Esto debe salir independientemente del tipo de elemento
<class 'int'>
2 es un número par
Esto debe salir independientemente del tipo de elemento
<class 'int'>
3 es un número impar
Esto debe salir independientemente del tipo de elemento
<class 'int'>
4 es un número par
Esto debe salir independientemente del tipo de elemento
<class 'int'>
5 es un número impar
Esto debe salir independientemente del tipo de elemento
<class 'int'>
6 es un número par
Esto debe salir independientemente del tipo de elemento
<class 'int'>
7 es un número impar
Esto debe salir independientemente del tipo de elemento
<class 'int'>
8 es un número par
Esto debe salir independientemente del tipo de elemento
<class 'int'>
9 es un número impar
Esto debe salir independientemente del tipo de elemento
<class 'int'>
10 es un número par
Esto debe salir independientemente del tipo de elemento
<class 'in

In [2]:
print(pares)
print(impares)
print(other)

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198]
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199]
['B', 'C', 'E', 4.24, 1.234, 1.356, 12.45]


#### Try Except clauses

Los try except clauses sirven para hacer acciones determinadas cada vez que ocurra un error específico en el código que se pretende correr, en lugar de detener por completo el programa. Es especialmente útil si se sabe que hay un error que puede ocurrir a menudo y queremos repetir la iteración cuando esto ocurra.

#### Pass, Continue, Break clauses

Respectivamente, son argumentos que permiten: seguir con el siguiente fragmento de código, ignorar el resto del código y avanzar a la siguiente iteración, detener por completo el loop.

In [None]:
# print(other[0] + 3)
print("Primer Loop")
for i in other:
    try:
        print(i + 3)
    except TypeError as e:
        print(f"El elemento {i} es una letra, no un número.")
    print("poyo")
    
print("\nSegundo Loop")
#Con Pass Clause
for i in other:
    try:
        print(i + 3)
    except TypeError as e:
        print(f"El elemento {i} es una letra, no un número.")
        pass
    print("poyo")

print("\nTercer Loop")
#Con Continue Clause
for i in other:
    try:
        print(i + 3)
    except TypeError as e:
        print(f"El elemento {i} es una letra, no un número.")
        continue
    print("poyo")

print("\nCuarto Loop")
#Con Break Clause
for i in other:
    try:
        print(i + 3)
    except TypeError as e:
        print(f"El elemento {i} es una letra, no un número.")
        break
    print("poyo")

#### List Comprehension

Los list comprehension son muy similares a los for loops, pero son más sencillos de iterar y generan listas personalizadas en una sola línea de código. Son exhaustivas en memoria, así que hay que tener cuidado con grandes tamaños de iteraciones.

In [None]:
#Hacer una lista con 20 números ordenados
a = [i for i in range(1,21)]
print(a)
#Hacer una lista con números pares:
b = [i for i in range(1,21) if i % 2 == 0]
print(b)
#Hacer una lista con números impares:
c = [i for i in range(1,21) if i % 2 != 0]
print(c)
#Hacer una lista con los cuadrados de los números del 1 al 20:
d = [i**2 for i in range(1,21)]
print(d)

#### Ejemplo de While loop

#### Diagrama de Flujo de los While Loop

![image-3.png](attachment:image-3.png)

In [None]:
#While loop
import random
text = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
a = [text[random.randint(0,len(text)-1)] for i in range(200)]
print(a)
count = a.count("C")
print(f"""Número de Cs en la lista: {a.count("C")}""")
while "C" in a:
    a.remove("C")
print(f"""Número de Cs en la lista: {a.count("C")}""")

# Sección 2: Web Scraping
En esta sección se pretende enseñar cómo utilizar las librerías Selenium, BeautifulSoup, Itertools y Pandas para: Navegar automáticamente por sitios web, extraer información de las páginas exploradas, generar múltiples perfiles de seguros, guardar la información de manera limpia y trabajable.

### Parte 1: Navegación de la página.

In [1]:
#Importar librerías
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd
import time
#Configurar la herramienta de navegación
url = r"https://ecuador.patiotuerca.com/usados/-/autos"

#Path del Chromedriver 

Path = "/Users/macbookair/Downloads/chromedriver"
driver = webdriver.Chrome(Path)

#Abrir página web
driver.get(url)

#Lista de vehículos
car_l = driver.find_element(By.CLASS_NAME,"usedList.half-banner.full-item")
#Encontrar el link de cada vehículo (order a).
cars = car_l.find_elements(By.CLASS_NAME,"col.vehicle-item.xl3.l4.m6.s12.order-a")
#Añadir vehuculos (order b - g).
letters = "bcdefg"
for letter in letters:
    cars.extend(
        car_l.find_elements(By.CLASS_NAME,f"col.vehicle-item.xl3.l4.m6.s12.order-{letter}"))
len(cars)


  driver = webdriver.Chrome(Path)


35

### Parte 2: Recolección de información

Teniendo una lista de carros de la cual sacar información, podemos empezar a diseñar el web scraper. La manera más intuitiva de comenzar el proceso es nevegar hacia la información y extraer los datos de un solo vehículo.

In [2]:
#Abrir la información del primer vehículo
cars[0].click()
#El click hace que se abra una nueva pestaña; para interactuar con sus elementos hay que abrirla.
tabs = driver.window_handles
driver.switch_to.window(tabs[1])
#Guardar el código HTML
source = driver.page_source

In [3]:
#Generar un objeto que permita procesar la iformación web, llamado BeautifulSoup.
soup = BeautifulSoup(source)
basic = soup.find("div",class_="row m-t")
basics = basic.find_all("div","col l3 m3 s6 p-b")
info = []

for i in basics:
    #Limpiar la información
    simple = i.text.replace("\n","")
    #Convertir los elementos de texto en una lista
    tup = simple.split("  ")
    #print(simple) #For demonstration only
    #Remover elementos vacíos
    while "" in tup:
        tup.remove("")
    #print(tup) #For demonstration only
    info.append(tuple(tup))
    #Li

#Guardar la información específica del vehículo
specific = soup.find("section",id="technicalData")
specifics = specific.find_all("div","col l4 m6 s6")

for i in specifics:
    #Limpiar la información
    spec = i.text
#         print(spec)
    #Convertir los elementos de texto en una lista
    tup = spec.split("\n")
#         print(tup)
    #Remover elementos vacíos
    while "" in tup:
        tup.remove("")
    #Si el elemento tiene información incompleta:
    if len(tup) < 2:
        tup.append("")
    #Añadir la información organizada a la lista maestra de información
    info.append(tuple(tup))
#         print(tup)
#Separar una lista de títulos y otra de información:
print(len(info))
display(info)
headers,information = zip(*set(info))
df = pd.DataFrame([information,information],columns = headers)
display(df)

driver.close()
driver.switch_to.window(tabs[0])

22


[('Año', '2012'),
 ('Ciudad', 'Quito'),
 ('Recorrido', '64000 Kms'),
 ('Tipo de pago', 'Negociable'),
 ('Precio Contado', '$14.700'),
 ('Publicación', '#1730449'),
 ('Marca', 'Citroen'),
 ('Modelo', 'DS3'),
 ('Subtipo', 'Hatchback (3 Puertas)'),
 ('Recorrido', '64000 Kms'),
 ('Sistema de climatización', 'Climatizador'),
 ('Tracción', '4 x 2'),
 ('Color', 'Blanco'),
 ('Último número de la placa', '1'),
 ('Vidrios', 'Eléctricos'),
 ('Transmisión', 'Manual'),
 ('Dirección', 'Hidráulica'),
 ('Motor(cilindraje)', '1400'),
 ('Tipo de Motor', '4L'),
 ('Tapizado', 'Cuero'),
 ('Combustible', 'Gasolina'),
 ('Placa', 'Tungurahua')]

Unnamed: 0,Precio Contado,Tracción,Subtipo,Color,Año,Vidrios,Publicación,Combustible,Tipo de Motor,Motor(cilindraje),...,Ciudad,Último número de la placa,Tapizado,Dirección,Recorrido,Marca,Modelo,Transmisión,Tipo de pago,Sistema de climatización
0,$14.700,4 x 2,Hatchback (3 Puertas),Blanco,2012,Eléctricos,#1730449,Gasolina,4L,1400,...,Quito,1,Cuero,Hidráulica,64000 Kms,Citroen,DS3,Manual,Negociable,Climatizador
1,$14.700,4 x 2,Hatchback (3 Puertas),Blanco,2012,Eléctricos,#1730449,Gasolina,4L,1400,...,Quito,1,Cuero,Hidráulica,64000 Kms,Citroen,DS3,Manual,Negociable,Climatizador


In [4]:
p = driver.find_element(By.CLASS_NAME,"col s12 m12 l12 center-align".replace(" ","."))
p.click()

In [6]:
#Guardar el código como una función, para usarlo con sencillez en un loop.
def saveInfo(driver,source):
    soup = BeautifulSoup(source)
    basic = soup.find("div",class_="row m-t")
    basics = basic.find_all("div","col l3 m3 s6 p-b")
    info = []

    for i in basics:
        #Limpiar la información
        simple = i.text.replace("\n","")
        #Convertir los elementos de texto en una lista
        tup = simple.split("  ")
        #print(simple) #For demonstration only
        #Remover elementos vacíos
        while "" in tup:
            tup.remove("")
        #print(tup) #For demonstration only
        info.append(tuple(tup))
        #Li

    #Guardar la información específica del vehículo
    specific = soup.find("section",id="technicalData")
    specifics = specific.find_all("div","col l4 m6 s6")

    for i in specifics:
        #Limpiar la información
        spec = i.text
#         print(spec)
        #Convertir los elementos de texto en una lista
        tup = spec.split("\n")
#         print(tup)
        #Remover elementos vacíos
        while "" in tup:
            tup.remove("")
        #Si el elemento tiene información incompleta:
        if len(tup) < 2:
            tup.append("")
        #Añadir la información organizada a la lista maestra de información
        info.append(tuple(tup))
#         print(tup)
    #Separar una lista de títulos y otra de información:
    print(len(info))
    display(info)
    headers,information = zip(*set(info))
    df = pd.DataFrame([information,information],columns = headers)
    display(df)
    
    driver.close()
    driver.switch_to.window(tabs[0])
    return df


### Parte 3: Recolección y guardado de información para todos los vehículos en la página.

Ahora que se conoce cómo navegar hacia la información de un vehículo y extraerla, podemos pasar a hacerlo para todos los carros, que es la parte más interesante. Para que el código luzca más intuitivo y menos complicado es útil expresar los códigos que usamos anteriormente como funciones individuales, que cumplen una tarea específica. En este caso podemos identificar tres tareas importantes y una tarea que las une a todas de manera harmónica para que funcionen una seguida de otra: 

1. Abrir la página web y guardar la lista de vehículos en la página.
2. Abrir cada uno de los vehículos en la lista, extraer su información, y regresar a la página principal.
3. Pasar a la siguiente página de vehículos para leer los vehículos que se encuentren en esta página.
4. Concatenar todas estas tareas de manera iterativa hasta que consigamos el volumen de información que necesitamos.

Esto quiere decir que podemos dividir nuestros códigos utilizados en cuatro partes importantes; veremos que esto es realmente útil, porque hace que el código sea más sencillo de interpretar a simple vista, pues se puede saber con rapidez y claridad absoluta qué hace cada linea de código.

### Paso 1: Función que genera la lista de vehículos en la página web

Queremos definir una función que complete la primera tarea mencionada anteriormente. La llamaremos find y tomará como argumento el driver de la página web. Cuando termine de hacer sus tareas específicadas queremos que nos devuelva, como variable la lista de vehículos.

In [7]:
def find(driver):
    #Lista de vehículos
    car_l = driver.find_element(By.CLASS_NAME,"usedList.half-banner.full-item")
    #Encontrar el link de cada vehículo (order a).
    cars = car_l.find_elements(By.CLASS_NAME,"col.vehicle-item.xl3.l4.m6.s12.order-a")
    #Añadir vehuculos (order b - g).
    letters = "bcdefg"
    for letter in letters:
        cars.extend(
            car_l.find_elements(By.CLASS_NAME,f"col.vehicle-item.xl3.l4.m6.s12.order-{letter}"))
    #Devolver la list de vehículos como una variable.
    return cars

In [8]:
###TEST 1:
#Configurar la herramienta de navegación
url = r"https://ecuador.patiotuerca.com/usados/-/autos"
driver = webdriver.Chrome()
#Abrir página web
driver.get(url)
#Generar la lista de vehículos
cars = nav(driver)
print(len(cars))

NameError: name 'nav' is not defined

### Paso 2: Abrir todos los vehículos de la lista y extraer la información

Ahora que se dispone de una lista de vehículos, necesitamos completar el paso 2 mencionado al inicio de la sección. Para esto vamos a hacer una función que itera sobre cada uno de los vehículos, los abre y extrae toda su información.

In [9]:
#Expresar el código que abre un solo carro y extrae su información como una función.
def saveInfo(driver,source):
    soup = BeautifulSoup(source)
    basic = soup.find("div",class_="row m-t")
    basics = basic.find_all("div","col l3 m3 s6 p-b")
    info = []

    for i in basics:
        #Limpiar la información
        simple = i.text.replace("\n","")
        #Convertir los elementos de texto en una lista
        tup = simple.split("  ")
        #print(simple) #For demonstration only
        #Remover elementos vacíos
        while "" in tup:
            tup.remove("")
        #print(tup) #For demonstration only
        info.append(tuple(tup))
        #Li

    #Guardar la información específica del vehículo
    specific = soup.find("section",id="technicalData")
    specifics = specific.find_all("div","col l4 m6 s6")

    for i in specifics:
        #Limpiar la información
        spec = i.text
#         print(spec)
        #Convertir los elementos de texto en una lista
        tup = spec.split("\n")
#         print(tup)
        #Remover elementos vacíos
        while "" in tup:
            tup.remove("")
        #Si el elemento tiene información incompleta:
        if len(tup) < 2:
            tup.append("")
        #Añadir la información organizada a la lista maestra de información
        info.append(tuple(tup))
#         print(tup)
    #Separar una lista de títulos y otra de información:
    print(len(info))
    display(info)
    headers,information = zip(*set(info))
    df = pd.DataFrame([information,information],columns = headers)
    display(df)
    
    driver.close()
    tabs = driver.window_handles
    driver.switch_to.window(tabs[0])
    return df

In [10]:
def extractInfo(driver,cars):
    #PASO 2: Iterar sobre la lista de vahículos 
    #Lista maestra para guardar la información de todos los vehículos:
    allinfo = []
    #Lista grande de encabezados para guardar todos los nombres posibles de columnas
    headers = []
    #Iterar sobre la lista de vehículos para 
    for car in cars:
        wait = WebDriverWait(driver,10)
        wait.until(EC.element_to_be_clickable(car))
        car.click()
        #El click hace que se abra una nueva pestaña; para interactuar con sus elementos hay que cambiarla
        tabs = driver.window_handles
        #A veces es posible que el navegador no pueda hacer click en el vehículo, en cuyo caso, no se abrirá ninguna pestaña.
        if len(tabs) != 2:
            print("Click Failed")
            #Si sucede esto, entonces se pasa al siguiente vehículo.
            continue
        #En caso de que sí funcione el click, pasamos a la siguiente pestaña.
        driver.switch_to.window(tabs[1])
        #Guardar el código HTML para extraer la información
        source = driver.page_source
        #A veces es posible que el carro ya haya sido vendido, en cuyo caso, no habrá información.
        try:
            #Extraer información
            df = saveInfo(driver,source)
            #Guardar la información de cada vehículo en una lista maestra:
            allinfo.append(df)
        except:
            #Si no hay información, se debe cerrar la pestaña y pasar al siguiente vehículo.
            driver.close()
            tabs = driver.window_handles
            driver.switch_to.window(tabs[0])
            continue
        time.sleep(2)
    return allinfo

In [11]:
len(extractInfo(driver,cars))

StaleElementReferenceException: Message: stale element reference: element is not attached to the page document
  (Session info: chrome=111.0.5563.64)
Stacktrace:
0   chromedriver                        0x000000010c9da428 chromedriver + 4899880
1   chromedriver                        0x000000010c957a23 chromedriver + 4364835
2   chromedriver                        0x000000010c5a1bf6 chromedriver + 474102
3   chromedriver                        0x000000010c5a5c94 chromedriver + 490644
4   chromedriver                        0x000000010c5a5876 chromedriver + 489590
5   chromedriver                        0x000000010c5a68f9 chromedriver + 493817
6   chromedriver                        0x000000010c6278b4 chromedriver + 1022132
7   chromedriver                        0x000000010c60b562 chromedriver + 906594
8   chromedriver                        0x000000010c626b5b chromedriver + 1018715
9   chromedriver                        0x000000010c60b333 chromedriver + 906035
10  chromedriver                        0x000000010c5d555f chromedriver + 685407
11  chromedriver                        0x000000010c5d6a7e chromedriver + 690814
12  chromedriver                        0x000000010c9a779e chromedriver + 4691870
13  chromedriver                        0x000000010c9ac961 chromedriver + 4712801
14  chromedriver                        0x000000010c9b32ff chromedriver + 4739839
15  chromedriver                        0x000000010c9ad85a chromedriver + 4716634
16  chromedriver                        0x000000010c97ffce chromedriver + 4530126
17  chromedriver                        0x000000010c9cd5c8 chromedriver + 4847048
18  chromedriver                        0x000000010c9cd747 chromedriver + 4847431
19  chromedriver                        0x000000010c9e287f chromedriver + 4933759
20  libsystem_pthread.dylib             0x00007fff204798fc _pthread_start + 224
21  libsystem_pthread.dylib             0x00007fff20475443 thread_start + 15


In [None]:
def lookForCars(num):
    info = []
    #While loop que recolecta información hasta que la lista de vehículos sea igual al número especificado
    while len(info) < num:
        #Generar la lista de vehículos:
        cars = nav(driver)
        #Añadir la información recolectada a otra lista
        info.extend(extractInfo(driver,cars))
        #PASO 3: Pasar a la siguiente página de vehículos
        #Encontrar el botón que permite pasar a la siguiente página de vehículos
        sig = driver.find_element(By.CLASS_NAME,"col.s12.m12.l12.center-align")
        #Pasar a la siguiente página de vehículos
        sig.click()
    return info

In [None]:
#PASO 1: Abrir la página web y extraer la lista de vehiculos
#Configurar la herramienta de navegación
url = r"https://ecuador.patiotuerca.com/usados/-/autos"
driver = webdriver.Chrome()
#Abrir página web
driver.get(url)
len(lookForCars(40))

In [None]:
tabs = driver.window_handles
driver.switch_to.window(tabs[0])

In [None]:
def lookForCars(driver,cars):
    #PASO 1: Abrir la página web y extraer la lista de vehiculos
    #Configurar la herramienta de navegación
    url = r"https://ecuador.patiotuerca.com/usados/-/autos"
    driver = webdriver.Chrome()
    #Abrir página web
    driver.get(url)
    #Generar la lista de vehículos:
    cars = nav(driver)
    
    #PASO 2: Iterar sobre la lista de vahículos 
    #Lista maestra para guardar la información de todos los vehículos:
    allinfo = []
    #Lista grande de encabezados para guardar todos los nombres posibles de columnas
    headers = []
    #Iterar sobre la lista de vehículos para 
    for car in cars:
        wait = WebDriverWait(driver,10)
        wait.until(EC.element_to_be_clickable(car))
        car.click()
        #El click hace que se abra una nueva pestaña; para interactuar con sus elementos hay que cambiarla
        tabs = driver.window_handles
        #A veces es posible que el navegador no pueda hacer click en el vehículo, en cuyo caso, no se abrirá ninguna pestaña.
        if len(tabs) != 2:
            print("Click Failed")
            #Si sucede esto, entonces se pasa al siguiente vehículo.
            continue
        #En caso de que sí funcione el click, pasamos a la siguiente pestaña.
        driver.switch_to.window(tabs[1])
        #Guardar el código HTML para extraer la información
        source = driver.page_source
        #A veces es posible que el carro ya haya sido vendido, en cuyo caso, no habrá información.
        try:
            #Extraer información
            df = saveInfo(driver,source)
            #Guardar la información de cada vehículo en una lista maestra:

            allinfo.append(df)
        except:
            #Si no hay información, se debe cerrar la pestaña y pasar al siguiente vehículo.
            driver.close()
            driver.switch_to.window(tabs[0])
            continue
        time.sleep(2)
    #Unificar toda la información en un solo DataFrame:
    final_info = pd.concat(allinfo)
    #Eliminar observaciones duplicadas
    final_info.drop_duplicates(inplace = True)
    #Reiniciar los valores del índice y eliminar la columna original del índice.
    final_info.reset_index(inplace = True,drop = True)
    display(final_info)
    return final_info
#Guardar la información en un archivo de Excel
# final_info.to_excel("carros.xlsx")

In [None]:
lookForCars(driver,cars)

#### Parte 3.5: Unificación de todos los códigos hechos.

In [None]:
#Unir todos los códigos en una sola celda
#Parte 1: Navegación Inicial.
#Importar librerías
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd
import time
#Configurar la herramienta de navegación
url = r"https://ecuador.patiotuerca.com/usados/-/autos"
driver = webdriver.Chrome()

#Abrir página web
driver.get(url)

#Lista de vehículos
car_l = driver.find_element(By.CLASS_NAME,"usedList.half-banner.full-item")
#Encontrar el link de cada vehículo (order a).
cars = car_l.find_elements(By.CLASS_NAME,"col.vehicle-item.xl3.l4.m6.s12.order-a")
#Añadir vehuculos (order b - g).
letters = "bcdefg"
for letter in letters:
    cars.extend(
        car_l.find_elements(By.CLASS_NAME,f"col.vehicle-item.xl3.l4.m6.s12.order-{letter}"))
len(cars)

#Partes 2 y 3: Utilización iterativa de la función de extracción de información.
#Extraer la información de cada vehículo:
allinfo = []
#Lista grande de encabezados para guardar todos los nombres posibles de columnas
headers = []
for car in cars:
    wait = WebDriverWait(driver,10)
    wait.until(EC.element_to_be_clickable(car))
    car.click()
    #El click hace que se abra una nueva pestaña; para interactuar con sus elementos hay que cambiarla
    tabs = driver.window_handles
    if len(tabs) != 2:
        print("Click Failed")
        continue
    driver.switch_to.window(tabs[1])
    #Guardar el código HTML
    source = driver.page_source
    try:
        #Extraer información
        df = saveInfo(driver,source)
        allinfo.append(df)
    except:
        driver.close()
        driver.switch_to.window(tabs[0])
        continue
    #Guardar la información de cada vehículo en una lista maestra:
    time.sleep(2)
#Guardar la información en un DataFrame
final_info = pd.concat(allinfo)
final_info.drop_duplicates(inplace = True)
final_info.reset_index(inplace = True,drop = True)
display(final_info)
#Guardar la información en un archivo de Excel
final_info.to_excel("carros.xlsx")

### Parte 1: Parámetros de Aseguramiento

In [None]:
#Importar librerías
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import Select
from selenium.webdriver.common.action_chains import ActionChains
#Configurar la herramienta de navegación
url = r"https://asegurame.org/cotizar-medico"
driver = webdriver.Chrome()

#Abrir página web
driver.get(url)

#Selector de días
día = driver.find_element(By.ID,"select-day")
#Opciones de días
d_opts = día.find_element(By.CLASS_NAME,"select-items").find_elements(
    By.CSS_SELECTOR,"*")

#Selector de mes
mes = driver.find_element(By.ID,"select-month")
#Opciones de meses
m_opts = mes.find_element(By.CLASS_NAME,"select-items").find_elements(
    By.CSS_SELECTOR,"*")

#Selector de año
año = driver.find_element(By.ID,"select-year")
#Opciones de años
a_opts = año.find_element(By.CLASS_NAME,"select-items").find_elements(
    By.CSS_SELECTOR,"*")


#Seleccionar valores para trabajar
#Día
día.click()
d_opts[2].click()
#Mes
mes.click()
m_opts[5].click()
#Año
año.click()
a_opts[34].click()

#Opciones de Sexo
sexo_m = driver.find_element(By.CLASS_NAME,"cotizador-origen-vehiculos")
sexos = sexo_m.find_elements(By.CLASS_NAME,"btn-centrar")
#Seleccionar Femenino
sexos[0].click()
#Seleccionar Masculino
sexos[1].click()

#Opciones de pareja a asegurar
pareja_m = driver.find_element(By.CLASS_NAME,"cotizador-origen-vehiculos.estado-civil")
pareja = pareja_m.find_elements(By.CLASS_NAME,"btn-centrar")
#Seleccionar Sí
pareja[0].click()
#Seleccionar No
pareja[1].click()

#Opciones de Hijos
hijos_m = driver.find_element(By.ID,"dependientesGM")
hijos = hijos_m.find_elements(By.CLASS_NAME,"btn-centrar")
#Seleccionar No
hijos[1].click()
#Seleccionar Si
hijos[0].click()

#¿Cuántos hijos?
q_hijos_m = driver.find_element(By.CLASS_NAME,"form-personal-info-ages")
q_hijos = driver.find_elements(By.CLASS_NAME,"radio-option-style")
#Clickear todas las opciones:
for q in q_hijos:
    q.click()
    
#Clickear el Botón de Continuar
driver.find_element(By.CLASS_NAME,"next-prev-butons").click()

### Parte 2: Información de Contacto

In [None]:
#Cajita de Nombre
nombre = driver.find_element(By.ID,"clienteNombre")
#Enviar nombre
nombre.send_keys("Poyo Cavayo")

#Escribir teléfono (directamente)
driver.find_element(By.ID,"clienteTelefono").send_keys("091234567")

#Escribir correo (directamente)
driver.find_element(By.NAME,"email_cliente").send_keys("poyitocavayo@gmail.com")

#Clickear botón de "No quiero ser contactado"
driver.find_element(By.CLASS_NAME,"items.no-contacto").click()

#Clickear el botón de Cotizar
driver.find_element(By.CLASS_NAME,"primary-boton-cotiza.as-btn-primary.personal-btn").click()

In [None]:
#Importar BeautifulSoup para extraer la información de la página web
from bs4 import BeautifulSoup
#Extraer el código fuente de la página web
source = driver.page_source

#Inicializar el programa que lee los elementos web
soup = BeautifulSoup(source,"lxml")

In [None]:
# tit = soup.find("div",class_="col-md-5 col-lg-3 contenedor-beneficios")
# tits = tit.find_all("p",class_="txt-contenido margin-cobertura")
# tits[-1]
# seg = soup.find("div",class_="col-lg-3 col-md-6 contenedor-seleccionado")

#Extraer información de las primas anuales de los seguros
primas = soup.find_all("h2",class_="m-0")
primas = [i.text for i in primas]
#Limpiar caracteres innecesarios
for i in range(len(primas)):
    item = primas[i]
    item = item.replace("L.","").replace(",","")
    primas[i] = item
    
#Calcular información de cuota anual

#Extraer información general de los seguros
nos = soup.find_all("p",class_="txt-contenido margin-cobertura")
nos = [str(i.text) for i in nos]

#Limpiar caracteres innecesarios
for i in range(len(nos)):
    item = nos[i]
    if i == 0: #Solo para demostración en el curso.
        print(f"""Información antes de la limpieza:
        {item}""")
    #Limpiar espacios en blanco, espacios verticales, signos de interrogación, símbolo de divisa
    #y comas separadoras de miles.¿
    item = item.replace("  ","").replace("\n","").replace("?","").replace("L.","").replace(",","")
    if i == 0: #Solo para demostración en el curso.
        print(f"Información después de la limpieza: \n{item}")
    nos[i] = item

#Limpiar información irrelevante
while "Proveedores de servicios médicos" in nos:
    nos.remove("Proveedores de servicios médicos")
        
#Contenedor de información de cada seguro
insurance = []
#Contenedor de información de todos los seguros
info = []
#Contador de número de seguro cotizado
count = 0

#Clasificar la información en cada contenedor
for i in range(len(nos)):
    #Añadir la información del seguro a la lista de seguros y limpiar la lista de información
    if len(insurance) == 12:
        #Insertar Cuota Mensual
        insurance.insert(0,("Cuota Mensual",float(primas[count])/12))
        #Insertar Prima Anual
        insurance.insert(0,("Prima",primas[count]))
        #Insertar la información completa del seguro en la lista de todos los seguros
        info.append(insurance)
        insurance = []
        count += 1
    #Separar el título de la información y la información per se.
    tag = nos.pop(0)
    data = nos.pop(0)
    #Añadir la información del seguro a la lista de información del seguro individual
    insurance.append((tag,data))
    if len(nos) == 0:
        break

In [None]:
#Hacer una sublista de los elementos pertinentes
info = info[:-10]
#Separar nombre de columnas e información en una lista:
n_cols = []
n_datos = []
for seguro in info:
    cols,datos = zip(*seguro)
    n_cols.append(cols)
    n_datos.append(datos)
display(n_datos)
n_cols = set(n_cols)
display(n_cols)
display(n_datos)

In [None]:
import pandas as pd
df = pd.DataFrame(n_datos,columns = cols,index = [f"Seguro #{i}" for i in range(1,len(info)+1)])
df.drop_duplicates()

# Sección 4: Iterar para n perfiles

En esta última sección, el objetivo es aprender a generar una gran variedad de perfiles diferentes y obtener las cotizaciones, automáticamente, para todos ellos.

## Paso 1: Generación de los perfiles de seguro

La idea general de lo que se quiere hacer en este paso es generar múltiples perfiles de personas a asegurar. Se busca generar casos diferentes de personas similares; por ejemplo: "Mujer de 18 años, *sin hijos*", "Mujer de 18 años, *con 1 hijo*", "Mujer de 18 años, *con 2 hijos*, etc.

In [None]:
#Generar los perfiles en base a la inoformación que solicita la página:
#Importar itertools para generar combinaciones de perfiles
import itertools as it
#Posibles valores de los perfiles:

#Año de nacimiento
años = [i for i in range(1,48)]    
#Sexo
sexos = [0,1]
#Hijos
hijos = [i for i in range(7)]

#Generar los perfiles de seguro
perfiles = list(it.product(años,sexos,hijos))

## Paso 2: Navegación iterada y extracción de perfiles de seguros

Este paso es muy similar que el aprendido en la sección 2. Con la particularidad de que todos los pasos se unen en uno solo y se los expresa dentro de una función, que toma como argumento los parámetros del asegurado. La idea detrás de esto es generar una lista de múltiples perfiles del asegurado, sobre la cual se puede iterar a la función de navegación y extracción de la información.

In [None]:
#Importar librerías
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd

import time

#Convertir el código de un perfil, en una función:
def nav(nac,sexo,dep):
    #Parte I: Alimentar el perfil al programa
    #Configurar la herramienta de navegación
    url = r"https://asegurame.org/cotizar-medico"
    driver = webdriver.Chrome()

    #Abrir página web
    driver.get(url)

    #Selector de días
    día = driver.find_element(By.ID,"select-day")
    #Opciones de días
    d_opts = día.find_element(By.CLASS_NAME,"select-items").find_elements(
        By.CSS_SELECTOR,"*")

    #Selector de mes
    mes = driver.find_element(By.ID,"select-month")
    #Opciones de meses
    m_opts = mes.find_element(By.CLASS_NAME,"select-items").find_elements(
        By.CSS_SELECTOR,"*")

    #Selector de año
    año = driver.find_element(By.ID,"select-year")
    #Opciones de años
    a_opts = año.find_element(By.CLASS_NAME,"select-items").find_elements(
        By.CSS_SELECTOR,"*")


    #Seleccionar valores para trabajar
    #Día
    día.click()
    d_opts[2].click()
    #Mes
    mes.click()
    m_opts[5].click()
    #Año
    año.click()
    a_opts[nac].click()

    #Opciones de Sexo
    sexo_m = driver.find_element(By.CLASS_NAME,"cotizador-origen-vehiculos")
    sexos = sexo_m.find_elements(By.CLASS_NAME,"btn-centrar")
    #Seleccionar Sexo Escogido en la Función
    sexos[sexo].click()

    #Opciones de pareja a asegurar
    pareja_m = driver.find_element(By.CLASS_NAME,"cotizador-origen-vehiculos.estado-civil")
    pareja = pareja_m.find_elements(By.CLASS_NAME,"btn-centrar")
    #Seleccionar No
    pareja[1].click()

    #Opciones de Hijos
    hijos_m = driver.find_element(By.ID,"dependientesGM")
    hijos = hijos_m.find_elements(By.CLASS_NAME,"btn-centrar")
    #Si no tiene hijos:
    if dep == 0:
        #Seleccionar la opción que indica que no se tiene hijos
        hijos[1].click()
    #Si tiene uno o más hijos:
    else:
        #Seleccionar la opción que indica que sí se tiene hijos
        hijos[0].click()
        #Opciones del número de hijos
        q_hijos_m = driver.find_element(By.CLASS_NAME,"form-personal-info-ages")
        q_hijos = driver.find_elements(By.CLASS_NAME,"radio-option-style")
        #Seleccionar el número específico de hijos
        q_hijos[dep-1].click()
    #Clickear el Botón de Continuar
    driver.find_element(By.CLASS_NAME,"next-prev-butons").click()
    
    #Parte II: Llenar la Información de Contacto
    #Cajita de Nombre
    nombre = driver.find_element(By.ID,"clienteNombre")
    #Enviar nombre
    nombre.send_keys("Poyo Cavayo")

    #Escribir teléfono (directamente)
    driver.find_element(By.ID,"clienteTelefono").send_keys("091234567")

    #Escribir correo (directamente)
    driver.find_element(By.NAME,"email_cliente").send_keys("poyitocavayo@gmail.com")

    #Clickear botón de "No quiero ser contactado"
    driver.find_element(By.CLASS_NAME,"items.no-contacto").click()

    #Clickear el botón de Cotizar
    driver.find_element(By.CLASS_NAME,"primary-boton-cotiza.as-btn-primary.personal-btn").click()


    #Parte III: Extraer y guardar la información
    #Esperar hasta que la información sea visible y guardable
    #Crear elemento WebDriverWait
    wait = WebDriverWait(driver,60)
    #Darle la instrucción de esperar hasta que la información aparezca
    wait.until(EC.presence_of_element_located((By.CLASS_NAME,"cont-boton")))
    #Indicador de que la espera ha finalizado
    print("Información Encontrada!")   

    #Extraer el código fuente de la página web
    source = driver.page_source
    #Inicializar el programa que lee los elementos web
    soup = BeautifulSoup(source,"lxml")
    
    #Extraer información de las primas anuales de los seguros
    primas = soup.find_all("h2",class_="m-0")
    primas = [i.text for i in primas]
    #Limpiar caracteres innecesarios
    for i in range(len(primas)):
        item = primas[i]
        item = item.replace("L.","").replace(",","")
        primas[i] = item

    #Calcular información de cuota anual

    #Extraer información general de los seguros
    nos = soup.find_all("p",class_="txt-contenido margin-cobertura")
    nos = [str(i.text) for i in nos]

    #Limpiar caracteres innecesarios
    for i in range(len(nos)):
        item = nos[i]
        #Limpiar espacios en blanco, espacios verticales, signos de interrogación, símbolo de divisa
        #y comas separadoras de miles.¿
        item = item.replace("  ","").replace("\n","").replace("?","").replace("L.","").replace(",","")
        nos[i] = item

    #Limpiar información irrelevante
    while "Proveedores de servicios médicos" in nos:
        nos.remove("Proveedores de servicios médicos")

    #Contenedor de información de cada seguro
    insurance = []
    #Contenedor de información de todos los seguros
    info = []
    #Contador de número de seguro cotizado
    count = 0

    #Clasificar la información en cada contenedor
    for i in range(len(nos)):
        #Añadir la información del seguro a la lista de seguros y limpiar la lista de información
        if len(insurance) == 12:
            #Insertar Cuota Mensual
            insurance.insert(0,("Cuota Mensual",float(primas[count])/12))
            #Insertar Prima Anual
            insurance.insert(0,("Prima",primas[count]))
            #Insertar la información completa del seguro en la lista de todos los seguros
            info.append(insurance)
            insurance = []
            count += 1
        #Separar el título de la información y la información per se.
        tag = nos.pop(0)
        data = nos.pop(0)
        #Añadir la información del seguro a la lista de información del seguro individual
        insurance.append((tag,data))
        if len(nos) == 0:
            break
            
    #Hacer una sublista de los elementos pertinentes
    info = info[:-10]
    #Separar nombre de columnas e información en una lista:
    n_cols = []
    n_datos = []
    for seguro in info:
        #Separar los títulos y los datos en listas individuales
        cols,datos = zip(*seguro)
        #Añadir los títulos y los datos separados en listas maestras
        n_cols.append(cols)
        n_datos.append(datos)
    n_cols = set(n_cols)
    #Organizar los datos en un DataFrame
    df = pd.DataFrame(n_datos,columns = cols,index = [f"Seguro #{i}" for i in range(1,len(info)+1)])
    df = df.drop_duplicates()
    #Guardar la información del perfil en el DataFrame, para poder hacer comparaciones entre perfiles
    #Años de Edad
    df.insert(1,"Edad", nac+17)
    #Sexo
    df.insert(2,"Sexo",sexo)
    #Hijos
    df.insert(3,"Hijos",dep)
    
    display(df)
    return driver, df

In [None]:
start = time.time()
df = nav(*perfiles[:10])
end = time.time()
print(end-start)

In [None]:
start = time.time()
data = []
#Iterar para 10 perfiles
for i in perfiles[:10]:
    data.append(nav(*i)[1])
#Unir todos los dataframes de la lista en uno solo
master_data = pd.concat(data)
end = time.time()
print(f"Total iteration time is: {start-end} seconds")

In [None]:
pd.concat(data)

In [None]:
perfiles[250]

## Paso 3: Iterar la función para múltiples perfiles del asegurado y guardar la información en un DataFrame

Con toda la infraestructura del código ya construida, se puede proceder a usar la función diseñada en el paso 2 para cada uno de los perfiles generados en el paso 1. La idea es guardar todos los dataframes de las cotizaciones de cada perfil en un solo DataFrame

In [None]:
import requests
from bs4 import BeautifulSoup

url = "https://data.worldbank.org/country/ecuador"

# Make a request to the website
res = requests.get(url)

# Use BeautifulSoup to parse the HTML content
soup = BeautifulSoup(res.text, "html.parser")

# Find the table with the data we want to scrape
table = soup.find("table", class_= "table-chart")

# Find the row with the GDP data
gdp_row = table.find("tr", "data-topic" = "NY.GDP.MKTP.CD")

# Extract the GDP data
gdp = gdp_row.find("td", class_= "text-right").text.strip()

# Save the GDP data to a text file
with open("ecuador_gdp.txt", "w") as file:
    file.write(gdp)






        