#**Laboratorio Estructura de datos II**

* Wilson Estrada Ortega
* Maria Camila Pinzon
* Orlando Junior Rengifo




In [45]:
import pandas as pd
archivo_csv = 'co_properties_final.csv'
# Lee el archivo Excel en un DataFrame
df = pd.read_csv(archivo_csv)

In [46]:
#Se crean las clases de pilas y colas para su posterior uso
from typing import Any, List, Optional
class Stack:
    def __init__(self, size: int) -> None:
        self.stack: List[Any] = []
        self.size = size
    def __repr__(self) -> str:
        return str(self.stack)
    def add(self, elem: Any) -> None:
        if len(self.stack) >= self.size:
            raise ValueError('The Stack is full')
        self.stack.append(elem)
    def remove(self) -> Any:
        if not self.stack:
            raise ValueError('The Stack is empty')
        return self.stack.pop()
    def is_empty(self) -> bool:
        return len(self.stack) == 0

class Queue:
    def __init__(self, size: int) -> None:
        self.queue: List[Any] = []
        self.size = size
    def __repr__(self) -> str:
        return str(self.queue)
    def add(self, elem: Any) -> None:
        if len(self.queue) >= self.size:
            raise ValueError('The Queue is full')
        self.queue.append(elem)
    def remove(self) -> Any:
        if not self.queue:
            raise ValueError('The Queue is empty')
        return self.queue.pop(0)
    def is_empty(self) -> bool:
        return len(self.queue) == 0

In [47]:
# Recorrido por niveles
def height_recursive(node)->int:
    ## Funcion para tener de manera recursiva la altura de un nodo en especifico
    if node is None:
        return 0
    else:
        # Calcula la altura de cada subarbol
        left_height = height_recursive(node.left)
        right_height = height_recursive(node.right)
        # Se escoge la mayor
        if left_height > right_height:
            return left_height+1
        else:
            return right_height+1


def levels_recursive(node)->None:
    ## Funcion para Recorrer el arbol por niveles de forma recursiva
    if node is None:
        return
    # Si es vacio no retorna nada
    def printlevel(node,level):
        #
        if node is None:
            return
        if level == 1:
            # Permite imprimir los valores por nivel
            print(node.val, end=' ')
        else:
            printlevel(node.left, level-1)
            # Decrece el level hasta llegar a que valga 1 y poder imprimir el nodo
            printlevel(node.right, level-1)
    for level in range(1,height_recursive(node)+1):
        # Permite imprimir cada uno de los niveles correspondientes, esto se hace mediante level que va incrementando
        # en el ciclo for, lo que permite cada vez llegar un nivel mas abajo en los nodos.
        printlevel(node, level)

In [48]:
# Factor de balanceo
def height_not_recursive(node)->int:
    # Funcion no recursiva mediante colas para verificar la altura de un nodo.
    if node is None:
        return 0
    else:
        p, q, l = node, Queue(250), 0
        q.add(p)
        while not q.is_empty():
            # Aumenta l segun el nivel visitado, por eso se remueven todos los nodos de la cola para almacenar
            # los del siguiente nivel
            per_level = len(q.queue)
            for i in range(per_level):
                p = q.remove()
                if p.left is not None:
                    q.add(p.left)
                if p.right is not None:
                    q.add(p.right)

            l += 1
        return l

def balance_factor(node) -> int:
    # Funcion que permite retornar el factor de balanceo de un nodo dado.
    if node is None:
        return False
    return height_not_recursive(node.right) - height_not_recursive(node.left)

In [49]:
# nivel de un nodo
def searchlevel_tree(node,element):
    # Funcion que retorna el nivel de un nodo
    # Los niveles comienzan desde 0 que es el de la raiz.
    p, q, l = node, Queue(250), 0
    q.add(p)
    while not q.is_empty():
        per_level = len(q.queue)
        for i in range(per_level):
            p = q.remove()
            if p.val == element:
                return l
            if p.left is not None:
                q.add(p.left)

            if p.right is not None:
                q.add(p.right)
        l += 1
    return False

In [50]:
# Padre de un nodo
def searchfather(node,element):
    # Función para obtener el padre de un nodo
    father = None
    p,q,f = node, Queue(250), Queue(250)
    q.add(p)
    f.add(father)
    while not q.is_empty():
        p = q.remove()
        f_ = f.remove()
        if p.val == element:
            return f_
        # En cada iteracion se va guardando en la cola, el respectivo nodo con su padre para tener la referencia.
        if p.left is not None:
            q.add(p.left)
            f.add(p)
        if p.right is not None:
            q.add(p.right)
            f.add(p)

In [51]:
# Abuelo
def searchgp(node, element):
    # Funcion para encontrar el abuelo de un Nodo
    father, grandpa = None, None
    p, q, f, g = node, Queue(250), Queue(250), Queue(250)
    q.add(p)
    f.add(father)
    g.add(grandpa)
    while not q.is_empty():
        p = q.remove()
        f_ = f.remove()
        g_ = g.remove()
        if p.val == element:
            return g_
        # Se hace necesario que se agreguen a la pila cada valor para mantener la referencia del nodo con su padre
        # y abuelo
        if p.left is not None:
            q.add(p.left)
            f.add(p)
            g.add(f_)
        if p.right is not None:
            q.add(p.right)
            f.add(p)
            g.add(f_)

In [52]:
# Tio
def searchuncle(node, element):
    father, uncle = None, None
    p, q, f, u = node, Queue(250), Queue(250), Queue(250)
    q.add(p)
    f.add(father)
    u.add(uncle)
    while not q.is_empty():
        p = q.remove()
        f_ = f.remove()
        u_ = u.remove()
        if p.val == element:
            return u_
        if p.left is not None:
            q.add(p.left)
            f.add(p)
            if (f_ is not None):
                if (p == f_.left):
                    u.add(f_.right)
                else:
                    u.add(f_.left)
            else:
                u.add(None)
        if p.right is not None:
            q.add(p.right)
            f.add(p)
            if (f_ is not None):
                if (p == f_.left):
                    u.add(f_.right)
                else:
                    u.add(f_.left)
            else:
                u.add(None)

In [53]:
def number_nodes(node):
    # Funcion que permite saber cuantos nodos hay en un arbol
    p,q, plus = node,Stack(250), 0
    q.add(p)
    while not q.is_empty():
        # Por medio de un recorrido por niveles se recorre cada nodo y si existe el nodo
        # Se aumenta el contador
        p = q.remove()
        plus += 1
        if p.left is not None:
            q.add(p.left)
        if p.right is not None:
            q.add(p.right)
    return plus

def search_node(node,element):
    # Funcion para buscar un nodo en un arbol
    # Te retornara el nodo como tal
    listnode = []
    p, q = node, Queue(250)
    q.add(p)
    while not q.is_empty():
        # Se hace un recorrido por niveles y se verifica si la informacion del nodo actul corresponde con la del valor a buscar
        p = q.remove()
        if p.val == element:
            listnode.append(p)
            return listnode
        if p.left is not None:
            q.add(p.left)

        if p.right is not None:
            q.add(p.right)
    return False

In [54]:
def filter_by(root):
    def search_tree(node, criteria, result):
        # Funcion que hace el filtro de los nodos segun los criterios
        if all(compare(node.cha[key], value, op) for key, (value, op) in criteria.items()):
            # itera sobre cada uno de los criterios y si unicamente el nodo cumple todos es que se agrega
            result.append(node)
        # De forma recursiva se hace el filtro para llegar a todos los nodos del arbol
        if node.left is not None:
            search_tree(node.left, criteria, result)
        if node.right is not None:
            search_tree(node.right, criteria, result)

    def compare(value1, value2, operation):
        # Funcion que permite controlar el manejo de las operaciones entre los parametros y los valores
        # Se revisa que tipo de operacion y segun eso se retorna un booleano.
        if operation == '==':
            return value1 == value2
        elif operation == '<':
            return value1 < value2
        elif operation == '>':
            return value1 > value2
        elif operation == '<=':
            return value1 <= value2
        elif operation == '>=':
            return value1 >= value2
        else:
            return False

    def fill_possible_criteria():
        #Funcion que obtiene los parametros digitados por el usuario
        n = int(input("Digite el numero de criterios a seleccionar: "))
        plist = []
        for i in range(n):
            x = input(f"Digite el criterio #{i+1}: ")
            plist.append(x)
        return plist

    criteria = {}
    possible_criteria = fill_possible_criteria()

    for criterion in possible_criteria:
        if criterion is not None:
            operation = input(f'Ingrese la operación para {criterion} (ejemplo: ==, <, >, <=, >=): ')
            if criterion == 'city':
                value = input(f'Ingrese el valor para {criterion}: ')
                criteria[criterion] = (value, operation)
            else:
                value = float(input(f'Ingrese el valor para {criterion}: '))
                criteria[criterion] = (value, operation)

    results = []
    search_tree(root, criteria, results)

    return results

In [72]:
import pandas as pd
import plotly.graph_objects as go
class AVL_Tree(object):

    def __init__(self):
        self.root = None
    def visualize_tree(self):
        ## Funciones para graficar el arbol de forma simetrica.
        fig = go.Figure()
        if self.root:
            fig.add_trace(go.Scatter(x=[0], y=[0], mode='markers+text', text=[],
                                     textposition="bottom center",hoverinfo='text', hovertext = f"Metrica: {self.root.val}, bedrooms: {self.root.cha['bedrooms']}, Factor Balanceo: {balance_factor(self.root)}"))
            ## Como Info de cada nodo se muestra la primera metrica, el
            self.plot_tree(fig, self.root, x=[0], y=[0], depth=1)
        fig.update_layout(showlegend=False)
        fig.show()

    def plot_tree(self, fig, node, x, y, depth):
        if node.left:
            x_left = x[0] - 2 ** (6 - depth)
            y_left = y[0] - 0.1
            fig.add_trace(go.Scatter(x=[x_left], y=[y_left], mode='markers+text', text=[],
                                     textposition="bottom center",hoverinfo='text', hovertext = f"Metrica: {node.left.val}, bedrooms: {node.left.cha['bedrooms']}, Factor Balanceo: {balance_factor(node.left)}"))
            fig.add_trace(go.Scatter(x=[x[0], x_left], y=[y[0], y_left], mode='lines'))
            self.plot_tree(fig, node.left, x=[x_left], y=[y_left], depth=depth + 1)
        if node.right:
            x_right = x[0] + 2 ** (6 - depth)
            y_right = y[0] - 0.1
            fig.add_trace(go.Scatter(x=[x_right], y=[y_right], mode='markers+text', text=[],
                                     textposition="bottom center",hoverinfo='text', hovertext = f"Metrica: {node.right.val}, bedrooms: {node.right.cha['bedrooms']}, Factor Balanceo: {balance_factor(node.right)}"))
            fig.add_trace(go.Scatter(x=[x[0], x_right], y=[y[0], y_right], mode='lines'))
            self.plot_tree(fig, node.right, x=[x_right], y=[y_right], depth=depth + 1)

    def insert(self, root, key, values):
        #Funcion que permite la insercion de un nodo en el arbol
        if not root:
            return TreeNode(key,values)
        #Si es el primer nodo se devuleve como raiz
        elif key < root.val or (key == root.val and values['bedrooms'] < root.cha['bedrooms']):
            root.left = self.insert(root.left, key, values)
            ## Verifica la primera y segunda metrica para saber si va a la derecha o izquierda del padre
            ## Se reconstuye cada subarbol de manera recursiva
        else:
            root.right = self.insert(root.right, key, values)
        #Este proceso se realiza con cada nodo excepto la hoja que se insertó, para saber el factor de balanceo
        # y balancearlo en caso de que sea necesario
        # Se actualiza la altura
        root.height = 1 + max(self.getHeight(root.left),self.getHeight(root.right))
        #Se toma el factor de balanceo
        balance = self.getBalance(root)
        # Si el nodo esta desbalanceado
        # Se prueban todos los posibles casos
        # 1 Simple izquierda
        if balance > 1 and key < root.left.val:
            return self.rightRotate(root)
        # 2 Simple derecha
        if balance < -1 and key > root.right.val:
            return self.leftRotate(root)
        # Izquierda derecha
        if balance > 1 and key > root.left.val:
            root.left = self.leftRotate(root.left)
            return self.rightRotate(root)
        # Derecha izquierda
        if balance < -1 and key < root.right.val:
            root.right = self.rightRotate(root.right)
            return self.leftRotate(root)
        return root

    def delete(self, root, key):
        # Funcion que elimina un nodo dado de manera recursiva
        # Retorna el nuevo root
        # Balancea el arbol en caso de ser necesario
        if not root:
            return root
        # Se elimina de manera normal el nodo pero de forma recursiva
        elif key < root.val:
            root.left = self.delete(root.left, key)
        elif key > root.val:
            root.right = self.delete(root.right, key)
        else:
            if root.left is None:
                temp = root.right
                root = None
                return temp
            elif root.right is None:
                temp = root.left
                root = None
                return temp

            temp = self.getMinValueNode(root.right)
            root.val = temp.val
            root.right = self.delete(root.right,temp.val)
        # Unico nodo
        if root is None:
            return root
        #Actualiza la altura
        root.height = 1 + max(self.getHeight(root.left),self.getHeight(root.right))
        # Factor de balanceo
        balance = self.getBalance(root)
        # Nodo desbalanceado
        # S.I
        if balance > 1 and self.getBalance(root.left) >= 0:
            return self.rightRotate(root)

        # S.D
        if balance < -1 and self.getBalance(root.right) <= 0:
            return self.leftRotate(root)

        # D.I.D
        if balance > 1 and self.getBalance(root.left) < 0:
            root.left = self.leftRotate(root.left)
            return self.rightRotate(root)

        # D.D.I
        if balance < -1 and self.getBalance(root.right) > 0:
            root.right = self.rightRotate(root.right)
            return self.leftRotate(root)
        return root

    # Funciones para hacer las respectivas rotaciones
    def leftRotate(self, z):
        y = z.right
        T2 = y.left
        y.left = z
        z.right = T2
        z.height = 1 + max(self.getHeight(z.left),self.getHeight(z.right))
        y.height = 1 + max(self.getHeight(y.left),self.getHeight(y.right))
        # Retorna el nuevo root
        return y

    def rightRotate(self, z):
        y = z.left
        T3 = y.right
        y.right = z
        z.left = T3
        z.height = 1 + max(self.getHeight(z.left),self.getHeight(z.right))
        y.height = 1 + max(self.getHeight(y.left),self.getHeight(y.right))
        # Retorna el nuevo root
        return y

    def getHeight(self, root):
        #Funcion para obtener altura
        if not root:
            return 0
        return root.height

    def getBalance(self, root):
        # Funcion para factor de balanceo
        if not root:
            return 0
        return self.getHeight(root.left) - self.getHeight(root.right)

    def getMinValueNode(self, root):
        # Minimo valor de un subarbol
        #Se usa para la eliminacion mediante el sucesor
        if root is None or root.left is None:
            return root
        return self.getMinValueNode(root.left)


In [56]:
df.head()

Unnamed: 0,title,department,city,property_type,latitude,longitude,surface_total,surface_covered,bedrooms,bathrooms,operation_type,price
0,Apartamento En Arriendo/venta En Barranquilla ...,Atlántico,Barranquilla,Apartamento,11.013,-74.836,70.0,70.0,1.0,2.0,Venta,250000000.0
1,Casa En Venta En Cali Ciudad Jardn Cod. VVLZ3039,Valle del Cauca,Cali,Casa,3.368,-76.531,420.0,420.0,5.0,5.0,Venta,950000000.0
2,Casa En Arriendo/venta En Barranquilla Bellavi...,Atlántico,Barranquilla,Casa,10.997,-74.791,83.0,150.0,3.0,3.0,Venta,320000000.0
3,Casa En Arriendo En Chia Chia Cod. AINH2992,Cundinamarca,Chía,Casa,4.845,-74.057,580.0,2.0,8.0,3.0,Arriendo,8000000.0
4,Apartamento En Arriendo En Cali Ciudad Crdoba ...,Valle del Cauca,Cali,Apartamento,3.402,-76.507,56.0,56.0,3.0,1.0,Arriendo,550000.0


In [57]:
import pandas as pd
class TreeNode(object):
    # Clase para crear cada uno de los nodos
    def __init__(self, val, cha):
        self.val = val # Metrica usada
        self.cha = cha # Todos los datos del nodo guardados en un diccionario
        self.left = None
        self.right = None
        self.height = 1
    def __repr__(self) -> str:
        return f'Node({self.val})'

def fill(df):
    #Funcion que permite crear y llenar el primer arbol con todos los datos del dataframe
    myTree = AVL_Tree()
    for index, row in df.iterrows():
        # Itera sobre cada una de las filas
        # Se puede acceder a los valores especificos
        # Estos valores se guardan como diccionario en cada uno de los nodos
        price_per_surface = row['price'] / row['surface_total']
        cha = {
            "department":row["department"],
            "city":row["city"],
            "property_type":row["property_type"],
            "latitude":row["latitude"],
            "longitude":row["longitude"],
            "surface_total":row["surface_total"],
            "surface_covered":row["surface_covered"],
            "bedrooms":row["bedrooms"],
            "bathrooms":row["bathrooms"],
            "operation_type":row["operation_type"],
            "price":row["price"]
        }
        myTree.root = myTree.insert(myTree.root, price_per_surface, cha)
    return myTree

In [58]:
tree = fill(df)

In [59]:

def insert_node(tree):
    # Funcion para insertar un nodo
    department = input("Digite el departamento: ")
    city = input("Digite la ciudad: ")
    property_type = input("Digite el tipo de propiedad: ")
    latitude = int(input("Digite la latiud "))
    longitude = int(input("Digite la longitud: "))
    surface_total = int(input("Digite el surface total: "))
    surface_covered = int(input("Digite el surface covered: "))
    bedrooms = int(input("Digite el numero de habitaciones: "))
    bathrooms = int(input("Digite el numero de baños: "))
    operation_type = input("Digite el tipo de operacion: ")
    price = int(input("Digite el precio: "))
    # Se preguntna todas las variables al usuario y se mandan en un diccionario al nuevo nodo insertado
    price_per_surface  = price/surface_total
    cha = {
        "department":department,
        "city":city,
        "property_type":property_type,
        "latitude":latitude,
        "longitude":latitude,
        "surface_total":surface_total,
        "surface_covered":surface_covered,
        "bedrooms":bedrooms,
        "bathrooms":bathrooms,
        "operation_type":operation_type,
        "price":price
    }

    tree.insert(tree.root, price_per_surface, cha)

In [60]:
# Pruebas de las funciones anteriormente hechas
print(searchgp(tree.root,9821.42857142857))
print(searchuncle(tree.root,9821.42857142857))
print(searchfather(tree.root,9821.42857142857))
print(searchlevel_tree(tree.root,9821.42857142857))
print(balance_factor(tree.root.left.left.left.left.right))

Node(10285.714285714286)
Node(12359.550561797752)
Node(8163.265306122449)
5
0


In [61]:
def menu2(tree,list_nodes):
    # Funcion correspondiente al segundo menu de la opcion 3 y 4 del primer menu
    print(list_nodes)
    index_select_node = int(input("Seleccione cual nodo escoger: "))
    node_selected = list_nodes[index_select_node - 1]
    # Se escoge la opcion y segun eso se llama a la funcion indicada
    while True:
        print("Opciones:")
        print("1. Nivel del nodo")
        print("2. Factor de balanceo del nodo")
        print("3. Padre del nodo")
        print("4. Abuelo del nodo")
        print("5. Tio del nodo")
        print("0. Salir")
        select = int(input("Seleccione una opción (1-5): "))
        if select == 0:
            break
        if select == 1:
            print(searchlevel_tree(tree.root,node_selected.val))
        elif select == 2:
            print(balance_factor(node_selected))
        elif select == 3:
            print(searchfather(tree.root,node_selected.val))
        elif select == 4:
            print(searchgp(tree.root,node_selected.val))
        elif select == 5:
            print(searchuncle(tree.root,node_selected.val))
        else:
            print("Opción no válida. Por favor, seleccione una opción válida (1-5).")

In [62]:
# Prueba de eliminado
tree.delete(tree.root,2000001)

Node(1187371.3109128345)

In [63]:
# Prueba de busqueda
print(search_node(tree.root,9821.42857142857))

[Node(9821.42857142857)]


In [64]:
# Prueba de recorrido por niveles
print(levels_recursive(tree.root))

1187371.3109128345 18853.69532428356 3571428.5714285714 13793.103448275862 31428.571428571428 2444444.4444444445 4753519.736842105 10285.714285714286 15625.0 24390.243902439026 45370.85744345081 2155172.4137931033 2890625.0 3865979.381443299 6388888.888888889 8163.265306122449 12359.550561797752 14545.454545454546 17142.85714285714 19767.441860465115 27239.150507848568 39600.0 146198.8304093567 1741293.5323383084 2261904.761904762 2578947.3684210526 3243243.243243243 3833333.3333333335 4263565.891472869 5147058.823529412 8080808.080808081 1750.0 9821.42857142857 11538.461538461539 12413.793103448275 14444.444444444445 15333.333333333334 16470.58823529412 18000.0 19354.83870967742 21025.641025641027 24603.174603174604 28571.428571428572 35002.32558139535 41538.46153846154 54545.454545454544 930851.0638297872 1500000.0 1934523.8095238095 2166666.6666666665 2368421.052631579 2500000.0 2790697.6744186045 3064516.129032258 3384615.3846153845 3787878.787878788 3855421.686746988 4137931.03448

In [65]:
# Filtrar df
df_filtrado = df.loc[df['bathrooms'] > 6]
df_filtrado

Unnamed: 0,title,department,city,property_type,latitude,longitude,surface_total,surface_covered,bedrooms,bathrooms,operation_type,price
29,Edificio En Venta En Cali San Fernando Cod. VB...,Valle del Cauca,Cali,Otro,3.431,-76.542,600.0,600.0,9.0,9.0,Venta,1300000000.0
35,Casa Campestre En Venta En Medellin Los Balsos...,Antioquia,Medellín,Casa,6.238,-75.574,1900.0,1115.0,5.0,7.0,Venta,4500000000.0
59,Casa En Arriendo En Cali Prados Del Norte Cod....,Valle del Cauca,Cali,Casa,3.472,-76.522,350.0,350.0,6.0,7.0,Arriendo,3600000.0


In [73]:
def main():
    # Funcion del menu principal con el que interactuará el usuario.
    tree = fill(df)
    tree.visualize_tree()
    # LLenado y creacion del arbol
    while True:
        print()
        print("Opciones:")
        print("1. Insertar nodo")
        print("2. Eliminar nodo")
        print("3. Buscar un nodo por metrica inicial")
        print("4. Buscar nodos por metricas")
        print("5. Recorrido por niveles")
        print("0. Salir")
        print()
        select = int(input("Seleccione una opción (1-5): "))
        # Se elige una opcion y segun eso se llama a la funcion correspondiente
        if select == 0:
            print()
            print("Gracias por usar la app!")
            break
        if select == 1:
            insert_node(tree)
            tree.visualize_tree()
        elif select == 2:
            metric_delete = float(input(f'Digite el nodo a eliminar: '))
            tree.delete(tree.root,metric_delete)
            tree.visualize_tree()
        elif select == 3:
            metric_search = float(input(f'Digite el nodo a buscar '))
            node_search =  search_node(tree.root,metric_search)
            menu2(tree,node_search)
            pass
        elif select == 4:
            nodes_searchs = filter_by(tree.root)
            menu2(tree,nodes_searchs)
            pass
        elif select == 5:
            print(levels_recursive(tree.root))
        else:
            print("Opción no válida. Por favor, seleccione una opción válida (1-5).")

In [74]:
# Ejecucion del codigo principal.
if __name__ == "__main__":
    main()


Opciones:
1. Insertar nodo
2. Eliminar nodo
3. Buscar un nodo por metrica inicial
4. Buscar nodos por metricas
5. Recorrido por niveles
0. Salir

Seleccione una opción (1-5): 0

Gracias por usar la app!
