<a href="https://colab.research.google.com/github/valentitos/Colabs-CC1002/blob/main/Clase_15_CasoEstudio_II/Clase15_Caso_Estudio_II.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Clase 15: Caso de Estudio II

## Caso de estudio II

Para una investigación sobre redes sociales, se están recopilando los siguientes datos de diversas cuentas de Instagram:

- Tag de la cuenta (``@``)

- Nombre de la cuenta

- Cantidad de seguidores (Followers)

Un grupo de investigadores le pide ayuda para poder almacenar todos estos datos y así realizar estudios interesantes. Para empezar, cuentan con la Estructura `Cuenta`, que permite almacenar los datos de una cuenta de Instagram en particular:


In [1]:
import estructura
from lista import *
from arbol import *

In [2]:
# Cuenta: tag(str) nombre(str) seguidores(int)
estructura.crear('Cuenta','tag nombre seg')

Y cuentan con varias cuentas ya registradas:

In [3]:
Calma = Cuenta('alma.observatory', 'ALMA observatory' , 142000)
Chaya = Cuenta('chayanne' , 'Chayanne' , 6800000)
Conf  = Cuenta('noot.notbeaucheems','Confesiones NootNoot', 2400)
Cval  = Cuenta('playvalorantofficial' , 'VALORANT' , 1100000)
Cpok  = Cuenta('pokemon' , 'Pokemon' , 4100000)
Cspy  = Cuenta('spyfamily_en' , 'SPY x FAMILY' , 199000)
Cwill = Cuenta('willowthesquishycat' , 'Willow' , 57100)

<div><img src="cuentas_sueltas.svg" width="40%;"/></div>

Estas cuentas las tienen organizadas en un Árbol de Búsqueda Binaria (ABB), ordenado por `tags`


<div><img src="ABB_instaV2.svg" width="60%;"/></div>

In [5]:
ABBcuentas = AB(Cval, AB(Chaya, AB(Calma, arbolVacio, arbolVacio),
                                AB(Conf, arbolVacio, arbolVacio)),
                      AB(Cspy, AB(Cpok, arbolVacio, arbolVacio),
                               AB(Cwill, arbolVacio, arbolVacio)))



Con esto, nos piden ayuda para realizar las siguientes operaciones sobre un ABB de Cuentas

- Agregar una Cuenta al árbol

- Buscar un tag en el árbol, y entregar su Cuenta asociada

- Editar el dato de seguidores de una Cuenta guardada en el árbol

- Borrar una Cuenta del árbol, dado un tag

También nos indican que podemos asumir que no hay cuentas repetidas en el ABB

### Parentesis Cultural

En el mundo de la computación (Ingeniería de Software), estas cuatro operaciones se conocen bajo el acrónimo **CRUD**

- `Create`: Crear un nuevo registro

- `Read`: Leer/obtener los datos asociados a un registro

- `Update`: Cambiar la información de un registro

- `Delete`: Borrar un registro
 
Por lo que, en concreto, crearemos las siguientes 4 funciones:

- `agregar(AC, NC)`: Agrega una nueva Cuenta `NC` al ABB de Cuentas `AC`

- `buscar(AC, tag)`: Busca la información de la Cuenta asociada al `tag` entregado y entrega la Cuenta si la encuentra.

- `cambiar(AC, tag, n)`: Busca la cuenta asociada al `tag` entregado, y modifica su cantidad de seguidores por el valor `n` entregado

- `eliminar(AC,tag)`: Elimina del Árbol la cuenta asociada al `tag` indicado





## ABB de Cuentas (función `buscar`)

Como estamos trabajando sobre un ABB, podemos usar su propiedad de orden. En este caso, las cuentas se encuentran ordenadas por `tag`.

- Revisamos el nodo actual, extrayendo el dato del `tag` guardado, y lo comparamos con el `tag` buscado

  - Si coinciden, entonces ganamos y entregamos la Cuenta actual
  
  - Si el `tag` actual es **menor** que el buscado, entonces seguimos la búsqueda en la rama `izq` del ABB

  - Si el `tag` actual es **mayor** que el buscado, entonces seguimos la búsqueda en la rama `der` del ABB

- Si llegamos al `arbolVacio`, entonces la cuenta no existe 

En este ejemplo, por la propiedad de orden, sabemos que `"pokemon"` , si es que existe en el ABB, debe encontrarse a la derecha de `"playvalorant…"`, y a su vez, sabemos que `"pokemon"` , si es que existe en el ABB, debe encontrarse a la izquierda de `"spyfamily…"`. Como nos encontramos eventualmente con `"pokemon"`, entonces existe en el árbol, y entregamos la cuenta asociada 



<div><img src="ABB_insta_buscar1.svg" width="50%;"/><img src="ABB_insta_buscar2.svg" width="50%;"/></div>
<div><img src="ABB_insta_buscar3.svg" width="50%;"/></div>

En este ejemplo, por la propiedad de orden, sabemos que `"mylittlepony"` , si es que existe en el ABB, debe encontrarse a la izquierda de `"playvalorant…"`, y a su vez, sabemos que `"mylittlepony"` , si es que existe en el ABB, debe encontrarse a la derecha de `"chayanne"`, y a su vez, sabemos que `"mylittlepony"` , si es que existe en el ABB, debe encontrarse a la derecha de `"confesiones_beaucheems"`. Finalmente, como llegamos a un nodo vacío, el elemento buscado no existe, ya que si existiese, si o si tiene que estar acá.


<div><img src="ABB_insta_buscarinf1.svg" width="50%;"/><img src="ABB_insta_buscarinf2.svg" width="50%;"/></div>
<div><img src="ABB_insta_buscarinf3.svg" width="50%;"/><img src="ABB_insta_buscarinf4.svg" width="50%;"/></div>








In [11]:
# buscar: AB(Cuenta) str -> Cuenta | None
# busca un tag en el ABB y entrega sus datos asociados
# Ej: buscar(ABBcuentas,'pewdiepie') entrega None
def buscar(AC, tag):
    assert esAB(AC) and type(tag) == str
    
    #CB: el nodo vacio nos dice que el elemento no existia
    if AC == arbolVacio:
        return None
    
    act = AC.valor
    # Si el tag del nodo actual coincide con el buscado, 
    # entonces entregamos la cuenta completa
    if act.tag == tag:
        return act
    # Si no coinciden, vemos por que rama hay que seguir la búsqueda
    elif act.tag > tag:  
        return buscar(AC.izq, tag)
    else:
        return buscar(AC.der, tag)

# Test
assert buscar(ABBcuentas, 'pewdiepie') == None 
assert buscar(ABBcuentas, 'pokemon') == Cpok

In [9]:
print(buscar(ABBcuentas, 'pewdiepie'))

None


In [10]:
buscar(ABBcuentas, 'pokemon')

Cuenta(tag='pokemon', nombre='Pokemon', seg=4100000)

## ABB de Cuentas (función `agregar`)

Cuando estamos modificando un ABB (en este caso agregando un nuevo elemento), tenemos que preservar la propiedad de orden. Para ello, realizamos algo similar a la búsqueda

- Revisamos el nodo actual, extrayendo el dato del `tag` guardado, y lo comparamos con el `tag` de la cuenta a agregar

  - Si coinciden, entonces la cuenta ya existía… no hacemos nada

  - Si el `tag` actual es **menor** que el que será agregado, entonces la nueva cuenta debe ser agregada en la rama `izq` del ABB

  - Si el `tag` actual es **mayor** que el buscado, entonces la nueva cuenta debe ser agregada en la rama `der` del ABB

- Si llegamos al `arbolVacio`, entonces la cuenta debe ser agregada en este lugar



En este ejemplo, por la propiedad de orden, sabemos que `"burgerking…"` , debe ser agregado a la izquierda de `"playvalorant…"`, y a su vez, sabemos que `"burgerking…"` , debe ser agregado a la izquierda de `"chayanne"`, y a su vez, sabemos que `"burgerking…"` , debe ser agregado a la derecha de `"alma.observatory"`. Eventualmente llegamos a un nodo vacío, y este es el lugar donde debe vivir la nueva cuenta


<div><img src="ABB_insta_insert1.svg" width="50%;"/><img src="ABB_insta_insert2.svg" width="50%;"/></div>
<div><img src="ABB_insta_insert3.svg" width="50%;"/><img src="ABB_insta_insert4.svg" width="50%;"/></div>






In [17]:
# agregar: AB(Cuenta) Cuenta -> AB(Cuenta)
# agrega una nueva cuenta al ABB
# Ej: agregar(ABBcuentas, CBurger) agrega 
# un nuevo nodo a la derecha de "alma..."
def agregar(AC, nuevaC):
    assert esAB(AC) # and esCuenta(NC)
    
    # CB: Se agrega la nueva cuenta en el lugar vacío
    if AC == arbolVacio:
        return AB(nuevaC,arbolVacio,arbolVacio)
    
    act = AC.valor
    # Dependiendo del tag actual y el tag de la nueva cuenta,
    #  vemos en que dirección debe ser agregada la nueva cuenta
    if act.tag > nuevaC.tag:  
        return AB(act, agregar(AC.izq, nuevaC), AC.der)
    elif act.tag < nuevaC.tag:
        return AB(act, AC.izq, agregar(AC.der, nuevaC))
    # Caso especial, por descarte, los tags son iguales… entregamos el árbol intacto
    else:
        return AC

#test
assert agregar(ABBcuentas, Chaya) == ABBcuentas

CBurger = Cuenta('burgerking_chile', 'Burger King Chile', 100000) 
nuevoABB = AB(Cval, AB(Chaya, AB(Calma, arbolVacio, 
                                          AB(CBurger,arbolVacio,arbolVacio)),
                                AB(Conf, arbolVacio, arbolVacio)),
                      AB(Cspy, AB(Cpok, arbolVacio, arbolVacio),
                               AB(Cwill, arbolVacio, arbolVacio)))
assert agregar(ABBcuentas, CBurger) == nuevoABB

In [18]:
agregar(ABBcuentas, Chaya)

AB(valor=Cuenta(tag='playvalorantofficial', nombre='VALORANT', seg=1100000), izq=AB(valor=Cuenta(tag='chayanne', nombre='Chayanne', seg=6800000), izq=AB(valor=Cuenta(tag='alma.observatory', nombre='ALMA observatory', seg=142000), izq=None, der=None), der=AB(valor=Cuenta(tag='confesiones_beaucheems', nombre='Confesiones Beaucheems', seg=2645), izq=None, der=None)), der=AB(valor=Cuenta(tag='spyfamily_en', nombre='SPY x FAMILY', seg=199000), izq=AB(valor=Cuenta(tag='pokemon', nombre='Pokemon', seg=4100000), izq=None, der=None), der=AB(valor=Cuenta(tag='willowthesquishycat', nombre='Willow', seg=57100), izq=None, der=None)))

In [20]:
CBurger = Cuenta('burgerking_chile', 'Burger King Chile', 100000) 
ABBcuentas = agregar(ABBcuentas, CBurger)

## ABB de Cuentas (función `cambiar`)

En este caso, editar el número de seguidores de una cuenta, no afecta la propiedad de orden, por lo que realizamos algo similar a la búsqueda:

- Revisamos el nodo actual, extrayendo el dato del `tag` guardado, y lo comparamos con el `tag` de la cuenta a editar

  - Si coinciden, este es el elemento a editar
  
  - Si el `tag` actual es **menor** que el que será agregado, entonces la cuenta a modificar está en la rama `izq` del ABB
  
  - Si el `tag` actual es **mayor** que el buscado, entonces la cuenta a modificar está en la rama `der` del ABB

- Si llegamos al `arbolVacio`, entonces la cuenta a editar no existía desde un principio…
 
En este ejemplo, por la propiedad de orden, sabemos que `"willow"` , se encuentra a la derecha de `"playvalorant…"`, y a su vez, sabemos que `"willow"` , se encuentra a la derecha de `"spyfamily…"`. Eventualmente encontramos a `"willow"` , por lo que editamos sus datos asociados.



<div><img src="ABB_insta_update1.svg" width="50%;"/><img src="ABB_insta_update2.svg" width="50%;"/></div>
<div><img src="ABB_insta_update3.svg" width="50%;"/><img src="ABB_insta_update4.svg" width="50%;"/></div>





In [27]:
# cambiar: AB(Cuenta) str int -> AB(Cuenta)
# modifica la cant. de seguidores de una cuenta dada
# Ej: cambiar(ABBcuentas, 'willow', 60000) cambia 
# los seguidores de la cuenta willow por 60000
def cambiar(AC, tag, n):
    assert esAB(AC) and type(tag) == str
    assert type(n) == int

    # Caso especial: si llegamos al nodo vacío, 
    # entonces no había nada que editar
    if AC == arbolVacio:
        return arbolVacio
    
    # Dependiendo del tag actual y el tag de la cuenta
    #  a editar, vemos en que dirección avanzar
    act = AC.valor
    if act.tag > tag:  
        return AB(act, cambiar(AC.izq, tag, n), AC.der)
    elif act.tag < tag:
        return AB(act, AC.izq, cambiar(AC.der, tag, n))
    # Si son iguales, entonces en este nodo se hace la edición
    else:
        nuevaC = Cuenta(act.tag, act.nombre, n)
        return AB(nuevaC, AC.izq, AC.der)

# Test 
assert cambiar(ABBcuentas, 'pewdiepie', 100) == ABBcuentas

C2will = Cuenta('willowthesquishycat' , 'Willow' , 60000)
nuevoABB = AB(Cval, AB(Chaya, AB(Calma, arbolVacio, 
                                          AB(CBurger,arbolVacio,arbolVacio)),
                                AB(Conf, arbolVacio, arbolVacio)),
                      AB(Cspy, AB(Cpok, arbolVacio, arbolVacio),
                               AB(C2will, arbolVacio, arbolVacio)))

assert cambiar(ABBcuentas, 'willowthesquishycat', 60000) == nuevoABB                              


In [28]:
cambiar(ABBcuentas, 'willowthesquishycat', 60000)

AB(valor=Cuenta(tag='playvalorantofficial', nombre='VALORANT', seg=1100000), izq=AB(valor=Cuenta(tag='chayanne', nombre='Chayanne', seg=6800000), izq=AB(valor=Cuenta(tag='alma.observatory', nombre='ALMA observatory', seg=142000), izq=None, der=AB(valor=Cuenta(tag='burgerking_chile', nombre='Burger King Chile', seg=100000), izq=None, der=None)), der=AB(valor=Cuenta(tag='confesiones_beaucheems', nombre='Confesiones Beaucheems', seg=2645), izq=None, der=None)), der=AB(valor=Cuenta(tag='spyfamily_en', nombre='SPY x FAMILY', seg=199000), izq=AB(valor=Cuenta(tag='pokemon', nombre='Pokemon', seg=4100000), izq=None, der=None), der=AB(valor=Cuenta(tag='willowthesquishycat', nombre='Willow', seg=60000), izq=None, der=None)))

## ABB de Cuentas (función `eliminar`)

Para eliminar una Cuenta del ABB, primero buscamos donde está el elemento a eliminar. Luego, al eliminar, tenemos que preservar la propiedad de búsqueda, por lo que hay varios casos, dependiendo de la forma del árbol

- Si la cuenta a eliminar está en un **nodo hoja**, la eliminamos

- Si la cuenta a eliminar está en un **nodo interior con 1 rama vacía**, entonces la eliminamos, y linkeamos su rama no-vacía

- Si la cuenta a eliminar es un **nodo interior sin ramas vacías**:

  - Buscamos la **mayor** Cuenta en la rama `izq` del ABB (llamémosla `MC`)
  - Colocamos a `MC` en el espacio donde eliminaremos la cuenta
  - Recursivamente eliminamos a `MC` de la rama `izq` del ABB

En este ejemplo, por la propiedad de orden, sabemos que `"pokemon"` , se encuentra a la derecha de `"playvalorant…"`, y a su vez, sabemos que `"pokemon"` , se encuentra a la izquierda de `"spyfamily…"`. Eventualmente encontramos a `"pokemon"` , procedemos a eliminarlo, y como estaba en un nodo hoja, la eliminación es directa.


<div><img src="ABB_insta_delete_hoja1.svg" width="50%;"/><img src="ABB_insta_delete_hoja2.svg" width="50%;"/></div>
<div><img src="ABB_insta_delete_hoja3.svg" width="50%;"/><img src="ABB_insta_delete_hoja4.svg" width="50%;"/></div>


En este ejemplo, por la propiedad de orden, sabemos que `"alma.obs…"` , se encuentra a la izquierda de `"playvalorant…"`, y a su vez, sabemos que `"alma.obs…"` , se encuentra a la izquierda de `"chayanne…"`. Eventualmente la encontramos y eliminamos `"alma.obs…"`, y como es un nodo con 1 sola rama, entonces esa rama no vacía, tiene que ascender a ocupar el espacio dejado por `"alma.obs…"`


<div><img src="ABB_insta_delete_int1.svg" width="50%;"/><img src="ABB_insta_delete_int2.svg" width="50%;"/></div>
<div><img src="ABB_insta_delete_int3.svg" width="50%;"/><img src="ABB_insta_delete_int4.svg" width="50%;"/></div>


En este ejemplo, por la propiedad de orden, sabemos que… oh, justo nos encontramos con "playvalorant…" que queremos eliminar. Al ser un nodo con dos ramas no-vacías, tenemos que buscar a la mayor cuenta en la rama izquierda, para que tome este lugar. Luego eliminamos recursivamente ese nodo de la rama izquierda. Al ser un nodo hoja, la eliminación cae en el caso visto anteriormente


<div><img src="ABB_insta_delete_hard1.svg" width="50%;"/><img src="ABB_insta_delete_hard2.svg" width="50%;"/></div>
<div><img src="ABB_insta_delete_hard3.svg" width="50%;"/></div>


In [30]:
# ABB(Cuenta) -> Cuenta
def mayorABB(AC):
    if AC.der == arbolVacio:
        return AC.valor
    else:
        return mayorABB(AC.der)

# eliminar: AB(Cuenta) str -> AB(Cuenta)
# elimina la cuenta del ABB asociada al tag
# Ej: eliminar(ABBcuentas, 'pokemon') entrega ...
def eliminar(AC, tag):
    assert esAB(AC) and type(tag) == str

    if AC == arbolVacio:
        return arbolVacio
    
    # Dependiendo de donde se encuentra la cuenta a eliminar,
    # seguimos por la rama respectiva, dejando la otra intacta
    act = AC.valor  
    if act.tag > tag:
        return AB(act, eliminar(AC.izq, tag), AC.der)
    elif act.tag < tag:
        return AB(act, AC.izq, eliminar(AC.der, tag))
    else: 
        # Caso eliminación en una hoja
        if AC.izq == arbolVacio and AC.der == arbolVacio:
            return arbolVacio
        # Caso eliminación en un nodo con 1 rama no-vacía
        elif AC.izq == arbolVacio:
            return AC.der
        elif AC.der == arbolVacio:
            return AC.izq
        # Caso dificil: Buscamos la mayor cuenta en la rama izquierda,
        #  para que ascienda a tomar este lugar. Luego eliminamos 
        # esa cuenta de la rama izquierda
        else:
            mayorC = mayorABB(AC.izq)
            return AB(mayorC, eliminar(AC.izq, mayorC.tag), AC.der)

# Test 
nuevoABB = AB(Cval, AB(Chaya, AB(Calma, arbolVacio, 
                                          AB(CBurger,arbolVacio,arbolVacio)),
                                AB(Conf, arbolVacio, arbolVacio)),
                      AB(Cspy, arbolVacio,
                               AB(Cwill, arbolVacio, arbolVacio)))
assert eliminar(ABBcuentas, 'pokemon') == nuevoABB

In [31]:
eliminar(ABBcuentas, 'pokemon')

AB(valor=Cuenta(tag='playvalorantofficial', nombre='VALORANT', seg=1100000), izq=AB(valor=Cuenta(tag='chayanne', nombre='Chayanne', seg=6800000), izq=AB(valor=Cuenta(tag='alma.observatory', nombre='ALMA observatory', seg=142000), izq=None, der=AB(valor=Cuenta(tag='burgerking_chile', nombre='Burger King Chile', seg=100000), izq=None, der=None)), der=AB(valor=Cuenta(tag='confesiones_beaucheems', nombre='Confesiones Beaucheems', seg=2645), izq=None, der=None)), der=AB(valor=Cuenta(tag='spyfamily_en', nombre='SPY x FAMILY', seg=199000), izq=None, der=AB(valor=Cuenta(tag='willowthesquishycat', nombre='Willow', seg=57100), izq=None, der=None)))

## Propuestos

- Recrear las mismas funciones CRUD, pero ahora suponiendo que las cuentas se encuentran agrupadas en una **lista ordenada por tag**

- Recrear el ABB anterior, pero ahora el criterio de orden del ABB es por número de seguidores de una cuenta

- Recrear las funcioens CRUD para el ABB ordenado por número de seguidores

## Extras

### Eliminación en un ABB

Como observamos recién, el eliminar un nodo de un árbol puede ser difícil de abordar y entender. Este tema se aborda con detalle en el curso de algoritmos y estructuras de datos. De todos modos, una manera alternativa de resolver el problema es mediante composición funcional:

- Pasar el ABB a una lista (en pre-orden)

- Realizar la eliminación del elemento en la lista

- Convertir la lista en ABB


<div><img src="delete_way2.svg" width="60%;"/></div>

### Criterio de Orden en ABB

Dado que el ABB utilizado en el Caso de Estudio II, optimiza la búsqueda por tags, eventuales búsquedas u operaciones que realicemos sobre otros de sus parámetros no serán tan fáciles de abordar

Por ejemplo, ¿obtener la cuenta con mayor cantidad de seguidores? Dado que el ABB no optimiza la búsqueda para seguidores, solo nos queda realizar una **búsqueda exhaustiva** en todo el árbol para encontrar lo pedido

Por lo que, si decidimos usar un ABB para ordenar un conjunto de elementos, tenemos que elegir adecuadamente cual será la `"llave"` por la cual vamos a ordenar el árbol

**Ordenado por tags**:


<div><img src="ABB_insta_V2_8.svg" width="50%;"/></div>

**Ordenado por seguidores**:

<div><img src="ABB_insta_per_seg.svg" width="60%;"/></div>

Y también evaluar los eventuales trade-off de elegir un criterio de orden por sobre otro (`tags` vs `seguidores`, en nuestro caso), ya que si bien pueden facilitar algunas operaciones, puede dificultar otras. Todo lo anterior, depende de cuales serán las operaciones recurrentes, o cual es el objetivo a cumplir


### Cambiar elementos en un ABB

Vimos que, cuando la operación de editar o cambiar un elemento no afecta la propiedad de orden, es relativamente directo de realizar

Ahora… cuando este cambio potencialmente puede afectar el orden (ej: aumentar la cantidad de seguidores de una cuenta, lo que rompería la propiedad de ABB), una alternativa para "simular" un cambio es:

- Eliminar el elemento del ABB

- Agregar el elemento al ABB, con sus datos editados

<div><img src="edit_way2.svg" width="60%;"/></div>

## Conclusiones

Hoy vimos una aplicación particular un ABB, que almacena una estructura que administra harta información

En particular, revisamos las particularidades que hay que tener al agregar, cambiar, eliminar o buscar elementos en un árbol, sobre todo si es un árbol que almacena estructuras
