# Sesión 17
> Por Christian Rubio Montiel (CRM), implementación por Josue Río Campos Becerra y CRM.

> Algunoas observaciones tomadas del profesor Jonathan Córdoba.

En esta sesión se hace un repaso sobre representaciones de una gráfica, pilas, colas, listas ligadas, y estructuras de datos para conjuntos disjuntos. Se aborda el uso de los paquetes Graphs.jl y DataStructures.jl de Julia.

<a id='indice'></a>
### Índice
---
1. **[Matriz de adyacencia](#MatrizAdyacencia)**
2. **[Lista](#lista)**
3. **[Colas](#colas)**
4. **[Pilas](#pilas)**
5. **[Listas Ligadas](#listasligadas)**
6. **[Conjuntos disjuntos](#cdisjuntos)**
7. **[Referencias](#referencias)**
---

Durante el 3er semestre de la carrera de MAC se lleva la asignatura de [Estructuras de Datos](https://mac.acatlan.unam.mx/media/temarios/1644/1311.pdf), por lo que el repaso será breve y puntual en las estructuras que se utilizán en el resto de este curso.

Una *estructura de datos* es un conjunto de datos, relacionados junto con un conjunto de  operaciones que se les aplica a la estructura misma y a los datos con la finalidad de organizar, administrar y almacenar.

Los algoritmos tienen tiempos de ejecución que depende de la estructura de datos empleada, buscando siempre la eficiencia.

Julia no tiene por default otras estructuras de datos además de las ya mencionadas en el apartado de arreglos. Recurrimos a paquetes que nos ayuden con estas estructuras de datos: [Graphs.jl](https://juliagraphs.org/Graphs.jl/stable/) y [DataStructures.jl](https://juliacollections.github.io/DataStructures.jl/stable/).

<a id='MatrizAdyacencia'></a>
## 1. Matriz de adyacencia

La representación de una gráfica $G$, de orden $n$, mediante su matriz de *adyacencia* $A$ será conveniente si es *densa*, esto es, que $m=|E(G)|=\Theta(n^2)$; o bien cuando el número de aristas sea cercano a $O(n^2)$.

En ocasiones, cuando no tenemos información sobre la gráfica, posiblemente sea conveniente el uso de esta representación, pero definitivamente dependerá del problema en cuestión.

Notemos que leer la matriz $A$ toma un tiempo de $\Theta(n^2)$, mientras que leer la matriz de *incidencia* toma un tiempo de $\Theta(nm)$. La representación de una gráfica mediante su matriz de incidencia no es recomendada, salvo en ciertas excepciones. Lo mismo aplica en el caso de gráficas que en el caso de di-, multi-, seudo- o hiper- gráfica.

<img src="Fig171.png" alt="Figura 1" width="100"/>

> `Figura 1: Diagrama de una gráfica G, cuyo conjunto de vértices es {1,2,3,4,5} y conjunto de aristas es {12,15,23,24,25,34,45}.`

Matriz de adyacencia $A$ de la gráfica $G$ de la figura 1, usando el orden canónico de los vértices.

In [1]:
A=[0 1 0 0 1;1 0 1 1 1;0 1 0 1 0;0 1 1 0 1;1 1 0 1 0]

5×5 Matrix{Int64}:
 0  1  0  0  1
 1  0  1  1  1
 0  1  0  1  0
 0  1  1  0  1
 1  1  0  1  0

Usando el paquete Graphs que previamente fue instalado, podemos guardar la gráfica en una variable.

In [2]:
using Graphs
g=SimpleGraph(A)

{5, 7} undirected simple Int64 graph

Ahora, podemos obtener la matriz de adyacencia de la gráfica guardada en nuestra variable.

In [3]:
adjacency_matrix(g)

5×5 SparseArrays.SparseMatrixCSC{Int64, Int64} with 14 stored entries:
 ⋅  1  ⋅  ⋅  1
 1  ⋅  1  1  1
 ⋅  1  ⋅  1  ⋅
 ⋅  1  1  ⋅  1
 1  1  ⋅  1  ⋅

Regresar al **[Índice](#indice)**.

<a id='lista'></a>
## 2. Lista

La representación de una gráfica $G$, de orden $n$, mediante una *lista* $L$ será conveniente si es *rala*, esto es, que $m=\Theta(n)$; o bien cuando el número de aristas sea cercano a $\Omega(n)$.

In [4]:
for u in vertices(g) print("$u: ")
for v in neighbors(g, u) print("$v ")
end
    println()
end

1: 2 5 
2: 1 3 4 5 
3: 2 4 
4: 2 3 5 
5: 1 2 4 


Notemos que leer una lista $L$ toma un tiempo de $\Theta(n+m)$, que será cuadrado si la gráfica es densa, y lineal si es rala; lo cual se logra porque la lista compacta la información con respecto a una matriz de adyacencia.

Para obtener una lista de una gráfica guardada en una variable $g$ es como sigue.

In [5]:
g.fadjlist #Hay un error en la implementación, por lo que no funciona fadjlist(g)

5-element Vector{Vector{Int64}}:
 [2, 5]
 [1, 3, 4, 5]
 [2, 4]
 [2, 3, 5]
 [1, 2, 4]

Regresar al **[Índice](#indice)**.

<a id='colas'></a>
## 3. Colas

Una cola (queue) es una estructura de datos lineal (mod $n$), con la característica llamada FIFO (Firts-in, Firts-out) que permite la inserción (enqueue) de un elemento en el extremo final (tail[Q]) y la eliminación (dequeue) de un elemento en el otro extremo frente (head[Q]).

Julia nos permite trabajar con colas a través del uso del paquete *DataStructures* que debe ser instalado previamente.

**NOTA**: El contenedor Queue es de tipo *Deque* que hace referencia comunmente a una estructura de datos de tipo cola donde es posible agregar o remover elementos de ambos extremos.

*ENQUEUE($Q$,$x$)*
1. $Q[tail[Q]]=x$
2. **if** $tail[Q]=length[Q]$
3. $\hspace{0.3cm}$**then** $tail[Q]=1$
4. $\hspace{0.3cm}$**else** $tail[Q]=tail[Q]+1$

In [6]:
using DataStructures

In [7]:
c = Queue{Int64}()

Queue{Int64}(Deque [Int64[]])

In [8]:
for i in 1:10
    enqueue!(c, i)
end

In [9]:
for item in c
    println(item)
end

1
2
3
4
5
6
7
8
9
10


In [10]:
first(c),last(c),length(c)

(1, 10, 10)

*DEQUEUE($Q$)*
1. $x=Q[head[Q]]$
2. **if** $head[Q]=length[Q]$
3. $\hspace{0.3cm}$**then** $head[Q]=1$
4. $\hspace{0.3cm}$**else** $head[Q]=head[Q]+1$
5. **return** $x$

In [11]:
for i in 1:5
    dequeue!(c)
end

In [12]:
for item in c
    println(item)
end

6
7
8
9
10


Tenemos otras funciones deltro del paquete DataStructures.

In [13]:
empty!(c) # Limpiar cola

Queue{Int64}(Deque [Int64[]])

In [14]:
isempty(c) # Verificar si la cola está vacía

true

In [15]:
d = Queue{Float64}() # Podemos crear una cola de datos de tipo X, en este ejemplo X=Float64

Queue{Float64}(Deque [Float64[]])

In [16]:
eltype(d)

Float64

Regresar al **[Índice](#indice)**.

<a id='pilas'></a>
## 4. Pilas

Una pila (stack) es una estructura de datos lineal, con la característica llamada  LIFO (Last-In, First-Out) por lo que hay que considerar el desbordamiento (stack-overflow) al insertar (push) datos, en la última posición (top[Q]), y vaciar la pila (stack-underflow) al borrar (pop) datos un dato.

Julia nos permite trabajar con pilas a través del uso del paquete *DataStructures* que debe ser instalado previamente.

**NOTA**: El contenedor Stack es de tipo *Deque* que hace referencia comunmente a una estructura de datos de tipo cola donde es posible agregar o remover elementos de ambos extremos.

*STACK-EMPTY($S$)*
1. **if** $top[S]=0$
2. $\hspace{0.3cm}$**then return** TRUE
3. $\hspace{0.3cm}$**else return** FALSE

*PUSH($S$,$x$)*
1. $top[S]=top[S]+1$
2. $S[top[S]]=x$

*POP($S$)*
1. **if** STACK-EMPTY($S$)
2. $\hspace{0.3cm}$**then** error "underflow"
3. $\hspace{0.3cm}$**else** $top[S]=tail[S]-1$
4. $\hspace{1cm}$**return** $S[tail[S]+1]$

In [17]:
using DataStructures

s = Stack{Int64}()

Stack{Int64}(Deque [Int64[]])

In [18]:
for i in 1:10
    push!(s, i)
end

In [19]:
for item in s
    println(item)
end

10
9
8
7
6
5
4
3
2
1


In [20]:
first(s),last(s),length(s)

(10, 1, 10)

In [21]:
for i in 1:5
    pop!(s)
end

In [22]:
for item in s
    println(item)
end

5
4
3
2
1


In [23]:
empty!(s)

Stack{Int64}(Deque [Int64[]])

In [24]:
isempty(s)

true

In [25]:
p = Stack{Float32}()

Stack{Float32}(Deque [Float32[]])

In [26]:
eltype(p)

Float32

Regresar al **[Índice](#indice)**.

<a id='listasligadas'></a>
## 5. Listas Ligadas

Una lista ligada es una estructura de datos lineal, donde el orden en una lista enlazada está determinado por punteros en cada objeto. Así, las listas ligadas proporcionan una representación simple y flexible para conjuntos dinámicos.

Los punteros (next y prev) son atributos de los datos (key). Una lista puede ser simple, apuntando en una sola dirección; doblemente ligada, apuntando en ambas direcciones; o circular, donde head (derecha) y tail (izquierda) se apuntan entre si.

In [27]:
l1=nil() #lista vacía

nil()

In [28]:
l2=list(2,3,4,5)

list(2, 3, 4, 5)

In [29]:
head(l2), tail(l2)

(2, list(3, 4, 5))

Podemos buscar un elemeto con *key* k en una lista, en un tiempo lineal.

*LIST-SEARCH($L$,$k$)*
1. $x=head[L]$
2. **while** $x\not =$ NIL **and** $key[x]\not = k$
3. $\hspace{0.3cm} x=next[x]$
4. **return** $x$

Podemos insertar un elemento al inicio de la lista en un tiempo constante.

*LIST-PREPEND($L$,$x$)*
1. $x.next=L.head$
2. $x.prev=$ NIL
3. **if** $L.head \not =$ NIL
4. $\hspace{0.3cm}$ **then** $L.head.prev=x$
5. $L.head=x$

Podemos insertar un elemento después de un elemento $y$ de la lista en un tiempo constante.

*LIST-INSERT($x$,$y$)*
1. $x.next=y.next$
2. $x.prev=y$
3. **if** $y.next \not =$ NIL
4. $\hspace{0.3cm}$ **then** $y.next.prev=x$
5. $y.next=x$

Podemos borrar un elemento de la lista en un tiempo constante, siempre que tenemos *key*, si no primero hay que buscarlo.

*LIST-DELETE($L$,$x$)*
1. **if** $x.prev\not=$ NIL
2. $\hspace{0.3cm}$ **then** $x.prev.next=x.next$
3. $\hspace{0.3cm}$ **else** $L.head = x.next$
4. **if** $x.next\not=$ NIL
5. $\hspace{0.3cm}$ **then** $x.next.prev=x.prev$

Regresar al **[Índice](#indice)**.

<a id='cdisjuntos'></a>
## 6. Conjuntos disjuntos

Dada una partición de un conjunto, le podemos vincular una relación de equivalencia donde cada clase tendrá un representante.

Computacionalmente, tendremos tres operaciones.
1. $MAKE-SET(x)$: Genera la clase singulas del elemento $x$.
2. $UNION(x,y)$: Fusiona la clase del elemnto $x$ con la clase del elemento $y$.
3. $FIND-SET(x)$: Regresa el representante de la clase del elemento $x$.

Las implementaciones dependerán de la estructura empleada, por ejemplo, si son arreglos o listas ligadas.

Por ejemplo, usando listas ligadas, las operaciones $MAKE-SET(x)$ y $FIND-SET(x)$ son constantes ya que cada elemento de una lista apunta a su representante (head).

Sin embargo, $UNION(x,y)$ toma un tiempo $O(n)$ en el peor caso (ya que la lista de $y$ se destruye pues cada uno de sus elementos tiene que apuntar a un nuevo representante.

Por lo que generar un conjunto de $n$ elementos tras $m$ operaciones $MAKE-SET(x)$ y $FIND-SET(x)$ y una heurística óptima de las operaciones $UNION(x,y)$ tiene una complejidad de $O(m+n\lg(n))$.

En el caso de usar arreglos lineales o usar heaps, cambiarán los tiempos de ejecución respectivamente.

Se puntualiza que usar árboles enraizados optimiza los procesos. Generar un conjunto de $n$ elementos tras $m$ operaciones $MAKE-SET(x)$ y $FIND-SET(x)$ y una heurística óptima de las operaciones $UNION(x,y)$ tiene una complejidad de $O(m\alpha(n))$ donde $\alpha(n)$ es una función de crecimiento muy lento.

En Julia, se tienen implementados las funciones usando árboles enraizados.

In [30]:
a = IntDisjointSets(10) # creates a forest comprised of 10 singletons

IntDisjointSets{Int64}([1, 2, 3, 4, 5, 6, 7, 8, 9, 10], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 10)

In [31]:
union!(a, 3, 5) # merges the sets that contain 3 and 5 into one and returns the root of the new set

3

In [33]:
root_union!(a, 1, 2) # merges the sets that have root x and y into one and returns the root of the new set

1

In [35]:
find_root(a, 5)  # finds the root element of the subset that contains 3

3

In [36]:
in_same_set(a, 1, 3) # determines whether x and y are in the same set

false

In [39]:
elem = push!(a)          # adds a single element in a new set; returns the new element
                         # (this operation is often called MakeSet)

11

In [40]:
b = DisjointSets{AbstractString}(["a", "b", "c", "d"])

DisjointSets{AbstractString} with 4 elements:
  "a"
  "b"
  "c"
  "d"

In [41]:
union!(b, "a", "b")

"a"

In [42]:
in_same_set(b, "c", "d")

false

In [43]:
push!(b, "f")

"f"

Regresar al **[Índice](#indice)**.

<a id='referencias'></a>
## 4. Referencias

$[1]$ Cormen, T. H., Leiserson, C. E., Rivest, R. L. y Stein C. (2022). **Introduction to algorithms**. MIT Press, 4E.