<a href="https://colab.research.google.com/github/martinmaturana777/AED-Apuntes/blob/main/Resumen_c2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 🌲 Árbol AVL

Un **Árbol AVL** es un tipo de árbol binario de búsqueda (ABB) **autobalanceado**. La propiedad principal es que, para cada nodo, la diferencia de altura entre sus subárboles izquierdo y derecho es a lo más 1.

### ➤ Usos:
- Estructura eficiente para búsquedas, inserciones y eliminaciones en **O(log n)**.
- Garantiza buen rendimiento incluso con entradas desordenadas.

### ➤ Propiedades importantes:
- Se reequilibra automáticamente usando **rotaciones** (simples o dobles).
- Mantiene altura logarítmica para n nodos.


## 🌳 Árbol 2-3

Es un árbol de búsqueda balanceado donde:
- Los nodos pueden tener **1 o 2 llaves**.
- Cada nodo interno tiene **2 o 3 hijos**.
- Todas las hojas están al mismo nivel.

### ➤ Usos:
- Almacenamiento ordenado con inserciones y eliminaciones eficientes.
- Alternativa balanceada a los AVL y B-trees.

### ➤ Propiedades:
- Al insertar, si un nodo se llena, se divide y se sube el valor medio.
- Altura logarítmica garantizada.


## 🧮 Hashing con encadenamiento

Es una técnica para guardar claves usando una función de hash que asigna cada clave a una posición en una tabla. Para manejar colisiones, se usa una **lista enlazada en cada posición**.

### ➤ Usos:
- Búsquedas, inserciones y eliminaciones rápidas en promedio **O(1)**.
- Ideal para diccionarios, sets y tablas de símbolos.

### ➤ Detalles importantes:
- Una **colisión** ocurre cuando dos claves diferentes producen el mismo valor hash.
- El rendimiento depende de una buena función hash y del tamaño de la tabla.


## ✅ Hashing perfecto

Una función de hash es **perfecta** para un conjunto de claves si **no produce colisiones**.

### ➤ Usos:
- Casos donde las claves posibles están **totalmente determinadas** de antemano.
- Compiladores, tablas de palabras clave, sistemas embebidos.

### ➤ Características:
- Solo puede ser perfecta si el conjunto de datos es **conocido y acotado**.
- Se construye a medida para evitar colisiones.


## 🔃 Métodos de ordenación

### 📌 Insertion Sort
- Inserta elementos uno por uno en la parte ya ordenada.
- **Estable** (mantiene el orden relativo).
- Bueno para arreglos pequeños o casi ordenados.
- Peor caso: O(n²)

### 📌 Heapsort
- Usa una estructura tipo heap para ordenar.
- **Inestable**
- Siempre O(n log n)

### 📌 Mergesort
- Divide y conquista: divide, ordena recursivamente y mezcla.
- **Estable**
- Siempre O(n log n), requiere espacio extra.


## 📈 Skip List

Una **skip list** es una lista enlazada con múltiples niveles que permite buscar, insertar y borrar en **O(log n)** en promedio.

### ➤ Usos:
- Alternativa simple a los árboles balanceados.
- Muy útil en estructuras concurrentes o distribuidas.

### ➤ Propiedades:
- Usa niveles superiores como "atajos".
- Se basa en aleatoriedad para decidir en qué niveles está cada nodo.


## ⚙️ Quicksort con elementos repetidos

Al adaptar Quicksort para datos con muchos elementos repetidos, se mejora la eficiencia usando una partición en **tres partes**:
- Menores que el pivote.
- Iguales al pivote.
- Mayores que el pivote.

### ➤ Beneficio:
- Evita recursión innecesaria.
- En arreglos con elementos todos iguales, se ejecuta en tiempo **O(n)**.


## 🔄 Listas auto-organizables

Son listas que se reorganizan cada vez que se accede a un elemento, para mejorar el rendimiento futuro.

### 📌 Transpose
- Intercambia el elemento accedido con el anterior.

### 📌 Move to Front
- Mueve el elemento accedido directamente al inicio.

### ➤ Usos:
- Listas de historial, caches, algoritmos de compresión.
- Buen desempeño cuando los accesos son repetitivos.


## 📑 Estabilidad en algoritmos de ordenación

Un algoritmo de ordenación es **estable** si **mantiene el orden relativo** entre elementos con la misma clave.

### ➤ Importancia:
- Útil cuando se hace ordenación por múltiples criterios (por ejemplo, por apellido y luego por edad).
- Mergesort e Insertion sort son estables; Heapsort y Quicksort típicamente no lo son (a menos que se adapten).


## 🏹 Robin Hood Hashing

En **Robin Hood Hashing** (open addressing) se mide la “distancia al hogar” (DIB) de la clave actual y de la entrante; la que esté más lejos se queda y “roba” la posición:

- **Inserción:**  
  1. Calcular índice inicial `i = h(x) mod m`.  
  2. Calcular `dib_x = 0`.  
  3. Si `table[i]` libre → insertar.  
  4. Si hay colisión con `y = table[i]`, calcular `dib_y`.  
     - Si `dib_y < dib_x`, intercambiar `x` y `y`, y continuar insertando `y`.  
  5. Avanzar `i = (i+1) mod m`, `dib_x += 1`, repetir.

- **Ventaja:** Reduce la varianza de distancias, equilibra la carga.


## 🌱 Inserción en raíz de ABB

Función para insertar `x` en un ABB y luego **rotar** hasta que `x` sea la nueva raíz:

```pseudocode
function insertar_raiz(x, root):
    if root == None:
        return new Nodo(x)
    if x < root.valor:
        root.izq = insertar_raiz(x, root.izq)
        # rotación derecha
        N = root.izq
        root.izq = N.der
        N.der = root
        return N
    else:
        root.der = insertar_raiz(x, root.der)
        # rotación izquierda
        N = root.der
        root.der = N.izq
        N.izq = root
        return N



---

```markdown
## 🎯 Quickselect

Algoritmo para encontrar el **k-ésimo elemento** en un arreglo en tiempo promedio **O(n)**:

1. Elegir pivote aleatorio y particionar en `< pivote`, `= pivote`, `> pivote`.  
2. Si `k` está en el grupo `<` recursar allí.  
3. Si `k` está en `=`, hemos encontrado el elemento.  
4. Si `k` está en `>`, ajustar índice y recursar en ese grupo.

- **Promedio:** O(n)  
- **Peor caso (sin pivot “mediana de medianas”):** O(n²)  
- **Con mediana de medianas:** peor caso O(n)


## 🌲 Trie para detección de duplicados en filas binarias

Usar un **Trie** (árbol de prefijos) para detectar filas de bits repetidas:

```pseudocode
function detectar_duplicados(matrix):
    trie = new Trie()
    duplicados = []
    for i in 0..N-1:
        node = trie.root
        for bit in matrix[i]:
            if node.child[bit] == None:
                node.child[bit] = new TrieNode()
            node = node.child[bit]
        if node.isEnd:
            duplicados.append((i, node.originalIndex))
        else:
            node.isEnd = True
            node.originalIndex = i
    return duplicados



---

```markdown
## ⚙️ Selección de los s menores (Quickselect modificado)

Modificar Quicksort/Quickselect para ordenar **solo los s menores** de un arreglo:

```python
def quicksort_s(a, s):
    def qsort(low, high):
        if low >= high:
            return
        k = partition(a, low, high)  # pivote final en k
        left_size = k - low + 1
        if s < left_size:
            qsort(low, k-1)
        else:
            qsort(low, k-1)
            qsort(k+1, high)
    qsort(0, len(a)-1)


## 🏹 Robin Hood Hashing

**Definición**  
Variante de _open addressing_ que minimiza la varianza de la “distancia al hogar” (DIB) de las claves.

**Uso general**  
Se emplea en tablas de hash donde se busca distribuir equitativamente las distancias de sondeo, reduciendo los “puntos calientes” que degradan el rendimiento.

**Conceptos clave**  
- **DIB (Distance‐from‐Initial‐Bucket):** número de pasos desde el índice ideal `h(x)` hasta la posición actual.  
- Al colisionar, la clave con **mayor DIB** “roba” la posición y desplaza a la otra.  
- Mejora la uniformidad de tiempo de acceso en tablas muy cargadas.

---

## 🌱 Inserción en raíz de ABB

**Definición**  
Mecanismo para insertar un elemento `x` en un árbol binario de búsqueda y luego aplicar rotaciones hasta que `x` quede en la raíz.

**Uso general**  
Sirve de base para árboles auto‐ajustables (ej. Splay Trees), que optimizan accesos recientes acercándolos a la raíz.

**Conceptos clave**  
- Inserción recursiva en subárbol izquierdo o derecho según comparación.  
- Rotación simple (derecha o izquierda) para “subir” el nuevo nodo.  
- Mantiene la propiedad de BST y reordena la estructura para accesos posteriores.

---

## 🎯 Quickselect

**Definición**  
Algoritmo de selección de orden estadístico que encuentra el k-ésimo menor elemento en un arreglo sin ordenarlo completamente.

**Uso general**  
Útil para calcular medianas, percentiles o los k-ésimos elementos en grandes volúmenes de datos, de manera más rápida que ordenar todo.

**Conceptos clave**  
- Basado en la partición de Quicksort: divide en `< pivote`, `= pivote`, `> pivote`.  
- Solo recursiona en la parte que contiene la posición k.  
- **Complejidad promedio:** O(n).  
- Con “mediana de medianas” como pivote, garantiza O(n) en el peor caso.

---

## 🌲 Trie para detección de duplicados en filas binarias

**Definición**  
Estructura de árbol de prefijos (Trie) que almacena secuencias de bits de longitud fija, permitiendo búsquedas y detección de repeticiones en tiempo lineal en la longitud de la secuencia.

**Uso general**  
Detectar y eliminar duplicados en colecciones de cadenas binarias (por ejemplo, firma de datos, hash de bitmaps, patrones en bioinformática).

**Conceptos clave**  
- Cada nivel del Trie corresponde a un bit (0 o 1).  
- Insertar o buscar una fila de M bits toma O(M).  
- Marcar nodos terminales permite identificar filas ya vistas.

---

## ⚙️ Selección de los s menores (Quickselect modificado)

**Definición**  
Extensión de Quickselect/Quicksort que ordena únicamente los **s** menores elementos de un arreglo, sin procesar el resto.

**Uso general**  
Cuando solo se necesitan los primeros s mínimos (top-k), como en análisis de grandes datasets, selección de candidatos o ranking parcial.

**Conceptos clave**  
- Partición estándar en torno a un pivote.  
- Si el bloque izquierdo contiene ≥ s elementos, recursiona solo allí.  
- Si contiene < s, ordena ese bloque y continúa buscando los (s – tamaño) siguientes en la parte derecha.  
- Eficiencia típica: O(n + s log s) en promedio.

---


# 📚 Estructuras de Datos: Colas de Prioridad y Diccionarios

---

## 🎯 Colas de Prioridad

Una **cola de prioridad** es una estructura de datos donde cada elemento tiene una prioridad. Al extraer elementos, se devuelve el de **mayor** o **menor** prioridad, según convención.

### 🔹 Características
- Generalmente se implementa usando un **heap** (montículo binario).
- Tipos de heap:
  - **Min-heap**: el menor valor está arriba.
  - **Max-heap**: el mayor valor está arriba.

### 🔹 Operaciones comunes
- `insertar(prioridad, valor)` — inserta un elemento con prioridad.
- `extraer_min()` — devuelve el de menor prioridad.
- `ver_min()` — muestra sin remover.
- `esta_vacia()` — verifica si está vacía.

---

## 🎯 Diccionarios (TDA Diccionario)

Un **diccionario** almacena pares **llave: valor**. Cada llave es única y permite acceder de forma eficiente a su valor.

### 🔹 Operaciones comunes en Python
- `d[x] = v` — asigna el valor `v` a la llave `x`.
- `d[x]` — accede al valor asociado.
- `d.get(x)` — accede sin error si no existe (`None` si no está).
- `x in d` — verifica si la llave está.
- `d.pop(x)` — elimina `x` y retorna su valor.
- `d.keys()`, `d.values()`, `d.items()` — listas de llaves, valores y pares.

---


In [None]:
# 🧪 Cola de Prioridad con heapq
import heapq

class ColaPrioridad:
    def __init__(self):
        self.q = []

    def insertar(self, prioridad, valor):
        heapq.heappush(self.q, (prioridad, valor))

    def extraer_min(self):
        if self.esta_vacia():
            raise Exception("Cola vacía")
        return heapq.heappop(self.q)

    def ver_min(self):
        if self.esta_vacia():
            raise Exception("Cola vacía")
        return self.q[0]

    def esta_vacia(self):
        return len(self.q) == 0

# Ejemplo de uso:
cp = ColaPrioridad()
cp.insertar(2, "comer")
cp.insertar(1, "dormir")
cp.insertar(3, "estudiar")

print(cp.extraer_min())  # (1, 'dormir')
print(cp.ver_min())      # (2, 'comer')


In [None]:
# 📦 Uso básico de diccionarios
distancia = {
    'Valparaíso': 102,
    'Concepción': 433,
    'Arica': 1664,
    'Puerto Montt': 912,
    'Rancagua': 80
}

# Acceder a un valor
print(distancia['Arica'])  # 1664

# Verificar si existe una ciudad
print('Osorno' in distancia)  # False

# Obtener con .get
print(distancia.get('Osorno'))  # None

# Insertar nuevo valor
distancia['Osorno'] = 945

# Eliminar un valor
valor_eliminado = distancia.pop('Rancagua')
print(valor_eliminado)  # 80

# Recorrer elementos
for ciudad, km in distancia.items():
    print(f"{ciudad} está a {km} km")


# Resumen de Ordenación y Grafos

## 1. Ordenación

### Cota Inferior
Para algoritmos de comparación, el mínimo número de comparaciones en el peor caso es:

\[
\log_2(n!) = \Theta(n \log n)
\]

Esto se justifica usando árboles de decisión.

### Quicksort

Algoritmo eficiente de tipo "divide y vencerás":

1. Escoge un pivote al azar.
2. Reorganiza el arreglo en 3 partes:
   - menores que el pivote,
   - el pivote,
   - mayores que el pivote.
3. Ordena recursivamente las partes.

Complejidad:
- Promedio: \( O(n \log n) \)
- Peor caso: \( O(n^2) \)

---

## 2. Grafos (hasta Prim + Kruskal)

### Definición

Un grafo es un conjunto de vértices \( V \) y de arcos \( E \). Puede ser:
- **No dirigido**: los arcos no tienen orientación.
- **Dirigido**: los arcos tienen dirección.

### Representaciones en memoria

- **Matriz de adyacencia**:
  - \( A[i][j] = 1 \) si hay conexión entre \( v_i \) y \( v_j \).
  - Espacio: \( \Theta(n^2) \)
  
- **Lista de adyacencia**:
  - Para cada nodo, guarda su lista de vecinos.
  - Espacio: \( \Theta(m) \)

### Caminos, ciclos y árboles

- **Camino**: secuencia de arcos consecutivos.
- **Ciclo**: camino simple cerrado.
- **Árbol**: grafo **conexo** y **acíclico**.
- **Árbol cobertor (spanning tree)**: árbol que contiene todos los nodos del grafo.

Propiedades:
- Un árbol con \( n \) nodos tiene \( n - 1 \) arcos.
- Agregar un arco genera un único ciclo.

### Recorridos

- **DFS (Depth-First Search)**: se profundiza lo más posible antes de retroceder.
- **BFS (Breadth-First Search)**: se explora por niveles.

### Algoritmo de Prim

Construye un árbol cobertor de peso mínimo:
1. Comienza desde un nodo.
2. Agrega sucesivamente el arco más barato que conecta con el árbol en construcción.

---

### Algoritmo de Kruskal

Construye un árbol cobertor mínimo:
1. Ordena todos los arcos por peso.
2. Agrega el arco más liviano que no forme un ciclo (usando conjuntos disjuntos / Union-Find).


In [None]:
import numpy as np

# Quicksort
def quicksort(a):
    qsort(a, 0, len(a) - 1)

def qsort(a, i, j):
    if i < j:
        k = particion(a, i, j)
        qsort(a, i, k - 1)
        qsort(a, k + 1, j)

def particion(a, i, j):
    k = np.random.randint(i, j + 1)
    a[i], a[k] = a[k], a[i]
    s = i
    for t in range(i + 1, j + 1):
        if a[t] <= a[i]:
            s += 1
            a[s], a[t] = a[t], a[s]
    a[i], a[s] = a[s], a[i]
    return s


In [None]:
# Algoritmo de Kruskal

class UnionFind:
    def __init__(self, n):
        self.padre = list(range(n))

    def find(self, u):
        if self.padre[u] != u:
            self.padre[u] = self.find(self.padre[u])
        return self.padre[u]

    def union(self, u, v):
        pu, pv = self.find(u), self.find(v)
        if pu == pv:
            return False
        self.padre[pu] = pv
        return True

def kruskal(n, aristas):
    """
    n: número de nodos (0 a n-1)
    aristas: lista de tuplas (peso, u, v)
    """
    aristas.sort()
    uf = UnionFind(n)
    mst = []
    total = 0

    for peso, u, v in aristas:
        if uf.union(u, v):
            mst.append((u, v, peso))
            total += peso
    return mst, total
