<div style="border-radius: 5px; padding: 1rem; margin-bottom: 1rem">
<img src="https://www.prototypesforhumanity.com/wp-content/uploads/2022/11/LOGO_UTEC_.png" alt="Banner" width="150" />   
 </div>

# Laboratorio 2: Sequential File vs AVL File
> **Profesor:** Heider Sanchez | ACLs: Sebastian Loza, Ana Maria Accilio

---

## **1. Introducción**

El propósito de este laboratorio es implementar y comparar el desempeño de dos estructuras de almacenamiento de datos en memoria secundaria:

1. Archivo Secuencialmente Ordenado (Sequential File)
2. Archivo organizado como Árbol Binario de Búsqueda Balanceado (AVL File)

Los estudiantes analizarán el tiempo de acceso y evaluación de eficiencia en las operaciones fundamentales:
- insert(record)
- search(key)
- remove(key)
- rangeSearch(init_key, end_key)

**Requerimientos de implementación:**
- La implementación de ambos métodos será en **Python**.
- Utilizar **archivos binarios** con registro de longitud fija.
- Medición y comparación de los **tiempos de acceso** en ambos métodos.
- Usar la siguiente **estructura de registro** para representar una venta de producto:

   | Campo            | Tipo de Dato          |
   |-----------------|------------------------|
   | ID de la venta  | `int (4 bytes)`        |
   | Nombre producto | `string (30 bytes)`    |
   | Cantidad vendida| `int (4 bytes)`        |
   | Precio unitario | `float (4 bytes)`      |
   | Fecha de venta  | `string (YYYY-MM-DD)`  |

---

## **2. Desarrollo**

### **Parte 1: Implementación del Archivo Secuencial**
   1. Carga de datos desde un archivo csv (sales_dataset.csv).
   2. Función para **insertar** nuevos registros usando espacio auxiliar. El archivo original debe reconstruirse con el espacio extra cuando este ultimo exceda k registros. 
   3. Función de **búsqueda secuencial** por ID de venta.
   4. Función para **eliminar** un registro marcándolo como eliminado. En la reconstrucción del archivo de datos no se debe considerar los registros eliminados lógicamente.
   5. Función para la **búsqueda por rango** el cual debe retornar todos los elementos entre un rango especificado.  

### **Parte 2: Implementación del Archivo AVL**
   1. Carga de datos desde un archivo csv (sales_dataset.csv).
   2. Función para **insertar** nuevos registros actualizando correctamente los punteros de jerarquía.
   3. Función para **buscar** una venta específica utilizando la estructura del AVL.
   4. Función para **eliminar** un registro y reestructurar el BST en el archivo.
   5. Función para la **búsqueda por rango** el cual debe retornar todos los elementos entre un rango especificado. 

### **Parte 3: Evaluación de Desempeño**
Para esta prueba, se realizó la inserción de los 1000 registros extraídos desde el archivo `sales_dataset.csv`.  
   ## <u>AVLFile</u> 
### Insercción de ventas
La operación demoró aproximadamente **16 segundos**, debido a que cada inserción implica escritura en disco, reorganización de nodos y posible rebalanceo del árbol AVL. Costo de inserción en el AVL: busqueda del nodo O(lg(n))+ actualizar alturas O(lg(n))+ rotacion O(1) = O(lg(n)) 

### Búsqueda de ventas específicas
Se realizaron 3 búsquedas por ID (al inicio, en la mitad y al final del árbol).  
El tiempo total es **0.008 segundos**, lo que demuestra que las búsquedas individuales son muy rápidas, como se espera en un AVL (O(log n)).

### Búsqueda por rango
Se buscó el rango completo desde (el primer hasta el último ID del dataset).  
Esto tomó **0.0026 segundos**, lo cual es eficiente considerando que se recorren múltiples nodos secuenciales en orden.

### Eliminación de registros
Se eliminaron dos registros (uno del inicio y uno del final del árbol).  
Esto tomó **0.0298 segundos**, ya que cada eliminación también puede provocar rebalanceo y actualización de punteros.
EL costo por eliminación en el AVL: Busqueda el nodo O(lg(n)) + Reorganizar O(lg(n))+ Actualizar alturas O(lg(n))+ Rotaciones O(1)->O(lg(n))  = O(lg(n))

| Operación | Tiempo (segundos) |
|-----------|------------------|
| Inserción | 16.6349 |
| Búsqueda específica | 0.008 |
| Búsqueda por rango | 0.0026 |
| Eliminación | 0.0298 |

## <u>BSTFile</u> 

### Insercción de ventas
La operación demoró aproximadamente **16 segundos**, ya que incluye verificar si el ID no se inserto previamente y de la misma inserción del elemento. Costo de inserción en el BST: busqueda del nodo O(lg(n)) y O(n) en el peor caso e igual que la busqueda O(lg(n)), con O(n) en el peor caso.

### Búsqueda de ventas específicas
Se realizaron 3 búsquedas por ID (al inicio, en la mitad y al final del árbol).  
El tiempo total es **0.0074 segundos**, lo que demuestra que las búsquedas individuales son muy rápidas, inclusive pudiendo estar desbalanceado el arbol.

### Búsqueda por rango
Se buscó el rango completo desde (el primer hasta el último ID del dataset).  
Esto tomó **0.0002 segundos**, lo cual es eficiente, considerando que el arbol puede estar desbalanceado.

### Eliminación de registros
Se eliminaron dos registros (uno del inicio y uno del final del árbol).  
Esto tomó **0.0099 segundos**, ya que cada eliminación debe verificar que el ID exista y seguir la estructuración del BST en base ID's borrados.
EL costo por eliminación en el AVL: Busqueda el nodo O(lg(n)), O(n) en el peor caso; y en busqueda del nodo a eliminar O(lg(n)), O(n) en el peor caso.

| Operación | Tiempo (segundos) |
|-----------|-------------------|
| Inserción | 16.1082           |
| Búsqueda específica | 0.0074            |
| Búsqueda por rango | 0.0002            |
| Eliminación | 0.0099            |


   #TODO
- Comparar los tiempos de acceso y **analizar los resultados**, utilizar una gráfica.

---

## **3. Análisis y Conclusión**

- ✅ Comparar los tiempos obtenidos para cada método.
- ✅ Evaluar en qué escenarios conviene usar cada método.
- ✅ Reflexionar sobre la importancia de la organización de archivos en almacenamiento eficiente.

---

## **4. Entregable**
- **Código fuente en Python** con las implementaciones.
- **Informe con los resultados del experimento** incluyendo el analisis y la discución.



