### **Introducción**

El objetivo de este y de otros cuadernos que acompañan a esta clase es explicar la importancia del análisis de algoritmos, sus notaciones, sus relaciones y **resolver tantos problemas como sea posible**. 

Primero, enfoquémonos en entender los elementos básicos de los algoritmos, la importancia de su análisis y, poco a poco, avancemos hacia los demás temas mencionados.

##### **Variables**

Antes de llegar a la definición de variables, relacionémoslas con antiguas ecuaciones matemáticas. Todos hemos resuelto muchas ecuaciones matemáticas desde la infancia. Como ejemplo, considera la siguiente ecuación:

$$
x^2 + 2y - 2 = 1
$$

No tenemos que preocuparnos por el uso de esta ecuación. Lo importante aquí es notar que la ecuación tiene **nombres** ($x$ e $y$) que **contienen valores** (datos). Esos nombres ($x$ e $y$) son marcadores de posición para representar datos. De manera similar, en la programación  necesitamos algo que contenga datos, y las **variables** son la manera de hacerlo.


##### **Tipos de datos**

En la ecuación mencionada anteriormente, las variables $x$ e $y$ pueden tomar distintos valores, por ejemplo, números enteros (10, 20), números reales (0.23, 5.5), o simplemente 0 y 1. Para resolver la ecuación, necesitamos relacionarlos con el tipo de valores que pueden tomar, y **tipo de dato** es el nombre que se usa en programación para este propósito.  

Un tipo de dato en un lenguaje de programación es un conjunto de datos con valores predefinidos. Ejemplos de tipos de datos son: entero (integer), punto flotante (floating point), número sin signo (unsigned number), carácter (character), cadena (string), etc.

La memoria de la computadora está llena de ceros y unos. Si tenemos un problema y queremos codificarlo, sería muy difícil dar la solución en términos de ceros y unos. Para ayudar a los usuarios, los lenguajes de programación y los compiladores nos proporcionan **tipos de datos**. Por ejemplo, un entero ocupa 2 bytes (el valor exacto depende del compilador), un float ocupa 4 bytes, etc. Esto indica que en memoria combinamos 2 bytes (16 bits) y lo llamamos un entero; combinamos 4 bytes (32 bits) y lo llamamos un float. Un tipo de dato reduce el esfuerzo de codificación.  
A alto nivel, existen dos tipos de datos:

1. **Tipos de datos definidos por el sistema** (también llamados **tipos de datos primitivos**).  
2. **Tipos de datos definidos por el usuario**.

##### **Tipos de datos definidos por el sistema (primitivos)**

Los tipos de datos que están definidos por el sistema se llaman **tipos primitivos**. Los tipos de datos primitivos más comunes en muchos lenguajes de programación son: `int`, `float`, `char`, `double`, `bool`, etc. 

El número de bits asignado a cada tipo de dato primitivo depende del lenguaje de programación, del compilador y del sistema operativo. Para el **mismo** tipo de dato primitivo, distintos lenguajes pueden utilizar tamaños diferentes. Dependiendo del tamaño de los tipos de datos, el dominio de valores disponibles también variará.  
Por ejemplo, "int" puede ocupar 2 bytes o 4 bytes. Si ocupa 2 bytes (16 bits), entonces el rango de valores es de -32,768 a +32,767 $(-2^{15}$ a $2^{15}-1)$. Si ocupa 4 bytes (32 bits), el rango va de -2,147,483,648 a +2,147,483,647 $(-2^{31}$ a $2^{31}-1)$. Lo mismo ocurre con otros tipos de datos.

##### **Tipos de datos definidos por el usuario**

Si los tipos de datos definidos por el sistema no son suficientes, la mayoría de los lenguajes de programación permiten a los usuarios **definir sus propios tipos de datos**, llamados **tipos de datos definidos por el usuario**. Ejemplos comunes son las **estructuras** en C/C++ y las **clases** en Java.  

Por ejemplo, en el siguiente fragmento de código, combinamos varios tipos de datos del sistema y llamamos al nuevo tipo de dato definido por el usuario **"newType"**. Esto da más flexibilidad y comodidad para manejar la memoria de la computadora:

```c
struct newType {
    int data1;
    float data2;
    char data;
};
```


##### **Estructuras de datos**

Una vez que tenemos datos en variables, necesitamos algún mecanismo para manipular esos datos y **resolver problemas**. Una **estructura de datos** es una forma particular de almacenar y organizar datos en una computadora de modo que puedan usarse de manera eficiente. En términos generales, una estructura de datos es una **fórmula especial** para organizar y almacenar datos. 

Los tipos de estructura de datos más comunes incluyen: arreglos, archivos, listas enlazadas, pilas, colas, árboles, grafos, etc.

Dependiendo de cómo se organicen los elementos, las estructuras de datos se clasifican en dos tipos:

1. **Estructuras de datos lineales**: se accede a los elementos en orden secuencial, pero no es obligatorio que todos los elementos se almacenen de manera contigua. Ejemplos: listas enlazadas, pilas y colas.  
2. **Estructuras de datos no lineales**: los elementos se almacenan/acceden en un orden no lineal. Ejemplos: árboles y grafos.

##### **Tipos de datos abstractos (ADTs)**

Antes de definir los tipos de datos abstractos, consideremos otra visión de los tipos de datos definidos por el sistema.  
Sabemos que, por defecto, todos los **tipos de datos primitivos** (int, float, etc.) soportan operaciones básicas como la suma y la resta, y el sistema proporciona las implementaciones para ellos. Para los **tipos de datos definidos por el usuario**, también necesitamos definir operaciones. La implementación de estas operaciones puede hacerse cuando realmente deseemos usarlas. En general, los tipos de datos definidos por el usuario se **definen junto con sus operaciones**.

Para simplificar el proceso de **resolver problemas**, combinamos las estructuras de datos con sus operaciones y los llamamos **tipos de datos abstractos (ADTs)**. Un ADT consta de dos partes:

1. Declaración de datos.  
2. Declaración de operaciones.

Los ADTs comúnmente utilizados incluyen: listas enlazadas, pilas, colas, colas de prioridad, árboles binarios, diccionarios, conjuntos disjuntos (Unión y Búsqueda), tablas hash, grafos y muchos otros.

Por ejemplo, la **pila** (stack) usa el mecanismo LIFO (Last-In-First-Out) para almacenar los datos. El último elemento insertado en la pila es el primero que se elimina. Sus operaciones comunes son: crear la pila, hacer *push* de un elemento, hacer *pop* de un elemento, encontrar el elemento superior (top) de la pila, encontrar cuántos elementos hay en la pila, etc.

Mientras se define un ADT, **no** hay que preocuparse demasiado por los detalles de implementación; estos solo entran en juego cuando realmente se usan. Diferentes tipos de ADTs se adecuan a distintos tipos de aplicaciones, y algunos están altamente especializados para tareas específicas. 

##### **¿Qué es un algoritmo?**

Consideremos el problema de **preparar una tortilla (omelette)**. Para prepararla, seguimos los pasos que se detallan a continuación:

1. Conseguir la sartén.  
2. Conseguir el aceite.  
   1. ¿Tenemos aceite?
      - Si sí, ponerlo en la sartén.
      - Si no, ¿queremos comprar aceite?
         - Si sí, entonces sal y cómpralo.
         - Si no, podemos terminar (abortar).  
3. Encender la estufa, etc.

Lo que estamos haciendo es, para un problema dado (preparar una tortilla), dar un procedimiento **paso a paso** para resolverlo. La definición formal de un algoritmo se puede expresar así:

> **Un algoritmo es un conjunto de instrucciones paso a paso para resolver un problema dado.**

Nota: No es necesario probar cada paso del algoritmo.


##### **¿Por qué analizar algoritmos?**

Para ir de la ciudad "A" a la ciudad "B", existen muchas formas de lograrlo: en avión, autobús, tren o bicicleta. Dependiendo de la disponibilidad y conveniencia, elegimos la que más nos conviene. Del mismo modo, en informática, **existen múltiples algoritmos** para resolver el mismo problema (por ejemplo, para el problema de ordenamiento hay muchos algoritmos, como de inserción,selección, quick, etc.). 

El análisis de algoritmos nos ayuda a determinar **cuál es el más eficiente** en términos de tiempo y espacio consumidos.


##### **Objetivo del análisis de algoritmos**

El objetivo del análisis de algoritmos es **comparar** algoritmos (o soluciones) principalmente en términos del **tiempo de ejecución**, pero también en otros factores (por ejemplo, memoria, esfuerzo de desarrollo, etc.).


##### **¿Qué es el análisis del tiempo de ejecución?**

Es el proceso de determinar **cómo** aumenta el tiempo de procesamiento a medida que **aumenta el tamaño del problema** (o tamaño de la entrada). El tamaño de la entrada es el número de elementos de la entrada y, dependiendo del tipo de problema, puede ser de distinta naturaleza. Algunos ejemplos comunes de tipos de entrada son:

- Tamaño de un arreglo.
- Grado de un polinomio.
- Número de elementos en una matriz.
- Número de bits en la representación binaria de la entrada.
- Vértices y aristas en un grafo.


##### **¿Cómo comparar algoritmos?**

Para comparar algoritmos, definamos algunas **medidas objetivas**:

- **¿Tiempos de ejecución?** No es una buena medida, porque los tiempos de ejecución dependen de la computadora específica.  
- **¿Número de sentencias ejecutadas?** Tampoco es una buena medida, ya que varía según el lenguaje de programación y el estilo del programador.  
- **Solución ideal**: Expresar el tiempo de ejecución de un algoritmo como una función del tamaño de la entrada $n$, es decir, $f(n)$ y comparar dichas funciones. Este método es independiente del tiempo de máquina, del estilo de programación, etc.


##### **¿Qué es la tasa de crecimiento?**

La tasa a la que aumenta el tiempo de ejecución como función de la entrada se llama **tasa de crecimiento** (rate of growth). Imagina que vas a una tienda a comprar un automóvil y una bicicleta. Si un amigo te ve y te pregunta qué estás comprando, normalmente contestarás "un auto". 

Esto se debe a que el costo del auto es mucho mayor que el de la bicicleta (aproximando el costo de la bicicleta al del auto).

$$
\text{Costo total} = \text{costo auto} + \text{costo bicicleta} \approx \text{costo auto}
$$

Para grandes valores de $n$, podemos **ignorar los términos de menor orden**. Por ejemplo, si tenemos $n^4 + 2n^2 + 100n + 500$, nos aproximamos a $n^4$ para valores grandes de $n$, ya que $n^4$ domina los demás términos.


##### **Tasas de crecimiento más comunes**

Se muestra la relación entre diferentes tasas de crecimiento, desde las más lentas hasta las más rápidas. Algunas de las más utilizadas son:

- $O(1)$: Constante  
- $O(\log n)$: Logarítmica  
- $O(n)$: Lineal  
- $O(n \log n)$: Lineal-logarítmica  
- $O(n^2)$: Cuadrática  
- $O(n^3)$: Cúbica  
- $O(2^n)$: Exponencial  

Como ejemplo, el tiempo para **agregar un elemento al frente de una lista enlazada** es $O(1)$. El tiempo para **encontrar un elemento en un array desordenado** es $O(n)$. El algoritmo de **merge sort** es $O(n \log n)$, etc.


##### **Tipos de análisis**

Para analizar un algoritmo, debemos saber con qué entradas el algoritmo tarda menos tiempo (buen rendimiento) y con qué entradas tarda más tiempo (peor rendimiento). Como ya hemos visto, un algoritmo se puede expresar en forma de una función. 

Eso significa que podemos representarlo con **múltiples expresiones**: una para el caso en que tarda menos y otra para el caso en que tarda más.

En general:

- **Peor caso (worst case)**: Define la entrada con la cual el algoritmo tarda más tiempo (más lento).  
- **Mejor caso (best case)**: Define la entrada con la cual el algoritmo tarda menos tiempo (más rápido).  
- **Caso promedio (average case)**: Da una **predicción** sobre el tiempo de ejecución asumiendo que la entrada es aleatoria.

$$\text{Límite inferior} <= \text{Tiempo medio} <= \text{Límite superior}$$

Así, existen **tres** tipos de análisis: **peor caso**, **mejor caso** y **caso promedio**. Cada uno puede expresarse como una función de $n$. Por ejemplo:

$$
f(n) = n^2 + 500 \quad (\text{peor caso})
$$
$$
f(n) = n + 100n + 500 \quad (\text{mejor caso})
$$

Para el caso promedio, se haría algo similar. 



### **Ejercicios**


**Pregunta 1**

**Considera la siguiente función en Python (lee los comentarios con atención):**

```python

def func(n):
    sum = 0  # costo temporal de la asignación = c1
    # se asume que la inicialización de i a 0 al inicio del bucle tiene costo 0
    for i in range(n):  # costo por cada incremento de i y verificación del rango = c2
        sum = sum + i * i  # costo de la suma = c3, 
        # costo de la multiplicación = c4 y 
        # costo de la asignación = c1
    return sum  # costo del retorno = c5
```

¿Cuál es el costo temporal total de llamar a la función `func` en términos de  $ n$, $c1$, $c2$, $c3$, $c4$ y $c5$?

Opciones:  
1. $c1 + n \times (c2 + c3 + c4) + c5$  
2. $n \times n \times (c2 + c3 + c4 + c1) + c1 + c5$  
3. $c1 + c2 + c3 + c4 + c5$  
4. $(n + 1) \times c1 + n \times (c2 + c3 + c4) + c5$  


**Pregunta 2**  
**Considera el siguiente arreglo que está casi ordenado en orden ascendente. Solo hay dos elementos (3 y 7) fuera de lugar:**  

$$A = [1, 2, 7, 4, 5, 6, 3, 8, 9]$$

Selecciona todas las afirmaciones correctas sobre la ejecución del algoritmo de ordenamiento por inserción (*insertion sort*) en $A$. Asegúrate de no seleccionar opciones incorrectas.

1. Durante la ejecución del algoritmo de ordenamiento por inserción, cuando el elemento $7$ se inserte en la porción ordenada $[1, 2]$, no se realizará ninguna operación de intercambio porque $2 < 7$.  
2. Después de insertar el elemento $7$, la inserción de los elementos $4$, $5$ y $6$ implicará una operación de intercambio cada uno, con el número $7$ permaneciendo al final de la porción ordenada del arreglo.  
3. La inserción del elemento $3$ en la porción ordenada $[1, 2, 4, 5, 6, 7]$ implica $4$ operaciones de intercambio, con $4$, $5$, $6$ y $7$, respectivamente.


**Pregunta 3**  
**Considera un arreglo de tamaño $n$ ordenado en orden descendente:**  
$$[n, n - 1, \ldots, 1] $$

Supón que ejecutamos el algoritmo de ordenamiento por inserción para ordenar este arreglo en orden ascendente.

Selecciona todas las opciones correctas:

1. Después de $i$ pasos, supón que la porción ordenada es $[n - i + 1, \ldots, n]$ y el elemento a insertar es $(n - i)$. Se necesitan realizar $i$ intercambios para garantizar que  $n - i$ se inserte en la posición correcta.  
2. El número total de intercambios es dado por:  
   $$
   1 + 2 + \cdots + (n - 1) = \frac{n(n - 1)}{2}
   $$
3. Considera un arreglo diferente $a = [a_1, a_2, \ldots, a_n]$ que cumple la propiedad $a[i] < a[i+1]$ en todas las posiciones excepto en una posición $a[j]$ donde $a[j] > a[j+1]$. El ordenamiento por inserción, tal como se presentó en la clase, se ejecutará en tiempo $\Theta(n)$ para dicho arreglo "casi" ordenado en forma ascendente.

**Pregunta 4**  
Dado el siguiente pseudocódigo para ordenar un arreglo $A$ de tamaño $n$ usando el *ordenamiento de inserción*:

```
for i from 1 to n - 1:
    key = A[i]  # costo de asignación = c1
    j = i - 1   # costo de asignación = c1
    while j >= 0 and A[j] > key:  # costo de comparación = c2
        A[j + 1] = A[j]  # costo de asignación = c1
        j = j - 1  # costo de decremento y asignación = c1
    A[j + 1] = key  # costo de asignación = c1
```

Supón que el arreglo inicial está ordenado en orden descendente:  $A = [n, n - 1, \ldots, 1]$  

¿Cuál es el costo total en el peor caso de ejecutar este algoritmo?  

1. $c1 \times n + c2 \times n$
2. $c1 \times n + \frac{n(n - 1)}{2} \times (c1 + c2)$  
3. $\Theta(n^2)$
4. $\Theta(n \log n)$  

**Pregunta 5**  
Se desea medir empíricamente el tiempo de ejecución de *ordenamiento de inserción* con distintos tamaños de entrada. Se utiliza Python con la función `time.time()` para medir el tiempo de inicio y finalización.

Considera los siguientes tamaños de entrada para arreglos aleatorios: $[100, 1000, 5000, 10000, 50000]$  

Preguntas:

1. ¿Cuál sería la complejidad temporal esperada en función del tamaño de entrada?  
2. Si al realizar el experimento con los tamaños mencionados se obtienen los siguientes tiempos:

   $$
   \text{Tiempos:} [0.01s, 0.12s, 0.48s, 2.00s, 12.5s]
   $$
   
   ¿El resultado se alinea con la complejidad $O(n^2)$? Justifica la respuesta.  


**Pregunta 6**  
Supón que tienes un arreglo de tamaño $n = 10,000$, donde los elementos están ordenados, excepto por $k = 10$ elementos en posiciones aleatorias que están desordenados.

Se ejecuta *ordenamiento inserción* en este arreglo.

Preguntas:  

1. ¿Cuál sería la complejidad temporal aproximada en función de $n$ y $k$?  
2. Si $k$ permanece constante y $n$ crece considerablemente, ¿qué sucede con el tiempo de ejecución?  
3. Explica por qué la complejidad en este caso se aproxima a $O(n)$ en lugar de $O(n^2)$.


**Pregunta 7**
 
Sea la función
$$
f(n) = n^4 + 3n^3\log n + 2n^2 + 100n + 1024.
$$
1. **Demuestra** que $ f(n) = O(n^4) $ utilizando la definición formal de la notación Big-O.  
2. **Obtén** una cota inferior de $ f(n) $ en términos de $\Omega(n^4)$ y argumenta por qué para $ n $ suficientemente grande los términos de menor orden son despreciables.

*Pistas:*  
- Identifica una constante $ c > 0 $ y un $ n_0 $ tal que $ f(n) \leq c \cdot n^4 $ para todo $ n \ge n_0 $.  
- Para la cota inferior, muestra que existe otra constante $ k > 0 $ y $ n_1 $ de modo que $ f(n) \ge k \cdot n^4 $ para $ n \ge n_1 $.

**Pregunta 8**
 
Considera dos algoritmos para resolver el problema de ordenamiento:
- **Algoritmo A:** Tiene complejidad en el peor caso de $ O(n \log n) $.  
- **Algoritmo B:** Tiene complejidad en el peor caso de $ O(n^2) $, pero se ha observado experimentalmente que para $ n \leq 1000 $ resulta más rápido que el algoritmo A.

1. **Diseña** un experimento teórico (o planteamiento matemático) que permita determinar a partir de qué tamaño de entrada $ n $ es preferible usar el Algoritmo A en lugar del Algoritmo B.  
2. **Discute** las implicaciones de depender únicamente del análisis asintótico frente a consideraciones prácticas (como constantes ocultas y la arquitectura del hardware).

*Pistas:*  
- Considera expresiones que incluyan constantes multiplicativas $ c_1 \cdot n \log n $ y $ c_2 \cdot n^2 $ para cada algoritmo.  
- Encuentra el valor de $ n $ a partir del cual $ c_1 \cdot n \log n \leq c_2 \cdot n^2 $.

**Pregunta 9**
 
Define un tipo de dato abstracto (ADT) que combine las características de una **pila** y una **cola**, conocido comúnmente como *deque* (double-ended queue).

1. **Especifica** las operaciones fundamentales del ADT, tales como:
   - `push_front(elemento)`
   - `push_back(elemento)`
   - `pop_front()`
   - `pop_back()`
   - `front()`
   - `back()`
2. **Diseña** el pseudocódigo para cada una de estas operaciones.  
3. **Analiza** la complejidad en el peor caso de cada operación considerando dos implementaciones:
   - Una basada en **listas enlazadas**.
   - Otra basada en **arreglos circulares**.

*Pistas:*  
- Reflexiona sobre cómo la elección de la estructura subyacente influye en la eficiencia (por ejemplo, en la operación de inserción o eliminación en ambos extremos).

**Pregunta 10**
 
Considera la siguiente definición de estructura en C:

```c
struct newType {
    int data1;
    float data2;
    char data;
};
```

1. **Investiga** cómo el alineamiento de memoria (padding) afecta el tamaño total de la estructura en diferentes compiladores y arquitecturas.  
2. **Calcula** el tamaño mínimo posible de esta estructura considerando un sistema donde:
   - `int` ocupa 4 bytes,
   - `float` ocupa 4 bytes, y
   - `char` ocupa 1 byte,
   teniendo en cuenta el alineamiento natural de cada tipo de dato.  
3. **Discute** las implicaciones del padding en el rendimiento y uso de la memoria en aplicaciones de sistemas embebidos o de alto rendimiento.

*Pistas:*  
- Recuerda que los compiladores pueden insertar bytes de relleno para alinear los datos según las reglas de la arquitectura.
- Determina el orden de los miembros y cómo reordenarlos podría optimizar el uso de memoria.

**Pregunta 11**

**Enunciado:**  
Imagina dos algoritmos que abordan un problema NP-completo:
- **Algoritmo de fuerza bruta:** Evalúa todas las posibles soluciones y tiene una complejidad temporal de $ O(2^n) $ en el peor caso.
- **Algoritmo heurístico:** Generalmente opera en tiempo $ O(n^2) $ en el caso promedio, pero en el peor caso puede llegar a $ O(2^n) $.

1. **Discute** las ventajas y desventajas de cada enfoque en escenarios prácticos.  
2. **Argumenta** bajo qué condiciones el algoritmo heurístico podría ser preferible al de fuerza bruta, considerando tanto el peor caso como el caso promedio.  
3. **Explora** cómo los análisis de complejidad (caso promedio, peor caso, mejor caso) pueden influir en la decisión de diseño de un algoritmo para problemas NP-completos.

*Pistas:*  
- Reflexiona sobre la aplicabilidad de cada método en función del tamaño de la entrada y la naturaleza del problema.
- Considera ejemplos prácticos en optimización, planificación o búsqueda de rutas.




In [None]:
## Tus respuestas