# Notación asintótica

Dadas las expresiones para mejor, promedio y peor caso, necesitamos representar formalmente las **cotas superior** y **cotas inferior**. Para ello, usamos cierta notación especial, que es el tema del siguiente cuaderno. Asumamos que el algoritmo se expresa como una función $f(n)$.


## 1.1 Notación Big-O

Esta notación proporciona la **cota superior ajustada** (tight upper bound) de la función dada. Normalmente se representa como $f(n) = O(g(n))$. Esto significa que, para valores grandes de $n$, la tasa de crecimiento de $f(n)$ es **como máximo** $g(n)$.  
Por ejemplo, si $f(n) = n^4 + 100n^2 + 10n + 50$, entonces $g(n)$ es $O(n^4)$.

La definición formal es:  
$$
O(g(n)) = \{\,f(n): \exists \, c, n_0 > 0 \;\text{tal que}\; 0 \le f(n) \le c\,g(n) \;\;\text{para todo}\; n \ge n_0\}.
$$

En términos sencillos, queremos encontrar la **tasa de crecimiento más grande** que **domina** a $f(n)$ cuando $n$ tiende a infinito. Ignoramos las constantes y los términos de menor orden.

Hay varios **ejemplos** sencillos:

- $3n + 8$ es $O(n)$.  
- $n^2 + 1$ es $O(n^2)$.  
- $n^4 + 100n^2 + 50$ es $O(n^4)$.  
- $2n^3 - 2n^2$ es $O(n^3)$.  
- $4^{10}$ (constante) es $O(1)$.

Generalmente descartamos valores más bajos de $n$. Esto significa que la tasa de crecimiento en valores más bajos de $n$ no es importante. por ejemplo $n_0$  es el punto a partir del cual necesitamos considerar la tasa de crecimiento para un algoritmo dado Por debajo de $n_0$, la tasa de crecimiento podría ser diferente. $n_0$ se llama umbral para la función dada.


$O(g(n))$ es el conjunto de funciones con un orden de crecimiento menor o igual al de $g(n)$. Por ejemplo, $O(n^2)$ incluye $O(1)$, $O(n)$, $O(n \log n)$, etc.

### 1.2 ¿No hay unicidad?

No hay un conjunto único de valores para $n_0$ y $c$ al probar los límites asintóticos. Consideremos, por ejemplo, $100n + 5 = O(n)$. Para esta función, hay múltiples valores posibles de $n_0$ y $c$.

- **Solución 1:**   $100n + 5 \leq 100n + n = 101n \leq 101n$, para todo $n \geq 5$, $n_0 = 5$ y $c = 101$ es una solución.

- **Solución 2:**   $100n + 5 \leq 100n + 5n = 105n \leq 105n$, para todo $n \geq 1$, $n_0 = 1$ y $c = 105$ también es una solución.

---

## 1.3 Notación Big Omega ($\Omega$)

Similar a Big-O, esta notación proporciona la **cota inferior ajustada** (tight lower bound) de la función, y se representa como $f(n) = \Omega(g(n))$. Esto significa que, para valores grandes de $n$, la tasa de crecimiento de $f(n)$ es **como mínimo** $g(n)$.  
La definición formal es:  

$$
\Omega(g(n)) = \{\,f(n): \exists \, c, n_0 > 0 \;\text{tal que}\; 0 \le c\,g(n) \le f(n) \;\;\text{para todo}\; n \ge n_0\}.
$$

Por ejemplo, si $f(n) = 100n^2 + 10n + 50$, su cota inferior ajustada es $\Omega(n^2)$.

**Ejemplos:**

**Ejemplo 1:** Encontrar la cota inferior para $f(n) = 5n^2$.

**Solución:**  
$\exists c, n_0$ tal que:  
$0 \leq cn^2 \leq 5n^2 \Rightarrow c = 1$ y $n_0 = 1$.  
Por lo tanto, $5n^2 = \Omega(n^2)$ con $c = 1$ y $n_0 = 1$.


**Ejemplo 2:** Probar que $f(n) = 100n + 5 \neq \Omega(n^2)$.

**Solución:**  
$\exists c, n_0$ tal que:  
$0 \leq cn^2 \leq 100n + 5$.  
$100n + 5 \leq 100n + 5n \ (\forall n \geq 1)\ = 105n$.  
$cn^2 \leq 105n \Rightarrow n(cn - 105) \leq 0$.  

Dado que $n$ es positivo $\Rightarrow cn - 105 \leq 0$.  
$\Rightarrow$ Contradicción: $n$ no puede ser menor que una constante.


**Ejemplo 3:** :$2n = \Omega(n), \quad n^3 = \Omega(n^3), \quad \log n = \Omega(\log n)$.

---

## 1.4 Notación Big-Theta ($\Theta$)

Esta notación decide si las cotas superior (**O**) e inferior (**$\Omega$**) de una función (algoritmo) son la **misma**. Es decir, si tanto la cota superior como la inferior tienen el **mismo orden** de crecimiento, entonces decimos que la función se encuentra en $\Theta(g(n))$.  

La definición formal:  

$$
\Theta(g(n)) = \{\,f(n) : \exists\, c_1, c_2, n_0 > 0 \;\text{tal que}\; 0 \le c_1 \, g(n) \le f(n) \le c_2 \, g(n) \;\;\text{para todo}\; n \ge n_0\}.
$$
$g(n)$ es una cota asintótica ajustada para $f(n)$. $\Theta(g(n))$ es el conjunto de funciones con el mismo orden de crecimiento que $g(n)$.

Por ejemplo, si $f(n) = 10n + n$, es $O(n)$ y también $\Omega(n)$. Por lo tanto, $f(n) = \Theta(n)$.


En este caso, las tasas de crecimiento en el mejor caso y en el peor caso son las mismas. Como resultado, el caso promedio también será el mismo. Para una función dada (algoritmo), si las tasas de crecimiento (cotas) para los casos $O$ y $\Omega$ no son las mismas, entonces la tasa de crecimiento para el caso $\Theta$ puede no ser la misma. En este caso, necesitamos considerar todos los posibles tiempos de ejecución y tomar el promedio de estos.


### **Ejemplos**

**Ejemplo 1:** Encontrar la cota $\Theta$ para $f(n) = \frac{n^2}{2} - \frac{n}{2}$.  

**Solución:**  

$$
\frac{n^2}{5} \leq \frac{n^2}{2} - \frac{n}{2} \leq n^2, \quad \text{para todo } n \geq 1
$$  

Por lo tanto:  

$$
\frac{n^2}{5} = \Theta(n^2) \text{ con } c_1 = \frac{1}{5}, c_2 = 1 \text{ y } n_0 = 1
$$


**Ejemplo 2:** Probar que $f(n) \neq \Theta(n^2)$.

**Solución:**  
$$
c_1n^2 \leq n \leq c_2n^2 \text{ solo se cumple para: } n \leq \frac{1}{c_1}
$$

Por lo tanto:  
$$
n \notin \Theta(n^2)
$$


**Ejemplo 3:** Probar que $6n^3 \neq \Theta(n^2)$.

**Solución:**  
$$
c_1n^2 \leq 6n^3 \leq c_2n^2 \text{ solo se cumple para: } n \leq \frac{c_2}{6}
$$  
Por lo tanto:  
$$
6n^3 \neq \Theta(n^2)
$$


**Ejemplo 4:** Probar que $$n \neq \Theta(\log n)$$.

**Solución:**  
$$
c_1\log n \leq n \leq c_2\log n \Rightarrow c_2 \geq \frac{n}{\log n}, \forall n \geq n_0
$$  

**Imposible.**

---

**Notas importantes:**  

Para el análisis (mejor caso, peor caso y promedio), tratamos de dar la cota superior ($O$) y la cota inferior ($\Omega$) junto con el tiempo de ejecución promedio ($\Theta$).

A partir de los ejemplos anteriores, también debe quedar claro que, para una función (algoritmo) dada, obtener la cota superior ($O$) y la cota inferior ($\Omega$) y el tiempo de ejecución promedio ($\Theta$) puede no ser siempre factible. Por ejemplo, si estamos discutiendo el mejor caso de un algoritmo, tratamos de dar la cota superior ($O$) y el tiempo de ejecución promedio ($\Theta$).  


## Ejercicios

#### **Pregunta 1**

##### **Algoritmo para discutir (pseudo código)**

```
algorithm compute_array_stuff(a)
# a es un arreglo de tamaño n
for k = 1 to n:
    if a[k] is prime:
        return 0

sum = 0
for i = 1 to n:
    for j = i+1 to n:
        sum = sum + a[i] * a[j]
```


##### **Afirmaciones (seleccionar solo las correctas, sin elegir las incorrectas)**

1. Para cada n, en el mejor caso, el algoritmo termina tras un número constante de pasos.
   Esto ocurre específicamente si el primer elemento del arreglo (posición 1) es un número primo.

2. Para cada n, el algoritmo se ejecuta en tiempo lineal en n en el peor caso.

3. El peor caso se alcanza cuando el arreglo está compuesto solo por números compuestos (no primos).

4. La complejidad en el peor caso del algoritmo está acotada superiormente por $O(n^3)$.

5. La complejidad en el peor caso del algoritmo está acotada inferiormente por $\Omega(n)$.

6. La complejidad en el peor caso del algoritmo es $\Theta(n^2)$.



#### **Pregunta 2**

El **Algoritmo X**, programado por un “programador experto”, se ejecuta en tiempo  

$$
2.5\,n^4 + 3\,n^3 + 1.4\,n + 2
$$  
para entradas de tamaño $n$ en el peor caso.  

Otro **algoritmo Y**, programado por un “novato” para el mismo problema, se ejecuta en tiempo  

$$
2000\,n + 10000
$$  
para entradas de tamaño $n$ en el peor caso.

Selecciona las respuestas correctas:

1. Para entradas de tamaño $n=2$, **X** es mucho más rápido que **Y**.
2. El algoritmo **X** será mucho más rápido que **Y** para **todas** las entradas.
3. **X** se ejecuta en tiempo $\Theta(n^4)$.
4. **Y** se ejecuta en tiempo $O(n^2)$.
5. **Y** es asintóticamente más rápido que **X**.
6. Es posible que para alguna entrada de tamaño 100, el algoritmo **X** sea más rápido que **Y**.


#### **Pregunta 3**

Supón que un algoritmo se ejecuta en tiempo  

$$
1.5 \times 2^n + 1.2 \times n^2
$$  
en el peor caso. Escoge la respuesta correcta de la siguiente lista:

1. Su tiempo de ejecución puede expresarse como $O(3^n)$.
2. Dado que las constantes se ignoran en el tiempo asintótico, podemos escribir el tiempo de ejecución como $\Theta(2^{2n})$.
3. El término $1.2 \times n^2$ domina a $2^n$. Por tanto, la complejidad asintótica del algoritmo es $O(n^2)$.
4. No es posible que un algoritmo programado tenga tiempos de ejecución como $2^n$.


#### **Pregunta 4**

Supón que un algoritmo se ejecuta en tiempo  
$$
200 \,\log_2(n) + 250
$$  
en el peor caso, dependiendo del tamaño de entrada $n$. ¿Cuáles de las siguientes opciones son correctas?

1. El tiempo de ejecución es $\Theta(\log_{10}(n))$, dado que $\log_{10}(n) = \frac{\log_2(n)}{\log_2(10)}$, y la constante $\frac{1}{\log_2(10)}$ no afecta la notación asintótica.
2. Es imposible que un algoritmo tenga tiempo de ejecución más pequeño que el tamaño de la entrada.
3. El tiempo de ejecución del algoritmo es $O(n)$.


#### **Pregunta 5**

Considera un algoritmo que, dado un número $n$, imprime todos los pares $(i,j)$ tales que $1 \le i < j \le n$.  

1. Escribe el pseudo código de dicho algoritmo.  
2. Determina su complejidad asintótica y justifica tu respuesta.

#### **Pregunta 6**

Un algoritmo recibe como entrada un arreglo de $n$ elementos. Primero revisa si alguno de los elementos es negativo (si encuentra uno, termina de inmediato). Si no encuentra ninguno, luego realiza un bucle doble para procesar cada par de elementos.  

- Describe en qué situaciones se alcanza el mejor caso y en cuáles el peor caso.  
- Determina la complejidad en ambos escenarios.

#### **Ejercicio 7**
Se tiene un algoritmo que suma recursivamente la mitad de los elementos de un arreglo en cada llamada, hasta que queda un solo elemento.  

1. Escribe la relación de recurrencia para el tiempo de ejecución $T(n)$.  
2. Resuélvela usando la metodología que prefieras (árbol de recurrencia, método maestro, sustitución, etc.) y da la complejidad resultante.


## Respuestas

#### **Pregunta 1**

##### **Análisis del algoritmo**

**Pseudo código:**
```pseudo
algorithm compute_array_stuff(a)
# a es un arreglo de tamaño n
for k = 1 to n:
    if a[k] is prime:
        return 0

sum = 0
for i = 1 to n:
    for j = i+1 to n:
        sum = sum + a[i] * a[j]
```

**Descripción del algoritmo:**
1. **Primera parte:**
   - Recorre el arreglo `a` desde el índice 1 hasta `n`.
   - Si encuentra un número primo en cualquier posición, retorna inmediatamente `0`.

2. **Segunda parte:**
   - Si no se encuentra ningún número primo, inicializa una variable `sum` en `0`.
   - Recorre todas las parejas de elementos `(i, j)` donde `i < j` y acumula el producto `a[i] * a[j]` en `sum`.

##### **Evaluación de las afirmaciones**

Vamos a analizar cada una de las afirmaciones para determinar cuáles son correctas.

1. **Para cada n, en el mejor caso, el algoritmo termina tras un número constante de pasos. Esto ocurre específicamente si el primer elemento del arreglo (posición 1) es un número primo.**

   - **Análisis:** En el mejor caso, el primer elemento `a[1]` es primo. El algoritmo realiza una sola verificación y retorna inmediatamente.
   - **Conclusión:** **Correcta.**

2. **Para cada n, el algoritmo se ejecuta en tiempo lineal en n en el peor caso.**

   - **Análisis:** En el peor caso, ningún elemento es primo. El algoritmo primero recorre `n` elementos en la primera parte ($O(n)$) y luego realiza un doble bucle anidado que tiene una complejidad de $O(n^2)$.
   - **Conclusión:** **Incorrecta.** La complejidad en el peor caso es $O(n^2)$.

3. **El peor caso se alcanza cuando el arreglo está compuesto solo por números compuestos (no primos).**

   - **Análisis:** Si todos los elementos son compuestos, el algoritmo no retorna en la primera parte y procede a ejecutar el doble bucle.
   - **Conclusión:** **Correcta.**

4. **La complejidad en el peor caso del algoritmo está acotada superiormente por $O(n^3)$.**

   - **Análisis:** La verdadera complejidad en el peor caso es $O(n^2)$, ya que el doble bucle es la parte dominante. Decir que está acotada por $O(n^3)$ es técnicamente correcto pero no es la cota más ajustada.
   - **Conclusión:** **Correcta.**

5. **La complejidad en el peor caso del algoritmo está acotada inferiormente por $\Omega(n)$.**

   - **Análisis:** En el peor caso, el algoritmo realiza al menos $O(n)$ operaciones en la primera parte del código.
   - **Conclusión:** **Correcta.**

6. **La complejidad en el peor caso del algoritmo es $\Theta(n^2)$.**

   - **Análisis:** Como el doble bucle es la parte dominante y no hay términos de orden superior, la complejidad es precisamente $\Theta(n^2)$.
   - **Conclusión:** **Correcta.**

#### **Pregunta 2**

##### **Descripción de los algoritmos**

- **Algoritmo X:**
  $$
  T_X(n) = 2.5\,n^4 + 3\,n^3 + 1.4\,n + 2
  $$
  
- **Algoritmo Y:**
  $$
  T_Y(n) = 2000\,n + 10000
  $$

##### **Evaluación de las afirmaciones**

1. **Para entradas de tamaño $n=2$, X es mucho más rápido que Y.**

   - **Cálculo:**
     $$
     T_X(2) = 2.5 \times 2^4 + 3 \times 2^3 + 1.4 \times 2 + 2 = 40 + 24 + 2.8 + 2 = 68.8
     $$
     $$
     T_Y(2) = 2000 \times 2 + 10000 = 4000 + 10000 = 14000
     $$
   - **Comparación:** $68.8 < 14000$
   - **Conclusión:** **Correcta.**

2. **El algoritmo X será mucho más rápido que Y para todas las entradas.**

   - **Análisis:** Para valores grandes de $n$, $T_X(n)$ crece como $n^4$ y $T_Y(n)4 crece linealmente. Aunque para pequeños $n$ $X$ es más rápido, para grandes $n$, $Y$ será más rápido.
   - **Conclusión:** **Incorrecta.**

3. **X se ejecuta en tiempo $\Theta(n^4)$.**

   - **Análisis:** El término dominante es $n^4$, por lo que la complejidad es $\Theta(n^4)$.
   - **Conclusión:** **Correcta.**

4. **Y se ejecuta en tiempo $O(n^2)$.**

   - **Análisis:** $T_Y(n) = O(n)$, y $O(n)$ es un subconjunto de $O(n^2)$.
   - **Conclusión:** **Correcta.**

5. **Y es asintóticamente más rápido que X.**

   - **Análisis:** Asintóticamente, $O(n)$ es más rápido que $O(n^4)$.
   - **Conclusión:** **Correcta.**

6. **Es posible que para alguna entrada de tamaño 100, el algoritmo X sea más rápido que Y.**

   - **Cálculo:**
     $$
     T_X(100) = 2.5 \times 100^4 + 3 \times 100^3 + 1.4 \times 100 + 2 = 2.5 \times 10^8 + 3 \times 10^6 + 140 + 2 = 253,000,142
     $$
     $$
     T_Y(100) = 2000 \times 100 + 10000 = 200,000 + 10,000 = 210,000
     $$
   - **Comparación:** $253,000,142 > 210,000$
   - **Conclusión:** **Incorrecta.**


#### **Pregunta 3**

##### **Descripción del algoritmo**

- **Tiempo de ejecución:**
  $$
  T(n) = 1.5 \times 2^n + 1.2 \times n^2
  $$

##### **Evaluación de las afirmaciones**

1. **Su tiempo de ejecución puede expresarse como $O(3^n)$.**

   - **Análisis:** $2^n = O(3^n)$, ya que para $n \geq 1$, $2^n < 3^n$.
   - **Conclusión:** **Correcta.**

2. **Dado que las constantes se ignoran en el tiempo asintótico, podemos escribir el tiempo de ejecución como $\Theta(2^{2n})$.**

   - **Análisis:** $2^{2n} = 4^n$, que crece mucho más rápido que $2^n$. Por lo tanto, $T(n)$ no es $\Theta(4^n)$.
   - **Conclusión:** **Incorrecta.**

3. **El término $1.2 \times n^2$ domina a $2^n$. Por tanto, la complejidad asintótica del algoritmo es $O(n^2)$.**

   - **Análisis:** En realidad, $2^n$ crece exponencialmente y domina a cualquier polinomial como $n^2$.
   - **Conclusión:** **Incorrecta.**

4. **No es posible que un algoritmo programado tenga tiempos de ejecución como $2^n$.**

   - **Análisis:** Existen algoritmos recursivos y de fuerza bruta que tienen tiempos de ejecución exponenciales como $2^n$.
   - **Conclusión:** **Incorrecta.**


#### **Pregunta 4**

##### **Descripción del algoritmo**

- **Tiempo de ejecución:**
  $$
  T(n) = 200 \times \log_2(n) + 250
  $$

##### **Evaluación de las afirmaciones**

1. **El tiempo de ejecución es $\Theta(\log_{10}(n))$, dado que $\log_{10}(n) = \frac{\log_2(n)}{\log_2(10)}$, y la constante $\frac{1}{\log_2(10)}$ no afecta la notación asintótica.**

   - **Análisis:** Las bases de los logaritmos difieren por una constante multiplicativa. Por lo tanto, $\log_2(n)$ y $\log_{10}(n)$ son de la misma clase asintótica.
   - **Conclusión:** **Correcta.**

2. **Es imposible que un algoritmo tenga tiempo de ejecución más pequeño que el tamaño de la entrada.**

   - **Análisis:** Existen algoritmos que operan en tiempo constante $O(1)$ o logarítmico $O(\log n)$, que son más pequeños que lineal $O(n)$.
   - **Conclusión:** **Incorrecta.**

3. **El tiempo de ejecución del algoritmo es $O(n)$.**

   - **Análisis:** $T(n) = O(\log n)$, y como $O(\log n) \subset O(n)$, esta afirmación es correcta.
   - **Conclusión:** **Correcta.**

#### **Pregunta 5**

##### **Descripción del problema**

Se requiere un algoritmo que, dado un número $n$, imprima todos los pares $(i, j)$ tales que $1 \leq i < j \leq n$.

##### **1. Pseudo código del algoritmo**

```pseudo
algorithm print_all_pairs(n)
    for i from 1 to n-1:
        for j from i+1 to n:
            print (i, j)
```

##### **2. Complejidad asintótica**

- **Análisis:**
  - **Número de iteraciones:**
    - El primer bucle recorre desde $i = 1$ hasta $i = n-1$ (total de $n-1$ iteraciones).
    - Para cada $i$, el segundo bucle recorre desde $j = i+1$ hasta $j = n$ (aproximadamente $n - i$ iteraciones).
    - El número total de pares es:
      $$
      \sum_{i=1}^{n-1} (n - i) = \frac{n(n-1)}{2} = O(n^2)
      $$
  - **Operación por iteración:** Cada iteración realiza una operación de impresión que se considera de tiempo constante $O(1)$.

- **Conclusión:** La complejidad asintótica del algoritmo es $\Theta(n^2)$.


#### **Pregunta 6**

##### **Descripción del algoritmo**

El algoritmo recibe un arreglo de $n$ elementos. Primero revisa si alguno de los elementos es negativo (si encuentra uno, termina de inmediato). Si no encuentra ninguno, realiza un bucle doble para procesar cada par de elementos.

##### **Análisis de casos**

1. **Mejor caso:**

   - **Descripción:** El primer elemento del arreglo es negativo.
   - **Comportamiento del algoritmo:**
     - Revisa el primer elemento.
     - Encuentra que es negativo y retorna inmediatamente.
   - **Complejidad:** Solo realiza una verificación.
     $$
     T(n) = O(1)
     $$

2. **Peor caso:**

   - **Descripción:** Ningún elemento del arreglo es negativo.
   - **Comportamiento del algoritmo:**
     - Recorre todo el arreglo en la primera parte ($O(n)$).
     - Luego, realiza un doble bucle para procesar cada par de elementos ($O(n^2)$).
   - **Complejidad total:**
     $$
     T(n) = O(n) + O(n^2) = O(n^2)
     $$

##### **Resumen:**

- **Mejor caso:**
  - **Situación:** Al menos un elemento negativo encontrado en las primeras posiciones del arreglo.
  - **Complejidad:** $O(1)$ (constante).

- **Peor caso:**
  - **Situación:** Todos los elementos son no negativos.
  - **Complejidad:** $O(n^2)$.

#### **Pregunta 7**

##### **Descripción del algoritmo**

Un algoritmo suma recursivamente la mitad de los elementos de un arreglo en cada llamada, hasta que queda un solo elemento.

##### **1. Relación de recurrencia para el tiempo de ejecución $T(n)$**

**Asunción:** En cada llamada recursiva, el algoritmo procesa $n/2$ elementos y hace una llamada recursiva con $n/2$ elementos.

- **Relación de recurrencia:**
  $$
  T(n) = T\left(\frac{n}{2}\right) + c \times \frac{n}{2}
  $$
  Donde $c$ es una constante que representa el tiempo de procesamiento de los $n/2$ elementos.

##### **2. Resolución de la relación de recurrencia**

Aplicaremos el **Teorema maestro** para resolver la recurrencia.

- **Forma del Teorema maestro:**
  $$
  T(n) = a \times T\left(\frac{n}{b}\right) + f(n)
  $$
  
- **Identificación de parámetros:**
  - $a = 1$
  - $b = 2$
  - $f(n) = c \times \frac{n}{2} = O(n)$

- **Cálculo de $ \log_b a $:**
  $$
  \log_2 1 = 0
  $$

- **Comparación de $f(n)$ con $n^{\log_b a}$:**
  $$
  f(n) = \Theta(n) \quad \text{vs} \quad n^{\log_b a} = n^0 = 1
  $$
  
- **Conclusión del Teorema maestro:**
  - Caso 3: Si $f(n) = \Omega(n^{\log_b a + \epsilon})$ para algún $\epsilon > 0$ y si $a \times f\left(\frac{n}{b}\right) \leq k \times f(n)$ para algún $k < 1$ y suficientemente grande $n$, entonces:
    $$
    T(n) = \Theta(f(n)) = \Theta(n)
    $$

Por lo tanto, la solución de la recurrencia es:
$$
T(n) = \Theta(n)
$$

## 1.5 ¿Por qué se llama análisis asintótico?

A partir de la discusión anterior (para las tres notaciones: peor caso, mejor caso y caso promedio), podemos entender fácilmente que, en cada caso para una función dada $f(n)$, tratamos de encontrar otra función $g(n)$ que **aproxime** $f(n)$ cuando $n$ toma valores grandes. Esto significa que $g(n)$ también es una curva que aproxima $f(n)$ en valores grandes de $n$.

En matemáticas, a una curva de este tipo se le llama **[curva asintótica](https://medium.com/@MA/asymptotic-notations-for-the-analysis-of-algorithms-71fdc3a48ee4)**. En otras palabras, $g(n)$ es la curva asintótica de $f(n)$. Por esta razón, al análisis de algoritmos se le llama **análisis asintótico**.


## 1.6 Guías para el análisis asintótico

Existen algunas reglas generales que nos ayudan a determinar el tiempo de ejecución de un algoritmo.

1. **Bucles (loops)**  
   El tiempo de ejecución de un bucle es, como máximo, el tiempo de ejecución de las sentencias dentro del bucle (incluyendo las evaluaciones de la condición) multiplicado por el número de iteraciones.

   ```python
   # se ejecuta n veces
   for i in range(0, n):
       print('Actual numero:', i)  # tiempo constante
   # Tiempo total = una constante c x n = c*n => O(n).
   ```

2. **Bucles anidados**  
   Analiza desde el interior hacia afuera. El tiempo de ejecución total es el producto de los tamaños de todos los bucles.

   ```python
   # bucle externo se ejecuta n veces
   for i in range(0, n):
       # bucle interno se ejecuta n veces
       for j in range(0, n):
           print('valor i  %d y valor j  %d' % (i, j))  # tiempo constante

   # Tiempo total: c * n * n = c*n^2 => O(n^2).
   ```

3. **Sentencias consecutivas**  
   Suma las complejidades de cada sentencia.

   ```python
   n = 100  # tiempo constante c0

   # se ejecuta n veces
   for i in range(0, n):
       print('Actual numero:', i)  # tiempo constante c1

   # bucle externo n veces
   for i in range(0, n):
       # bucle interno n veces
       for j in range(0, n):
           print('Valor i  %d y valor j %d' % (i, j))  # tiempo constante c2

   # Tiempo total = c0 + c1*n + c2*n^2 => O(n^2).
   ```

4. **Sentencias if-then-else**  
   El tiempo de ejecución en el peor caso es el tiempo de la comparación, más el tiempo de la parte `then` o la parte `else` (la que tome más tiempo).

   ```python
   if n < 1:
       print("Valor equivocado")  # tiempo constante
       print(n)              # tiempo constante
   else:
       for i in range(0, n):
           print('Actual numero:', i)  # se ejecuta n veces

   # Tiempo total = c0 + c1*n => O(n).
   ```

5. **Complejidad logarítmica**  
   Un algoritmo es $O(\log n)$ si le toma tiempo constante reducir el **tamaño del problema** en una fracción (usualmente la mitad). Por ejemplo:

   ```python
   def Logarithms(n):
       i = 1
       while i <= n:
           i = i * 2
           print(i)

   Logarithms(100)
   ```
   Si observamos con cuidado, el valor de `i` se **duplica** cada vez. Suponiendo que el bucle se ejecute $k$ veces, al salir se cumple $2^k \approx n$.  
   Tomando logaritmo a ambos lados:  
   $$
   \log(2^k) = \log(n) \quad \Rightarrow \quad k = \log_2 n
   $$  
   Por lo tanto, el tiempo total es $O(\log n)$.

   > **Nota**: Para el caso inverso (disminuir a la mitad), también obtenemos $O(\log n)$. Un ejemplo típico es la **búsqueda binaria**, en la que cada vez descartamos la mitad del espacio de búsqueda.

   ```python
   def Logarithms(n):
       i = n
       while i >= 1:
           i = i // 2
           print(i)

       Logarithms(100)
   ```

---

## 1.7 Propiedades de las notaciones

- **Transitividad**:  
  Si $f(n) = O(g(n))$ y $g(n) = O(h(n))$, entonces $f(n) = O(h(n))$. Esto también aplica para $\Omega$.  
- **Reflexividad**:  
  $f(n) = O(f(n))$. Válido para $O$ y $\Omega$.  
- **Simetría**:  
  $f(n) = O(g(n))$ si y solo si $g(n) = \Omega(f(n))$.  
- **Transposición simétrica**:  
  $f(n) = O(g(n))$ si y solo si $g(n) = \Omega(f(n))$. (Es la misma idea de la propiedad de simetría.)

---


## 1.8 Análisis amortizado

El análisis amortizado se refiere a determinar el **tiempo de ejecución promedio** para una **secuencia de operaciones**. Es distinto al **análisis de caso promedio**, porque en el análisis amortizado no se hacen suposiciones sobre la distribución de los datos, mientras que el análisis de caso promedio supone que los datos no son “malos” (por ejemplo, algunos algoritmos de ordenamiento funcionan bien en promedio, pero muy mal en ciertos ordenamientos de entrada).El análisis amortizado es un análisis de **peor caso** para **toda la secuencia** de operaciones, no para operaciones individuales.  

Se motiva para entender mejor el tiempo de ejecución de ciertas técnicas, cuando la mayoría de operaciones son “baratas” pero algunas pocas pueden ser “caras”. Si se puede mostrar que las operaciones costosas son raras, se compensa con las baratas.

La idea es asignar un “costo artificial” a cada operación de la secuencia, tal que la **suma de los costos artificiales** limite o “amortigüe” la suma de los costos reales. Ese costo artificial se llama **costo amortizado** de la operación. Para analizar el tiempo total de ejecución, el costo amortizado provee una manera correcta de entender el tiempo global. Sin embargo, no limita el tiempo de ejecución de una operación individual (que aún podría ser costosa en un punto aislado).

**Ejemplo:** Consideremos un arreglo de elementos del cual queremos encontrar el k-ésimo elemento más pequeño. Podemos resolver este problema utilizando ordenamiento. Después de ordenar el arreglo dado, solo necesitamos devolver el $k$-ésimo elemento.  
El costo de realizar el ordenamiento (suponiendo un algoritmo de ordenamiento basado en comparaciones) es $O(n \log n)$. Si realizamos $n$ selecciones de este tipo, el costo promedio de cada selección es $O(n \log n /n) = O(\log n)$. Esto indica claramente que ordenar una sola vez reduce la complejidad de las operaciones posteriores.

### Casos

##### **1. Arreglos dinámicos (dynamic arrays)**

**Descripción del ejemplo:**
Los arreglos dinámicos, como los `ArrayList` en Java o los `vector` en C++, permiten cambiar su tamaño durante la ejecución. Cuando se agrega un elemento y el arreglo está lleno, se crea un nuevo arreglo con mayor capacidad (generalmente el doble), y se copian los elementos existentes al nuevo arreglo.

**Análisis amortizado:**
Aunque una operación de inserción puede requerir una copia de todos los elementos existentes (lo que tiene un costo de $O(n)$), la mayoría de las inserciones son de costo constante $O(1)$. Usando el análisis amortizado, el costo promedio por inserción sigue siendo $O(1)$ a lo largo de una secuencia de operaciones, ya que las operaciones costosas de copia ocurren raramente.

##### **2. Pilas con operaciones de apilado y desapilado**

**Descripción del ejemplo:**
Consideremos una pila que soporta operaciones `push` (apilar) y `pop` (desapilar). Además, supongamos que la pila puede ocasionalmente realizar operaciones adicionales, como invertir los elementos.

**Análisis amortizado:**
Aunque una operación individual como invertir la pila puede tener un costo alto ($O(n)$), si esta operación se realiza solo después de muchas operaciones de `push` y `pop`, el costo se distribuye a lo largo de todas las operaciones. Por lo tanto, el costo amortizado por operación sigue siendo $O(1)$, ya que las operaciones costosas son compensadas por muchas operaciones de bajo costo.

##### **3. Estructuras de unión-find con compresión de caminos**

**Descripción del ejemplo:**
La estructura de datos unión-find es utilizada para gestionar conjuntos disjuntos y soporta operaciones de `find` y `union`. Al implementar técnicas como la compresión de caminos y la unión por rango, se optimiza el tiempo de ejecución de estas operaciones.

**Análisis amortizado:**
Aunque una operación `find` individual podría parecer costosa, las optimizaciones aseguran que una secuencia de $m$ operaciones sobre $n$ elementos tenga un tiempo total de casi $O(m)$. Por lo tanto, el costo amortizado por operación es prácticamente constante, aunque algunas operaciones específicas puedan tener un costo mayor.

##### **Diferencias con el análisis de costo promedio**

- **Análisis amortizado:**
  - **Enfoque:** Considera una secuencia de operaciones y distribuye el costo total de la secuencia entre todas las operaciones.
  - **Garantía:** Proporciona una cota superior garantizada para el costo promedio por operación, independientemente de la distribución de las entradas.
  - **Aplicabilidad:** Es útil para estructuras de datos donde ciertas operaciones ocasionales son costosas, pero el costo se amortiza a lo largo de muchas operaciones de bajo costo.

- **Análisis de costo promedio:**
  - **Enfoque:** Calcula el costo esperado por operación, asumiendo una distribución de probabilidad específica para las entradas.
  - **Dependencia:** Depende de supuestos sobre cómo se distribuyen las operaciones o los datos de entrada.
  - **Limitación:** No siempre proporciona garantías en el peor de los casos, ya que está basado en promedios probabilísticos.

Mientras que el análisis amortizado garantiza que el costo promedio por operación será bajo en una secuencia de operaciones sin asumir nada sobre la distribución de las entradas, el análisis de costo promedio se basa en supuestos probabilísticos sobre cómo se comportarán las entradas o las operaciones, lo que puede no siempre reflejar el peor de los casos.


### 1.8 Ejemplos

#### Ejemplo 1

¿Cuál es el tiempo de ejecución del siguiente código?

```python
def Function(n):
    i = 1
    s = 1
    while s < n:
        i = i + 1
        s = s + i
        print("*")

Function(20)
```

**Solución**: La variable `s` se incrementa de manera que en la k-ésima iteración es la suma de los **primeros k enteros**. Si $k$ es el número de iteraciones, el bucle termina cuando

$$
1 + 2 + 3 + \dots + k \ge n \quad \Rightarrow \quad \frac{k(k+1)}{2} \approx n,
$$

por lo cual $(k = O(\sqrt{n})$. De ahí que la complejidad sea $O(\sqrt{n})$.

#### Ejemplo 2

Encuentra la complejidad de la función dada:

```python
def Function(n):
    i = 1
    count = 0
    while i*i < n:
        count = count + 1
        i = i + 1
    print(count)

Function(20)
```

**Solución**: Se repite el bucle mientras $i^2 < n$. Esto implica $i < \sqrt{n}$. Por lo tanto, la complejidad es $O(\sqrt{n})$.

#### Ejemplo 3
Encuentra la complejidad de la función dada:


```python
def Function(n):
    count = 0
    for i in range(n/2, n):
        j = 1
        while j + n/2 <= n:
            k = 1
            while k <= n:
                count = count + 1
                k = k * 2
            j = j + 1
    print(count)

Function(20)
```

**Solución**:

- `for i in range(n/2, n)`: se itera aproximadamente $n/2$ veces.  
- `while j + n//2 <= n`: se itera otras $n/2$ veces.  
- `while k <= n`: se itera $\log n$ veces (porque `k` se duplica cada vez).  

Multiplicando: $\tfrac{n}{2} \times \tfrac{n}{2} \times \log n = O(n^2 \log n)$.

#### Ejemplo 4

Encuentra la complejidad de la función dada:

```python
def Function(n):
    count = 0
    for i in range(n/2, n):
        j = 1
        while j + n/2 <= n:
            k = 1
            while k <= n:
                count = count + 1
                k = k * 2
            j = j * 2
    print(count)

Function(20)
```

**Solución**:

- Bucle externo: $(n/2$ veces.  
- Bucle medio: ahora es $j = j * 2$, así que se ejecuta $\log n$ veces.  
- Bucle interno: $\log n$ veces también.  

El total es: $\tfrac{n}{2} \times \log n \times \log n = O(n \log^2 n)$.

#### Ejemplo 5

Encuentra la complejidad de la función dada:

```python
def Function(n):
    count = 0
    for i in range(n/2, n):
        j = 1
        while j + n/2 <= n:
            break
            j = j * 2
    print(count)

Function(20)
```

**Solución**:

- Bucle externo: se ejecuta $n/2$ veces.  
- Bucle interno: **tiene un `break` inmediato**, así que apenas se ejecuta una vez por cada iteración del bucle externo.  

La complejidad es $O(n)$.

#### Ejemplo 6

Analiza el tiempo de ejecución del siguiente programa:

```python
def Function(n):
    count = 0
    if n <= 0:
        return
    for i in range(0, n):
        j = 1
        while j < n:
            j = j + i
            count = count + 1
    print(count)

Function(20)
```

##### Comentarios

- El bucle externo: se ejecuta $n$ veces.  
- El bucle interno: la variable `j` se incrementa de `j = j + i`.  
  - Si $i = 0$, el bucle interno se vuelve infinito, **pero** con `i=0` no se incrementa `j`, así que habría que ver si sale del while. (Si es un caso particular, quizá el programa no está bien definido para $i=0$).  
  - Si $i>0$, la cantidad de iteraciones internas es $\approx n / i$.  

Asumiendo que el código real tiene un manejo diferente de $i=0$ o que se salta ese caso, la **suma** de iteraciones ~ $\sum_{i=1}^{n-1} (n/i)$. Esa sumatoria es $n\cdot\sum_{i=1}^{n} 1/i = n \log n$.  

Por tanto, el tiempo de ejecución es $O(n \log n)$.

*(Si el caso $i=0$ produce un bucle infinito, habría un error; a veces se asume $i$ inicia en 1).*

#### Ejemplo 7

¿Cuál es la complejidad de $\sum_{i=1}^{n} \log i$?

**Solución**  
Usando la propiedad logarítmica:  

$$
\sum_{i=1}^{n} \log i = \log\Bigl(\prod_{i=1}^{n} i\Bigr) = \log(n!) \approx n \log n.
$$  

Por lo tanto, $\sum_{i=1}^{n} \log i = O(n \log n)$.

#### Ejemplo 8
Analiza el tiempo de ejecución del programa:

```python
def Function(n):
    for i in range(1, n):
        j = 1
        while j <= n:
            j = j * 2
        print("*")

Function(20)
```

**Solución**  
- El bucle externo (`for i in range(1, n)`) se ejecuta $n$ veces.  
- El bucle interno (`while j <= n: j = j * 2`) se ejecuta $\log n$ veces (ver regla para bucles logarítmicos).  
- Complejidad total: $O(n \log n)$.


#### Ejemplo 9
Dado el siguiente código:

```python
import math
count = 0

def Logarithms(n):
    global count
    i = 1
    while i <= n:
        j = n
        while j > 0:
            j = j // 2
            count = count + 1
        i = i * 2
    return count

print(Logarithms(10))
```

**Solución**  
- El bucle externo (`while i <= n: i = i * 2`) se ejecuta $\log n$ veces.  
- Dentro, el bucle `while j > 0: j = j//2` se ejecuta $\log n$ veces.  
- Multiplicando: $\log n \times \log n = (\log n)^2$.  
Por lo tanto, la complejidad es $O\bigl((\log n)^2\bigr)$, a veces se escribe $O(\log^2 n)$.



### Ejercicios

#### **Ejercicio 1**

El siguiente es un fragmento de código de un algoritmo de ordenamiento por inserción (`Insertion Sort`) en Python:

```python
def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >=0 and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
```

**Tareas:**

1. Determina la complejidad asintótica en el peor caso de `insertion_sort`.
2. Determina la complejidad asintótica en el mejor caso de `insertion_sort`.
3. Explica por qué la complejidad en el caso promedio de `insertion_sort` es $\Theta(n^2)$.


#### **Ejercicio 2**

Considera dos algoritmos, **Algoritmo A** y **Algoritmo B**, con las siguientes complejidades en el peor caso:

- **Algoritmo A:** $T_A(n) = 3n^3 + 2n^2 + 5n + 7$
- **Algoritmo B:** $T_B(n) = 4n \log n + 10n + 20$

**Tareas:**

1. Determina las notaciones Big-O, Omega y Theta para ambos algoritmos.
2. Para valores grandes de $n$, cuál de los dos algoritmos será más eficiente y por qué.
3. Si se ejecutan ambos algoritmos con $n = 1000$, cuál podría ser una observación práctica sobre su rendimiento relativo.



#### **Ejercicio 3**

Considera la siguiente función recursiva en Python que calcula la suma de los primeros $n$ números enteros:

```python
def recursive_sum(n):
    if n == 0:
        return 0
    else:
        return n + recursive_sum(n - 1)
```

**Tareas:**

1. Plantea la relación de recurrencia para $T(n)$, donde $T(n)$ es el tiempo de ejecución de `recursive_sum(n)`.
2. Resuelve la relación de recurrencia utilizando el método maestro o cualquier otro método apropiado para determinar la complejidad asintótica de la función.


#### **Ejercicio 4**

Supón que tienes una estructura de datos tipo pila (`stack`) que soporta operaciones de `push` y `pop`. Además, la pila tiene una operación adicional `double_push` que duplica el elemento superior de la pila.

**Operaciones:**

- `push(x)`: Agrega el elemento $x$ al tope de la pila. Tiempo de ejecución $O(1)$.
- `pop()`: Elimina y devuelve el elemento en el tope de la pila. Tiempo de ejecución $O(1)$.
- `double_push()`: Duplica el elemento en el tope de la pila. Es decir, si el tope es $x$, después de la operación el tope será $x$ y se agrega otro $x$. Tiempo de ejecución $O(1)$.

**Tareas:**

1. Realiza un análisis amortizado para determinar la complejidad promedio de una secuencia de $m$ operaciones en esta pila, considerando que `double_push` puede ser llamada en cualquier momento.
2. Explica si la operación `double_push` afecta el análisis amortizado de la estructura de datos y por qué.


#### **Ejercicio 5**


Considera un árbol binario de búsqueda ([BST](https://en.wikipedia.org/wiki/Binary_search_tree)) implementado de manera que cada operación de inserción y búsqueda tiene una complejidad asintótica determinada por la altura del árbol.

**Tareas:**

1. Determina la complejidad en el peor caso para las operaciones de inserción y búsqueda en un BST.
2. Si el árbol está balanceado, cómo cambia la complejidad de estas operaciones?.
3. Relaciona las notaciones Big-O, Omega y Theta con respecto a la altura del árbol en ambos escenarios (balanceado y no balanceado).


#### **Ejercicio 6**

Considera la siguiente función en Python:

```python
def complex_function(n):
    count = 0
    for i in range(1, n):
        j = 1
        while j < n:
            k = 1
            while k < n:
                count += 1
                k *= 2
            j += 1
    return count
```

**Tareas:**

1. Determina la complejidad asintótica de `complex_function(n)` utilizando las guías para el análisis asintótico.
2. Explica detalladamente cómo llegas a la conclusión sobre la complejidad, identificando las tasas de crecimiento de cada bucle.

#### **Ejercicio 7**

Considera el siguiente algoritmo de búsqueda que combina búsqueda lineal y binaria:

```python
def mixed_search(arr, target):
    n = len(arr)
    for i in range(0, n//2):
        if arr[i] == target:
            return i
    # Si no se encuentra en la primera mitad, realizar búsqueda binaria en la segunda mitad
    left = n//2
    right = n - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1
```

**Tareas:**

1. Determina la complejidad en el peor caso de `mixed_search`.
2. Explica cómo la combinación de búsqueda lineal y binaria afecta la complejidad total del algoritmo.
3. Determina si existe una notación asintótica que capture exactamente la complejidad de este algoritmo y justifica tu respuesta.


#### **Ejercicio 8**

Considera la siguiente función que combina un bucle condicional con una llamada recursiva:

```python
def conditional_recursive(n):
    count = 0
    for i in range(1, n):
        if i % 2 == 0:
            count += conditional_recursive(i)
        else:
            count += 1
    return count
```

**Tareas:**

1. Plantea la relación de recurrencia para $T(n)$, donde $T(n)$ es el tiempo de ejecución de `conditional_recursive(n)`.
2. Resuelve la relación de recurrencia para determinar la complejidad asintótica de la función.
3. Discute cómo la condición $i \% 2 == 0$ influye en el análisis de la complejidad.


In [None]:
## Tus respuestas