<div align="right">
  <img src="https://drive.google.com/uc?export=view&id=1J8JpP65HsHXdpJvhb_sMwn3yROyU832m" height="80" width="200" style="float: right;">
</div>
<h1><b>Data Science and Machine Learning</b></h1>
<h2><b>Clase 10</b>: Optimización algorítmica</h2>
<h3><b>Docente</b>: <a href="https://www.linkedin.com/in/danielablanco/">Daniela Blanco</a>

# Contenido

- [1. Algoritmo](#algoritmo)
- [2. Complejidd temporal de los algoritmos](#complejidad)
- [3. Buenas prácticas](#buenas_practicas)
- [4. Links de interés](#links)


## 1. Algoritmo <a name="algoritmo"></a>

<img src="https://drive.google.com/uc?export=view&id=19oWQQKGplOQ6-dEkXo0nnI9lZBvKDk--" height="160" width="460" style="float: center;">

Un **algoritmo** es un conjunto de instrucciones que se siguen para lograr un objetivo o resolver un problema.

Por ejemplo, la ejecución de tareas cotidianas tan simples como cepillarse los dientes, lavarse las manos o seguir el manual de instrucciones de armado de un mueble, se pueden ver como un algoritmo.

En programación, un algoritmo es un conjunto de instrucciones informáticas que constituyen una función.

Hablamos de una secuencia ordenada de pasos (receta).

In [None]:
def calculate_triangle_area(base, height):
    product = base * height
    area = product / 2
    return f"El área es {area}"

calculate_triangle_area(20, 15)

**¿Cuál es el algoritmo para hacer una buena tortilla española de papas?**

## 2. Complejidd temporal de los algoritmos <a name="complejidad"></a>

La **complejidad temporal de los algoritmos** es una medida que describe la cantidad de tiempo que un algoritmo necesita para completar su ejecución en función del tamaño de la entrada.

Podemos verlo como el número de operaciones que realiza un algoritmo para completar su tarea (considerando que cada operación dura el mismo tiempo).

El algoritmo que realiza la tarea en el menor número de operaciones (o tiempo) se considera el más eficiente en términos de complejidad temporal.

Esta medida se expresa generalmente utilizando la notación **Big O**.

### 2.1. Notación O grande (big) <a name="notacion"></a>

La notación **Big O** se usa para clasificar los algoritmos según su rendimiento o el tiempo que requieren en el peor de los casos.

Por ejemplo, un algoritmo con complejidad 𝑂(𝑛) se dice que tiene tiempo lineal, lo que significa que el tiempo de ejecución crece de manera proporcional al tamaño de la entrada.

**Tamaño de la entrada**: denotado como 𝑛, se refiere a la cantidad de datos que se procesan. Puede ser el número de elementos en una lista, la longitud de una cadena, o cualquier otra métrica relevante según el contexto del problema.

### 2.2. Tipos Comunes de Complejidad Temporal <a name="tipos"></a>

- $O(1)$ - **Tiempo constante**: La sentencia solo necesita una unidad de tiempo para terminar. Es la mejor medida de todas. No depende del tamaño de entrada.

- $O(n)$ - **Tiempo lineal**: La sentencia necesita $n$ unidades de tiempo para realizar la tarea. El tiempo de ejecución crece linealmente con el tamaño de la entrada. Si por ejemplo $n = 3$, la sentencia necesitará $3$ unidades de tiempo para terminar.

- $O(n^2)$ - **Tiempo cuadrático**: La sentencia necesita $n · n$ unidades de tiempo para realizar la tarea. El tiempo de ejecución crece proporcionalmente al cuadrado del tamaño de entrada. Si por ejemplo $n = 3$, la sentencia necesitará $3 · 3 = 9$ unidades de tiempo para terminar.

- $O(n^3)$ - **Tiempo cúbica**: El tiempo de ejecución crece proporcionalmente al cubo del tamaño de la entrada.

- $O(log (n))$ - **Tiempo logaritmico**: El tiempo de ejecución crece logarítmicamente con el tamaño de la entrada.

- $O(n log (n))$ - **Tiempo log lineal**: El tiempo de ejecución crece en una combinación de lineal y logarítmica.

- $O(C^n)$ - **Tiempo exponencial**: La sentencia es muy ineficiente en tiempo. Necesitará una gran cantidad de tiempo para terminar. Es la peor medida de todas.

![Gráfico comparativo de complejidad temporal](https://github.com/4GeeksAcademy/machine-learning-content/blob/master/assets/complexity_chart.PNG?raw=true)


###**Ejemplos**

**Ejemplo 1**: Acceso a un Elemento en un Arreglo

In [1]:
def get_first_element(arr):
    return arr[0]

# Ejemplo de uso
arr = [10, 20, 30, 40, 50]

print(get_first_element(arr))

10


En este caso, sin importar el tamaño del arreglo arr, la operación de acceso a un elemento específico siempre toma la misma cantidad de tiempo, es decir, constante **O(1)**.

**Ejemplo 2**: Busqueda lineal

In [3]:
def linear_search(arr, target):
    for index, element in enumerate(arr):
        if element == target:
            return index

    # Elemento no encontrado
    return -1

In [4]:
arr = [10, 20, 30, 40, 50]
target = 30

index = linear_search(arr, target)

print(f'Elemento {target} encontrado en el índice {index}')

Elemento 30 encontrado en el índice 2


La búsqueda lineal es un algoritmo de búsqueda simple que tiene una complejidad temporal de **𝑂(𝑛)**

Recorre cada elemento de la lista hasta encontrar el objetivo o hasta llegar al final de la lista.

**Ejemplo 3**: Ordenación por Burbuja

La ordenación por burbuja es un algoritmo de ordenación simple pero ineficiente para listas grandes.

In [5]:
def bubble_sort(arr):
    n = len(arr)

    for i in range(n):
        for j in range(0, n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]

In [6]:
arr = [64, 34, 25, 12, 22, 11, 90]
bubble_sort(arr)

print(f'Lista ordenada: {arr}')

Lista ordenada: [11, 12, 22, 25, 34, 64, 90]


El algoritmo de ordenación por burbuja tiene complejidad **𝑂($n^2$)** porque, en el peor de los casos, necesita comparar y posiblemente intercambiar cada par de elementos.

**Ejemplo 4**: Multiplicación de matrices

In [None]:
def multiply_matrices(matrix_a, matrix_b):
    n = len(matrix_a)
    result = [[0] * n for _ in range(n)]
    for i in range(n):
        for j in range(n):
            for k in range(n):
                result[i][j] += matrix_a[i][k] * matrix_b[k][j]
    return result

In [None]:
matrix_a = [[1, 2], [3, 4]]
matrix_b = [[5, 6], [7, 8]]

result = multiply_matrices(matrix_a, matrix_b)
print(result)

En este caso, la multiplicación de dos matrices de tamaño n×n requiere 𝑛3 operaciones, lo que resulta en una complejidad cúbica **O($n^3$)**.

**Ejemplo 5**: Problema de la Subset Sum

Indica dado un arreglo y un número si hay alguna forma de sumar alguno de sus elementos tal que de el número indicado.

In [7]:
def subset_sum(arr, target, index=0):
    if target == 0:
        return True
    if index >= len(arr) or target < 0:
        return False
    # Incluir el elemento actual o no incluirlo
    return subset_sum(arr, target - arr[index], index + 1) or subset_sum(arr, target, index + 1)

In [9]:
# Ejemplo de uso
arr = [3, 34, 4, 12, 5, 2]
target = 59

print(subset_sum(arr, target))

False


En este caso, el problema de la Subset Sum tiene una complejidad exponencial **O($2^n$)** porque cada elemento puede ser incluido o no, lo que resulta en **$2^n$** posibles combinaciones a considerar.

**Ejemplo 6**: Ordenación Rápida (Quicksort)

In [10]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]

    return quicksort(left) + middle + quicksort(right)

In [11]:
arr = [3, 6, 8, 10, 1, 2, 1]
sorted_arr = quicksort(arr)

print(f'Lista ordenada: {sorted_arr}')


Lista ordenada: [1, 1, 2, 3, 6, 8, 10]


Selecciona un elemento como pivote.

Divide la lista en tres partes: elementos menores que el pivote, elementos iguales al pivote, y elementos mayores que el pivote.

Ordena recursivamente las sublistas de elementos menores y mayores.

Combina las sublistas ordenadas con el pivote.

El algoritmo de ordenación rápida tiene una complejidad promedio de **𝑂(𝑛 log (𝑛)**, aunque en el peor de los casos puede ser **O($n^2$)**.

**Ejemplo 7**: Búsqueda binaria

In [12]:
def binary_search(arr, target):
    left, right = 0, len(arr) - 1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1  # Elemento no encontrado

In [14]:
arr = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
target = 4
index = binary_search(arr, target)
print(f'Elemento {target} encontrado en el índice {index}')

Elemento 4 encontrado en el índice 3


Divide la lista en dos mitades y compara el elemento medio con el objetivo.

Si el elemento medio es el objetivo, se devuelve el índice.

Si el objetivo es menor que el elemento medio, busca en la mitad izquierda.

Si el objetivo es mayor que el elemento medio, busca en la mitad derecha.

Repite hasta que se encuentre el elemento o los índices se crucen.

Un algoritmo de búsqueda binaria tiene complejidad **𝑂(log 𝑛)** porque divide el espacio de búsqueda a la mitad en cada paso.

## 3. Buenas prácticas <a name="buenas_practicas"></a>

#### 1. Mantente actualizado

El primer principio de todo buen desarrollador que busque un código eficiente es **actualizar constantemente la versión de las librerías y del lenguaje de programación**.

Así, por ejemplo, Python 3 es mucho más rápido que Python 2, así que parte de esa eficiencia necesaria podrías conseguirla simplemente con la actualización del lenguaje.

#### 2. No programes todo lo que quieras hacer en detalle, apóyate de las librerías

Normalmente el código que hay detrás de las funciones de estas librerías estará altamente optimizado aprovechando cada recurso disponible, por lo que será más eficiente siempre utilizarlas antes que programar las tuyas propias.

Además, el código va a quedar más entendible, limpio y seguramente más escalable.

| ✅ Hazlo así | ❌ No lo hagas así |
|:---------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------|
| `np.array([1, 2, 3]).mean()` | <br>`def mean(elements):`<br>&nbsp;&nbsp;&nbsp;&nbsp;`sum = elements.sum()`<br>&nbsp;&nbsp;&nbsp;&nbsp;`n = len(elements)`<br>&nbsp;&nbsp;&nbsp;&nbsp;`return sum/n`<br><br>`mean(np.array([1, 2, 3]))`<br><br> |
| <br>`names['Gender'].replace('female', 'FEMALE', inplace=True)`<br><br> | `names["Gender'].loc[names.Gender=='female'] = 'FEMALE'` |

Aquí tienes algunos trucos de los más utilizados y necesarios en el día a día trabajando con datos: https://www.turing.com/kb/22-hottest-python-tricksfor-efficient-coding

#### 3. Utiliza estructuras de datos eficientes

`Python` proporciona muchos mecanismos para realizar tareas computacionalmente y temporalmente eficientes, como se muestra en los siguientes ejemplos:

| ✅ Hazlo así | ❌ No lo hagas así |
|:---------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------|
| `def good_list(elements):`<br>&nbsp;&nbsp;&nbsp;&nbsp;`my_list = [value for value in range(elements)]` | <br>`def bad_list(elements):`<br>&nbsp;&nbsp;&nbsp;&nbsp;`my_list = []`<br>&nbsp;&nbsp;&nbsp;&nbsp;`for value in range(elements):`<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;`my_list.append(value)`<br><br> |
| `def good_string_joiner(elements):`<br>&nbsp;&nbsp;&nbsp;&nbsp;`"".join(elements)` | <br>`def bad_string_joiner(elements):`<br>&nbsp;&nbsp;&nbsp;&nbsp;`final_string = ""`<br>&nbsp;&nbsp;&nbsp;&nbsp;`for value in elements:`<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;`final_string += value`<br><br> |

Más información sobre cómo puedes eficientar al máximo tu código aprovechando las herramientas nativas y paquetes de Python aquí: https://khuyentran1401.github.io/Efficient_Python_tricks_and_tools_for_data_scientists/README.html

#### 4. Elimina lo que no necesites

En cualquier lenguaje de programación, las variables y objetos ocupan memoria, de tal forma que una buena forma de mantener el código limpio es eliminar las variables que no vayamos a necesitar más.

En Python puedes ver cuánta memoria ocupa tu variable con la función `sys.getsizeof(variable)` del paquete `sys`.

Si observas que una variable tiene un peso considerable, podrías plantearte eliminarla para no cargar innecesariamente la memoria del entorno de ejecución, ya que cuanto más colapsado esté y más uso de su memoria se haga, peor rendimiento tendrá.


#### 5. Aprende de otros

Muchas veces necesitamos inspiración de otros.

Por eso, la mejor forma de eficientar el código es aprender del código de otros desarrolladores.

La experiencia es la mejor vía hacia la eficiencia.

## 4. Links de interés <a name="links"></a>

- [Python Enhancement Proposals (PEP)](https://peps.python.org/pep-0020/)
- [Real python](https://realpython.com/)
- [The Hitchhiker’s Guide to Python](https://docs.python-guide.org/)
- [Effective Python](https://effectivepython.com/)
- [Fluent Python](https://www.oreilly.com/library/view/fluent-python-2nd/9781492056348/)
- [Python IDE for beginners](https://thonny.org/)