# Problemas de optimización de algoritmos

## Ejercicio 1
### Optimización de código para procesamiento de texto

Se te ha entregado un código de procesamiento de texto que realiza las siguientes operaciones:

1. Convierte todo el texto a minúsculas.
2. Elimina los signos de puntuación.
3. Cuenta la frecuencia de cada palabra.
4. Muestra las 5 palabras mas comunes.

El código funciona, pero es ineficiente y puede optimizarse. Tu tarea es identificar las áreas que pueden ser mejoradas y reescribir esas partes para hacer el código mas eficiente y legible.


In [1]:
import string

def process_text(text):
    # Texto a minuscula
    text = text.lower()

    # Eliminación de puntuaciones
    for p in string.punctuation:
        text = text.replace(p, "")

    # Split text into words
    words = text.split()

    # Conteo de frecuencias
    frequencies = {}
    for w in words:
        if w in frequencies:
            frequencies[w] += 1
        else:
            frequencies[w] = 1

    sorted_frequencies = sorted(frequencies.items(), key = lambda x: x[1], reverse = True)

    # Obtener las 5 palabras más comunes
    top_5 = sorted_frequencies[:5]
    
    for w, frequency in top_5:
        print(f"'{w}': {frequency} times")

text = """
    In the heart of the city, Emily discovered a quaint little café, hidden away from the bustling streets. 
    The aroma of freshly baked pastries wafted through the air, drawing in passersby. As she sipped on her latte, 
    she noticed an old bookshelf filled with classics, creating a cozy atmosphere that made her lose track of time.
"""
process_text(text)

'the': 5 times
'of': 3 times
'in': 2 times
'a': 2 times
'she': 2 times


Puntos a optimizar:

1. **Eliminar los signos de puntuación**: Usar `replace`  en un ciclo puede ser ineficiente, especialmente con textos largos. Busca una formas eficiente de eliminar los signos de puntuación.
2. **Contador de frecuencia**: El código verifica la existencia de cada palabra en el diccionario y luego actualiza su cuenta. Esto puede hacerse mas eficientemente con ciertas estructuras de datos en Python.
3. **Ordenar y seleccionar:** Considera si hay una forma mas directa o efectiva de obtener las 5 palabras mas frecuentes sin ordenar todas las palabras.
4. **Modularidad**: Divide el código en funciones mas pequeñas para que cada una puede realizar una tarea específica. Esto no solo optimizará el desempeño, sino también hará el código mas legible y mantenible.

In [4]:
# Se importan las librerías necesarias:
import string # Se necesita utilizar string.punctuation (conjunto de signos de puntuación posibles) para identificar si hay alguno en el tesxto
from collections import Counter # Se utiliza Counter para saber cuántas veces aparece cada elemento en la lista de palabras creada

# # # FUNCTION - TO LOWER CASE # # #
# Se utliza el método .lower() para pasar todas las letras del texto a minúscula:
def to_lower (text): return text.lower();


# # # FUNCTION - DELETE PUNCTUATION # # #
# Se comprueba cada uno de los caracteres dentro del texto dado como argumento
# En caso de no ser un signo de puntuación (no ser igual a ninguno de los elementos de string.punctuation), se unen todos en una cadena sin signos de puntuación
# Finalmente, la cadena se separa en una lista de palabras, utilizando como elemento separador el espacio " "
def del_punctuation (text): 
    words = (''.join(caracter for caracter in text if caracter not in string.punctuation)).split();
    return words;


# # # FUNCTION - COUNTER # # #
# Se toma la lista de palabras generada con la función del_punctuation() y se aplica la función Counter a partir del cual se genera un diccionario con la palabra y el número de veces que aparece
# A este diccionario, se le aplica el método .most_common() indicando que solo se quieren mostrar tantas palabras como el número indicado como argumento (top_words)
# Finalmente, se itera para cada elemento del diccionario generado con Counter mostrando qué palabra es (primera key) como su frecuencia en el texto (segunda key):
def counter (words, top_words):
    counter = Counter(words).most_common(top_words);
    for element, frequency in counter: print (f" La palabra '{element}' aparece {frequency} veces");
    return

# # # FUNCTION - PROCESADO TEXTO GENERAL # # #
# Función que llama a todas las funciones anteriores para ejecutar todas las funcionalidades deseadas:
def process_text(text): return counter(del_punctuation (to_lower(text)), 5);

# Declaración del texto:
text = """
    In the heart of the city, Emily discovered a quaint little café, hidden away from the bustling streets. 
    The aroma of freshly baked pastries wafted through the air, drawing in passersby. As she sipped on her latte, 
    she noticed an old bookshelf filled with classics, creating a cozy atmosphere that made her lose track of time.
"""
# Llamada a la función general:
process_text (text)


 La palabra 'the' aparece 5 veces
 La palabra 'of' aparece 3 veces
 La palabra 'in' aparece 2 veces
 La palabra 'a' aparece 2 veces
 La palabra 'she' aparece 2 veces


## Ejercicio 2
### Optimización de código para procesamiento de listas

Se te ha dado el siguiente código que realiza operaciones en una lista de números para:

1. Filtrar los números pares.
2. Duplicar cada número.
3. Sumar todos los números.
4. Verificar si el resultado es un número primo.

El código entregado logra los objetivos, pero puede ser ineficiente. Tu tarea es identificar y mejorar las partes de ese código para mejorar su eficiencia.

In [3]:
import math

def is_prime(n):
    if n <= 1:
        return False
    for i in range(2, int(math.sqrt(n)) + 1):
        if n % i == 0:
            return False
    return True

def process_list(list_):
    filtered_list = []
    for num in list_:
        if num % 2 == 0:
            filtered_list.append(num)
    
    duplicate_list = []
    for num in filtered_list:
        duplicate_list.append(num * 2)
        
    sum = 0
    for num in duplicate_list:
        sum += num

    prime = is_prime(sum)
    
    return sum, prime

list_ = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
result, result_prime = process_list(list_)
print(f"Result: {result}, ¿Prime? {'Yes' if result_prime else 'No'}")

Result: 60, ¿Prime? No


Puntos a optimizar:

1. **Filtrar las números**: El código recorre la lista original para filtrar los números pares. Considera una forma mas eficiente de filtrar la lista.
2. **Duplicación**: La lista es atravesada varias veces. ¿Hay alguna manera de hacer esto mas eficientemente?
3. **Suma**: Los números en la lista se suman a traves de un bucle. Python trae incluidas unas funciones que pueden optimizar esto.
4. **Función `is_prime`**: Aunque ésta función es relativamente eficiente, investiga si hay maneras de hacerla aun más rápida.
5. **Modularidad**: Considera dividir el código en funciones más pequeñas, cada una enfocada en una tarea específica.

In [5]:
# Se importan las librerías necesarias:
from sympy import isprime # Se importa la función isprime de la librería sympy para saber si un número dado es primo o no:

# # # FUNCTION - EVEN NUMBER # # #
# Se filtra la lista de números dada como argumento, devolviendo solo los números pares (cuyo resto es nulo al dividir entre dos):
def is_even (numbers): return list(filter(lambda x : x % 2 == 0, numbers));

# # #  FUNCTION - DUPLICATE # # #
# Se devuelve una lista de los números duplicados. Se utiliza map() para poder iterar sobre todos los números a la vez:
def duplicate (numbers): return list(map(lambda x : x * 2, numbers));

# # # FUNCTION - SUMMATION # # #
# Se devuelve un entero, resultado de la suma de todos los números de la lista dada como argumento:
def summation (numbers): return sum(numbers);


# Declaración del array de números:
list_ = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10];

# Se hace una call indentada a todas las funciones anteriores para aplicar todas las operaciones deseadas al array
# Se guarda el valor de la suma en una variable para, posteriormente, saber si el resultado es primo o no:
sum_list = summation (duplicate (is_even (list_)));

# Se aplica la función isprime() de la libería sympy para saber si el resultado de la suma es primo o no: 
result_prime = isprime(sum_list);

# Se imprime el resultado y se dice si es o no primo dependiendo de si la función isprime() ha devuelto True o False:
print(f"Resultado: {sum_list}, ¿Primo? {'Sí' if result_prime else 'No'}")



Resultado: 60, ¿Primo? No


Ambos ejercicios  ayudarán a mejorar tu habilidad de optimizar el desempeño del código y te darán un mejor entendimiento de como las diferentes estructuras de datos y técnicas de programación pueden afectar la eficiencia de tu código.