# Problemas de optimizaci√≥n de algoritmos

## Ejercicio 1
### Optimizaci√≥n de c√≥digo para procesamiento de texto

Se te ha entregado un c√≥digo de procesamiento de texto que realiza las siguientes operaciones:

1. Convierte todo el texto a min√∫sculas.
2. Elimina los signos de puntuaci√≥n.
3. Cuenta la frecuencia de cada palabra.
4. Muestra las 5 palabras mas comunes.

El c√≥digo funciona, pero es ineficiente y puede optimizarse. Tu tarea es identificar las √°reas que pueden ser mejoradas y reescribir esas partes para hacer el c√≥digo mas eficiente y legible.


In [4]:
import string # Importa el m√≥dulo string, que contiene una lista de caracteres de puntuaci√≥n en string.punctuation.

""" Texto a minuscula """
def process_text(text): # Define una funci√≥n llamada process_text(text) que tomar√° un texto como entrada y lo procesar√°.
    text = text.lower() # Convierte todo el texto a min√∫sculas usando lower(). Esto asegura que palabras como "The" y "the" se traten como la misma palabra.


    """ Eliminaci√≥n de puntuaciones """
    for p in string.punctuation:
        text = text.replace(p, "")
    # Recorre todos los caracteres de puntuaci√≥n en string.punctuation.
    # Usa replace(p, "") para eliminar cada signo de puntuaci√≥n del texto.
    # Problema: Esto es ineficiente porque crea una nueva cadena en cada iteraci√≥n.


    """ Split text into words """
    words = text.split()
    # Usa split() para dividir el texto en palabras, creando una lista de palabras.
    # Separa por espacios en blanco autom√°ticamente.


    """ Conteo de frecuencias """
    frequencies = {}
    for w in words:
        if w in frequencies:
            frequencies[w] += 1
        else:
            frequencies[w] = 1
    # Usa un diccionario (frequencies) para contar cu√°ntas veces aparece cada palabra.
    # Si la palabra ya existe en el diccionario, se incrementa el contador.
    # Problema: Se puede hacer de forma m√°s eficiente con Counter.


    """ Ordenar las palabras por frecuencia """
    sorted_frequencies = sorted(frequencies.items(), key = lambda x: x[1], reverse = True)
    # Convierte el diccionario en una lista de tuplas [(palabra, frecuencia)].
    # Usa sorted() para ordenarlas en orden descendente por la frecuencia.
    # Problema: Ordena toda la lista cuando solo necesitamos las 5 m√°s frecuentes.


    """ Obtener las 5 palabras m√°s comunes """
    top_5 = sorted_frequencies[:5]
    # Obtiene las primeras 5 palabras m√°s comunes de la lista ordenada.


    """ Imprime los resultados """
    for w, frequency in top_5:
        print(f"'{w}': {frequency} times")
    # Recorre las 5 palabras m√°s comunes e imprime su conteo.


""" Define un texto de prueba. """
text = """
    In the heart of the city, Emily discovered a quaint little caf√©, hidden away from the bustling streets. 
    The aroma of freshly baked pastries wafted through the air, drawing in passersby. As she sipped on her latte, 
    she noticed an old bookshelf filled with classics, creating a cozy atmosphere that made her lose track of time.
"""


""" Llama a process_text(text) para analizar el texto. """
process_text(text)

'the': 5 times
'of': 3 times
'in': 2 times
'a': 2 times
'she': 2 times


Puntos a optimizar:

1. **Eliminar los signos de puntuaci√≥n**: Usar `replace`  en un ciclo puede ser ineficiente, especialmente con textos largos. Busca una formas eficiente de eliminar los signos de puntuaci√≥n.
2. **Contador de frecuencia**: El c√≥digo verifica la existencia de cada palabra en el diccionario y luego actualiza su cuenta. Esto puede hacerse mas eficientemente con ciertas estructuras de datos en Python.
3. **Ordenar y seleccionar:** Considera si hay una forma mas directa o efectiva de obtener las 5 palabras mas frecuentes sin ordenar todas las palabras.
4. **Modularidad**: Divide el c√≥digo en funciones mas peque√±as para que cada una puede realizar una tarea espec√≠fica. Esto no solo optimizar√° el desempe√±o, sino tambi√©n har√° el c√≥digo mas legible y mantenible.

In [3]:
# TODO


import string # Importa string como antes.
from collections import Counter # Importa Counter de collections, que facilita el conteo de palabras.

def clean_text(text): # Funci√≥n para limpiar el texto
    """Convierte el texto a min√∫sculas y elimina la puntuaci√≥n."""
    text = text.lower() # Convierte el texto a min√∫sculas.
    text = text.translate(str.maketrans('', '', string.punctuation)) #Usa str.translate(str.maketrans('', '', string.punctuation)) para eliminar la puntuaci√≥n.
    return text

def get_word_frequencies(text): # Funci√≥n para contar palabras
    """Cuenta la frecuencia de cada palabra en el texto."""
    words = text.split() # Divide el texto en palabras.
    return Counter(words) # Autom√°ticamente crea un diccionario con los conteos.

def print_top_words(frequencies, n=5): # Funci√≥n para imprimir las palabras m√°s comunes
    """Imprime las N palabras m√°s comunes."""
    for word, count in frequencies.most_common(n): # most_common(n) devuelve las n palabras m√°s frecuentes sin necesidad de ordenar todo.
        print(f"'{word}': {count} times")

def process_text(text): # Funci√≥n principal
    cleaned_text = clean_text(text) # Llama a clean_text(text) para limpiar el texto.
    frequencies = get_word_frequencies(cleaned_text) # Obtiene las frecuencias de palabras con get_word_frequencies(cleaned_text).
    print_top_words(frequencies) # Imprime las palabras m√°s comunes con print_top_words(frequencies).

# Texto de ejemplo
text = """
    In the heart of the city, Emily discovered a quaint little caf√©, hidden away from the bustling streets. 
    The aroma of freshly baked pastries wafted through the air, drawing in passersby. As she sipped on her latte, 
    she noticed an old bookshelf filled with classics, creating a cozy atmosphere that made her lose track of time.
"""
process_text(text)


# Mejoras del c√≥digo optimizado:

# ‚úÖ 1. Eliminaci√≥n eficiente de signos de puntuaci√≥n:
#     Usa str.translate(str.maketrans('', '', string.punctuation)), lo que elimina todos los signos de puntuaci√≥n en una sola operaci√≥n sin usar un for.
#     Esto es mucho m√°s r√°pido y eficiente.

# ‚úÖ 2. Uso de Counter para contar palabras:
#     Counter(words) autom√°ticamente crea un diccionario con los conteos, eliminando la necesidad de un ciclo for manual.
#     Es m√°s corto y m√°s eficiente.

# ‚úÖ 3. Obtenci√≥n directa de las palabras m√°s comunes:
#     frequencies.most_common(5) obtiene las 5 palabras m√°s frecuentes directamente sin ordenar todo el diccionario.
#     Reduce la complejidad del c√≥digo.

# ‚úÖ 4. C√≥digo modular y m√°s legible:
#     Se separaron las responsabilidades en funciones (clean_text, get_word_frequencies, print_top_words).
#     Esto facilita la reutilizaci√≥n y mantenimiento del c√≥digo.

# üî• Comparaci√≥n de Eficiencia
# Funci√≥n	                    |C√≥digo Original	                        |C√≥digo Optimizado
# Eliminaci√≥n de puntuaci√≥n	    |Usa replace() en un for, lento	            |Usa str.translate(), r√°pido
# Conteo de palabras	        |Usa dict con if, manual	                |Usa Counter, m√°s eficiente
# Selecci√≥n de top 5	        |Ordena toda la lista, ineficiente	        |Usa most_common(5), m√°s directo
# Modularidad	                |Todo en una sola funci√≥n, dif√≠cil de leer	|C√≥digo dividido en funciones

# üî• Resumen
#     La versi√≥n optimizada es m√°s r√°pida, modular y legible.
#     Se usaron estructuras de datos m√°s eficientes como Counter y str.translate().
#     Se elimin√≥ la necesidad de ordenar toda la lista, reduciendo la complejidad.

'the': 5 times
'of': 3 times
'in': 2 times
'a': 2 times
'she': 2 times


## Ejercicio 2
### Optimizaci√≥n de c√≥digo para procesamiento de listas

Se te ha dado el siguiente c√≥digo que realiza operaciones en una lista de n√∫meros para:

1. Filtrar los n√∫meros pares.
2. Duplicar cada n√∫mero.
3. Sumar todos los n√∫meros.
4. Verificar si el resultado es un n√∫mero primo.

El c√≥digo entregado logra los objetivos, pero puede ser ineficiente. Tu tarea es identificar y mejorar las partes de ese c√≥digo para mejorar su eficiencia.

In [3]:
import math #Importa el m√≥dulo math, necesario para calcular la ra√≠z cuadrada en is_prime().

def is_prime(n):
    if n <= 1:
        return False
    for i in range(2, int(math.sqrt(n)) + 1):
        if n % i == 0:
            return False
    return True

# üîπ ¬øQu√© hace?
#     Si n <= 1, devuelve False, porque los n√∫meros menores que 2 no son primos.
#     Usa un bucle for para probar la divisibilidad de n desde 2 hasta sqrt(n).
#     Si n es divisible por alg√∫n n√∫mero en ese rango, retorna False.
#     Si no se encontraron divisores, n es primo y retorna True.

# üîπ Problema:
#     Recorre todos los n√∫meros desde 2 hasta sqrt(n), incluyendo los pares innecesariamente despu√©s del 2.


def process_list(list_): # Define una funci√≥n que tomar√° una lista de n√∫meros y aplicar√° las transformaciones necesarias.
    filtered_list = []
    for num in list_:
        if num % 2 == 0:
            filtered_list.append(num)        
# üîπ ¬øQu√© hace?
#     Crea una lista vac√≠a filtered_list.
#     Recorre list_ y si el n√∫mero es par (num % 2 == 0), lo agrega a filtered_list.

# üîπ Problema:
#     Recorre toda la lista manualmente con for, en lugar de usar filter(), que es m√°s eficiente.
 
    
    duplicate_list = []
    for num in filtered_list:
        duplicate_list.append(num * 2)
    # üîπ ¬øQu√© hace?
    #     Crea duplicate_list y la llena con cada n√∫mero par de filtered_list, multiplicado por 2.

    # üîπ Problema:
    #     Recorre nuevamente la lista con un for, cuando map() puede hacerlo en una sola l√≠nea.

        
    sum = 0
    for num in duplicate_list:
        sum += num
    # üîπ ¬øQu√© hace?
    #     Inicializa sum en 0.
    #     Recorre duplicate_list y va sumando cada n√∫mero.

    # üîπ Problema:
    #     sum() puede hacer esto directamente sin necesidad de un bucle.


    prime = is_prime(sum)
    #  üîπ ¬øQu√© hace?
    #     Llama a is_prime(sum) para verificar si el resultado final es primo.
   
    return sum, prime
    # üîπ ¬øQu√© hace?
    #     Devuelve la suma total y el resultado de is_prime().

list_ = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
result, result_prime = process_list(list_)

print(f"Result: {result}, ¬øPrime? {'Yes' if result_prime else 'No'}")

# üîπ ¬øQu√© hace?
#     Define la lista list_.
#     Llama a process_list(list_).
#     Imprime el resultado de la suma y si es primo.

Result: 60, ¬øPrime? No


Puntos a optimizar:

1. **Filtrar las n√∫meros**: El c√≥digo recorre la lista original para filtrar los n√∫meros pares. Considera una forma mas eficiente de filtrar la lista.
2. **Duplicaci√≥n**: La lista es atravesada varias veces. ¬øHay alguna manera de hacer esto mas eficientemente?
3. **Suma**: Los n√∫meros en la lista se suman a traves de un bucle. Python trae incluidas unas funciones que pueden optimizar esto.
4. **Funci√≥n `is_prime`**: Aunque √©sta funci√≥n es relativamente eficiente, investiga si hay maneras de hacerla aun m√°s r√°pida.
5. **Modularidad**: Considera dividir el c√≥digo en funciones m√°s peque√±as, cada una enfocada en una tarea espec√≠fica.

In [1]:
# TODO

import math # Importa el m√≥dulo math, necesario para calcular la ra√≠z cuadrada en is_prime().

def is_prime(n): # Optimizaci√≥n de is_prime()
    """Verifica si un n√∫mero es primo de manera optimizada."""
    if n < 2:
        return False
    if n % 2 == 0:
        return n == 2  # 2 es primo, otros pares no lo son
    for i in range(3, int(math.sqrt(n)) + 1, 2):  # Solo impares
        if n % i == 0:
            return False
    return True

# Mejoras:
#     Si n < 2, no es primo.
#     Si n es par, retorna True solo si es 2, ya que ning√∫n otro n√∫mero par puede ser primo.
#     Itera solo por impares despu√©s del 2, reduciendo a la mitad las iteraciones.


def process_list(numbers): # Funci√≥n para procesar la lista. Aplica todas las transformaciones en una sola funci√≥n.
    """Filtra pares, duplica valores, suma y verifica si es primo."""
    filtered = list(filter(lambda x: x % 2 == 0, numbers))  # Filtrar pares: Usa filter() con lambda para conservar solo los n√∫meros pares. Es m√°s r√°pido que un bucle for porque filter() est√° optimizado.
    doubled = list(map(lambda x: x * 2, filtered))  # Duplicar valores: Usa map() con lambda para duplicar cada n√∫mero en filtered. Evita la necesidad de un for, optimizando el c√≥digo.
    total_sum = sum(doubled)  # Sumar elementos: Usa sum() para calcular la suma de doubled de manera eficiente. Elimina el bucle innecesario del c√≥digo original.
    return total_sum, is_prime(total_sum) # Retorna total_sum y el resultado de is_prime().


# Lista de entrada
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # Define la lista numbers.
result, is_result_prime = process_list(numbers) # Llama a process_list(numbers). 
    # ¬øPor qu√© se pueden asignar dos valores a la vez? 
    # Esto se debe a una caracter√≠stica de Python llamada "desempaquetado de tuplas" (tuple unpacking).
    # Cuando una funci√≥n devuelve m√∫ltiples valores, en realidad est√° devolviendo una tupla.
    # return 10, 20 es equivalente a return (10, 20), ya que Python autom√°ticamente crea una tupla cuando hay m√∫ltiples valores separados por comas.
    # result obtiene la suma total de los n√∫meros procesados.
    # is_result_prime almacena True o False, indicando si result es un n√∫mero primo.
print(f"Result: {result}, ¬øPrime? {'Yes' if is_result_prime else 'No'}") # Imprime la suma total y si es primo.


# üî• versi√≥n optimizada del c√≥digo que mejora la eficiencia y la legibilidad:
#     Usa filter() y lambda para filtrar los n√∫meros pares de manera m√°s eficiente.
#     Usa map() para duplicar los valores en una sola operaci√≥n.
#     Usa sum() en lugar de un bucle para sumar la lista.
#     Optimiza is_prime() verificando primero divisibilidad por 2 y luego probando solo n√∫meros impares.
#     Divide el c√≥digo en funciones m√°s peque√±as para mejorar la modularidad.


# üî• Mejoras Aplicadas
# ‚úÖ Filtrado eficiente con filter(lambda x: x % 2 == 0, numbers).
# ‚úÖ Duplicaci√≥n directa con map(lambda x: x * 2, filtered).
# ‚úÖ Suma optimizada con sum(doubled), eliminando el bucle.
# ‚úÖ Optimizaci√≥n de is_prime() al:
    # Descartar los pares inmediatamente.
    # Iterar solo por n√∫meros impares hasta la ra√≠z cuadrada de n.
# ‚úÖ C√≥digo modular con funciones claras y reutilizables.


# üî• Comparaci√≥n Final
# Aspecto	        |C√≥digo Original	                        |C√≥digo Optimizado
# Filtrado	        |for con append()	                        |filter()
# Duplicaci√≥n	    |for con append()	                        |map()
# Suma	            |for con +=	                                |sum()
# is_prime()	    |Itera por todos los n√∫meros hasta sqrt(n)	|Omite pares y revisa solo impares
# Modularidad	    |Todo en una funci√≥n	                    |Funciones separadas


# üî• Conclusi√≥n
#    El c√≥digo optimizado es m√°s r√°pido, modular y legible.
#    Reduce la cantidad de iteraciones innecesarias y aprovecha funciones nativas de Python.
#    Se mejora is_prime() eliminando chequeos innecesarios.

Result: 60, ¬øPrime? No


Ambos ejercicios  ayudar√°n a mejorar tu habilidad de optimizar el desempe√±o del c√≥digo y te dar√°n un mejor entendimiento de como las diferentes estructuras de datos y t√©cnicas de programaci√≥n pueden afectar la eficiencia de tu c√≥digo.