<a href="https://colab.research.google.com/github/davidheram/algorithm-optimization/blob/main/optimizacion_de_algoritmos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

1. **Eliminar los signos de puntuación**: Usar `replace`  en un ciclo puede ser ineficiente, especialmente con textos largos. Busca una formas eficiente de eliminar los signos de puntuación.
2. **Contador de frecuencia**: El código verifica la existencia de cada palabra en el diccionario y luego actualiza su cuenta. Esto puede hacerse mas eficientemente con ciertas estructuras de datos en Python.
3. **Ordenar y seleccionar:** Considera si hay una forma mas directa o efectiva de obtener las 5 palabras mas frecuentes sin ordenar todas las palabras.
4. **Modularidad**: Divide el código en funciones mas pequeñas para que cada una puede realizar una tarea específica. Esto no solo optimizará el desempeño, sino también hará el código mas legible y mantenible.

In [14]:
import string
from collections import Counter

def clean_text(text):
    text = text.lower()
    return text.translate(str.maketrans("", "", string.punctuation))

def tokenize(text):
    return text.split()

def count_words(words):
    return Counter(words)

def process_text(text, top_n=5):
    text = clean_text(text)
    words = tokenize(text)
    frequencies = count_words(words)

    for word, freq in frequencies.most_common(top_n):
        print(f"'{word}' : {freq} times")

text = """
    In the heart of the city, Emily discovered a quaint little café, hidden away from the bustling streets.
    The aroma of freshly baked pastries wafted through the air, drawing in passersby. As she sipped on her latte,
    she noticed an old bookshelf filled with classics, creating a cozy atmosphere that made her lose track of time.
"""
process_text(text)

'the' : 5 times
'of' : 3 times
'in' : 2 times
'a' : 2 times
'she' : 2 times


Puntos a optimizar:

1. **Filtrar las números**: El código recorre la lista original para filtrar los números pares. Considera una forma mas eficiente de filtrar la lista.
2. **Duplicación**: La lista es atravesada varias veces. ¿Hay alguna manera de hacer esto mas eficientemente?
3. **Suma**: Los números en la lista se suman a traves de un bucle. Python trae incluidas unas funciones que pueden optimizar esto.
4. **Función `is_prime`**: Aunque ésta función es relativamente eficiente, investiga si hay maneras de hacerla aun más rápida.
5. **Modularidad**: Considera dividir el código en funciones más pequeñas, cada una enfocada en una tarea específica.

In [25]:
def is_prime(n):
  if n<=1:
    return False

  if n <=3:
    return True

  if n % 2== 0:
    return False

  limit = int(n**0.5) + 1

  for i in range(3, limit, 2):
    if n % i == 0:
      return False

  return True

def sum_of_doubled_evens(numbers):
  return sum(num * 2 for num in numbers if num % 2==0)

def process_list(numbers):
  total = sum_of_doubled_evens(numbers)

  return total, is_prime(total)

list_ = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
result, result_prime = process_list(list_)
print(f"Result: {result}, ¿Prime? {'Yes' if result_prime else 'No'}")


Result: 60, ¿Prime? No
