# Problemas de optimización de algoritmos

## Ejercicio 1
### Optimización de código para procesamiento de texto

Se te ha entregado un código de procesamiento de texto que realiza las siguientes operaciones:

1. Convierte todo el texto a minúsculas.
2. Elimina los signos de puntuación.
3. Cuenta la frecuencia de cada palabra.
4. Muestra las 5 palabras mas comunes.

El código funciona, pero es ineficiente y puede optimizarse. Tu tarea es identificar las áreas que pueden ser mejoradas y reescribir esas partes para hacer el código mas eficiente y legible.


In [7]:
import string

def process_text(text):
    # Texto a minuscula
    text = text.lower()

    # Eliminación de puntuaciones
    for p in string.punctuation:
        text = text.replace(p, "")

    # Split text into words
    words = text.split()

    # Conteo de frecuencias
    frequencies = {}
    for w in words:
        if w in frequencies:
            frequencies[w] += 1
        else:
            frequencies[w] = 1

    sorted_frequencies = sorted(frequencies.items(), key = lambda x: x[1], reverse = True)

    # Obtener las 5 palabras más comunes
    top_5 = sorted_frequencies[:5]
    
    for w, frequency in top_5:
        print(f"'{w}': {frequency} times")

text = """
En un rincón remoto de Chile, en las vastas llanuras de la región de Magallanes, habitaba una colonia de canguros que había llegado a tierras chilenas por razones desconocidas. Estos exóticos marsupiales, más asociados con Australia, encontraron en los campos abiertos de Chile un hogar inesperado pero acogedor.

Los lugareños se maravillaban al ver a estos saltadores ágiles y curiosos, cuyas siluetas se recortaban contra el horizonte patagónico. Al principio, su presencia generó asombro y desconcierto, pero con el tiempo, los canguros se convirtieron en una parte más del paisaje, tan chileno como los guanacos y los cóndores.

Los científicos se sintieron intrigados por este fenómeno y se lanzaron a estudiar a estos visitantes inusuales. Descubrieron que los canguros habían llegado a través de un extraño giro del destino: un grupo de ellos había escapado de un zoológico en Argentina y cruzado la frontera hacia Chile en busca de libertad.

Con el paso de los años, los canguros prosperaron en su nuevo hogar. Se adaptaron sorprendentemente bien al clima y al paisaje chileno, encontrando alimento en los pastizales y refugio entre los arbustos. Su presencia se convirtió en un símbolo de la diversidad y la capacidad de adaptación de la naturaleza.

Hoy en día, los canguros de Chile son una atracción turística única, atrayendo a viajeros de todo el mundo que desean presenciar este fenómeno singular. Se han convertido en embajadores no oficiales de la fauna australiana en tierras chilenas, recordándonos que en la naturaleza, las fronteras son solo líneas en el mapa y que la vida siempre encuentra una manera de florecer en los lugares más inesperados.
"""
process_text(text)

'de': 17 times
'en': 15 times
'los': 13 times
'y': 9 times
'la': 8 times


Puntos a optimizar:

1. **Eliminar los signos de puntuación**: Usar `replace`  en un ciclo puede ser ineficiente, especialmente con textos largos. Busca una formas eficiente de eliminar los signos de puntuación.
2. **Contador de frecuencia**: El código verifica la existencia de cada palabra en el diccionario y luego actualiza su cuenta. Esto puede hacerse mas eficientemente con ciertas estructuras de datos en Python.
3. **Ordenar y seleccionar:** Considera si hay una forma mas directa o efectiva de obtener las 5 palabras mas frecuentes sin ordenar todas las palabras.
4. **Modularidad**: Divide el código en funciones mas pequeñas para que cada una puede realizar una tarea específica. Esto no solo optimizará el desempeño, sino también hará el código mas legible y mantenible.

In [12]:
import re
from collections import Counter

def signos_de_puntuacion(texto):
    texto_sin_puntuaciones = str.maketrans("","",string.punctuation)
    return texto.translate(texto_sin_puntuaciones)

def contar_palabras(texto):
    palabras = texto.split()
    return Counter(palabras)

def obtener_mas_comunes(frecuencias, n=5):
    return frecuencias.most_common(n)

def procesar_texto(texto):
    #Todo a minuscula
    texto = texto.lower()
    #Eliminar puntuaciones
    texto = signos_de_puntuacion(texto)
    #Contar frecuencias
    frecuencia = contar_palabras(texto)
    #Ordenar
    top_5 = obtener_mas_comunes(frecuencia)
    #imprimir
    for w, frequency in top_5:
        print(f"'{w}': {frequency} veces")

    procesar_texto(texto)

## Ejercicio 2
### Optimización de código para procesamiento de listas

Se te ha dado el siguiente código que realiza operaciones en una lista de números para:

1. Filtrar los números pares.
2. Duplicar cada número.
3. Sumar todos los números.
4. Verificar si el resultado es un número primo.

El código entregado logra los objetivos, pero puede ser ineficiente. Tu tarea es identificar y mejorar las partes de ese código para mejorar su eficiencia.

In [3]:
import math

def is_prime(n):
    if n <= 1:
        return False
    for i in range(2, int(math.sqrt(n)) + 1):
        if n % i == 0:
            return False
    return True

def process_list(list_):
    filtered_list = []
    for num in list_:
        if num % 2 == 0:
            filtered_list.append(num)
    
    duplicate_list = []
    for num in filtered_list:
        duplicate_list.append(num * 2)
        
    sum = 0
    for num in duplicate_list:
        sum += num

    prime = is_prime(sum)
    
    return sum, prime

list_ = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
result, result_prime = process_list(list_)
print(f"Result: {result}, ¿Prime? {'Yes' if result_prime else 'No'}")

Result: 60, ¿Prime? No


Puntos a optimizar:

1. **Filtrar las números**: El código recorre la lista original para filtrar los números pares. Considera una forma mas eficiente de filtrar la lista.
2. **Duplicación**: La lista es atravesada varias veces. ¿Hay alguna manera de hacer esto mas eficientemente?
3. **Suma**: Los números en la lista se suman a traves de un bucle. Python trae incluidas unas funciones que pueden optimizar esto.
4. **Función `is_prime`**: Aunque ésta función es relativamente eficiente, investiga si hay maneras de hacerla aun más rápida.
5. **Modularidad**: Considera dividir el código en funciones más pequeñas, cada una enfocada en una tarea específica.

In [27]:
def filtrar_lista_mult_2(list_):
    return[num*2 for num in list_ if num%2 == 0]

def es_primo(n):
    if (n<=1):
        return False
    if (n<=3):
        return True
    if (n%2==0) or (n%3==0):
        return False
    i=5
    while(i*i<=n):
        if(n%i == 0) or (n%(i+2)==0):
            return False
        i+=6
    return True

def procesar_lista(list_):
    #Filtrar lista y mult2
    n_lista = filtrar_lista_mult_2(list_)
    #suma de la lista
    suma = sum(n_lista)
    primo = es_primo(suma)
    #devolver valores
    return suma,primo

list_ = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
result, result_prime = procesar_lista(list_)
print(f"Result: {result}, ¿Prime? {'Yes' if result_prime else 'No'}")

Result: 60, ¿Prime? No


Ambos ejercicios  ayudarán a mejorar tu habilidad de optimizar el desempeño del código y te darán un mejor entendimiento de como las diferentes estructuras de datos y técnicas de programación pueden afectar la eficiencia de tu código.