 ###  $ >Resumen - Procesamientos $  ### 


---

$ Procesamiento - 1 $

In [None]:
def load_headers(headers):
    """
    Carga dos nuevos datos a los indices

    args:
        headers (list): lista de con los indices del archivo
    """
    headers.append('elevation_name') 
    headers.append('prov_name')
    return headers

def calculate_height(height):
    """
    Compara el dato recibido y retorna x resultado segun en que sector este dicho dato

    args:
        height (int): altura a compar
    """
    if (not height):
        return 'Sin Datos'
    height = int(height)
    if (height <= 131):
        return 'bajo'
    elif (131 < height <= 903):
        return 'medio'
    else:
        return 'altos'

def search_province(municipality,citys):
    """
    Compara dos datos, si son iguales retorna la provincia de la ciudad, sino recortan que no se la encontro

    args:
        municipality(string): municipalidad del aeropuerto
        citys(list): lista de ciudades con tus respectivos datos
    """
    end = False
    for city in citys[1:]:
        if municipality.lower() == city[0].lower():  
            province = city[5]  
            end = True
            return province
    if not end:
        return 'No encontrada'

def processing_1(airports_original,citys_original,airports_modified): 
    """
    Procesa el archivo original de aeropuertos y realiza los cambios necesarios utilizando datos ingresados
    por teclado, comparando en otro archivo (ciudades) y guarda la informacion modificada en el nuevo archivo

    args:
        airports_original(string): ruta del archivo original de aeropuertos
        citys_original(string): ruta del archivo original de ciudades
        airports_modified(string): ruta del nuevo archivo modificado de aeropuertos
    """
    with (airports_original.open(mode='r', encoding='utf 8') as read_airports,
          citys_original.open(mode='r', encoding='utf 8') as read_citys, 
          airports_modified.open(mode='w', encoding='utf 8',newline='') as wrile_new_airports): 
        reader_airports = csv.reader(read_airports) 
        reader_citys = csv.reader(read_citys)  
        writer = csv.writer(wrile_new_airports) 

        citys = []
        for i in reader_citys:
            citys.append(i)

        headers = load_headers(next(reader_airports)) 
        writer.writerow(headers) 
        
        for airports in reader_airports: 
            height = (airports[6]) 
            municipality = airports[13]
            provincia = search_province(municipality,citys)
            dato_height = calculate_height(height) 
            airports.append(dato_height) 
            airports.append(provincia)
            writer.writerow(airports) 

1. `Usar csv.DictReader y csv.DictWriter:` En lugar de trabajar con listas índice en csv.reader y csv.writer, podrías considerar usar csv.DictReader y csv.DictWriter. Esto te permitiría acceder a las columnas por su nombre en lugar de su índice, lo que hace que el código sea más legible y menos propenso a errores si se reorganizan las columnas en el archivo CSV.

3. `Manejar Excepciones:` Puedes agregar manejo de excepciones para capturar posibles errores al abrir o procesar los archivos CSV.

6. `Separación de Funciones:` Si deseas modularizar aún más tu código, podrías dividir algunas partes de la función processing_1 en funciones separadas para mejorar la legibilidad y facilitar la reutilización del código.

2. `Usar un Generador para la Lista de Ciudades:` En lugar de crear una lista completa de ciudades en memoria (citys), podrías usar un generador para iterar sobre las ciudades. Esto puede ser más eficiente en términos de uso de memoria, especialmente si el archivo de ciudades es grande.

In [None]:
def load_city_data(citys_file):
    """
    Carga los datos de ciudades utilizando un generador

    Args:
        citys_file (file): Archivo CSV de ciudades

    Yields:
        tuple: Tupla con los datos de una ciudad
    """
    with citys_file.open(mode='r', encoding='utf-8') as read_citys:
        reader_citys = csv.reader(read_citys)
        # Saltar la primera línea si es un encabezado
        next(reader_citys, None)
        for city in reader_citys:
             yield tuple(city)

4. `Optimizar Búsqueda de Provincia:` Si el archivo de ciudades es grande y la búsqueda de la provincia se vuelve lenta, podrías considerar usar un diccionario para mapear directamente las municipalidades a las provincias. Esto aceleraría la búsqueda.

In [None]:
def search_province(municipality, city_dict):
    return city_dict.get(municipality.lower(), 'No encontrada')

city_dict = {}
with open(citys_original, mode='r', encoding='utf-8') as read_citys:
    reader_citys = csv.reader(read_citys)
    next(reader_citys)  # Saltar la primera fila si es el encabezado
    for city in reader_citys:
        city_dict[city[0].lower()] = city[5]  # Guardar el nombre de la ciudad en minúsculas como clave

provincia = search_province(municipality, city_dict)

Tambien se puede optimizar el bucle for al utilizar un for-else, lo que te permite reducir el uso de la variable end y mejorar la legibilidad del código. Esto elimina la necesidad de la variable end.

In [None]:
def search_province(municipality,citys):
    for city in cities[1:]:
        if municipality.lower() == city['city'].lower():
            return city['admin_name']
    else:
        return 'No encontrada'

Tambien con la implementacion de un filter

In [None]:
def search_province(municipality, citys):
    #si encuentro coincidencia devuelve la ciudaden result, sino result queda vacio 
    result = list(filter(lambda city: city[0].lower() == municipality.lower(), citys))
    if result:
        return result[0][5]  # Devuelve la provincia si se encontró la ciudad
    else:
        return 'No encontrada'  # Devuelve este mensaje si la ciudad no está en la lista


5. `Validación de Datos de Altura:` Antes de calcular la altura, podrías agregar una validación para asegurarte de que los datos de altura sean válidos antes de intentar convertirlos a entero.

In [None]:
def get_valid_integer(prompt):
    """
    Solicita al usuario un entero válido y devuelve ese entero.

    Args:
        prompt (str): El mensaje que se muestra al usuario para solicitar el valor.

    Returns:
        int: El entero ingresado por el usuario.
    """
    while True:
        try:
            value = int(input(prompt))
            return value
        except ValueError:
            print("Error: Debes ingresar un número entero válido.")

# Ejemplo de uso:
altura = get_valid_integer("Ingrese la altura: ")
print("Gracias por ingresar un entero válido:", altura)


---

$ Procesamiento - 3 $

In [None]:
def define_size(num):

    """
    Retorna una cadena string segun el tamaño de la superficie del lago.
    args:
        num (int) : Tamaño de la superficie del lago.
     returns
        string.
    """

    if (num <= 17):
        return 'chico'
    elif (num > 17 and num <= 59):
            return 'medio'
    else:
        return 'grande'
        
def calculate_coordinate(coordinate):

    """
    Retorna la coordenada en formato de grados decimales (GD).
    args:
        coordinate (string) : Cadena de caracteres que representa una coordenada (longitud o latitud).
     returns
        float.
    """

    numbers = re.findall(r'\d+', coordinate)
    return int (numbers[0]) + (int(numbers[1]) / 60) + (int(numbers[2]) / 3600)

def processing_3(reader_path, writer_path):

    """
    Recorre el archivo original de lagos mientras crea uno nuevo modificado agregando 3 columnas ("Sup Tamaño","latitud","longitud")
    y los valores que rellenan dichas columnas.
    args:
        reader_path (string) : Ruta del archivo de lagos original.
        writer_path (string) : Ruta del archivo de lagos modificado.
    """

    # Apertura punto 1 {

    with (
            reader_path.open(mode='r', encoding='utf-8') as file_r,
            writer_path.open(mode='w', encoding='utf-8', newline='') as file_w
        ):
        reader = csv.reader (file_r)
        writer = csv.writer (file_w)

    # } Cierre punto 1
    # Apertura punto 2 { 

        SUPERFICIE = 2
        COORDENADAS = 5

    # } Cierre punto 2
    # Apertura punto 3 {

        header = next (reader)
        header.append('Sup Tamaño')
        header.append('Latitud')
        header.append('Longitud')
        writer.writerow (header)

    # } Cierre punto 3
    # Apertura punto 4 {

        for line in reader:
            num = int (line[SUPERFICIE])
            coord = line[COORDENADAS].split(' ')
            line.append(define_size(num))
            line.append(calculate_coordinate(coord[0]))
            line.append(calculate_coordinate(coord[1]))
            writer.writerow (line)

1. La expresión `re.findall(r'\d+', coordinate)` busca todas las secuencias de dígitos en la cadena coordinate y devuelve una lista con esas secuencias encontradas. Por ejemplo, si coordinate es "45°30'15", re.findall(r'\d+', coordinate) devolverá ['45', '30', '15']

2. En la `carga de headers` se podria optimizar de la siguiente manera (solo si se el archivo de lectura esta abierto en forma de diccionario)

In [None]:
writer.writerow(reader.fieldnames + ['Sup Tamaño', 'Latitud', 'Longitud'])

3. Tambien si `los dos archivos eran diccionarios` se podria plantear estas modificaciones

In [None]:
def processing_3(reader_path, writer_path):
    """Recorre el archivo original de lagos mientras crea uno nuevo modificado."""
    with reader_path.open(mode='r', encoding='utf-8') as file_r, \
         writer_path.open(mode='w', encoding='utf-8', newline='') as file_w:
        reader = csv.DictReader(file_r)
        writer = csv.DictWriter(file_w, fieldnames=reader.fieldnames + ['Sup Tamaño', 'Latitud', 'Longitud']) # agrego columnas es decir claves
        writer.writeheader()

        for line in reader:
            num = int(line['Superficie'])
            coord = line['Coordenadas'].split(' ')
            line['Sup Tamaño'] = define_size(num) # agrego nueva clave (es decir columna) con su valor
            line['Latitud'] = calculate_coordinate(coord[0])
            line['Longitud'] = calculate_coordinate(coord[1])
            writer.writerow(line)

---

$ Procesamiento - 3 $

In [None]:
def conectivity (line):
        '''
         Determina si una línea tiene conectividad en alguna de las categorías especificadas.

        Recibe:
        - line: Diccionario que representa una línea de datos del archivo CSV original.

        Retorna:
        - "SI" si alguna columna tiene un valor diferente de "--", o "NO" de lo contrario.
        '''
        return "SI" if any(line[key].strip() != "--" for key in TYPES_OF_CONECTIVITIES) else "NO"

def change (line):
        '''
        Reemplaza los valores "--" por "NO" en todas las columnas de una línea.

        Recibe:
        - line: Un diccionario que representa una línea de datos del archivo CSV original.

        Retorna:
        - Una versión modificada de la línea con los valores "--" reemplazados por "NO".
        '''
        for key in line:
                if line[key].strip() == "--":
                        line[key]="NO"
        return line               

def processing_2(read_dataset,write_dataset):
        '''
        Toma un archivo CSV y genera un nuevo archivo CSV modificado y con una columna adicional ("posee_conectividad").
        
        Recibe:
        - read_dataset: El Pathlib con la ruta del archivo de entrada CSV.
        - write_dataset: El Pathlib con la ruta del archivo de salida CSV.
        '''
        with (
                read_dataset.open (mode = "r", encoding = "utf-8") as read_file,\
                write_dataset.open (mode = "w", encoding = "utf-8", newline='') as write_file
                ):

                reader = csv.DictReader(read_file)
                writer = csv.DictWriter(write_file, fieldnames=reader.fieldnames + ["posee_conectividad"])

                writer.writeheader()

                for line in reader:
                        line["posee_conectividad"] = conectivity(line)
                        line = change (line)
                   
                        writer.writerow(line)

1. `any()` se utiliza para verificar si al menos uno de los valores en el diccionario line no es igual a "--", lo que indica que hay conectividad en alguna de las categorías especificadas. Si any() encuentra al menos un valor distinto de "--", la función retorna "SI" (true), de lo contrario, retorna "NO"(false)

2. se podria hace rmas compacta la funcion `change()`

In [None]:
def change(line):

    return {key: "NO" if value.strip() == "--" else value for key, value in line.items()}

# La expresión {key: "NO" if value.strip() == "--" else value for key, value in line.items()} 
# itera sobre todas las claves y valores del diccionario line y crea un nuevo diccionario donde los valores "--" se reemplazan por "NO" y los demás valores se mantienen iguales.

---

$ Procesamiento - 4 $

In [None]:
def replace_simbols(line):
    """
    Reemplaza los simbolos /// y - de la fila del archivo recibida
    por 0
    args:
        line (list): Lista con una fila del archivo
    """
    return [0 if elem in ['///', '-'] else elem for elem in line]

def calc_percentage(total_population, total_homeless):
    """
    Calcula el porcentaje de poblacion en situacion de calle
    args:
        total_population (int): Cantidad total de poblacion
        total_homeless (int): Cantidad de poblacion en situacion de calle
    """
    if (total_homeless == 0):
        return 0
    return ((total_homeless / total_population) * 100)

def processing_4(original_path,new_path):
    """
    Procesa el archivo original realizando los cambios solicitados
    y guarda la informacion modificada dentro del nuevo archivo
    args:
        original_path (string): Ruta del archivo original
        new_path (string): Ruta del nuevo archivo
    """
    POPULATION_POS = 1 # Constante - Posicion de la columna Poblacion Total
    HOMELESS_POS = 4 # Constante - Posicion de la columna Poblacion en Situacion de Calle
    
    with (
        original_path.open(mode = 'r', encoding='utf-8') as file_r,
        new_path.open(mode = 'w', encoding='utf-8', newline='') as file_w
    ):
        reader = csv.reader(file_r)
        writer = csv.writer(file_w)
        
        header = next(reader)
        header.append('Porcentaje en Situacion de Calle')
        writer.writerow(header)
        for line in reader:
            line = replace_simbols(line)

            percentage = calc_percentage(int(line[POPULATION_POS]),int(line[HOMELESS_POS]))
            line.append(f"{percentage:.2f}%")

            writer.writerow(line)

1. `calc_percentage()` se podria simplicar con un lamda y asi crear el mismo resultado en el main del proceso por ejemplo

In [None]:
calc = lambda total_population, total_homeless: (total_homeless / total_population) * 100 if total_homeless != 0 else 0