# Práctica 5 - Funciones y librerías de funciones (módulos) en Python
Autor: Claudio Morales D.<br>
https://github.com/cmoralesd/conociendo-python <br>
Otoño 2023<br>
<br>
Para profundizar en conceptos y otros aspectos de programación con Python, recomiendo consultar el curso en línea de la Escuela de Ingenierías Industriales de la Universidad de Valencia, "Fundamentos de Programación en Python", disponible en este enlace: https://www2.eii.uva.es/fund_inf/python/index.html

Los archivos de datos en formato **csv** se obtienen desde: https://climatologia.meteochile.gob.cl/application/index/menuTematicoEmas



## 1. Construyendo funciones mediante 'def'

In [None]:
# un archivo de texto se puede leer fácilmente utilizando la instrucción 'with' junto a 'open()'
nombre_archivo = '330075_202303_Temperatura.csv'
try:
    with open(nombre_archivo) as archivo:
        print(f'El Archivo fue leido correctamente: {nombre_archivo}')
    for linea in archivo:
        print(linea)
except:
    print(f'ERROR: No se pudo abrir el archivo {nombre_archivo}')        

In [None]:
def leer_archivo(nombre_archivo):
    # nombre_archivo: un archivo csv obtenido desde https://climatologia.meteochile.gob.cl/application/index/menuTematicoEmas
    # retorna: el contenido del archivo como una lista, cuyos elementos son las
    #          líneas del archivo original, sin el caracter final '\n'
    contenido = ´[]
    try:
        with open(nombre_archivo) as archivo:
            print(f'El Archivo fue leido correctamente: {nombre_archivo}')
            for linea in archivo:
                contenido.apend(linea[:-1])
        
    except:
        print(f'ERROR: No se pudo abrir el archivo {nombre_archivo}')  
   
    return contenido

In [None]:
def datos_registrados(datos):
    # datos: una lista con datos leidos desde el archivo csv
    # retorna: una lista con todos los nombres encontrados en la fila de cabecera
    datos_encontrados = datos[0].split(';')
    return datos_encontrados
    
    

In [None]:
def filtrar_cabecera(datos, filtro):
    # datos: la lista con los datos leidos desde el archivo csv
    # filtro: una variable 'str' con el nombre de cabecera que se desea filtrar
    # retorna: una lista con todas las filas de 'datos', pero conteniendo únicamente los datos bajo el nombre 'filtro'.
    #          Los datos que representan números están en formato numérico correspondiente (int o float)
    index = datos_registrados(datos).index(filtro)
    datos_filtrados = []
    for filas in datos:
        valor = fila.split(';')[index]
        if valor.isnumeric():
            valor = int(valor)
        else:
            try:
                valor = float(valor)
            except:
                pass

        datos_filtrados.append(valor)

    return datos_filtrados

    
        
        

## Algo más sobre las listas

In [None]:
# usando el operador ':' en los índices de elementos
lista_1 = [10, 20, 30, 40, 50]


In [None]:
# precaución al hacer copias de listas, recordar que son elementos mutables
lista_1 = [10, 20, 30, 40, 50]
lista_2 = lista_1


In [None]:
# quitar elementos de una lista por su índice, usando .pop()
lista_1 = [10, 20, 30, 40, 50]


In [None]:
# eliminar elementos de una lista por su valor, usando .remove()
lista_1 = [10, 20, 30, 40, 50]


In [None]:
# agregar un elemento en una posición específica de una lista, usando .insert()
lista_1 = [10, 20, 30, 40, 50]


In [None]:
# calculando máximos y mínimos de una lista de números, con max() y min()
lista_1 = [10, 20, 30, 40, 50]


In [None]:
# sumando los elementos de una lista, con sum()
lista_1 = [10, 20, 30, 40, 50]


In [None]:
# saber si un elemento está contenido en una lista con 'in'
lista_1 = [10, 20, 30, 40, 50]


## 2. Creando y utilizando una librería de funciones

Una **líbrería** o **módulo** de Python es típicamente un archivo de texto con extensión .py (la misma extensión de los script de python). 

Como cualquier archivo de python, debe comenzar con un encabezado que permita al sistema operativo reconocer que este archivo debe ser tratado en un entorno de python e indicar el tipo de codificación utilizado.

A continuación, debe existir una documentación que indique la utilidad de la librería y otros datos relevantes para su utilización y mantenimiento y luego todo el código que conforma el módulo.

In [None]:
#! /usr/bin/env-python
# -*- coding: utf-8 -*-

# meteodatos - librería para la consulta de datos meteorológicos obtenidos desde
# las bases de datos disponibles en https://climatologia.meteochile.gob.cl/application/index/menuTematicoEmas
# versión: 0.1
# fecha: abril de 2023
# github: cmoralesd/aprendiendo-python

# el código sigue aquí...


In [None]:
# para importar el módulo en un script, se utiliza 'import'
import meteodatos


In [None]:
def filtrar_dia(datos, dia):
    # datos: una lista cuyas filas contienen los datos agrupados como una cadena de texto
    # dia:   el día que se desea filtrar, en formato 'AAAA-MM-DD', ejemplo: '2023-03-01'
    # retorna: la misma lista 'datos', pero conteniendo únicamente las filas
    #          que coinciden con 'dia' y manteniendo la cabecera
    
    # TODO: Escriba su código aquí:
    # from datetime import datetime

    def filtrar_dia(datos, dia):
    # Convertir el argumento 'dia' en un objeto datetime
      dia_dt = datetime.strptime(dia, '%Y-%m-%d').date()
    
    # Filtrar las filas que coinciden con 'dia'
    datos_filtrados = [datos[0]]  # Incluir la cabecera en los datos filtrados
    for fila in datos[1:]:
        fecha = datetime.strptime(fila.split(',')[0], '%Y-%m-%d').date()
        if fecha == dia_dt:
            datos_filtrados.append(fila)
    
    return datos_filtrados
    # Su código termina aquí, luego se retornan los datos calculados
    
    return [] # reemplace la lista vacía [] por el resultado de su código


In [None]:
filtrar_dia(mis_datos, '2023-03-01')

In [None]:
def estadisticas_dia(datos, dia):
    # datos: una lista con datos leidos desde la base de datos meteorológicos,
    #        mediante la función 'leer_archivo()'
    # dia:   el día que se desea reportar, en formato 'AAAA-MM-DD', ejemplo: '2023-03-01'
    # retorna: tmax, tmin, tmedia, la temperatura máxima, mínima y promedio para el día.
    tmax = tmin = tmedia = 0
    
    # TODO: Escriba su código aquí:
    def estadisticas_dia(datos, dia):
    # Convertir el argumento 'dia' en un objeto datetime
       from datetime import datetime
    dia_dt = datetime.strptime(dia, '%Y-%m-%d').date()
    
    # Filtrar las filas que coinciden con 'dia'
    datos_filtrados = []
    for fila in datos:
        fecha = datetime.strptime(fila.split(',')[0], '%Y-%m-%d').date()
        if fecha == dia_dt:
            datos_filtrados.append(fila)
    
    # Calcular las estadísticas diarias
    n = len(datos_filtrados)
    if n > 0:
        tmax = max(float(fila.split(',')[1]) for fila in datos_filtrados)
        tmin = min(float(fila.split(',')[2]) for fila in datos_filtrados)
        tmedia = sum(float(fila.split(',')[3]) for fila in datos_filtrados) / n
    
    return tmax, tmin, tmedia

    
    # ---------------------------------------------
    # Su código termina aquí, luego se retornan los datos calculados
    
    return tmax, tmin, tmedia
    
    

In [None]:
estadistica_dia(mis_datos, '2023-03-01')

In [None]:
# Una vez creada una librería, se puede importar como módulo de Python con 'import'
import meteodatos

## ACTIVIDAD:

Completar las funciones ```filtrar_dia()``` y ```estadisticas_dia()``` e incluirlas en la librería **meteodatos.py**.

La función ```filtrar_dia()```recibe el conjunto de datos para un mes y, de ese conjunto de datos, retorna sólo aquellos datos que corresponden a un día en específico, conservando la fila de cabecera.

La función ```estadisticas_dia()``` recibe el conjunto de datos para un mes, los filtra respecto de un día en específico, toma los datos bajo la cabecera de temperatura de superficie ```'ts'``` y, con ese conjunto de datos, calcula las estadísticas diarias de temperatura mínima, máxima y promedio. 

1. Complete la función ```filtrar_dia()```, siguiendo los siguientes pasos:
- Cree una copia de la lista recibida en el parámetro ```datos``` y almacénela en una nueva variable con otro nombre.
- Para cada fila de esta nueva variable, verifique si el texto recibido en el parámetro ```dia``` está contenido en esa fila. Si la fila corresponde a ```dia```, se debe conservar, en caso contrario la fila debe ser eliminada. El conjunto de datos resultante de este procedimiento corresponderá a los datos filtrados para ```dia```.
- Asegúrese de incluir la fila de cabecera en el conjunto de datos filtrados y envíelo como retorno.

2. Para construir la función ```estadisticas_dia()```, proceda de la siguiente forma:
- Utilice las funciones ```filtrar_dia()``` y ```filtrar_cabecera()``` para crear una nueva lista que contenga únicamente los datos para el día especificado en el parámetro ```dia```, y que estén bajo la cabecera ```'ts'```.
- Calcule los valores máximo, mínimo y promedio para la lista de datos filtrados.
- Redonde el valor de promedio a 1 dígito decimal.
- Retorne los valores calculados.

3. Actualice la definición de las funciones ```filtrar_dia()``` y ```estadisticas_dia()``` en el archivo ***meteodatos.py***

Para verificar que sus resultados son correctos reinicie el kernel de este cuaderno de Júpiter y ejecute el código que se entrega a continuación.

**NOTA**: Recuerde que el archivo de datos **330075_202303_Temperatura.csv** y la librería **meteodatos.py** deben estar alojadas en la misma carpeta que este cuaderno de Jupyter.

**NOTA 2**: Cada vez que haga cambios en el archivo **meteodatos.py** debe reiniciar el kernel de este cuaderno para actualizar los cambios en la importación de librería.


In [None]:
# *** NO MODIFIQUE ESTA CELDA ***

# importamos la librería requerida, utilizando un nombre corto
import meteodatos as mtd

# leemos el archivo de datos
archivo = '330075_202303_Temperatura.csv'
datos = mtd.leer_archivo(archivo)

# seleccionamos el día requerido y obtenemos sus estadísticas de temperatura
dia = '2023-03-31'
tmax, tmin, tmedia = mtd.estadisticas_dia(datos, dia)

# presentamos los resultados
print(f'Las estadísticas para el día {dia} son:')
print(f'temperatura máxima: {tmax} °C')
print(f'temperatura mínima: {tmin} °C')
print(f'temperatura promedio: {tmedia} °C')

El resultado esperado es:
```
El archivo fue leido correctamente: 330075_202303_Temperatura.csv
Las estadísticas para el día 2023-03-31 son:
temperatura máxima: 33.8 °C
temperatura mínima: 10.4 °C
temperatura promedio: 21.1 °C
```

In [None]:
`