# Práctica 5 - Funciones y librerías de funciones (módulos) en Python
Autor: Claudio Morales D.<br>
https://github.com/cmoralesd/conociendo-python <br>
Otoño 2023<br>
<br>
Para profundizar en conceptos y otros aspectos de programación con Python, recomiendo consultar el curso en línea de la Escuela de Ingenierías Industriales de la Universidad de Valencia, "Fundamentos de Programación en Python", disponible en este enlace: https://www2.eii.uva.es/fund_inf/python/index.html

Los archivos de datos en formato **csv** se obtienen desde: https://climatologia.meteochile.gob.cl/application/index/menuTematicoEmas



## 1. Construyendo funciones mediante 'def'

In [None]:
# un archivo de texto se puede leer fácilmente utilizando la instrucción 'with' junto a 'open()'
nombre_archivo = '330075_202303_Temperatura.csv'
try:

    with open(nombre_archivo) as archivo:
        print(f'El archivo fue leído correctamente:{nombre_archivo}')
        for linea in archivo:
            print(linea)
except:
    print(f'ERROR: No se pudo abrir el archivo:{nombre_archivo}')

In [11]:
def leer_archivo(nombre_archivo):
    # nombre_archivo: un archivo csv obtenido desde https://climatologia.meteochile.gob.cl/application/index/menuTematicoEmas
    # retorna: el contenido del archivo como una lista, cuyos elementos son las
    #          líneas del archivo original, sin el caracter final '\n'
    contenido=[]
    try:
        with open(nombre_archivo) as archivo:
            print(f'El archivo fue leído correctamente:{nombre_archivo}')
            for linea in archivo:
                contenido.append(linea[:-1])
    except:
        print(f'ERROR: No se pudo abrir el archivo:{nombre_archivo}')

    return contenido

In [12]:
mis_datos=leer_archivo('330075_202303_Temperatura.csv')
mis_datos

El archivo fue leído correctamente:330075_202303_Temperatura.csv


['codigoNacional;idEquipo;idPista;momento;ts;td;tMin12Horas;tMax12Horas;tMin24Horas;tMax24Horas;horaTMin12Horas;horaTMax12Horas;horaTMin24Horas;horaTMax24Horas;ts02;ts10;ts30;momentoRegistro;tsMed15m;tsMax15m;tsMin15m;tsSupMax15m;tsSupMed15m;tsSupMin15m;tMin1M;tMax1M',
 '330075;0;;2023-03-01 00:00:00;23.9;7.4;;;;;;;;;;;;2023-03-01 00:20:14;;24.6;23.9;;;;;',
 '330075;0;;2023-03-01 00:20:00;22.5;6.1;;;;;;;;;;;;2023-03-01 01:45:01;;24.1;22.2;;;;;',
 '330075;0;;2023-03-01 00:40:00;21.1;5.8;;;;;;;;;;;;2023-03-01 01:45:01;;22.6;20.9;;;;;',
 '330075;0;;2023-03-01 01:00:00;20.5;5.3;;;;;;;;;;;;2023-03-01 01:45:01;;21.6;20.5;;;;;',
 '330075;0;;2023-03-01 01:20:00;19.9;5.2;;;;;;;;;;;;2023-03-01 02:35:14;;20.7;19.8;;;;;',
 '330075;0;;2023-03-01 01:40:00;19.3;5.1;;;;;;;;;;;;2023-03-01 02:35:14;;20.0;19.2;;;;;',
 '330075;0;;2023-03-01 02:00:00;19.4;5.1;;;;;;;;;;;;2023-03-01 02:35:14;;20.0;19.2;;;;;',
 '330075;0;;2023-03-01 02:20:00;18.6;4.9;;;;;;;;;;;;2023-03-01 03:20:15;;19.7;18.6;;;;;',
 '330075;0

In [13]:
mis_datos[0].split(';')

['codigoNacional',
 'idEquipo',
 'idPista',
 'momento',
 'ts',
 'td',
 'tMin12Horas',
 'tMax12Horas',
 'tMin24Horas',
 'tMax24Horas',
 'horaTMin12Horas',
 'horaTMax12Horas',
 'horaTMin24Horas',
 'horaTMax24Horas',
 'ts02',
 'ts10',
 'ts30',
 'momentoRegistro',
 'tsMed15m',
 'tsMax15m',
 'tsMin15m',
 'tsSupMax15m',
 'tsSupMed15m',
 'tsSupMin15m',
 'tMin1M',
 'tMax1M']

In [48]:
def datos_registrados(datos):
    # datos: una lista con datos leidos desde el archivo csv
    # retorna: una lista con todos los nombres encontrados en la fila de cabecera
    datos_encontrados = datos[0].split(';')
    return datos_encontrados

In [49]:
cabecera = datos_registrados(mis_datos)
cabecera

['codigoNacional',
 'idEquipo',
 'idPista',
 'momento',
 'ts',
 'td',
 'tMin12Horas',
 'tMax12Horas',
 'tMin24Horas',
 'tMax24Horas',
 'horaTMin12Horas',
 'horaTMax12Horas',
 'horaTMin24Horas',
 'horaTMax24Horas',
 'ts02',
 'ts10',
 'ts30',
 'momentoRegistro',
 'tsMed15m',
 'tsMax15m',
 'tsMin15m',
 'tsSupMax15m',
 'tsSupMed15m',
 'tsSupMin15m',
 'tMin1M',
 'tMax1M']

In [50]:
datos_registrados(mis_datos).index('ts')

4

In [51]:
def filtrar_cabecera(datos, filtro):
    # datos: la lista con los datos leidos desde el archivo csv
    # filtro: una variable 'str' con el nombre de cabecera que se desea filtrar
    # retorna: una lista con todas las filas de 'datos', pero conteniendo únicamente los datos bajo el nombre 'filtro'.
    #          Los datos que representan números están en formato numérico correspondiente (int o float)
    index = datos_registrados(datos).index(filtro)
    datos_filtrados = []
    for fila in datos:
        valor = fila.split(';')[index]
        if valor.isnumeric():
            valor = int(valor)
        else:
            try:
                valor = float(valor)
            except:
                pass
            
        datos_filtrados.append(valor)
    return datos_filtrados
        
        

In [52]:
tsT = filtrar_cabecera(mis_datos,'ts')
tsT

['ts',
 23.9,
 22.5,
 21.1,
 20.5,
 19.9,
 19.3,
 19.4,
 18.6,
 18.2,
 17.9,
 17.6,
 17.4,
 17.1,
 16.8,
 16.8,
 16.4,
 16.1,
 15.7,
 15.4,
 15.6,
 15.1,
 15.4,
 15.3,
 15.1,
 14.8,
 15.1,
 14.9,
 15.1,
 15.1,
 15.7,
 15.6,
 15.0,
 14.2,
 14.3,
 14.2,
 15.5,
 17.4,
 19.6,
 22.1,
 24.0,
 24.7,
 25.9,
 26.9,
 27.3,
 28.2,
 28.9,
 29.3,
 29.9,
 29.5,
 30.4,
 30.5,
 31.7,
 31.9,
 32.2,
 32.4,
 32.3,
 32.9,
 32.6,
 32.5,
 32.8,
 32.5,
 32.6,
 31.0,
 30.3,
 29.4,
 28.9,
 28.1,
 27.5,
 26.9,
 25.9,
 24.8,
 22.5,
 22.0,
 21.8,
 20.7,
 19.9,
 20.0,
 19.1,
 18.9,
 18.1,
 18.0,
 17.6,
 18.0,
 17.6,
 16.7,
 16.8,
 16.8,
 16.4,
 16.2,
 16.0,
 15.6,
 15.4,
 15.4,
 15.5,
 15.7,
 14.8,
 15.1,
 14.8,
 14.5,
 14.4,
 14.3,
 14.6,
 14.4,
 14.1,
 13.1,
 13.9,
 15.0,
 16.6,
 19.1,
 21.1,
 22.4,
 24.0,
 24.7,
 26.3,
 27.4,
 27.8,
 28.4,
 29.6,
 30.3,
 31.1,
 31.5,
 32.2,
 32.5,
 32.6,
 32.5,
 33.1,
 33.4,
 33.5,
 33.8,
 33.4,
 33.4,
 33.9,
 32.5,
 31.9,
 31.5,
 30.9,
 30.1,
 29.1,
 27.6,
 26.3,
 25.1,
 23.9,

## Algo más sobre las listas

In [18]:
# usando el operador ':' en los índices de elementos
lista_1 = [10, 20, 30, 40, 50]
lista_1[1:-2]

[20, 30]

In [19]:
# precaución al hacer copias de listas, recordar que son elementos mutables
lista_1 = [10, 20, 30, 40, 50]
lista_2 = lista_1.copy()
lista_2[0] = 60
lista_2

[60, 20, 30, 40, 50]

In [20]:
lista_1


[10, 20, 30, 40, 50]

In [21]:
# quitar elementos de una lista por su índice, usando .pop()
lista_1 = [10, 20, 30, 40, 50]
eliminar = lista_1.pop(0)
print(lista_1, eliminar)

[20, 30, 40, 50] 10


In [22]:
# eliminar elementos de una lista por su valor, usando .remove()
lista_1 = [10, 20, 30, 40, 50]
lista_1.remove(30)
lista_1

[10, 20, 40, 50]

In [23]:
# agregar un elemento en una posición específica de una lista, usando .insert()
lista_1 = [10, 20, 30, 40, 50]
lista_1.insert(0, 60)
lista_1

[60, 10, 20, 30, 40, 50]

In [24]:
# calculando máximos y mínimos de una lista de números, con max() y min()
lista_1 = [10, 20, 30, 40, 50]
min(lista_1)

10

In [25]:
# sumando los elementos de una lista, con sum()
lista_1 = [10, 20, 30, 40, 50]
sum(lista_1)

150

In [26]:
# saber si un elemento está contenido en una lista con 'in'
lista_1 = [10, 20, 30, 40, 50]
35 in lista_1

False

## 2. Creando y utilizando una librería de funciones

Una **líbrería** o **módulo** de Python es típicamente un archivo de texto con extensión .py (la misma extensión de los script de python). 

Como cualquier archivo de python, debe comenzar con un encabezado que permita al sistema operativo reconocer que este archivo debe ser tratado en un entorno de python e indicar el tipo de codificación utilizado.

A continuación, debe existir una documentación que indique la utilidad de la librería y otros datos relevantes para su utilización y mantenimiento y luego todo el código que conforma el módulo.

In [None]:
#! /usr/bin/env-python
# -*- coding: utf-8 -*-

# meteodatos - librería para la consulta de datos meteorológicos obtenidos desde
# las bases de datos disponibles en https://climatologia.meteochile.gob.cl/application/index/menuTematicoEmas
# versión: 0.1
# fecha: abril de 2023
# github: cmoralesd/aprendiendo-python

# el código sigue aquí...


In [None]:
# para importar el módulo en un script, se utiliza 'import'
import meteodatos as mtd



In [None]:
mis_datos = mtd.leer_archivo('330075_202303_Temperatura.csv')
mis_datos

In [None]:
mtd.datos_registrados(mis_datos).index('ts')

In [None]:
mtd.filtrar_cabecera(mis_datos,'ts')

In [None]:
mtd.filtrar_dia(mis_datos,'2023-03-31')

In [None]:
mtd.estadisticas_dia(mis_datos,'2023-03-31')

In [53]:
def filtrar_dia(datos, dia):
    # datos: una lista cuyas filas contienen los datos agrupados como una cadena de texto
    # dia:   el día que se desea filtrar, en formato 'AAAA-MM-DD', ejemplo: '2023-03-01'
    # retorna: la misma lista 'datos', pero conteniendo únicamente las filas
    #          que coinciden con 'dia' y manteniendo la cabecera
    
    # TODO: Escriba su código aquí:
    # ---------------------------------------------
    datos_filtrados = []
    datos_filtrados.append(datos[0])

    for linea in datos[1:]:
        if dia in linea:
            datos_filtrados.append(linea)
  
    # ---------------------------------------------
    # Su código termina aquí, luego se retornan los datos calculados
    
    return datos_filtrados # reemplace la lista vacía [] por el resultado de su código


In [54]:
Data_dia = filtrar_dia(mis_datos, '2023-03-01')
Data_dia


['codigoNacional;idEquipo;idPista;momento;ts;td;tMin12Horas;tMax12Horas;tMin24Horas;tMax24Horas;horaTMin12Horas;horaTMax12Horas;horaTMin24Horas;horaTMax24Horas;ts02;ts10;ts30;momentoRegistro;tsMed15m;tsMax15m;tsMin15m;tsSupMax15m;tsSupMed15m;tsSupMin15m;tMin1M;tMax1M',
 '330075;0;;2023-03-01 00:00:00;23.9;7.4;;;;;;;;;;;;2023-03-01 00:20:14;;24.6;23.9;;;;;',
 '330075;0;;2023-03-01 00:20:00;22.5;6.1;;;;;;;;;;;;2023-03-01 01:45:01;;24.1;22.2;;;;;',
 '330075;0;;2023-03-01 00:40:00;21.1;5.8;;;;;;;;;;;;2023-03-01 01:45:01;;22.6;20.9;;;;;',
 '330075;0;;2023-03-01 01:00:00;20.5;5.3;;;;;;;;;;;;2023-03-01 01:45:01;;21.6;20.5;;;;;',
 '330075;0;;2023-03-01 01:20:00;19.9;5.2;;;;;;;;;;;;2023-03-01 02:35:14;;20.7;19.8;;;;;',
 '330075;0;;2023-03-01 01:40:00;19.3;5.1;;;;;;;;;;;;2023-03-01 02:35:14;;20.0;19.2;;;;;',
 '330075;0;;2023-03-01 02:00:00;19.4;5.1;;;;;;;;;;;;2023-03-01 02:35:14;;20.0;19.2;;;;;',
 '330075;0;;2023-03-01 02:20:00;18.6;4.9;;;;;;;;;;;;2023-03-01 03:20:15;;19.7;18.6;;;;;',
 '330075;0

In [55]:
def estadisticas_dia(datos, dia):
    # datos: una lista con datos leidos desde la base de datos meteorológicos,
    #        mediante la función 'leer_archivo()'
    # dia:   el día que se desea reportar, en formato 'AAAA-MM-DD', ejemplo: '2023-03-01'
    # retorna: tmax, tmin, tmedia, la temperatura máxima, mínima y promedio para el día.
    tmax = tmin = tmedia = 0
    
    # TODO: Escriba su código aquí:
    # ---------------------------------------------

    Datos_ordenados=[]

    Datos_ordenados=filtrar_dia(datos,dia)
    Temp_filtrada=filtrar_cabecera(Datos_ordenados,'ts')
    
    Temp_filtrada.pop(0)

    tmin= min(Temp_filtrada)
    tmax= max(Temp_filtrada)
    tmedia= round(sum(Temp_filtrada)/len(Temp_filtrada),1)

    # ---------------------------------------------
    # Su código termina aquí, luego se retornan los datos calculados
    
    return tmax, tmin, tmedia,

In [None]:

#Datos_ordenados=filtrar_dia(mis_datos,'2023-03-01')
#filtro_temp=filtrar_cabecera(Datos_ordenados,"ts")

#tmax = max(filtro_temp)
#tmin = min(filtro_temp)
#tmedia = sum(filtro_temp) // len(filtro_temp)
#filtro_temp

In [58]:
Stats_dia = estadisticas_dia(mis_datos, '2023-03-31')
Stats_dia

(33.7, 13.7, 21.8)

In [None]:
# Una vez creada una librería, se puede importar como módulo de Python con 'import'
import meteodatos

## ACTIVIDAD:

Completar las funciones ```filtrar_dia()``` y ```estadisticas_dia()``` e incluirlas en la librería **meteodatos.py**.

La función ```filtrar_dia()```recibe el conjunto de datos para un mes y, de ese conjunto de datos, retorna sólo aquellos datos que corresponden a un día en específico, conservando la fila de cabecera.

La función ```estadisticas_dia()``` recibe el conjunto de datos para un mes, los filtra respecto de un día en específico, toma los datos bajo la cabecera de temperatura de superficie ```'ts'``` y, con ese conjunto de datos, calcula las estadísticas diarias de temperatura mínima, máxima y promedio. 

1. Complete la función ```filtrar_dia()```, siguiendo los siguientes pasos:
- Cree una copia de la lista recibida en el parámetro ```datos``` y almacénela en una nueva variable con otro nombre.
- Para cada fila de esta nueva variable, verifique si el texto recibido en el parámetro ```dia``` está contenido en esa fila. Si la fila corresponde a ```dia```, se debe conservar, en caso contrario la fila debe ser eliminada. El conjunto de datos resultante de este procedimiento corresponderá a los datos filtrados para ```dia```.
- Asegúrese de incluir la fila de cabecera en el conjunto de datos filtrados y envíelo como retorno.

2. Para construir la función ```estadisticas_dia()```, proceda de la siguiente forma:
- Utilice las funciones ```filtrar_dia()``` y ```filtrar_cabecera()``` para crear una nueva lista que contenga únicamente los datos para el día especificado en el parámetro ```dia```, y que estén bajo la cabecera ```'ts'```.
- Calcule los valores máximo, mínimo y promedio para la lista de datos filtrados.
- Redonde el valor de promedio a 1 dígito decimal.
- Retorne los valores calculados.

3. Actualice la definición de las funciones ```filtrar_dia()``` y ```estadisticas_dia()``` en el archivo ***meteodatos.py***

Para verificar que sus resultados son correctos reinicie el kernel de este cuaderno de Júpiter y ejecute el código que se entrega a continuación.

**NOTA**: Recuerde que el archivo de datos **330075_202303_Temperatura.csv** y la librería **meteodatos.py** deben estar alojadas en la misma carpeta que este cuaderno de Jupyter.

**NOTA 2**: Cada vez que haga cambios en el archivo **meteodatos.py** debe reiniciar el kernel de este cuaderno para actualizar los cambios en la importación de librería.


In [37]:
# *** NO MODIFIQUE ESTA CELDA ***

# importamos la librería requerida, utilizando un nombre corto
import meteodatos as mtd

# leemos el archivo de datos
archivo = '330075_202303_Temperatura.csv'
datos = mtd.leer_archivo(archivo)

# seleccionamos el día requerido y obtenemos sus estadísticas de temperatura
dia = '2023-03-31'
tmax, tmin, tmedia = mtd.estadisticas_dia(datos, dia)

# presentamos los resultados
print(f'Las estadísticas para el día {dia} son:')
print(f'temperatura máxima: {tmax} °C')
print(f'temperatura mínima: {tmin} °C')
print(f'temperatura promedio: {tmedia} °C')

El archivo fue leído correctamente:330075_202303_Temperatura.csv
Las estadísticas para el día 2023-03-31 son:
temperatura máxima: 33.7 °C
temperatura mínima: 13.7 °C
temperatura promedio: 21.8 °C


El resultado esperado es:
```
El archivo fue leido correctamente: 330075_202303_Temperatura.csv
Las estadísticas para el día 2023-03-31 son:
temperatura máxima: 33.7 °C
temperatura mínima: 13.7 °C
temperatura promedio: 21.8 °C
```