# Módulos

A medida que nuestros programas se hacen más y más complejos, tienden a crecer en cantidad de líneas de código.

La organización por **módulos** nos ayuda a organizar partes del código en archivos, de manera que se facilite la reutilización de código.

"Los módulos son simplemente carpetas de texto que contienen código Python y representan unidades con las que evitar la repetición y favorecer la reutilización" [1].

## ¿Para qué importar módulos?

Vamos a descargar el archivo "*miModulo.py*" [(descargar el archivo haciendo clic derecho en este texto, luego "guardar enlace como")](https://github.com/luismiguelaristi/MecanismosPythonUPB/raw/main/00_Inicio/miModulo.py) y lo vamos a poner en la misma carpeta que este cuaderno, de manera que nos quede así:

![image-2.png](attachment:image-2.png)

Si abrimos el archivo vamos a encontrar la siguiente función:

```python
def pasar_a_mayusculas(ruta_archivo):
    #paso 1: abrir el archivo
    archivo = open(ruta_archivo,encoding='UTF-8')
    #paso 2: iterar sobre el archivo para acceder a cada linea
    for linea in archivo:
        print(linea.upper().strip())
```

Esta función es conocida: recibe como argumento la ruta a un archivo, luego imprime el texto del archivo convertido a MAYÚSCULAS. Si recuerdan bien la usamos cuando aprendimos sobre manejo de archivos.

Digamos que queremos reutilizar esta función en nuestro código. Para hacerlo no tenemos que copiar el código de la función, solo debemos **importar** el archivo.

## Importar un módulo

vamos a usar la sentencia ```import``` con nuestro archivo *miModulo.py*, para utilizar la función **pasar_a_mayusculas**

In [5]:
import miModulo

## Usar una función de un módulo

Si todo salió bien, no debemos tener errores al correr esta celda, y podremos usar la función **pasar_a_mayusculas** así:

In [6]:
miModulo.pasar_a_mayusculas("miModulo.py")

DEF PASAR_A_MAYUSCULAS(RUTA_ARCHIVO):
#PASO 1: ABRIR EL ARCHIVO
ARCHIVO = OPEN(RUTA_ARCHIVO,ENCODING='UTF-8')
#PASO 2: ITERAR SOBRE EL ARCHIVO PARA ACCEDER A CADA LINEA
FOR LINEA IN ARCHIVO:
PRINT(LINEA.UPPER().STRIP())


¿Qué pasó? acabamos de abrir el archivo "*miModulo.py*" como texto, y usamos la función **pasar_a_mayusculas** para convertir todo el téxto a mayúsculas.

Esto es sumamente poderoso, ya que
- podemos desarrollar módulos genéricos para resolver problemas comunes, luego reutilizarlos cuantas veces queramos, evitándonos copiar el código muchas veces.
- hay miles de módulos desarrollados para Python que hacen cualquier cantidad de cosas que necesitemos.
 - por ejemplo, el módulo [statistics](https://docs.python.org/3/library/statistics.html) puede, entre muchas cosas, calcular los promedios que hemos hecho manualmente hasta el momento.


# Importar partes de un módulo

Si tenemos un módulo que tiene muchas funciones, y sólo necesitamos unas cuantas, podemos importar netamente lo necesario

In [7]:
from miModulo import pasar_a_mayusculas

luego, puedo usar la función **pasar_a_mayusculas** directamente

In [8]:
pasar_a_mayusculas("miModulo.py")

DEF PASAR_A_MAYUSCULAS(RUTA_ARCHIVO):
#PASO 1: ABRIR EL ARCHIVO
ARCHIVO = OPEN(RUTA_ARCHIVO,ENCODING='UTF-8')
#PASO 2: ITERAR SOBRE EL ARCHIVO PARA ACCEDER A CADA LINEA
FOR LINEA IN ARCHIVO:
PRINT(LINEA.UPPER().STRIP())


## Poner un nombre alternativo o alias a un módulo

Podemos importar módulos o funciones con nombres alternativos, también llamados alias, a la hora de importarlos, usando la expresión ```as```

In [9]:
import miModulo as mm

mm.pasar_a_mayusculas("miModulo.py")

DEF PASAR_A_MAYUSCULAS(RUTA_ARCHIVO):
#PASO 1: ABRIR EL ARCHIVO
ARCHIVO = OPEN(RUTA_ARCHIVO,ENCODING='UTF-8')
#PASO 2: ITERAR SOBRE EL ARCHIVO PARA ACCEDER A CADA LINEA
FOR LINEA IN ARCHIVO:
PRINT(LINEA.UPPER().STRIP())


esto aplica para también para funciones así:

In [10]:
from miModulo import pasar_a_mayusculas as mayus

mayus("miModulo.py")

DEF PASAR_A_MAYUSCULAS(RUTA_ARCHIVO):
#PASO 1: ABRIR EL ARCHIVO
ARCHIVO = OPEN(RUTA_ARCHIVO,ENCODING='UTF-8')
#PASO 2: ITERAR SOBRE EL ARCHIVO PARA ACCEDER A CADA LINEA
FOR LINEA IN ARCHIVO:
PRINT(LINEA.UPPER().STRIP())


### Ejercicio

1. Descargue el script realizado para el **[taller de funciones](https://auladigital.upb.edu.co/course/view.php?id=18493)** en la misma carpeta donde está este cuaderno
2. Impórtelo como módulo con alguna de las formas previamente mostradas
3. Use cada una de las funciones de dicho módulo.

In [11]:
# Resolver aquí el ejercicio

## Paquetes y configuración de programa principal

Para los alcances del curso, no necesitaremos estos temas, por lo cual quedan para consulta de forma autónoma [1]

# Módulos incorporados

Cuando se instala Python, también se instalan múltiples módulos útiles que nos simplifican la vida. Los módulos incorporados en la **[Librería Estandar de Python (Python Standard Library)](https://docs.python.org/es/3/library/index.html)** resuelven varios de los problemas que resuelto manualmente hasta el momento, como por ejemplo:

- [statistics](https://docs.python.org/es/3/library/statistics.html): Funciones de estadística matemática como promedio y desviación estandar
- [csv](https://docs.python.org/es/3/library/csv.html): Lectura y escritura de archivos CSV
- [json](https://docs.python.org/es/3/library/json.html): Codificador y decodificador JSON
- [re](https://docs.python.org/es/3/library/re.html): Operaciones con expresiones regulares (para procesar texto con reglas que facilitan la extracción de información)
- Y muchas otras más.

## Ejemplo: Módulo csv

Vamos a leer un archivo csv, convirtiéndolo a lista directamente con el módulo csv

In [12]:
import csv

with open("miArchivo.csv",encoding="utf-8") as archivo:  # esto hace lo mismo que archivo = open(...)
    miCSV = csv.reader(archivo)
    lista = list(miCSV)
    encabezados = lista[0]
    lista = lista[1:]
    
for linea in lista:
    print(linea)


['2022', '2022-07-31', '4300,3', '31', 'Julio', '7']
['2022', '2022-07-30', '4300,3', '30', 'Julio', '7']
['2022', '2022-07-29', '4375,51', '29', 'Julio', '7']
['2022', '2022-07-28', '4420,75', '28', 'Julio', '7']
['2022', '2022-07-27', '4445,01', '27', 'Julio', '7']
['2022', '2022-07-26', '4461,63', '26', 'Julio', '7']
['2022', '2022-07-25', '4423,86', '25', 'Julio', '7']
['2022', '2022-07-24', '4423,86', '24', 'Julio', '7']
['2022', '2022-07-23', '4423,86', '23', 'Julio', '7']


Notemos que el módulo **csv** fue capaz de interpretar el campo número 3, el cual tenía una "coma" como separador decimal del número. Si lo hicieramos con la lectura línea a línea y *split*, tendríamos que considerar esto.

In [13]:
with open("miArchivo.csv",encoding="utf-8") as archivo:  # esto hace lo mismo que archivo = open(...)
    for linea in archivo:
        print(linea.split(','))

['Año', 'Fecha (dd/mm/aaaa)', 'TRM', 'Día del mes', 'Mes', 'Id Mes\n']
['2022', '2022-07-31', '"4300', '3"', '31', 'Julio', '7\n']
['2022', '2022-07-30', '"4300', '3"', '30', 'Julio', '7\n']
['2022', '2022-07-29', '"4375', '51"', '29', 'Julio', '7\n']
['2022', '2022-07-28', '"4420', '75"', '28', 'Julio', '7\n']
['2022', '2022-07-27', '"4445', '01"', '27', 'Julio', '7\n']
['2022', '2022-07-26', '"4461', '63"', '26', 'Julio', '7\n']
['2022', '2022-07-25', '"4423', '86"', '25', 'Julio', '7\n']
['2022', '2022-07-24', '"4423', '86"', '24', 'Julio', '7\n']
['2022', '2022-07-23', '"4423', '86"', '23', 'Julio', '7\n']


# Módulos externos

Existen miles de módulos que no están incluidos en la librería estandar de Python. En el mundo del análisis de datos, hay varios módulos externos que vamos a necesitar, por lo que primero debemos saber cómo se instalan en caso de que nuestro sistema no los tenga incluidos.

<span class="mark">**NOTA:** el entorno de desarrollo que estamos usando (**Anaconda**) **ya trae instalados los módulos que necesitaremos el resto del curso**, sin embargo, deben tener presente que estos no vienen instalados con la versión estandar de Python.</span> 

## Instalación

La instalación estandar de Python incluye el **Instalador de Paquetes Pip**. Para usarlo, debemos abrir una consola en nuestro sistema operativo (windows: símbolo del sistema, mac y linux: terminal) 

![image-2.png](attachment:image-2.png)

luego, seguimos las instrucciones de instalación del paquete que necesitemos. Por ejemplo, el módulo *Seaborn* para presentar información de forma gráfica

![image.png](attachment:image.png)

## Instalación de módulos en Anaconda

Si usamos el intérprete de Anaconda, la instalación de módulos externos debe realizarse por medio de **Anaconda Prompt**

![image.png](attachment:image.png)

## Módulos con VS Code (Solo para usuarios de VS Code, no afecta a Jupyter)

Si estamos usando la versión de Python instalada desde la Microsoft Store, o directamente desde la tienda de extensiones de VS Code, es probable que muchos módulos no funcionen, ya que el intérprete de Python instaldo de esta forma no encuentra los recursos por problemas de rutas. La recomendación aquí es:
- Instalar Python con el [instalador oficial que aparece en la página](https://www.python.org/downloads/)
  - También podemos usar el intérprete de Python que viene con Anaconda, si este es el caso, ver la nota para usuarios de Anaconda.
- En VS Code, especificar dicho intérprete. Para hacerlo: 
    - presionar la tecla F1
    - escribir "Python"
    - Seleccionar la opción "select interpreter" o "seleccionar intérprete"
    - Escoger uno de los siguientes (no debe decir "Windows Apps" o "Microsoft Store")
![image-3.png](attachment:image-3.png)

A continuación veremos en la esquina inferior derecha el intérprete seleccionado.

Forma incorrecta|Forma Correcta
-|-
![image-5.png](attachment:image-5.png)|![image-4.png](attachment:image-4.png)


## Módulos externos útiles para análisis de datos

Los módulos externos que usaremos frecuentemente son:

- [pandas](https://pandas.pydata.org/)
- [matplotlib](https://matplotlib.org/)
- [seaborn](https://matplotlib.org/)

## Ejemplo

Verifiquemos si tenemos instalados los módulos mencionados. Para esto solo debemos importarlos usando Try, e imprimir algo en la excepción

In [14]:
try:
    import pandas as pd
    # si sí hay pandas, crear un dataframe a partir del archivo csv con la primera fila como encabezado
    datos = pd.read_csv("miArchivo.csv",header=[0],decimal=',')
except:
    print("no hay pandas")
    datos = 0

## Ejercicio

1. Verificar la instalación de los módulos **matplotlib** y **seaborn**
2. Graficar los datos obtenidos en esta lista usando matplotlib:

In [15]:
encabezados,lista

(['Año', 'Fecha (dd/mm/aaaa)', 'TRM', 'Día del mes', 'Mes', 'Id Mes'],
 [['2022', '2022-07-31', '4300,3', '31', 'Julio', '7'],
  ['2022', '2022-07-30', '4300,3', '30', 'Julio', '7'],
  ['2022', '2022-07-29', '4375,51', '29', 'Julio', '7'],
  ['2022', '2022-07-28', '4420,75', '28', 'Julio', '7'],
  ['2022', '2022-07-27', '4445,01', '27', 'Julio', '7'],
  ['2022', '2022-07-26', '4461,63', '26', 'Julio', '7'],
  ['2022', '2022-07-25', '4423,86', '25', 'Julio', '7'],
  ['2022', '2022-07-24', '4423,86', '24', 'Julio', '7'],
  ['2022', '2022-07-23', '4423,86', '23', 'Julio', '7']])

3. Graficar los datos obtenidos en este *dataframe* usando alguna forma de gráfico de **seaborn**

In [16]:
datos

Unnamed: 0,Año,Fecha (dd/mm/aaaa),TRM,Día del mes,Mes,Id Mes
0,2022,2022-07-31,4300.3,31,Julio,7
1,2022,2022-07-30,4300.3,30,Julio,7
2,2022,2022-07-29,4375.51,29,Julio,7
3,2022,2022-07-28,4420.75,28,Julio,7
4,2022,2022-07-27,4445.01,27,Julio,7
5,2022,2022-07-26,4461.63,26,Julio,7
6,2022,2022-07-25,4423.86,25,Julio,7
7,2022,2022-07-24,4423.86,24,Julio,7
8,2022,2022-07-23,4423.86,23,Julio,7


- Nota: la columna TRM requiere conversión a número float antes de poderse graficar

# Referencias

[1] Delgado-Quintero, Sergio (2020) - Aprende Python: Módulos - https://aprendepython.es/core/modularity/modules/

# Otros módulos recomendados para ingenieros

1. [numpy](https://aprendepython.es/pypi/datascience/numpy/): computación numérica para arreglos de datos multidimensionales multidimensionales
2. [scipy](https://en.wikipedia.org/wiki/SciPy): herramientas de computación científica