![imagen](./img/python.jpg)

# Módulos y bibliotecas en Python

Hasta ahora hemos desarrollado programas no muy complicados que cabían en una celda de un Notebook, pero poco a poco se va complicando más la cosa. ¿Qué ocurrirá cuando tengamos varias Clases definidas, funciones, datos declarados, llamadas a paginas web...? ¿Lo vamos a tener todo en una celda/Notebook? Para ayudarnos con esto utilizaremos la sentencia `import`, pudiendo dividir nuestro programa en varios scripts de Python, y no solo eso, sino que tendremos también la opción de usar librerías de terceros en nuestro código, lo que va a ayudar mucho en el desarrollo.

Para este Notebook se recomienda tener otro IDE como VSCode, Spyder o Pycharm.

1. [import](#1.-import)
2. [Bibliotecas](#2.-Bibliotecas)
3. [Resumen](#3.-Resumen)

## 1. import
Recuerda que hay que **evitar en la medida de lo posible tener código repetido o duplicado**, por lo que funcionalidades que uses en diferentes partes del código no tendrás que copiar y pegarlas en todos lados, sino que existe la posibilidad de definirlas una sola vez, e importarlas después.

Por tanto, según vamos complicando nuestros programas, surge la necesidad de modularizarlo, es decir, poder dividirlo y paquetizarlo. Como habrás podido imaginar, programas productivos como una página web o un juego, no van en un Notebook, sino en varios scripts de Python. Según las diferentes funcionalidades del código, lo iremos dividiendo en varias partes. Por ejemplo, en un script pueden ir funciones auxiliares, en otro constantes, en otro tus Clases... Veamos algunos conceptos

**Script**

No es más que un archivo con código Python. Estos archivos tienen la extensión `.py`, por lo que un ejemplo podría ser `primer_script.py`.

**Módulo/Biblioteca/Librería/Paquete**

Son términos parecidos que se suelen utilizar para referirse a lo mismo. A efectos prácticos, los consideraremos igual. Se trata de paquetes de código que tienen una funcionalidad bien definida y podremos importar en nuestros programas de Python, utilizando lo que haya dentro (clases, funciones, variables...).

**import**

Palabra reservada y sentencia que se usa en Python para importar cualquier objeto en nuestro código. Se usa para importar variables, funciones o módulos.

Veamos cómo podemos importar objetos de otros scripts

In [1]:
%%file primer_script.py
"""
Example of a python module. Contains a variable called my_variable,
a function called my_function, and a class called MyClass.
"""

my_variable = 0

def my_function():
    """
    Example function
    """
    return my_variable
    
class MyClass:
    """
    Example class.
    """

    def __init__(self):
        self.variable = my_variable
        
    def set_variable(self, new_value):
        """
        Set self.variable to a new value
        """
        self.variable = new_value
        
    def get_variable(self):
        return self.variable

Writing primer_script.py


Tenemos en otro script una variable, una función y una clase definida. Ahora lo importamos

In [2]:
import primer_script
help(primer_script)

Help on module primer_script:

NAME
    primer_script

DESCRIPTION
    Example of a python module. Contains a variable called my_variable,
    a function called my_function, and a class called MyClass.

CLASSES
    builtins.object
        MyClass
    
    class MyClass(builtins.object)
     |  Example class.
     |  
     |  Methods defined here:
     |  
     |  __init__(self)
     |      Initialize self.  See help(type(self)) for accurate signature.
     |  
     |  get_variable(self)
     |  
     |  set_variable(self, new_value)
     |      Set self.variable to a new value
     |  
     |  ----------------------------------------------------------------------
     |  Data descriptors defined here:
     |  
     |  __dict__
     |      dictionary for instance variables (if defined)
     |  
     |  __weakref__
     |      list of weak references to the object (if defined)

FUNCTIONS
    my_function()
        Example function

DATA
    my_variable = 0

FILE
    c:\users\javi p. piazz

Como siempre en cualquier lenguaje de programación **tenemos que fijarnos siempre dónde está apuntando el Notebook**, es decir, en qué directorio de trabajo va a leer el script. Al poner `import primer_script`, va a buscar ese script en el **mismo directorio donde esté el Notebook**. Si lo tenemos en otro lado del ordenador, no lo detectará. Cuando realizas el importado Python no recorre todas las carpetas del ordenador, lo busca en el mismo sitio donde está el Notebook. Más delante veremos cómo leer scripts de otros directorios.

Si queremos acceder a cualquier objeto del módulo, simplemente utilizamos la sintaxis `nombre_modulo.objeto`

In [3]:
print(primer_script.my_variable)
print(primer_script.my_function)
print(primer_script.MyClass)

0
<function my_function at 0x0000018A876B5440>
<class 'primer_script.MyClass'>


In [4]:
primer_script.my_function()

0

In [5]:
new_object = primer_script.MyClass()
print(new_object)
print(new_object.get_variable())

<primer_script.MyClass object at 0x0000018A876E5450>
0


[Aquí](https://docs.python.org/3/reference/import.html) tienes el enlace a la documentación del `import` por si tienes dudas, o necesitas realizar operaciones más complejas con el importado de módulos.

<table align="left">
 <tr><td width="80"><img src="./img/error.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>ERRORES Importado de módulos</h3>
         
 </td></tr>
</table>

Típico error cuando intentamos acceder a un módulo que pensamos que está instalado en el intérprete de VSCode, o queremos acceder a un *.py* que en realidad no está en la ruta deseada.

In [6]:
import mi_modulo

ModuleNotFoundError: No module named 'mi_modulo'

O si intentamos acceder una función/atributo que en realidad no existe en el módulo.

In [7]:
primer_script.my_function2()

AttributeError: module 'primer_script' has no attribute 'my_function2'

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Crear un script</h3>
         
Crea un nuevo script de Python (es un archivo .py) y ponle de nombre "ejer_prueba.py". Lo puedes crear desde el propio Jupyter Lab desde File -> New -> Text File. O también desde VSCode/Pycharm
         
         Declara dos variables en el script
         a = 1
         b = 2

Importa ambas variables e imprimelas por pantalla.

NOTA: si estás seguro de que está bien y no te reconoce las variables, prueba a reiniciar el kernel.
 </td></tr>
</table>

In [8]:
from ejer_prueba import a
from ejer_prueba import b

print(f"{a} y {b}")

1 y 2


Tienes otras maneras de importar datos, ya que en ocasiones desconocemos lo que hay dentro del módulo, o simplemente no queremos utilizar todo lo que hay.

In [9]:
from primer_script import my_variable
print(my_variable)

0


In [10]:
from math import pi
print(pi)

3.141592653589793


En este caso ya no es necesario usar la sintaxis `modulo.objeto`, sino que el objeto ya está cargado en memoria. Es como si lo hubiésemos ejecuctado en una celda.

Otra opción es importar todo. **NO es lo recomendable**. Porque el módulo podría tener muchas variables o funciones que no necesitemos, y ocupan espacio en memoria.

In [None]:
# import primer_script
from primer_script import *

**¿Y si tenemos el archivo en otra carpeta?** La sintaxis es la misma. Si dentro de la carpeta donde está el Notebook, hay otra carpeta llamada `direc_segundo`, y dentro de esa carpeta hay otro script llamado `segundo_script.py`, podrás acceder a los objetos de ese script mediante la sintaxis `import direc_segundo.segundo_script`

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Crear un script dentro de una carpeta</h3>
         
En el mismo sitio donde se encuentra este Notebook, crea la carpeta "direc_segundo", y dentro de la carpeta crea otro script llamado "segundo_script.py".
         
         Declara dos variables en el script
         c = 3
         d = 4

Importa ambas variables e imprimelas por pantalla.
         
 </td></tr>
</table>

In [3]:
from direc_segundo.segundo_script import c
from direc_segundo.segundo_script import d

print(f"{c} y {d}")


3 y 4


En estos casos resulta muy útil ponerle un alias al `import`. Esto nos ayudará a acortar el nombre y a poner uno más intuitivo

Por útimo, **¿y si nuestros módulos no están en una carpeta dentro del proyecto donde estamos trabajando, sino en otra carpeta del ordenador, o en directorios anteriores?** Esto lo podemos solucionar mediante `sys.path`. `sys` es el módulo de Python que se usa para manejar las variables del sistema y el intérprete. Y `path` es una lista de strings con una serie de rutas donde acude el intérprete de Python cuando tiene que buscar un módulo. [Tienes aqui la documentación de `sys`](https://docs.python.org/3/library/sys.html)

In [53]:
import sys

sys.path

lista = sys.path

set2 = set(lista)

lista = list(set2)

sys.path = lista

sys.path







['',
 'C:\\Users\\Javi P. Piazza\\AppData\\Local\\Programs\\Python\\Python311\\Lib\\site-packages',
 'c:\\Users\\Javi P. Piazza\\AppData\\Local\\Programs\\Python\\Python311\\DLLs',
 'C:\\Users\\Javi P. Piazza\\AppData\\Roaming\\Python\\Python311\\site-packages\\Pythonwin',
 'C:\\Users\\Javi P. Piazza\\AppData\\Roaming\\Python\\Python311\\site-packages\\win32\\lib',
 'c:\\Users\\Javi P. Piazza\\AppData\\Local\\Programs\\Python\\Python311\\python311.zip',
 'c:\\Users\\Javi P. Piazza\\AppData\\Local\\Programs\\Python\\Python311\\Lib',
 'C:\\Users\\Javi P. Piazza\\AppData\\Roaming\\Python\\Python311\\site-packages',
 'c:\\Users\\Javi P. Piazza\\AppData\\Local\\Programs\\Python\\Python311',
 'C:\\Users\\Javi P. Piazza\\OneDrive\\Escritorio\\direc_tercero\\tercer_script.py',
 'c:\\Users\\Javi P. Piazza\\OneDrive\\Documents\\DOCUMENTOS\\INFORMATICA\\DATA SCIENCE\\GIT\\ALUMNOS\\THE_BRIDGE_DS_BC\\1-Ramp_Up\\2-Python\\6-Modulos\\Teoria']

Si queremos que el intérprete de Python entienda de otros módulos que **no están en la carpeta de Notebook**, tendremos que añadir esa ruta a la lista de paths mediante la sintaxis `sys.path.append(la_nueva_ruta)`. Recuerda que `sys.path` es una lista, por lo que podrás aplicarle lo que ya sabes sobre listas.

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Añadir un nuevo path</h3>
         
Crea un nuevo directorio en otra ruta del ordenador, por ejemplo en el escritorio. Llámalo "direc_tercero" e introduce dentro un nuevo script que se llame "tercer_script.py". Tendrás que añadir el path de ese directorio a los paths de sys.
         
         Declara dos variables en el script
         e = 5
         f = 6


Importa ambas variables e imprimelas por pantalla.
         
 </td></tr>
</table>

In [54]:
import sys

# Ruta al directorio que contiene tercer_script.py
nueva_ruta = "C:\\Users\\Javi P. Piazza\\OneDrive\\Escritorio\\direc_tercero\\tercer_script.py"

sys.path.append(nueva_ruta)
    
import tercer_script

ModuleNotFoundError: No module named 'tercer_script'

Una vez creado el nuevo directorio, se recomienda copiar su ruta y pegarla en el `append`

Con lo visto en este Notebook tienes conocimiento de sobra para manejar tu programa en varios scripts, pero si quieres aprender más sobre el concepto `import`, te recomiendo que te leas [este artículo](https://chrisyeh96.github.io/2017/08/08/definitive-guide-python-imports.html).

## 2. Bibliotecas
Hasta ahora, todas las funcionalidades que necesitabas en Python las has ido desarrollando con tu propio código. Esto está bien, pero no siempre es necesario. **Existen muchísimas librerías que pueden hacer el trabajo por ti**, por lo que antes de implementar algo, ***no reinventes la rueda***. Se listo y busca si ya hay algo hecho en la web. Esto es lo bueno de trabajar con un lenguaje open source, que existe una comunidad con muchísimos desarrolladores y hay una gran cantidad de código publicado de manera gratuita. Por tanto, ¿De dónde podemos sacar estos códigos mágicos?

* **[Biblioteca estándar de Python](https://docs.python.org/3/library/index.html#the-python-standard-library)**: aqui tienes muchas de las cosas que hemos visto ya (tipos de datos, el móduglo math...) y mucho más (lectura de archivos, compresión, acceso a BBDD...).
* **Bibliotecas de terceros**: librerías que no vienen en el paquete por defecto de Python. Estas librerías o bien las implementa un particular o una empresa, y son de código abierto. Anaconda está muy orientado a la ciencia de datos, por lo que tiene librerías muy interesantes que utilizaremos durante el curso (pandas, numpy o sklearn). Además de estás librerías, podrás añadir al intérprete de Python todas las que necesites

Veamos un ejemplo de importación de una librería

In [55]:
import math
math.sqrt(36)

6.0

Importando `math`, podremos acceder a todas sus funciones mediante la sintaxis `math.funcion()`. [En la documentación](https://docs.python.org/3/library/math.html#math.log) verás todo lo que puedes hacer con `math`. 

Veamos un ejemplo en el que nos ayude a no escribir código de más.

In [56]:
help(math)

Help on built-in module math:

NAME
    math

DESCRIPTION
    This module provides access to the mathematical functions
    defined by the C standard.

FUNCTIONS
    acos(x, /)
        Return the arc cosine (measured in radians) of x.
        
        The result is between 0 and pi.
    
    acosh(x, /)
        Return the inverse hyperbolic cosine of x.
    
    asin(x, /)
        Return the arc sine (measured in radians) of x.
        
        The result is between -pi/2 and pi/2.
    
    asinh(x, /)
        Return the inverse hyperbolic sine of x.
    
    atan(x, /)
        Return the arc tangent (measured in radians) of x.
        
        The result is between -pi/2 and pi/2.
    
    atan2(y, x, /)
        Return the arc tangent (measured in radians) of y/x.
        
        Unlike atan(y/x), the signs of both x and y are considered.
    
    atanh(x, /)
        Return the inverse hyperbolic tangent of x.
    
    cbrt(x, /)
        Return the cube root of x.
    
    ceil(x, /)

In [57]:
help(math.sqrt)

Help on built-in function sqrt in module math:

sqrt(x, /)
    Return the square root of x.



In [58]:
print(dir(math))

['__doc__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'cbrt', 'ceil', 'comb', 'copysign', 'cos', 'cosh', 'degrees', 'dist', 'e', 'erf', 'erfc', 'exp', 'exp2', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'isqrt', 'lcm', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'nextafter', 'perm', 'pi', 'pow', 'prod', 'radians', 'remainder', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'tau', 'trunc', 'ulp']


Otro ejemplo en el que vemos la potencia de `pandas`, a la hora de leer archivos

In [59]:
import csv

with open('mi_csv.csv', 'r') as file:
    my_reader = csv.reader(file, delimiter = ',')
    
    for row in my_reader:
        print(row)

print("Fin")

['version https://git-lfs.github.com/spec/v1']
['oid sha256:898bcc11c128068c7ea5dd639d1293e47f28fef35fbe176e773719fc6f579365']
['size 44']
Fin


In [66]:
%pip install seaborn

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 23.1.2 -> 23.2.1
[notice] To update, run: python.exe -m pip install --upgrade pip


Collecting seaborn
  Downloading seaborn-0.13.0-py3-none-any.whl (294 kB)
                                              0.0/294.6 kB ? eta -:--:--
     -------------------------              194.6/294.6 kB 3.9 MB/s eta 0:00:01
     -------------------------------------- 294.6/294.6 kB 3.6 MB/s eta 0:00:00
Collecting matplotlib!=3.6.1,>=3.3 (from seaborn)
  Downloading matplotlib-3.8.0-cp311-cp311-win_amd64.whl (7.6 MB)
                                              0.0/7.6 MB ? eta -:--:--
     --                                       0.4/7.6 MB 8.1 MB/s eta 0:00:01
     ----                                     0.9/7.6 MB 7.3 MB/s eta 0:00:01
     -------                                  1.4/7.6 MB 9.0 MB/s eta 0:00:01
     ----------                               1.9/7.6 MB 8.7 MB/s eta 0:00:01
     ------------                             2.4/7.6 MB 8.9 MB/s eta 0:00:01
     -------------                            2.5/7.6 MB 7.6 MB/s eta 0:00:01
     ---------------                  

In [65]:
import pandas as pd

mi_data = pd.read_csv("mi_csv.csv")
mi_data.head()

Unnamed: 0,version https://git-lfs.github.com/spec/v1
0,oid sha256:898bcc11c128068c7ea5dd639d1293e47f2...
1,size 44


In [68]:
%pip install --upgrade pip

Collecting pip
  Downloading pip-23.2.1-py3-none-any.whl (2.1 MB)
                                              0.0/2.1 MB ? eta -:--:--
     --                                       0.1/2.1 MB 4.3 MB/s eta 0:00:01
     -----------                              0.6/2.1 MB 7.5 MB/s eta 0:00:01
     -------------                            0.7/2.1 MB 6.3 MB/s eta 0:00:01
     --------------------------               1.4/2.1 MB 7.2 MB/s eta 0:00:01
     -------------------------------          1.6/2.1 MB 7.5 MB/s eta 0:00:01
     ---------------------------------------- 2.1/2.1 MB 7.4 MB/s eta 0:00:00
Installing collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 23.1.2
    Uninstalling pip-23.1.2:
      Successfully uninstalled pip-23.1.2
Successfully installed pip-23.2.1
Note: you may need to restart the kernel to use updated packages.




In [69]:
import seaborn as sns

sns.barplot(x = "origin", y = "distance", data = mi_data)

ValueError: Could not interpret value `origin` for `x`. An entry with this name does not appear in `data`.

### Bibliotecas de terceros
**¿Y si encontramos una librería interesante y queremos instalarla?** La podremos instalar. Anaconda viene con muchas bibliotecas ya instaladas, la mayoría orientadas a trabajar con datos, pero por supuesto, no contiene todas las bibliotecas. Si quieres ver los paquetes de Anaconda, abre un *Prompt de Anaconda* y escribe `pip freeze`.

Entonces, **¿cómo se instala un paquete nuevo?** La mayoría de paquetes los vas a encontrar en [PyPI (Python Package Index)](https://pypi.org), que es el repositorio oficial de paquetes de Python. Existen paquetes de particulares (no empresas, ni comunidades) en PyPI. Eso no quiere decir que no los puedas instalar, sino que probablemente estén menos testados que los "oficiales".

Veamos un ejemplo de cómo instalar una nueva librería. En este caso, instalaremos **wget**, que nos sirve para obtener archivos de la web.

In [70]:
!pip freeze

asttokens==2.2.1
async-lru==2.0.4
attrs==23.1.0
Automat==22.10.0
Babel==2.12.1
backcall==0.2.0
beautifulsoup4==4.12.2
bleach==6.0.0
blinker==1.6.2
certifi==2023.7.22
cffi==1.15.1
charset-normalizer==3.2.0
click==8.1.7
colorama==0.4.6
constantly==15.1.0
contourpy==1.1.0
cryptography==41.0.3
cssselect==1.2.0
cycler==0.11.0
debugpy==1.6.7.post1
decorator==5.1.1
defusedxml==0.7.1
EasyProcess==1.1
entrypoint2==1.1
exceptiongroup==1.1.3
executing==1.2.0
fastjsonschema==2.18.0
filelock==3.12.2
Flask==2.3.2
fonttools==4.40.0
fqdn==1.5.1
h11==0.14.0
hyperlink==21.0.0
idle==1.0.4
idna==3.4
imbalanced-learn==0.11.0
imblearn==0.0
incremental==22.10.0
itemadapter==0.8.0
itemloaders==1.1.0
itsdangerous==2.1.2
Jinja2==3.1.2
jmespath==1.0.1
joblib==1.3.2
json5==0.9.14
jsonpointer==2.4
jupyter_core==5.3.1
jupyterlab-pygments==0.2.2
kiwisolver==1.4.4
lxml==4.9.3
MarkupSafe==2.1.3
matplotlib==3.7.1
matplotlib-inline==0.1.6
mistune==3.0.1
MouseInfo==0.1.3
mss==9.0.1
nest-asyncio==1.5.7
numpy==1.25.0
outco

In [71]:
!where python

c:\Users\Javi P. Piazza\AppData\Local\Programs\Python\Python311\python.exe
C:\Users\Javi P. Piazza\AppData\Local\Microsoft\WindowsApps\python.exe


In [74]:
import wget

Al hacer el `import`, no existe, por lo que tendremos que instalarla. Para instalarla, abre un prompt de Python y ejecuta `pip install wget`

In [73]:
%pip install wget

Collecting wget
  Downloading wget-3.2.zip (10 kB)
  Installing build dependencies: started
  Installing build dependencies: finished with status 'done'
  Getting requirements to build wheel: started
  Getting requirements to build wheel: finished with status 'done'
  Preparing metadata (pyproject.toml): started
  Preparing metadata (pyproject.toml): finished with status 'done'
Building wheels for collected packages: wget
  Building wheel for wget (pyproject.toml): started
  Building wheel for wget (pyproject.toml): finished with status 'done'
  Created wheel for wget: filename=wget-3.2-py3-none-any.whl size=9680 sha256=bc1ef0b5121d1556bf3c7373af713e160acc057ca516822927274e917e7cfec7
  Stored in directory: c:\users\javi p. piazza\appdata\local\pip\cache\wheels\40\b3\0f\a40dbd1c6861731779f62cc4babcb234387e11d697df70ee97
Successfully built wget
Installing collected packages: wget
Successfully installed wget-3.2
Note: you may need to restart the kernel to use updated packages.


In [75]:
import wget

url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'
filename = wget.download(url)
filename

'razorback (1).mp3'

¡Perfecto! has podido instalar tu primer paquete en el intérprete de Python 3.7

## 3. Resumen
Como ves, **gran parte de la potencia de Python reside en sus librerías**. Combinando los conocimientos ya aprendidos con las librerías adecuadas, podremos crear dashboards interactivos, modelos de machine learning, páginas webs, automatizar procesos... ¡Los límites los pones tu! :)

In [None]:
# Sintaxis básica para importar un modulo
import primer_script

# PAra acceder a su documentación
help(primer_script)

# PAra acceder a los objetos del modulo
print(primer_script.my_variable)
print(primer_script.my_function)
print(primer_script.MyClass)

# Una manera de acceder a todo
from primer_script import *

# Renombrar el modulo también es util
import direc_segundo.segundo_script as variables
print(variables.c)

# Si queremos acceder rutas en otras partes del ordenador, hay que añadirlas a sys.path
sys.path.append('C:/Users/Daney/Desktop/direc_tercero')
sys.path

# Por otro lado, tenemos las librerías del estandar de Python
import math
math.sqrt(36)

# O librerias de terceros que podrás instalar mediante un pip install libreria, en un Prompt de Anaconda.
import wget