<a href="https://colab.research.google.com/github/molecular-mar/molecular-mar.github.io/blob/master/Sesion9_1_PAQ24P.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Módulos y paquetes
---


Las funciones resultan de gran utilidad al condensar procedimientos que no quisieramos escribir desde cero cada que sean necesarios. Hasta ahora solo hemos usado las funciones que hemos definido y las llamadas *funciones internas*, que Python reconoce sin necesidad de pasos adicionales.

La gran mayoría de las funciones de uso común en Python provienen de *paquetes*, que son compendios de funciones (y variables) previamente desarrollados con un fin específico. Dichas funciones se encuentran almacenadas en archivos, conocidos como módulos. En otros lenguajes a este tipo de compendios se les conocen como *bibliotecas*, o debido a una traducción incorrecta del inglés como *librerias*.

Para utilizar un paquete debemos utilizar la instrucción `import`:
 ```python
 import paquete
 ```

 Un paquete común es el de funciones matemáticas `math`, el cuál incluye funciones como la raíz cuadrada, funciones trigonométricas, función logaritmo, constantes como $\pi$ o $e$, entre otras.

In [None]:
import math

# Para utilizar una función de un paquete, debemos escribir el nombre
# del paquete, un punto y el nombre de la función del paquete.
print(math.sqrt(4))
print(math.log(math.e)) # Nota que e, al ser un número, no va acompañado de parentesis
print(math.pi)

En la práctica no es muy común el uso del paquete `math`. En su lugar se utiliza **Numpy**, cuyas capacidades son más extensas y emplea algoritmos más eficientes.

Es frecuente usar abreviaturas para no escribir el nombre completo del paquete. Con este fin usamos la instrucción `as`:

In [None]:
import numpy as np #usaremos np como 'apodo' de numpy

np.pi

Con la instrucción anterior, le hemos puesto un *apodo* al paquete `numpy`. Dicho apodo lo podemos definir como queramos, pero muchos paquetes suelen recomendar un apodo en específico, como es el caso de `np` para `numpy`.

Escribir el nombre del paquete o la abreviatura para realizar una operación puede resultar engorroso. Pero tiene un uso importante: si nosotros definimos una variable llamada `pi`, no habrá confusiones internamente sobre cuál es nuestra variable y cuál la del paquete Numpy (`np.pi`). Cuando cargamos muchos paquetes es útil por los mismos motivos: quizá el paquete `numeros` tiene una función llamada `suma`, y el paquete `matriz` también. Podemos cargar ambos módulos y sin confusiones utilizar una función o la otra: `numeros.suma(2,3)` y `matriz.suma(A,B)`.

Aún así, es posible cargar funciones o variables de un paquete de tal forma que no sea necesario indicar de que paquete proviene. Para ellos usamos la instrucción `from` antes de `import`:

```python
from paquete import funcion1, variable1, funcion2,...
```



Revisa el siguiente ejemplo, donde cargamos el submódulo `random` del paquete `numpy`, que incluye funciones para generar números aleatorios.

In [None]:
from numpy import sum
sum([1,2,3])

### Algunos paquetes comúnes para ciencias:

* **Numpy**: Provee de herramientas para la manipulación de datos numéricos. Útil para problemas de álgebra lineal, generación de números aleatorios, manipulación de funciones, métodos numéricos.

* **Matplotlib**: Nos permite realizar gráficas de diversos tipos con amplias capacidades de personalización.

* **Pandas**: Para la creación y manipulación de datos en tablas, similar a lo que podríamos hacer en una hoja de cálculo.

* **Sympy**: Para realizar cálculo simbólico, lo que permite realizar operaciones algebraicas con símbolos (como lo hacemos Mathematica o MatLab).

* **Scikit-learn**: Para realizar procesos de aprendizaje automatizado, incluyendo clasificación, regresión y clustering.

Dada su importancia, veremos a continuación algunos procedimientos básicos que podemos hacer con Numpy, Pandas y Matplotlib. Las siguientes secciones fueron tomadas o adaptadas del siguiente notebook: [Python para Química, parte 2](https://colab.research.google.com/github/molecular-mar/ws_python_quimica/blob/main/PythonQuimiK2.ipynb).

### Numpy

Como se indicó arriba, Numpy nos puede ayudar a realizar muchas operaciones matemáticas. Estas son accesibles de forma relativamente sencilla y además están optimizadas, por lo que se ejecutan más rápido que si nosotros crearamos una función con un fin similar. Puedes consultar más en la página del [Numpy](https://numpy.org/doc/stable/).
Para empezar, en Numpy podemos crear un tipo de dato similar a las listas, conocido como *arreglo* o `array`. En la siguiente celda veamos un ejemplo de este tipo de dato:

In [None]:
#Importante siempre cargar primero el paquete si no lo hemos hecho
import numpy as np

#Para crear desde cero un arreglo, indicando sus elementos:
arreglo_1 = np.array([3,6,3,6,9])
#Nota que el argumento es una lista

#Podemos crear un arreglo de numpy desde una variable que sea una lista:
lista_1 = [2,4,2,4,8]
arreglo_2 = np.array(lista_1)

print(arreglo_1, lista_1, arreglo_2)
# Nota cuales son las diferencias al imprimir una lista o imprimir un arreglo

Es posible realizar algunas operaciones que hemos visto en el curso de una forma sencilla usando Numpy:

In [None]:
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
print(2 * arr) # ¿Cómo haríamos esto usando listas?

In [None]:
# Para construir una matriz

matriz1 = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(2 * matriz1) # Aplica igual que con un arreglo unidimensional

❓Crea la matriz:

$$\mathbf{A}=\begin{bmatrix}
1 & 0 & 0\\
0 & 1 & 0\\
0 & 0 & 1
\end{bmatrix}$$

Crea y escribe una segunda matriz $\mathbf{B}$ para que la suma $\mathbf{A+B}$ dé como resultado la matriz $\mathbf{C}$:

$$\mathbf{C}=\begin{bmatrix}
1 & 0 & 1\\
0 & 2 & 0\\
1 & 0 & 3
\end{bmatrix}$$

Calcula e imprime la matriz $\mathbf{C}$.

### Arreglos usando secuencias

Podemos crear arreglos siguiendo secuencias que podamos definir de forma sencilla, similar a lo que haciamos con `range` pero con más posibilidades:


In [None]:
# Con arange generamos secuencias como al usar range
# arange(inicio, fin(no inclusivo), paso)
arr = np.arange(0, 10, 0.5)
arr

In [None]:
# Con linspace debemos indicar el número de divisiones
# linspace(inicio,fin(inclusivo),divisiones)
arr = np.linspace(0,10, 20)
arr

### Cambiando la forma del arreglo


In [None]:
# Para determinar la forma del arreglo, podemos usar shape y size
print(matriz1)
print(matriz1.size)
print(matriz1.shape)

In [None]:
# Podemos cambiar la forma del arreglo
array_1D = np.linspace(0, 9.5, 20)
array_2D = np.reshape(array_1D, (4, 5))
array_2D

In [None]:
# Para volverlo unidimensional (aplanarlo)
print(array_2D.flatten())

In [None]:
# Podemos generar la transpuesta
transpuesta_2D = array_2D.T
print(array_2D, transpuesta_2D)

### Índices en Numpy



In [None]:
# Para un arreglo de una dimensión, es igual que con listas
array_1D[5]

In [None]:
# Para un arreglo multidimensional, podemos hacer varias cosas
array_2D[1] # Una fila completa

In [None]:
array_2D[1][0] # Un solo elemento

In [None]:
array_2D[1,0] # Equivalente

In [None]:
array_2D[:,1] # Una columna

In [None]:
# ¿Cómo accedemos al último elemento?

❓Para la matriz `D`, imprime los siguientes números.

* 8
* 2
* La segunda columna
* La tercera fila



In [None]:
D = np.array([[1,2,3],[4,5,6],[7,8,9]])

---
### Operaciones algebraicas

In [None]:
import numpy as np
vec_a = np.array([1,2,1])
vec_b = np.array([3,7,4])
a = [[1,2],[3,4]]
b = [[5,6],[7,8]]
#Utiliza las matrices A y B previamente definidas
producto_punto = np.dot(vec_a,vec_b) # Para realizar el producto punto
producto_matricial = np.matmul(a,b) # Para realizar el producto matricial
producto_matricial2 = np.dot(a,b) # Otra forma de realizar el producto matricial
print(producto_punto)
print(producto_cruz)
print(producto_cruz2)

In [None]:
# Podemos resolver sistemas de ecuaciones lineales Ax=B
mat_A = np.array([[4,-2,1],[-3,-1,4],[1,-1,3]])
mat_B = np.array([15,8,13])
np.linalg.solve(mat_A,mat_B)
