<p align="center">
<img src='https://static.wixstatic.com/media/42c521_bbcac1847d1a46739c6ccb446a2be592~mv2.png/v1/fill/w_490,h_189,al_c,q_85,usm_0.66_1.00_0.01/20210730_website_header.webp' width="1000" />
</p>


\textbf{Instructor}: Manuel A. Morgado V. (morgadovargas@unistra.fr)

\textbf{Affiliation}: 

- \textit{Institut de Science et d’Ingénierie Supramoléculaires (ISIS, UMR7006), University of Strasbourg and CNRS}

- \textit{Centre Européen de Sciences Quantiques (CESQ-ISIS, UMR7006), University of Strasbourg and CNRS}

\textbf{Created}: Jul.10, 2021

\textbf{Last Modification}: Aug.25, 2021

\textbf{License}: http://www.apache.org/licenses/LICENSE-2.0

---

<font size="12">TABLA DE CONTENIDO</font>

* [NumPy](#NumPy)
    * [Importar módulo](#section_1_1)
    * [`Arrays` protagonista de NumPy](sSection_1_2)
        * [Operaciones algebráicas](#section_1_2_1)
        * [Funciones matemáticas](#section_1_2_2)
        * [Manejo de datos](#section_1_2_3)
* [Matplotlib](#Matplotlib)
    * [Tipos de plots](#section_2_1)
    * [Histogramas](#section_2_2)
    * [Subplots](#section_2_2)
    * [Guardando plots](#section_2_2)
    
* [SciPy](#SciPy)
    * Módulo de álgebra: sistema de ecuaciones, autovalores(vectores), operaciones matriciales...
    * Módulo de cálculo: funciones especiales, integración, ecuaciones diferenciales...
    * Módulo de optimización: mínimos y raíces de funciones, interpolación y ajustes de curva
    * Módulo de estadística: números aleatorios, functiones de distribución

* [Scikit-learn](#Scikit-learn)
* [Pandas](#Pandas)

---

# NumPy <a class="anchor" id="NumPy"></a>

<p align="center">
<img src='https://numpy.org/doc/stable/_static/numpylogo.svg' width="700" />
</p>

Documentación:[ https://numpy.org/doc/stable/](https://numpy.org/doc/stable/)



`NumPy` es un módulo de Python que para llevar a cabo una gran cantidad de cálculos numéricos usando Python. La mayor ventaja de NumPy es que esta implementado en lenguajes de más bajo nivel como `C` y `FORTRAN`, de manera que ofrece un gran desempeño al momento de realizar cálculos utilizando vectores y matrices o como se conocen en NumPy: `arrays`. 

## Importar módulo

<div class="alert alert-block alert-danger">

**Importante**
    
El primer paso para comenzar utilizando NumPy es importando el módulo de NumPy en nuestro cuaderno de `Jupyter`, ya sea completamente o las funciones que vayamos a utilizar de dicho paquete.   

</div>


<div class="alert alert-block alert-info">

**Nota** : importando con sobrenombre
    
Importamos el módulo de un sobrenombre más corto

</div>


In [None]:
import numpy as np

<div class="alert alert-block alert-info">

**Nota** : importando 1 función de NumPy
    
Esta es la manera si solo importamos una sola función de `NumPy`.
</div>


In [None]:
from numpy import linspace

In [None]:
help(linspace) #ayuda sobre comando linspace

Si queremos utilizar esta sintaxis para importar todo NumPy podemos escribir: `from numpy import *`

<div class="alert alert-block alert-danger">

**Nota** : limpiar módulo
    
Podemos limpiar el módulo de la memoria con: `del <módulo>`
</div>


In [None]:
del np

In [None]:
np.pi

## `Arrays` protagonista de NumPy

El objeto desarrollado en NumPy para la realización de cálculos son los arreglos o como le llamaremos: `array`. Estos pueden ser generados a partir de objetos de Python como listas de números o listas de listas de números, también existen comando propios de NumPy para generar arreglos con características específicas.

Comencemos definiendo algunos valores para algunas variables:

In [None]:
'''

    Para asignar el valor a una variable la sintaxis sigue:

    <variable> = <valor>; 

    el símbolo ";" se incluye para evitar que la línea sea 
    mostrada en pantalla.

'''
start = 0; 
final = 10;
nr_steps = 11;

import numpy

Nuestro primer **Numpy array**!

In [None]:
numpy.linspace(start, final, nr_steps) #crea un array desde el valor 0 al valor 10 con 11 elementos

In [None]:
final #revisamos el valor de la variable final (IPython Notebooks)

In [None]:
print(final); #revisamos el valor de la variable final

In [None]:
type(final) #revisamos que tipo de variable es

In [None]:
npArray = numpy.linspace(start, final, nr_steps); #crea y guarda array anterior en array_value 

In [None]:
npArray

In [None]:
len(npArray) #revisamos longitud de arreglo

In [None]:
numpy.arange(11) #una manera de crear un array de 11 nros. enteros

In [None]:
type(numpy.arange(11)[4]) #revisamos la clase de objeto de este array

In [None]:
type(npArray[4])

Veamos que las dos herramientas de NumPy:

-`np.linspace(inicial, final, #elementos)`

-`np.arange(#elementos)`

tienen claras diferencias no solo al momento de emplearlos para el cual `np.linspace` requiere de 3 argumentos de entrada mientras que `np.arange` requiere 1 solo argumento. Sino también que en los elementos de salida, del primero resulta un array de números **flotantes de 64-bits (*float64*)** mientras que en el segundo nos resulta un array de **enteros de 64-bits (*int64*)**.

También es possible crear arreglos de número predeterminados como 0 y 1 usando commandos de NumPy:

In [None]:
numpy.zeros(10)

In [None]:
numpy.zeros((3,3)) #matrix 3x3 of zeros

In [None]:
numpy.ones(10) #array de 10 elementos donde todos son 1

In [None]:
numpy.ones((3,3)) #matrix 3x3 of ones

O podemos emplear una lista de números para convertirlo en array:

In [None]:
numpy.array([0.1, 3, 250.5])

Incluso podemos convertir lista de listas de números en **matrices o array 2D**:

\begin{equation*}
    \begin{pmatrix}
        1 & 0.4 \\
        10 & 3
    \end{pmatrix} _{2\times 2}
\end{equation*}

In [None]:
npMatrix = numpy.array([[1,0.4],[10,3]]); #matriz 2x2
print(npMatrix)

O matrices diagonales:

\begin{equation*}
 \begin{pmatrix}
        0 & 0 & 0 \\
        0 & 1 & 0 \\
        0 & 0 & 2
    \end{pmatrix} _{3\times 3}
\end{equation*}

In [None]:
numpy.diag([0,1,3])

<div class="alert alert-block alert-info">

**Nota** : otras propiedades
    
Los array de NumPy también poseen una serie de atributos (propiedades) o métodos (funciones) que se puede revisar en cualquier objeto de python escribiendo el nombre del objeto seguido de ' . ' y luego al presionar la tecla de "tab" aparecerá una lista. A continuación unos ejemplos:
</div>


In [None]:
npMatrix.ndim

In [None]:
npMatrix.T #transpuesta de la matriz

Por ejemplo una matrix $3\times3$:
    
\begin{equation*}
\text{npMatrix_3x3} = 
    \begin{pmatrix}
        1 & 2 & 3 \\
        4 & 5 & 6 \\
        7 & 8 & 9
    \end{pmatrix} _{3\times 3}
\end{equation*}

In [None]:
npMatrix_3x3 = numpy.array([[1,2,3], [4,5,6], [7,8,9]])
npMatrix_3x3

Donde el elemento $ a_{(2,3)}=8 $

In [None]:
npMatrix_3x3[2,1]

<div class="alert alert-block alert-danger">

**Nota** : Notación de Python
    
Es importante recordar que en Python la notación de índices comienza en 0.
</div>


In [None]:
npMatrix_3x3[:,1] #columna nro 2

In [None]:
npMatrix_3x3[1,:] #fila nro 2

In [None]:
npMatrix_3x3[1:3, 1:3] #bloque de matrix derecha-inferior

En ocasiones puede ser útil convertir la matriz en un array unidimensional, esto se logra con el método `<array>.flatten()`

In [None]:
npMatrix_3x3.flatten()

Otras operaciones que se pueden hacer con array de NumPy es la de concatenar y apilar estos objetos en uno solo. Primero agamos una copy del array:

In [None]:
numpy.concatenate((npMatrix_3x3, npMatrix_3x3), axis=0)

<div class="alert alert-block alert-danger">

**Nota** : Copia y manejo de memoria
    
Python es un lenguaje que gestiona la memoria de manera automática, eliminando esta preocupación al usuario. Esto lleva a ciertas confusiones al momento de hacer una copia.
    
```python
npArray = numpy.array([1,0])
npArrayCopy = npArray
```
    
No es igual para Python que hacer un nuevo objeto usando:
    
```python
npArray = numpy.array([1,0])
npArrayCopy = npArray.copy()
```
Puesto que cualquier modificación en la copia también afecta al original.
</div>


In [None]:
numpy.shape(npMatrix_3x3); #muestra las dimensiones del array

In [None]:
npArray_EX = numpy.array([1,0]); #creacion del array
npArray_EXCopy = npArray_EX; #falsa copia

npArray_EXCopy[0]=0; #modificiacion

npArray_EX

<div class="alert alert-block alert-danger">

**Nota** : Array Vs. Listas
    
Las listas de Python no estan optimizadas para processar arrays muy grandes a menor nivel de máquina. Adicionalmente, es importante debido a que los array puede ser usados para **vectorizar** funciones que incrementa la velocidad de cálculo.
    

</div>

## Operaciones algebráicas con `Arrays`

Una de las aplicaciones más importantes de Numpy es su aplicación a cálculos de álgebra lineal e.g., operaciones básicas de matrices, producto con escalares, vectores, producto interno, traza etc. A continuación algunos de ellos: 

\begin{equation*}
\text{vector_1} = 
    \begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}
\end{equation*}

In [None]:
vector_1 = numpy.arange(0,3)
vector_1

**Producto por un escalar**

\begin{equation*}
\text{vector_1} = 
    2 \times\begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}=
    \begin{pmatrix}
        2\times 0  \\
        2\times1  \\
        2\times2 
    \end{pmatrix} _{3\times 1}= 
   \begin{pmatrix}
        0  \\
        2  \\
        4 
    \end{pmatrix} _{3\times 1}
\end{equation*}

In [None]:
vector_1*2

**Suma de un escalar a cada elemento o suma de un vector constante**

\begin{equation*}
\text{vector_1} + \vec{1}=
    \begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}+\begin{pmatrix}
        1  \\
        1  \\
        1 
    \end{pmatrix} _{3\times 1}= 
   \begin{pmatrix}
        1  \\
        2  \\
        3 
    \end{pmatrix} _{3\times 1}
\end{equation*}

In [None]:
vector_1+1

**Producto de elemento por elemento**
\begin{equation*}
\text{vector_1} \odot \vec{1}=
    \begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}\odot\begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}= 
   \begin{pmatrix}
        0  \\
        1  \\
        4 
    \end{pmatrix} _{3\times 1}
\end{equation*}

In [None]:
vector_1 * vector_1

In [None]:
numpy.multiply(vector_1, vector_1)

**Producto interno de dos vectores**
\begin{equation*}
\text{vector_1} \cdot \vec{1}=
    \begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}\cdot\begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}= 0 + 1 + 4 = 5
\end{equation*}

In [None]:
numpy.dot(vector_1,vector_1)

**Producto vectorial de dos vectores**
\begin{equation*}
\text{vector_1} \times \vec{1}=
    \begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}\times\begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1}=\begin{pmatrix}
        0  \\
        0  \\
        0 
    \end{pmatrix} _{3\times 1}
\end{equation*}

In [None]:
numpy.cross(vector_1,vector_1)

**Producto matricial de matriz con vector**
\begin{equation*}
\text{npMatrix_3x3} \cdot \text{vector_1} =\begin{pmatrix}
        1 & 2 & 3 \\
        4 & 5 & 6 \\
        7 & 8 & 9
    \end{pmatrix} _{3\times 3} \cdot \begin{pmatrix}
        0  \\
        1  \\
        2 
    \end{pmatrix} _{3\times 1} =\begin{pmatrix}
        8  \\
        17  \\
        26 
    \end{pmatrix} _{3\times 1}
\end{equation*}


In [None]:
npMatrix_3x3@vector_1

En NumPy también existen las matrices como objetos a los cuales puedes realizarse cierto tipo de operaciones predefinidas:

**Producto exterior de dos vectores**

In [None]:
vector_3x1 = numpy.matrix([[1],[3],[2]])
vector_1x3 = numpy.matrix([1,2,3])
vector_3x1@vector_1x3


In [None]:
npMatrix = numpy.matrix([[-0.1j, 2.j], [-2.8j, -5.j]]).T; #matriz con entradas complejas
npMatrix

In [None]:
npMatrix[0,1] #elemento (0,1)

<div class="alert alert-block alert-info">

**Nota** : complejos en Python
    
En python los números complejos se denotan por un coeficiente acompañado por la letra "j". Por ejemplo:
    

$3i =$`3j`
    
</div>


\begin{equation}\begin{pmatrix}
        1i & 2.8i \\
        -2i & +5i
\end{pmatrix}_{3\times 3} \end{equation}

In [None]:
numpy.conjugate(npMatrix) #calcula la conjugada

In [None]:
npMatrix.H #calcula la transpuesta conjugada

In [None]:
numpy.trace(npMatrix) #traza de la matriz

In [None]:
numpy.real(npMatrix) #parte real de la matriz

In [None]:
numpy.imag(npMatrix) #parte imaginaria de la matriz

In [None]:
numpy.linalg.inv(npMatrix) #calcula la inversa. 

In [None]:
numpy.linalg.det(npMatrix) #calcula el determinante

Otra función que tiene NumPy es la posibilidad de generar **array de números aleatorios**.

In [None]:
npRandom = numpy.random.rand(3,3)
npRandom

In [None]:
npRandom.max() #el calculo del maximo es de la matriz, pero puede especificarse para una columna o fila usando el argumento 'axis'

In [None]:
npRandom.min() #el calculo del minimo es de la matriz, pero puede especificarse para una columna o fila usando el argumento 'axis'

<div class="alert alert-block alert-info">

**Nota** : Métodos internos de comandos de librerías
    
Este cálculo de la inversa tiene condiciones sobre la matriz a invertir pues usan metodos que traen ciertas restricciones.
    
https://stackoverflow.com/questions/31188979/is-numpy-linalg-inv-giving-the-correct-matrix-inverse-edit-why-does-inv-gi
    
También es posible desarrollar tus propios métodos para realizar la misma tarea. ¡Inténtalo! 
</div>


## Funciones matemáticas con NumPy

NumPy es un paquete muy completo que incluye funciones matemáticas predefinidas que en general, su sintaxis solo requiere como argumentos los mismos requeridos por su definición en cálculo además del dominio de la función. Una ventaja de estas funciones es que estan implementadas en lenguajes de más bajo nivel, haciendolas muy eficientes y rápidas a nivel tiempo de procesamiento al ser vectorizadas.

**Funciones trigonométricas** e.g., seno, coseno, arcoseno... 

In [None]:
x_domain = numpy.linspace(-1, 1, 25)

numpy.arcsin(x_domain)

**¡También podemos usar parámetros físicos!**

In [None]:
freq = 10;
amp = 2;
ph = numpy.pi/2

x_domain = numpy.linspace(0, 10, 25)

amp*numpy.sin(freq*x_domain + ph)

<div class="alert alert-block alert-info">

**Nota** : ¿Radianes o grados?
    
Las funciones trigonométricas de NumPy estan originalmente escritas para calcular el valor de la función pero siempre puede ser reconvertida a grados usando `numpy.degrees()` en el argumento de la función.
    
</div>


In [None]:
x_domain = numpy.linspace(0, 30, 30)

numpy.sqrt(x_domain)

In [None]:
x_domain = numpy.linspace(0, 15, 15)

numpy.exp(x_domain)

Incluso podemos hacer nuestras propias funciones matemáticas con ayuda de Python y NumPy:

En este caso haremos la función de un oscilador amortiguado:

\begin{equation}
f(t) = A e^{-\gamma t}\cos{(\omega t + \phi)}
\end{equation}

In [None]:
def OsciAmortiguada(domain, amp, freq, ph, decay):
    return numpy.exp(-1*decay*domain)*amp*numpy.cos(freq*domain + ph)

In [None]:
x_domain = numpy.linspace(0, 10, 10); #time domain
amp = 3; #amplitude
freq = 10; #frequency
ph = numpy.pi/4; #phase
decay = 0.2; #decay rate

OsciAmortiguada(x_domain, amp, freq, ph, decay)

## Manejo de datos e importe de datos

Los arreglos y matrices podemos almacenarlos utilizando el formato nativo de numpy haciendo utilizando `save()`. De hecho, puede ser utilizado para guardar cualquier tipo de objeto de Python.

In [None]:
numpy.save("npRandom.npy", npRandom)

Y accedemos a la información mediante el comando `numpy.load()`

In [None]:
numpy.load("npRandom.npy")

O también podemos almacenarlo en un archivo con formato `.csv`. También se puede usar otros formatos como `.txt`

In [None]:
numpy.savetxt("npRandom.csv", npRandom) # fmt='%.5f' como argunmento extra especificaria el formato

Y accedemos a la información mediante el comando `numpy.genfromtxt()`

In [None]:
numpy.genfromtxt('npRandom.csv')

---

# Matplotlib <a class="anchor" id="Matplotlib"></a>

<p align="center">
<img src='https://matplotlib.org/_static/logo2_compressed.svg' width="700" />
    
Documentación:[https://matplotlib.org/](https://matplotlib.org/)

</p>


`Matplotlib` es una herramienta muy importante en el uso de Python. Este paquete nos da todas las herramientas para trabajar, desarrollar e implementar visualización de datos, arrays, matrices, y funciones generados por Python y otros paquetes como NumPy.

Lo primero que vamos hacer para generar un gráfico embebido en una ventana, o lo que denotaremos como **plot** es importar la librería de Matplotlib

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline
#%matplotlib notebook

In [None]:
plt.figure();


<div class="alert alert-block alert-info">

**Nota** : Graficando en Notebooks
    
Graficar en Notebooks de Python (i.e., Jupyter Notebooks, Colab) es diferente a cuando se utilizan scripts de Python i.e., `<archivo>.py` pues en los notebooks los plots quedan generados en el notebooks y no en ventanas de la terminal o del IDLE que se utilice. 
    
Por ello en los notebooks debe utilizarse:
    
    %matplotlib inline
    
Mientras que en los scripts debe utilizarse al final de los comando de graficación, el comando de `show()`, como por ejemplo:
    
    
```python
plt.figure()
plt.plot(x, y)
plt.show()
```
    
</div>


## Tipos de plots

In [None]:
#creando la funcion que queremos mostrar
x = numpy.linspace(0,100,300)
f_x = numpy.sin(x)

In [None]:
plt.plot(x, f_x) #graficando la funcion 

También existen otros tipos de plots:

In [None]:
plt.scatter(x, f_x)

In [None]:
plt.fill(x, f_x)

<div class="alert alert-block alert-danger">

**Nota** : Cuidar la consistencia del gráfico
    
Es de suma importancia que la cantidad de puntos del dominio sea la misma cantidad de puntos en los que la función sea evaluada, o de manera más general es importante que ambos array de entradas tengan la misma cantidad de elementos.
    
</div>


También es possible sobre poner otros gráficos en el mismo plot además de poder ajustar algunos de las propiedades de los mismos:

In [None]:
plt.figure() #inicializa una nueva figura

plt.plot(x, numpy.sin(x), color='orange', alpha=0.8, label='sin(x)')
plt.plot(x, OsciAmortiguada(x, amp=1, freq=1, ph=0, decay=0.02), color='blue', alpha=0.5, label='Damp. Osc.')

plt.legend() #muestra la leyenda

plt.xlim(0,100); #ubica los limites a mostrar en el eje X
plt.ylim(-1,1); #ubica los limites a mostrar en el eje Y

plt.xlabel(r'Time [$\mu s$]');#titulo del eje X
plt.ylabel('Signal'); #titulo del eje Y

plt.title('My first plot'); #titulo del plot

In [None]:
plt.figure() #inicializa una nueva figura

plt.scatter(x, OsciAmortiguada(x, amp=1, freq=1, ph=0, decay=0.02), color='orange', alpha=0.5, label='Damp. Osc.')
plt.plot(x, OsciAmortiguada(x, amp=1, freq=1, ph=0, decay=0.02), color='blue', alpha=0.5, label='Damp. Osc.')

plt.legend() #muestra la leyenda

plt.xlim(0,100); #ubica los limites a mostrar en el eje X
plt.ylim(-1,1); #ubica los limites a mostrar en el eje Y

plt.xlabel(r'Time [$\mu s$]'); #titulo del eje X
plt.ylabel('Signal'); #titulo del eje Y


## Histogramas

Un tipo de plot que es de gran utilidad para el manejo de datos en Python, son los **histogramas**. Dada una secuencia de datos, este comando de Matplotlib lo que hace es hacer una acumulación de eventos para valor posible en los datos.

In [None]:
numpy.random.seed(19680801)
multirandData = numpy.random.randn(3, 100) #inicializa dos array como secuencias aleatorias de 100 eventos con valores entre 0 y 1

In [None]:
for i in range(len(multirandData)):
    plt.hist(multirandData[i], alpha=0.15, label='Array #'+str(i+1))
plt.legend()

#¡Escribe esto en una linea!

Matplotlib también puede generar un histograma de los eventos acumulados como se muestra continuación:

In [None]:
for i in range(len(multirandData)):
    plt.hist(multirandData[i], alpha=0.15, label='Array #'+str(i+1), cumulative=True)
plt.legend()

## Subplots

<div class="alert alert-block alert-info">

**Nota** : Plots múltiples
    
Matplotlib tiene la propiedad de realizar varios plots embebidos en la misma venta pero mostrados en diferentes ejes, a lo que se le conoce como `subplots`. La manera estándar de generar un subplot es de la siguiente manera:

```python
fig, axs = plt.subplots(2, 2, figsize=(5, 5)) #arreglo de 2 por 2 subplots
    
axs[0, 0].hist(randData[0]) #histograma de los datos
axs[1, 0].scatter(randData[0], randData[1]) #valores del 1er array vs 2do array (plot)
axs[0, 1].plot(randData[0], randData[1]) #valores del 1er array vs 2do array (scatter)
axs[1, 1].hist2d(randData[0], randData[1]) #histograma en 2D
```
Donde luego de inicializar la figura de subplots, se coloca el eje ```axs[i, j].<tipo de plot>(argumentos)```
    
</div>


In [None]:
numpy.random.seed(19680801)
randData = numpy.random.randn(2, 100) #inicializa dos array como secuencias aleatorias de 100 eventos con valores entre 0 y 1

In [None]:
fig, axs = plt.subplots(2, 2, figsize=(6, 6))
axs[0, 0].hist(randData[0])
axs[0, 0].set_xlabel('values', fontsize=14)

axs[1, 0].scatter(randData[0], randData[1])
axs[1, 0].set_xlabel('values', fontsize=14)

axs[0, 1].plot(randData[0], randData[1])
axs[0, 1].set_xlabel('values', fontsize=14)

axs[1, 1].hist2d(randData[0], randData[1])
axs[1, 1].set_xlabel('values', fontsize=14)


fig.suptitle('Subplots');

Pero Python, Matplotlib y muchos otros paquetes son usados para el análisis de imágenes (i.e., matrices), para ello Matplotlib usa el comando `plt.imshow()`

In [None]:
plt.figure(figsize=(12,7))
plt.imshow(numpy.random.rand(11,11)) #mostrando una matriz aleatoria

También es possible hacer **plots en 3D**, para ello hay un ejemplo en la documentación de Matplotlib, así como también para otros aspectos: https://matplotlib.org/stable/gallery/mplot3d/surface3d.html

In [None]:
fig = plt.figure(figsize=(9,6))

axes1 = fig.add_axes([0.1, 0.1, 0.7, 0.78]); #eje mayor axes
axes2 = fig.add_axes([0.2, 0.5, 0.2, 0.3]); #eje menor axes

#plot mayor
axes1.plot(numpy.linspace(-numpy.pi, numpy.pi, 20), numpy.sin(numpy.linspace(-numpy.pi, numpy.pi, 20)), 'r', ls='--', label=r'$\sin(x)$');
axes1.set_xlabel('x');
axes1.set_ylabel('y');
axes1.set_title('title');
axes1.grid(color='purple', alpha=0.4, linestyle='dashed', linewidth=0.9); #añade grid al plot
axes1.text(0.2, 0.01, r"$y=\sin(x)$", fontsize=20, color="red"); #añade texto al plot

#plot menor
axes2.plot(numpy.cos(numpy.linspace(-numpy.pi, numpy.pi, 20)), numpy.sin(numpy.linspace(-numpy.pi, numpy.pi, 20)), 'g', label=r'$(\cos(x),\sin(x))$');
axes2.set_xlabel('y');
axes2.set_ylabel('x');
axes2.set_title('mini title');
axes2.grid();
fig.legend(loc=7); #7='center right'

## Guardando los plots

Es muy importante guardar tus resultados en un formato que luego pueda ser utilizado bien sea en presentaciones, artículos o simplemente documentación. Es importante comprender que Matplotlib puede guardar 1 sola figura por archivo, es decir que muchas figuras no pueden ser almacenadas en un mismo archivo imagen (e.g., `.png`, `.jpeg`, `.svg`, `.eps`); sin embargo, es posible almacenar varias figuras en un solo archivo `.pdf` usando funciones especiales de Matplotlib.

In [None]:
filename = "test.svg"
fig.savefig(filename)

<div class="alert alert-block alert-info">

**Nota** : Revisa
    
Luego de ejecutar la última celda, un nuevo archivo con nombre `test.svg` debió ser creado. Es también posible cambiar la extensión del archivo a otro formato de los mencionados anteriormente, dependiendo del uso.
    
</div>


---

# SciPy <a class="anchor" id="SciPy"></a>

<p align="center">
<img src='https://www.scipy.org/_static/logo.png' width="400" />
    
Documentación:[https://docs.scipy.org/doc/scipy/reference/](https://docs.scipy.org/doc/scipy/reference/)
    
</p>


`Scipy` es un modulo de Python basado en gran parte en el módulo de NumPy que ya hemos revisado. Este módulo, sin embargo, ofrece una serie de herramientas matemáticas más complejas y avanzadas predefinidas y optimizadas.

In [None]:
import scipy as scp

## Sub-módulo de álgebra

In [None]:
from scipy.linalg import *

### Sistema de ecuaciones lineales

Resolver un sistema de ecuaciones lineales es resolver el sistema:
    
$$ \mathbf{A}x = \mathbf{b} $$

In [None]:
A = numpy.array([[1,2,3], [4,5,6], [7,8,9]] );
b = numpy.array([1,2,3]);

In [None]:
x = solve(A, b)
x

In [None]:
numpy.dot(A, x) - b


### Autovalores y autovectores

En física y muchas otras áreas, los problemas pueden ser resueltos a partir del cálculo de autovalores y autovectores. SciPy nos facilita un comando para calcular ambos simultáneamente:

In [None]:
rMatrix = numpy.random.rand(3,3)
evals, evecs = eig(rMatrix); #calcula autovalores y autovalores de matriz Real


In [None]:
evals

In [None]:
evecs

Igualmente existe un commando para las matrices que Hermíticas:

In [None]:
hMatrix = (numpy.random.random(4) + numpy.random.random(4) * 1j).reshape((2,2)); #matriz Hermitica
eigh(hMatrix) #calcula autovalores y autovectores de matriz Hermitica

### Operaciones matriciales con SciPy

Igualmente que como vimos con el paquete de Python, es possible realizar una serie de operaciones algebráicas con matrices:

In [None]:
inv(rMatrix) #calcula la matriz inversa

In [None]:
det(rMatrix) #calcula el determinante

<div class="alert alert-block alert-danger">

**Nota** : Comandos repetidos
    
Es común que uno o más paquetes de Python compartan el mismo nombre de un comando, más aún si uno de ellos es escrito alrededor del otro. Por ello hay que tener cuidado con los argumentos que deben ser introducidos en la sintaxis puesto que esto no necesariamente es igual. Por ejemplo:
    
    
```python
import numpy as np

    def sin(t, amp, freq, phase):
        return amp*np.sin(freq*t + phase)
```
    
En este ejemplo, la función de NumPy funciona distinto: `np.sin(x)` a la función que recién creamos `sin(x, amp, freq, phase)` puesto que la primera necesita 1 argumento de entrada mientras que la segunda utiliza 4 argumentos de entrada.

    
</div>


### Vista rápida de matrices dispersas

Las **matrices dispersas** (*sparse matrices* en inglés, https://en.wikipedia.org/wiki/Sparse_matrix) son aquellas en las cuales la mayoría de los elementos son nulos, y por ende a nivel computacional es más eficiente almacena solo aquellos elementos no-nulos. Esto puede ser muy poco intuitivo pero aumenta la velocidad de cálculo de algunos motores de solucionadores de ecuaciones que utilizan multiplicación de matrices. En SciPy hay un módulo dedicado a esta tarea.

In [None]:
from scipy.sparse import *

In [None]:
M = numpy.array([[1,0,0,0,0,0], 
                 [0,3,0,0,0,1], 
                 [0,1,0,1,0,0], 
                 [1,0,0,1,1,0], 
                 [1,3,0,0,3,1], 
                 [0,3,3,0,0,1]]);
M

In [None]:
sparseM = csr_matrix(M);
sparseM

<div class="alert alert-block alert-info">

**Nota** : Formatos de matrices dispersas
    
Existen varios formatos para almacenar matrices dispersas que estan altamente optimizados y que presentan ciertas ventajas y desventajas al momento de guardar y acceder a los elementos de la matriz.
    
</div>


In [None]:
sparseM.todense() #para visualizar la matriz completa

In [None]:
sparseM.multiply(sparseM).todense() #producto elemento a elemento

In [None]:
(sparseM * sparseM).todense() #producto interno de matrices 

In [None]:
sparseM.dot(sparseM).todense() #producto interno de matrices

In [None]:
v = numpy.array([1,2,3,4,5,6])[:,numpy.newaxis]; #anadiendo indices a un vector

In [None]:
numpy.shape(v) #verificando las dimensiones

In [None]:
sparseM * v #producto de matriz dispersa con vector

In [None]:
sparseM.todense() * v #producto de matriz completa con vector (revision del mismo resultado)

## Sub-módulos de cálculo

### Funciones especiales

In [None]:
from scipy.special import jn, yn, jn_zeros, yn_zeros, lpmv, sph_harm, gamma, sinc, eval_laguerre

**Funciones de Bessel**

\begin{equation}
J_{\alpha }(x)=\sum _{m=0}^{\infty }{\frac {(-1)^{m}}{m!\Gamma (m+\alpha +1)}}{\left({\frac {x}{2}}\right)}^{2m+\alpha }
\end{equation}

In [None]:
n = 0    #orden

x = 0.0
#funcion de Bessel del primer tipo
print("J_%d(%f) = %f" % (n, x, jn(n, x)))

x = 1.0
#funcion de Bessel del segundo tipo
print("Y_%d(%f) = %f" % (n, x, yn(n, x)))

In [None]:
x = numpy.linspace(0, 10, 100)

fig, ax = plt.subplots()
for n in range(4):
    ax.plot(x, jn(n, x), label=r"$J_%d(x)$" % n)
ax.legend();

In [None]:
#los primero 4 raíces(ceros) de la funcion de Bessel de orden 0
n = 0; 
m = 4; 
jn_zeros(n, m)

**Función ```Sinc(x)```**

\begin{equation}
\operatorname {sinc} (x)={\frac {\sin (x)}{x}}
\end{equation}

In [None]:
x = numpy.linspace(-10, 10, 200)
plt.plot(x, sinc(x))

**Función Gamma**

\begin{equation}
\Gamma (z)=\int _{0}^{\infty }x^{z-1}e^{-x}\,dx
\end{equation}

In [None]:
x = numpy.linspace(-3.5, 5.5, 2251)
plt.plot(x, gamma(x))
plt.ylim(-10, 25)

**Funciones de Leguerre**

Las cuales estan generadas por esta fórmula de recursión de Rodrígues:

\begin{equation}
L_{n}(x)={\frac {e^{x}}{n!}}{\frac {d^{n}}{dx^{n}}}\left(e^{-x}x^{n}\right)={\frac {1}{n!}}\left({\frac {d}{dx}}-1\right)^{n}x^{n}
\end{equation}

In [None]:
mlst = numpy.arange(0,5); #degree

fig, ax = plt.subplots()
for i in range(len(mlst)):
    x=numpy.linspace(-2,10, 3000)
    ax.plot(x, eval_laguerre(mlst[i],  x), label=r'$\mathcal{L}$'+str(i))
ax.legend();

**Funciones de Legendre**
Estas también pueden ser generadas por otra fórmula de recursión de Rodrígues:

\begin{equation}
P_{n}(x)={\frac {1}{2^{n}n!}}{\frac {d^{n}}{dx^{n}}}(x^{2}-1)^{n}
\end{equation}

In [None]:
m = 1; #orden
vlst = numpy.arange(0,5);

fig, ax = plt.subplots()
for i in range(len(vlst)):
    x=numpy.linspace(-100,100, 3000)
    ax.plot(x, lpmv(m, vlst[i], x), label=r'$\mathcal{L}$'+str(i))
ax.legend();

**Funciones de los Armónicos Esféricos**

Estas funciones resultan del producto de una exponencial compleja y su respectivo polinomio de Legendre $P_{\ell }^{m}(\cos {\theta }$:

\begin{equation}
Y_{\ell }^{m}(\theta ,\varphi )=Ne^{im\varphi }P_{\ell }^{m}(\cos {\theta })
\end{equation}

In [None]:
from matplotlib import cm, colors

l = 4;   #grado del armonico
m = 2;   #orden
phi, theta = numpy.mgrid[0:2*numpy.pi:200j, 0:numpy.pi:100j] #array de variables angulares
# R = numpy.abs(sph_harm(m, l, phi, theta)) #array de valores absolutos de Ymn
R = (sph_harm(m, l, phi, theta)).real #array de valores absolutos de Ymn

#A continuación convertimos a coordenadas cartesianas
# para su representación 3D
X = R * numpy.sin(theta) * numpy.cos(phi)
Y = R * numpy.sin(theta) * numpy.sin(phi)
Z = R * numpy.cos(theta)

In [None]:

N = R/R.max()    #normalizacion de R para que ajustar el rango del colormap.

fig, ax = plt.subplots(subplot_kw=dict(projection='3d'), figsize=(12,10))

im = ax.plot_surface(X, Y, Z, rstride=1, cstride=1, facecolors=cm.ocean(N), alpha=0.3)

ax.set_title(r'$|\mathcal{Y}^2_ 4|$', fontsize=20)
m = cm.ScalarMappable(cmap=cm.ocean)
m.set_array(R)    #asigna el mappable al array de datos sin normalizar

fig.colorbar(m, shrink=0.8);

### Integración

La operación de integración en SciPy recibe el nombre de cuadratura numérica denotado por `quad()`, de igual manera la generalización a 2, 3 o más integrales estan denotadas en SciPy como: `dblquad()`, `tplquad()` y `nquad()`. Lo primero que se debe hacer para poder utilizar esta herramienta es importar los comandos directamente.

In [None]:
from scipy.integrate import quad, dblquad, tplquad, nquad

Para el caso de **una integral** definida:

$$ \int_{a}^{b}f(x) dx $$

In [None]:
def f1v(x):
    return x**2 #funcion de Python que regresa el valor de la funcion evaluada en x. Aqui va la funcion a integrar

a = 0; #limite inferior
b = 1; #limite superior

intVal, asbERR = quad(f1v, a, b); #calculo de la integral

print ("Integral value: {0:.5f} \nAbsolute error: {1:.5E}".format(intVal,asbERR)) 

<div class="alert alert-block alert-info">

**Nota** : Función Lambda de Python
    
Recordemos que podemos hacer una función corta comprendida en una sola expresión de Python, usando la función lambda. Que funciona de la siguiente manera:    
    
<p align="center">
<img src='https://drive.google.com/uc?export=view&id=1OSoFreNH0XCpVvWikY4vUFYq-N9hmylm' width="700" align="center" />
</p>
Esta en general puede estar acompañada de la función `map()` que difunde los valores de entradas a la función lambda. Por ejemplo:

```python
numbers = [1,2,3]
result = map(lambda x: x**2, numbers)
>> 1, 4, 6
```
</div>


Para el caso de **dos integrales** definidas:

$$\int_{c}^{d}\!\! \int_{a}^{b}\!\! f(x,y)\, dx dy $$

In [None]:
def f2v(x, y):
    return numpy.exp(-x**2-y**2)

a = 0; #limite inferior
b = 10; #limite superior
c = 0; #limite inferior
d = 10; #limite superior

intDVal, asbERRD = dblquad(f2v, a, b, lambda x : c, lambda x: d); #calculando la integral doble

print ("Integral value: {0:.5f} \nAbsolute error: {1:.5E}".format(intDVal,asbERRD)) 

Para el caso de **tres integrales** definidas:

$$\int_{e}^{f}\!\! \int_{c}^{d}\!\! \int_{a}^{b}\!\! f(x,y,z)\, dx dy dz$$

In [None]:
def f3v(x, y, z):
    return numpy.exp(-x**2-y**2)

a = 0; #limite inferior
b = 10; #limite superior
c = 0; #limite inferior
d = 10; #limite superior
e = 0; #limite inferior
f = 10; #limite superior

intTVal, asbERRT = tplquad(f3v, a, b, lambda x : c, lambda x: d, lambda x,y: e, lambda x,y: f); #calculando la integral triple

print ("Integral value: {0:.5f} \nAbsolute error: {1:.5E}".format(intTVal,asbERRT)) 

### Ecuaciones differenciales

En física es común encontrarse con problemas que pueden ser descritos por funciones que se obtienen de resolver ecuaciones que establecen la tasa de cambio de dicha función respecto a uno más parámetros. El ejemplo, más general que se puede pensar es el de las ecuaciones de movimiento de un sistema dinámico. Esto es, que la tasa de cambio de una función $y(t)$ o en otras palabras $y'(t)$ es una función $f(y,t)$ y al resolver la ecuación diferencial ordinaria (EDO o ODE en inglés):

$$y'(t) = f(y,t)$$

encontramos la función $y(t)$ que describe la dinámica. Veamos un ejemplo aunque primero debemos importar las funciones de SciPy `odeint()` que vamos utilizar.

In [None]:
from scipy.integrate import odeint, ode

Para utilizar este comando lo importante es:

    - Definir la función $f(y,t)$ o lado derecho de la EDO
    - Condiciones iniciales del sistema $y(0)$
    - Dominio del tiempo
    - Parámetros de la EDO

Ejemplo de oscilador harmónico amortiguado

La ecuación de movimiento es:

$$ \frac{\text{d}^{2}x}{\text{d}t^{2}} + 2\zeta \omega_o \frac{\text{d}x}{\text{d}t} +2 \omega^{2}_o x = 0 $$

En el cual $x$ es la variable de la función, $\omega_o$ es la frecuencia natural o de resonancia y $\zeta$ es la tasa de amortiguación. Esta ecuación puede ser re-escrita de forma que la EDO de 2do orden se convierta en un sistema de EDO de 1er orden. Esto implica también que requerimos 2 valores iniciales: uno para la derivada y otro para la función $x_o = [x(0), x'(0)]$

\begin{equation}
    \begin{cases}
      \frac{\text{d}p}{\text{d}t} = -2\zeta\omega_o p - \omega^2_ox\\
      \frac{\text{d}x}{\text{d}t} = p
    \end{cases}\,.
\end{equation}

In [None]:
#definimos el lado derecho de las ecuaciones del sistema
def dy(y, t, zeta, w0):
    x, p = y[0], y[1]
    
    dx = p
    dp = -2 * zeta * w0 * p - w0**2 * x

    return [dx, dp]

y0 = [1.0, 0.0]; #condiciones iniciales
t = numpy.linspace(0, 10, 1000); #dominio del tiempo
w0 = 2*numpy.pi*1.0; #frecuencia natural o de resonancia del sistema

In [None]:
y = odeint(dy, y0, t, args=(0.07, w0)); #resolviendo el sistema de EDO

fig, ax = plt.subplots()
ax.plot(t, y[:,0], 'b', label=r"y(t)", linewidth=0.25)
ax.plot(t, numpy.cos(w0*t), 'k', label=r"Reference frequency", linewidth=0.25, alpha=0.3)
ax.legend(loc=1);

<div class="alert alert-block alert-info">

**Nota** : Construye tu propio solucionador de EDO
    
Para ejemplos de como aplicar tu solucionador de Ecuaciones Diferenciales, puedes revisar este cuaderno que contiene ejemplo detallados de los métodos para resolver EDO. 
    
<br>
Repositorio de GitHub de: M.Caicedo
    
https://github.com/mario-i-caicedo-ai/Ondas-y-Optica/blob/d6bed82f460856edb11b15ac071238f53e73d71a/cuadernos/Sol_Num_de_EDO.ipynb
    
</div>
 

### Transformada de Fourier

In [None]:
from scipy.fft import fft, ifft, fftfreq

In [None]:
signal = y[:,0]#*numpy.sin(numpy.random.rand(1000)*3*t)

fourier = fft(signal)
n = signal.size
timestep = t[1]-t[0]
freq = fftfreq(n, d=timestep)

# plt.plot(freq, abs(fourier))
# plt.xlim(0,5);

plt.plot(freq[numpy.where(freq > 0)], abs(fourier[numpy.where(freq > 0)]))


<div class="alert alert-block alert-info">

**Nota** : También en NumPy!
    
Como mencionamos anteriormente, SciPy esta escrito alrededor de NumPy por ende utiliza array para realizar los cálculos. En ocasiones es tan parecido que es difícil determinar las diferencias. En el ejemplo anterior ubiese sido equivalente si en lugar de importar las funciones desde SciPy, las hubiesemos importado desde NumPy:
    
```python
from numpy.fft import fft, fftfreq
```
</div>
 

Adicionalmente en SciPy existe una serie de transformaciones matemáticas ya implementadas, para más información revisar: https://docs.scipy.org/doc/scipy/reference/tutorial/fft.html

## Sub-módulo de procesamiento de señales

In [None]:
from scipy import signal


Una herramienta importante en el análisis de señales es la generación de arrays que describan un tipo de onda, que bien puede tiener una expresión matemática definida (fórmula) en el caso de las formas de ondas o no en el caso de los Splines

**Forma de ondas**

In [None]:
t = numpy.linspace(-1, 1, 500, endpoint=False); #dominio del tiempo

#algunas senales que se pueden general en SciPy

SineSignal = numpy.sin(2 * numpy.pi * t); #senal generica de un seno(2pi*t), frecuencia=1osc por unidad de tiempo

DiracDeltaSignal = signal.unit_impulse(500, 250); #Delta de Dirac centrada en 0
SquareSignal = signal.square(2 * numpy.pi * 6 * t); #senal cuadrada periodica
SawtoothSignal = signal.sawtooth(2 * numpy.pi * 5 * t); #senal diente de sierra
quadrature, GaussPulseSignal = signal.gausspulse(numpy.linspace(-1,1,500), fc=5, retenv=True); #senal de pulso gaussiano
ChirpSignal = signal.chirp(t, f0=1, f1=180, t1=5, method='linear'); #senal de frecuencia modulada pulsada
MorletSignal = signal.morlet(len(t)); #senal de paquete de ondas de Morlet

Signals = [DiracDeltaSignal, SquareSignal, SawtoothSignal, GaussPulseSignal, ChirpSignal, MorletSignal]; #lista de senales


In [None]:
#Graficando
fig, ax = plt.subplots(nrows=2, ncols=3,figsize=(15,8))
i=0;
for row in ax:
    for col in row:
        
        col.plot(numpy.linspace(-1,1, len(Signals[i])), Signals[i])
        i+=1;

**Splines**

Los splines no solo sirven para hacer trazados suaves de formas de ondas de las cuales se conocen algunos valores, sino también para suavizar señales ruidosas como un primer filtro que se puede emplear, en lugar de usar comandos especializados para el filtraje de señales como se verá en las próximas secciones.

In [None]:
t = numpy.linspace(0, 1, 11); #dominio de la forma de onda
amp_vals = numpy.array([0.0,0.1,0.4,0.9,0.99,1.0,0.99,0.9,0.4,0.1,0.0]); #valores de la amplitud

points = numpy.stack((t,amp_vals),axis=1); #valores en pares del dominio y amplitud

spline  =  scp.interpolate.CubicSpline(points[:,0], points[:,1],extrapolate=True); #interpolacion de los puntos

#graficacion
plt.plot(t, spline(t), label="interpolation");
plt.plot(points[:,0], points[:,1], 'o', label="points");


In [None]:
rng = numpy.random.default_rng(); #numeros aleatorios para la adicion de ruido
sig = numpy.repeat([0., 1., 0.], 100); #generacion de pulso cuadrado
t = numpy.linspace(0, len(sig)); #dominio de la forma de onda

sig += rng.standard_normal(len(sig))*0.05;  #adicion de ruido a la senal

filtered = signal.cspline1d_eval(signal.cspline1d(sig), t); #interpolacion y evaluacion

#graficacion
plt.plot(sig, label="signal")
plt.plot(t, filtered, label="filtered")

**Búsquedad de picos**

La busquedad de picos puede es un herramienta importante para determinar puntos críticos de un set de datos. Imaginemos que tenemos un set 2D de datos y queremos encontrar el pico a lo largo de un corte de dicho set.

In [None]:
#funcion para generar datos
def f(x, y):
    return (1 - 9*x / 2 + x ** 5 + y ** 3) * numpy.exp(-x ** 2 -y ** 2)

#funcion para generar ruido
def fNoisy(x, y):
    return (x*numpy.random.random() + y*numpy.random.random())


# Make the X, Y meshgrid instead of np.tile
xs = numpy.linspace(-2*numpy.pi, 2*numpy.pi, 200); #generacion de array para eje x
ys = numpy.linspace(-2*numpy.pi, 2*numpy.pi, 200); #generacion de array para eje y
X,Y = numpy.meshgrid(xs, ys); #grid

data2D = f(X,Y); #datos sin ruido
data2DNoisy = 1*numpy.random.rand(200,200);  #datos con ruido

data1D = (data2DNoisy+data2D)[100,:]; #corte en los datos para hacer analisis


fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(10,4))

ax[0].imshow(data2DNoisy+data2D)
ax[0].hlines(100, 0, 200, colors='white')
ax[0].set_xlim(0,200)
ax[1].plot(data1D)

In [None]:
peaks, properties = signal.find_peaks(data1D, prominence=(1, 4), width=1); #encuentra los picos dentro del set de datos

plt.plot(data1D)
plt.plot(peaks, data1D[peaks], "x", color='red')

print(properties["prominences"], properties["widths"])

plt.vlines(x=peaks, ymin=data1D[peaks] - properties["prominences"],
           ymax = data1D[peaks], color = "C1")
plt.hlines(y=properties["width_heights"], xmin=properties["left_ips"],
           xmax=properties["right_ips"], color = "C1")

**Convolución**

Las convoluciones son útiles para el cálculo de respuestas de dispositivos, estimación de correlaciones y análisis de sistemas usando matrices de transferencia. La señal o función resulante $g(t)$ vienen dadas por la expresión:

$$g(t) = \int_{a}^{b} f(t-\tau) \kappa(\tau) d\tau$$

donde $f(t)$ es la función que de entrada y $\kappa(\tau)$ es lo que se conoce como el kernel de la convolución que por ejemplo contiene la función que contiene la información del comportamiento de respuesta. 

<p align="center">
<img src='https://upload.wikimedia.org/wikipedia/commons/6/6a/Convolution_of_box_signal_with_itself2.gif' width="500" />
</p>


In [None]:
plt.plot(signal.convolve(sig, MorletSignal))

**Filtros**

Hay una infinidad de funciones o comando de filtros con distintas ventajas y desventajas en las que se consideran distintos métodos para tratar los valores extremos de la señal que se va a filtrar. Algunos de ellos introducen un desfase en la señal filtrada pero otros realizan un filtraje a 2 órdenes que permite eliminar este efecto. Escoger el filtro correcto depende de la aplicación y la naturaleza de los datos. La documentación de SciPy tiene varios ejemplos de utilidad. En esta sección solo tomamos en cuenta algunos de los filtros disponibles: `butter()`, `filtfilt()` y `lfilter()`. Del mismo modo se pueden construir filtros manualmente con análisis de Fourier.

In [None]:
sos = signal.butter(1, 4, 'lp', fs=200, output='sos'); #crea filtro paso bajo con frecuencias entre 1 y 4
filtered = signal.sosfilt(sos, data1D); #filtraje de la senal usando el filtro paso bajo empleando cascada de secciones de segundo orden

#graficando
fig, (ax1, ax2) = plt.subplots(2, 1, sharex=True)

ax1.plot(numpy.linspace(0,1,200), data1D)
ax1.set_title('10 Hz and 20 Hz sinusoids')

ax2.plot(numpy.linspace(0,1,200), filtered)
ax2.set_title('After 15 Hz high-pass filter')


plt.tight_layout()


In [None]:
b, a = signal.butter(3, 0.05); #filtro Butterworth

zi = signal.lfilter_zi(b, a); #
z, _ = signal.lfilter(b, a, data1D, zi=zi*data1D[0]); #senal filtrada por 
z2, _ = signal.lfilter(b, a, z, zi=zi*z[0]); #
y = signal.filtfilt(b, a, data1D); #senal filtrada por filtfilt


In [None]:
plt.figure
plt.plot(numpy.linspace(0,1,200), data1D, 'b', alpha=0.75)
plt.plot(numpy.linspace(0,1,200), z, 'r--',
         numpy.linspace(0,1,200), z2,'r',
         numpy.linspace(0,1,200), y, 'k')
plt.legend(('noisy signal', 'lfilter, once', 'lfilter, twice',
            'filtfilt'), loc='best')
plt.grid(True)
plt.show()

## Sub-módulo de optimización e interpolación

El sub-módulo de SciPy contiene funciones para encontrar mínimos y raíces de funciones, así como también hacer interpolaciones y ajustes de curvas.

In [None]:
from scipy import optimize

In [None]:
#funcion a buscar dominio y raices
def f(x):
    return -0.1*x**3 + -(11*x)**2 + 10*x**4

x = numpy.linspace(-4, 4, 100); #dominio de la funcion
plt.scatter(x, f(x));
plt.hlines(-367.5161513277576, -4,4,color='red') #np.min()
plt.hlines(-364.540295, -4,4,color='orange')

### Encontrar mínimos de una función

In [None]:
x_min = optimize.fmin_bfgs(f,10) #calculo de minimos, que usa descenso de gradiente
x_min, min(f(x))

In [None]:
plt.scatter(x_min, f(x_min[0]))
plt.hlines(min(f(x)), -4,4,color='red')
plt.hlines(-364.540295, -4,4,color='orange')
plt.ylim(-368, -364);

SciPy sub-módulo también cuenta con otros comando para encontar mínimos como lo son: `optimize.brent(<funcion>)` y `optimize.fminbound(<funcion>, <args>)`

### Encontrar raíces de una función

Dos de los comandos más empleados para encontrar raíces o soluciones de una función vectorizada son: `fsolve()` y `root()`

In [None]:
initGuess = [-3,0,3]; #conjetura
optimize.fsolve(f, initGuess) #calculo de raices

In [None]:
optimize.root(f, initGuess) #calculo de raices

### Interpolación lineal

Las interpolaciones en SciPy estan pensadas de manera que podamos determinar como una serie de puntos o datos se pueden comportar como una función específica asociada.

In [None]:
from scipy import interpolate

Lo que intentaremos a continuación es usar una función conocida y hacer un array a partir de ella, luego añadiremos ruido almacenándola en otro array. Esto lo usaremos para realizar la interpolación lineal y cúbica con los datos ruidoso empleando un número menor de puntos.

Notaremos que con una interpolación de menor orden la aproximación pierde calidad y se asemeja menos a la función esperada.

In [None]:
n = numpy.arange(0, 10); #puntos de interpolacion  
x = numpy.linspace(0, 9, 100); #puntos de evaluacion de la funcion real y la ruidosa

y_meas = numpy.sin(n) + 0.2 * numpy.random.randn(len(n)); #funcion ruidosa
y_real = numpy.sin(x); #funcion original

linear_interpolation = interpolate.interp1d(n, y_meas); #funcion de interpolacion lineal
y_interp1 = linear_interpolation(x); #interpolando linearmente el dominio

cubic_interpolation = interpolate.interp1d(n, y_meas, kind='cubic'); #funcion de interpolacion cubica
y_interp2 = cubic_interpolation(x); #interpolando cubicamente el dominio

Graficando...

In [None]:
fig, ax = plt.subplots(figsize=(10,4))

ax.plot(n, y_meas, 'bs', label='Noisy function')
ax.plot(x, y_real, 'k', lw=2, label='Expected function')
ax.plot(x, y_interp1, 'r', label='Linear interpolation')
ax.plot(x, y_interp2, 'g', label='Cubic interpolation')

ax.legend(loc=3);

### Ajuste de curvas

El ajuste de curvas es un aspecto crítico en física y en especial en física experimental, esto debido a que no siempre es possible confirmar el valor de los parámetros de unos datos empíricos a pesar de tener un modelo general que los describa. Aquí entra en juego los ajustes de curvas para así determinar con mayor precisión los valores de los parámetros libres del modelo considerado.

Importamos la función de SciPy para el ajuste de curvas:

In [None]:
from scipy.optimize import curve_fit

Imaginemos que queremos determinar los parámetros de decaimiento de la desintegración gamma dada por un modelo sencillo:
    
$$ I(t) = I_o exp^{-\gamma t} + I_c $$
    
donde $I_o$ es el valor inicial de decaimiento y $\gamma$ es la tasa de decaimiento y $I_c$ es alguna constante de compensación experimental.

In [None]:
#funcion de decaimiento exponencial
def I(t, I_o, gamma, I_c):
    return I_o * numpy.exp(-gamma * t) + I_c

In [None]:
len(t)

In [None]:
t = numpy.linspace(0, 4, 50); 
I_o = 2.5; 
gamma = 1.3;
I_c = 0.5;
rng = numpy.random.default_rng(); #numero aleatorio para generar ruido ficticio 

y = I(t, I_o, gamma, I_c); #array de funcion de nuestro modelo
y_noise = 0.2 * rng.normal(size=t.size); #array de ruido
ydata = y + y_noise; #datos artificiales con ruido incluido

plt.plot(t, ydata, color='blue', label='data');

El ajuste de la curva usando el comando `curve_fit()` necesita de un objeto tipo función asociado a nuestro modelo, el dominio y los datos a los cuales se les aplicará el ajuste.

In [None]:
popt, pcov = curve_fit(I, t, ydata); #haciendo el ajuste 
popt

In [None]:
plt.plot(t, I(t, *popt), 'g--',
         label=r'fit: $I_o$=%5.3f, $\gamma$=%5.3f, $I_c$=%5.3f' % tuple(popt))
plt.plot(t, ydata, color='blue', label='data');
plt.legend() #mostrar cosas como R2!!!!!!!

## Sub-módulo de estadística

Este bootcamp tiene como uno de los tópicos fundamentales la enseñanza de los fundamentos básicos de Mecánica Estadística. Para ello, SciPy puede ser una buena herramienta para explorar los conceptos y métodos de esta rama. En la ese sub-módulo se puede encontrar una extensa librería de comandos de diferentes tipos de distribuciones, cálculos estadísticos y funciones de correlación como los puntos más relevantes.

In [None]:
from scipy import stats

### Números aleatorios

Algunas funciones de distribución

In [None]:
mean, var, skew, kurt = stats.uniform.stats(moments='mvsk'); #propiedades de distribucion uniforme

r = stats.uniform.rvs(0,1, size=int(1e3)); #muestra de distribucion uniforme entre 0 y 1

plt.hist(r, bins=30, color='orange', alpha=0.6); #histograma
print ("Mean: {0:.2f} \nVariance: {1:.2f} \nSkew: {2:.2f} \nKurt: {3:.2f}".format(mean, var, skew, kurt)) 

In [None]:
mu = 1; #media de la distribucion de Poisson
mean, var, skew, kurt = stats.poisson.stats(mu, moments='mvsk'); #propiedades de distribucion uniforme

r = stats.poisson.rvs(mu, size=int(1e8)); #muestra de distribucion de Poisson

plt.hist(r, bins=30);
print ("Mean: {0:.2f} \nVariance: {1:.2f} \nSkew: {2:.2f} \nKurt: {3:.2f}".format(mean, var, skew, kurt)) 

In [None]:
lambda_ = 0.51; #parametros de forma

mean, var, skew, kurt = stats.planck.stats(lambda_, moments='mvsk'); #propiedades de distribucion de Planck

r = stats.planck.rvs(lambda_, size=int(1e8)); #muestra de distribucion de Planck

plt.hist(r, bins=30);
print ("Mean: {0:.2f} \nVariance: {1:.2f} \nSkew: {2:.2f} \nKurt: {3:.2f}".format(mean, var, skew, kurt)) 

In [None]:
lambda_, N = 1.4, 19; #parametros de forma

mean, var, skew, kurt = stats.boltzmann.stats(lambda_, N, moments='mvsk');  #propiedades de distribucion de Boltzmann

r = stats.boltzmann.rvs(lambda_, N, size=int(1e8)); #muestra de distribucion de Boltzmann

plt.hist(r, bins=30);
print ("Mean: {0:.5f} \nVariance: {1:.5E} \nSkew: {1:.5E} \nKurt: {1:.5E}".format(mean, var, skew, kurt)) 

In [None]:
mean, var, skew, kurt

In [None]:
n=5;
p=0.4;

mean, var, skew, kurt = stats.binom.stats(n, p, moments='mvsk');  #propiedades de distribucion binomial


r = stats.binom.rvs(5,0.4, size=int(1e8)); #muestra de distribucion binomial

plt.hist(r, bins=30);
print ("Mean: {0:.5f} \nVariance: {1:.5E} \nSkew: {1:.5E} \nKurt: {1:.5E}".format(mean, var, skew, kurt)) 

In [None]:
#ejemplos

### Funciones de distribución

In [None]:
Y = stats.norm() #distribucion de probabilidad
x = linspace(-5,5,100) #muestra

fig, axes = plt.subplots(3,1, sharex=True)

axes[0].plot(x, Y.pdf(x)) #plot de la funcion de distribucion de probabilidad

axes[1].plot(x, Y.cdf(x)); #plot de la funcion de distribucion acumulada (CDF)

# plot histogram of 1000 random realizations of the stochastic variable Y
axes[2].hist(Y.rvs(size=1000), bins=50, alpha=0.4);

In [None]:
Y.mean(), Y.std(), Y.var() #propiedades de la distribucion

---

# Scikit-learn <a class="anchor" id="Scikit-learn"></a>

<p align="center">
<img src='https://scikit-learn.org/stable/_static/scikit-learn-logo-small.png' width="400" />
    
Documentación: [https://scikit-learn.org/stable/user_guide.html](https://scikit-learn.org/stable/user_guide.html)
</p>


Modelos de ejemplo para unsupervised models

[https://scikit-learn.org/stable/tutorial/statistical_inference/index.html](https://scikit-learn.org/stable/tutorial/statistical_inference/index.html)

[https://scikit-learn.org/stable/tutorial/statistical_inference/unsupervised_learning.html](https://scikit-learn.org/stable/tutorial/statistical_inference/unsupervised_learning.html) 

[https://scikit-learn.org/stable/tutorial/statistical_inference/supervised_learning.html](https://scikit-learn.org/stable/tutorial/statistical_inference/supervised_learning.html)

In [None]:
from sklearn.decomposition import FastICA, PCA

# Generate sample data
np.random.seed(0)
n_samples = 2000
time = numpy.linspace(0, 8, n_samples)

s1 = numpy.sin(2 * time)  # Signal 1 : sinusoidal signal
s2 = numpy.sign(numpy.sin(3 * time))  # Signal 2 : square signal
s3 = signal.sawtooth(2 * numpy.pi * time)  # Signal 3: saw tooth signal

S = numpy.c_[s1, s2, s3]
S += 0.2 * numpy.random.normal(size=S.shape)  # Add noise

S /= S.std(axis=0)  # Standardize data
# Mix data
A = numpy.array([[1, 1, 1], [0.5, 2, 1.0], [1.5, 1.0, 2.0]])  # Mixing matrix
X = numpy.dot(S, A.T)  # Generate observations

# Compute ICA
ica = FastICA(n_components=3)
S_ = ica.fit_transform(X)  # Reconstruct signals
A_ = ica.mixing_  # Get estimated mixing matrix

# We can `prove` that the ICA model applies by reverting the unmixing.
assert numpy.allclose(X, numpy.dot(S_, A_.T) + ica.mean_)

# For comparison, compute PCA
pca = PCA(n_components=3)
H = pca.fit_transform(X)  # Reconstruct signals based on orthogonal components

# #############################################################################
# Plot results

plt.figure()

models = [X, S, S_, H]
names = ['Observations (mixed signal)',
         'True Sources',
         'ICA recovered signals', 
         'PCA recovered signals']
colors = ['red', 'steelblue', 'orange']

for ii, (model, name) in enumerate(zip(models, names), 1):
    plt.subplot(4, 1, ii)
    plt.title(name)
    for sig, color in zip(model.T, colors):
        plt.plot(sig, color=color)

plt.tight_layout()


---

# Pandas <a class="anchor" id="Pandas"></a>

<p align="center">
<img src='https://pandas.pydata.org/docs/_static/pandas.svg' width="700" />
</p>


In [1]:
# https://pandas.pydata.org/docs/
import pandas as pd

df = pd.DataFrame({"Name": ["Braund, Mr. Owen Harris",
                             "Allen, Mr. William Henry",
                             "Bonnell, Miss. Elizabeth",] ,
                   "Age": [22, 35, 58] ,
                   "Sex": ["male", "male", "female"] } )

df

Unnamed: 0,Name,Age,Sex
0,"Braund, Mr. Owen Harris",22,male
1,"Allen, Mr. William Henry",35,male
2,"Bonnell, Miss. Elizabeth",58,female


También se pueden sacar algunas estadísticas del dataset:

In [2]:
df.groupby("Sex").mean()

Unnamed: 0_level_0,Age
Sex,Unnamed: 1_level_1
female,58.0
male,28.5


<div class="alert alert-block alert-info">

**Nota** : También con pandas!
    
Con pandas también es posible importar datos desde un archivo `.csv` y directamente a un data frame de Python.
    
```python
df = pd.read_csv("directorio/archivo.csv")
```
</div>
 

---

# Footnote

In [None]:
#libs summary
import types
def imports():
    for name, val in globals().items():
        if isinstance(val, types.ModuleType):
            yield val.__name__
list(imports())

<font size="12">Más referencias</font>

<font size="4">
<br>
    
https://github.com/manuelmorgado/scientific-python-lectures

<br>
    
https://betterprogramming.pub/numpy-illustrated-the-visual-guide-to-numpy-3b1d4976de1d

<br>
</font>

    