# Herramientas para hacer ciencia con Python

- Hay varias alternativas para la realización de calculo numérico y modelación científica con Python, pero quizá la opción mas popular es la combinación de librerías:
  - numpy
  - Scipy
  - Matplotlib
  
- Un curso completo de trabajo numérico puede ser accedido libremente, en la pagina
https://www.python-course.eu/index.php

- El objetivo de los desarrolladores, es hacer de Python una herramienta competitiva frente a sus rivales comerciales. 
  - En el caso del trabajo numérico y análisis de datos, el principal competidor comercial es MATLAB.
  - Siendo un software muy bueno y con una gran comunidad de soporte, por el hecho de ser software privativo, MATLAB carga los problemas intrínsecos de ese tipo de licencias.
    - Los algoritmos son de carácter privado, y como tal no pueden ser vistos (no hay acceso al código fuente). Desde el punto de vista científico, esto es malo, puesto que no permite la revisión o peritaje. El usuario se ve obligado a tener fe en que el algoritmo ha sido correctamente implementado.
    - El costo de las licencias es realmente alto, luego unicamente personas o grupos con fondos suficientes pueden hacer uso de los algoritmos implementados en MATLAB.
    - Hay restricciones en la portabilidad del código, luego un código funcional en su maquina, puede no funcionar en otra maquina con una versión diferente del MATLAB
    - Modificar el código no esta permitido.
    - Extender la funcionabilidad es difícil, por la propia naturaleza de la licencia.
    - La sintaxis utiliza paréntesis en lugar de corchetes para acceder a los elementos de un arreglo, lo cual va en la dirección contraria del estándar en programación. Adicionalmente, a  la lectura dicha sintaxis es confusa, pues es la misma que se utiliza para la evaluación de funciones.
  - Python es software de código abierto y licencia libre. Adicionalmente, tiene características que le hacen competitivo frente a sus rivales.
      - Tiene un diseño excelente, lo cual le permite tener una sintaxis intuitiva: Es fácil llevar los algoritmos al código.
      - Posee mas tipos de datos: listas, tuplas, arreglos, etc... cada cual con sus características que le hacen adecuado para algún trabajo en particular.
      - Usa espacios de nombre en todos los niveles: Python se estructura por módulos (librerías), que deben ser importadas antes de utilizar. Cada una con su propio espacio de nombres, lo que evita la anbigüedad en el uso de funciones.
      - Soporta programación orientada a objetos, lo cuál provee un alto nivel de abstracción, que permite escribir de forma simple, lógicas complejas.

## Instalación
Al ser Python un lenguaje de programación de proposito general, su instalación básica no suele incluir los módulos científicos por defecto. 

- Desde linux, instalar es tan fácil como buscar los paquetes de numpy, scipy y matplotlib en el administrador de paquetes de la distribución en uso.
- Desde cualquier sistema, los paquetes pueden ser instalados en su ultima versión desde:
    - numpy: www.numpy.org
    - scipy: www.scipy.org
    - matplotlib: www.matplotlib.org
- numpy es un requisito para que las otras dos funcionen correctamente.

## Que son:

- numpy: **Numerical Python** es la librería o modulo que contiene las herramientas necesarias para el trabajo numérico.
- scipy: **Scientifical Python** es definida por sus autores como: *la librería fundamenta para el calculo científico*. Contiene herramientas especializadas para integración, derivación, interpolación, ajuste de datos, funciones especiales, etc...
- matplotlib: El proyecto se define como: *una herramienta de grafícación en 2d para la producción de gráficas con calidad de publicación en una amplia variedad de formatos e itegrable en ambientes interactivos*.
    - El modulo también puede grafícar en 3D (NO renderiza)
    - Para usuarios de MATLAB, la librería posee una interfaz llamada pylab, que utiliza una sintaxis familiar y facilita la migración a matplotlib

# numpy

La estructura fundamental en numpy es el arreglo de datos **array**
- Un arreglo es una tabla de elementos, todos del mismo tipo.
    - Aunque el uso fundamental del arreglo es el almacenamiento de datos numéricos, numpy esta preparado para crear arreglos de todo tipo de datos, incluso de arreglos.
    - Cada dimensión recibe el nombre de eje (axis).
    - El número de ejes se llama rango.

In [6]:
import numpy as np
# Un arreglo de rango 1 y longitud 3
a=np.array([1,2,3])
print(a, type(a))
print(a.size, a.shape)
a=np.array([[1,2,3],[4,5,6]])
print(a.size, a.shape)

[1 2 3] <class 'numpy.ndarray'>
3 (3,)
6 (2, 3)


Pero podríamos tener un arreglo con caracteres

In [5]:
a=["hola", "mundo"]
a= np.array(a)
print(a, type(a))
print(a.size, a.shape)

['hola' 'mundo'] <class 'numpy.ndarray'>
2 (2,)


Un arreglo de arreglos:

In [7]:
a=[np.array([1,2,3]),["hola", "mundo"] ]
a= np.array(a)
print(a, type(a))
print(a.size, a.shape)

[array([1, 2, 3]) ['hola', 'mundo']] <class 'numpy.ndarray'>
2 (2,)


- Los arreglos son una clase, y como tal tiene atributos y métodos a los que podemos acceder
- Algunas propiedades útiles:
    - size: el numero de elementos que contiene el array
    - ndim: el rango del array (numero de dimensiones o ejes)
    - shape: forma en que se distribuyen los elementos
    - dtype: tipo de variable que contiene el arreglo

In [7]:
a.max()

6

In [10]:
lista=[[1,2,3.],[3,2,1]]
a=np.array(lista)
print(a.size, a.ndim, a.shape, a.dtype)
a

6 2 (2, 3) float64


array([[ 1.,  2.,  3.],
       [ 3.,  2.,  1.]])

- Algunos métodos:
    - reshape: permite reorganizar los elementos del arreglo en distintas combinaciones
    - max: reporta el máximo valor de un arreglo (numérico)
    - min: el mínimo.
    - mean: el promedio de las entradas del arreglo

In [12]:
np.arange(12)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [13]:
a=(np.arange(12)).reshape(2,6)
print("matriz 2x6\n", a)
print("matriz 6x2\n", a.reshape(6,2))
print("tensor 3x2x2\n", a.reshape(3,2,2))

matriz 2x6
 [[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
matriz 6x2
 [[ 0  1]
 [ 2  3]
 [ 4  5]
 [ 6  7]
 [ 8  9]
 [10 11]]
tensor 3x2x2
 [[[ 0  1]
  [ 2  3]]

 [[ 4  5]
  [ 6  7]]

 [[ 8  9]
  [10 11]]]


In [16]:
a=np.arange(9).reshape(3,3)
print(a)
print(a.max(), a.min(), a.mean(), a.trace(), a.diagonal())
a.max(axis=1)

[[0 1 2]
 [3 4 5]
 [6 7 8]]
8 0 4.0 12 [0 4 8]


array([2, 5, 8])

## Crear arreglos

- Los arreglos se crean de forma estándar a partir de una lista.
- De forma "inteligente", Python escoge el tipo de argumento en función del contenido de la lista

In [19]:
lista=[1,2,3]
a=np.array(lista)
a.dtype
b=np.linspace(1,4,4)
print(b)

[ 1.  2.  3.  4.]


- Pero se puede especificar el tipo de dato con la opción dtype

In [39]:
a=np.array(lista, dtype=np.float64)
a.dtype

dtype('float64')

También tenemos funciones auxiliares que ayudan a reservar la memoria en caso de que no se tenga aún conocido los datos del arreglo, pero si su tamaño

In [54]:
# matriz de ceros
a=np.zeros((3,2))
a

array([[ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.]])

In [56]:
# matriz de unos
np.ones((3,3))

array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.],
       [ 1.,  1.,  1.]])

In [22]:
# matriz "vacia", queda con la información basura que ya se encuentra en la memoria
np.empty((2,2))

array([[ 0.,  0.],
       [ 0.,  0.]])

## Acceso a los elementos de un arreglo.
- El acceso es similar a las demás secuencias que soporta Python.

In [23]:
a=np.arange(9)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8])

- El primer elemento se indexa con el cero, y se sigue hasta el ultimo, que tiene indice $n-1$, con $n$ la longitud del arreglo

In [25]:
# el elemento 4, tiene indice 4-1=3
print (a[3])
# todos los elementos, desde el primero hasta el indice 3
print(a[2:7])

3
[2 3 4 5 6]


In [80]:
# todos los elementos desde el indice 2 (tercero), hasta el indice $dim-1-2$
print(a[2:-2])
# El ultimo elemento
print(a[-1])

[2 3 4 5 6]
8


Acceder elementos de 2 en 2

In [100]:
print(a[::2],"\n")
# o en un rango
print(a[1:-1:3])

[0 2 4 6 8] 

[1 4 7]


- En caso de matrices, se admite una notación mas intuitiva

In [27]:
a=a.reshape(3,3)
# El elemento (0,1) primera fila, segunda columna, accedido en forma de lista
print("la matriz\n",a,"\n")
print( a[0][1])
# se puede acceder de forma mas intuitiva
a[0,1]

la matriz
 [[0 1 2]
 [3 4 5]
 [6 7 8]] 

1


1

In [30]:
# columna 0 (primera)
print(a[:,0],"\n")
# fila 0
print(a[0,:])
a[0,1:]

[0 3 6] 

[0 1 2]


array([1, 2])

- Se puede utilizar listas para seleccionar elementos de un arreglo.
- Por cada dimensión o eje, se puede incluir una lista

In [33]:
lista=[0,2]
print(a,"\n")
a[[0,2],[1,2]]
b=[[1,2],[3,4]]

[[0 1 2]
 [3 4 5]
 [6 7 8]] 



## Copias y vistas
- En Python, la memoria del sistema se optimiza creando vistas (o punteros) a las clases, en ves de crear copias.

In [34]:
a=np.arange(3)
b=a
print(a,b)
b[0]=10
print(a,b)

[0 1 2] [0 1 2]
[10  1  2] [10  1  2]


Si se requiere una copia real (otro espacio de memoria con la misma información), se debe de utilizar el método copia

In [35]:
a=np.arange(3)
b=a.copy()
print(a,b)
b[0]=10
print(a,b)

[0 1 2] [0 1 2]
[0 1 2] [10  1  2]


## Operaciones básicas

In [36]:
a=np.array([1,2,3])
b=np.array([4,5,6])

In [37]:
# suma
print("suma",a+b)
# multiplicación escalar
print("dos por ",a,"es ",2*a)

suma [5 7 9]
dos por  [1 2 3] es  [2 4 6]


- numpy define las operaciones y los operadores elemento a elemento:

In [5]:
# vector o arreglo mas un escalar
print("suma 1 a cada elemento del arreglo",a+1)
# funciones actuando sobre el arreglo
print("eleva al cuadrado cada elemento", a**2)

suma 1 a cada elemento del arreglo [2 3 4]
eleva al cuadrado cada elemento [1 4 9]


In [25]:
# las operaciones matriciales requieren el llamado de la función correspondiente
print("a*b no es el producto interno,", a*b, "es el producto elemento a elemento")
print("el producto interno lo realizamos con la función dot: np.dot(a,b)=",np.dot(a,b))
print("producto cruz axb", np.cross(a,b))

a*b no es el producto interno, [ 4 10 18] es el producto elemento a elemento
el producto interno lo realizamos con la función dot: np.dot(a,b)= 32
producto cruz axb [-3  6 -3]


# Funciones matemáticas básicas

In [9]:
# basicas sin, cos, tan, arcsin, log, etc...
print( np.sin(a) )
print (np.exp(a) )

[ 0.84147098  0.90929743  0.14112001]
[  2.71828183   7.3890561   20.08553692]


## Implementación de calculo en los complejos
- numpy viene preparado para trabajar en variable compleja

In [10]:
a=a+b*1j

In [12]:
np.sin(a)

array([ 22.97908558 +14.74480519j,  67.47891524 -30.87943134j,
        28.46611220-199.69451226j])

In [15]:
print( np.real(a), np.imag(a))

[ 1.  2.  3.] [ 4.  5.  6.]


In [23]:
a.conj()

array([ 1.-4.j,  2.-5.j,  3.-6.j])

## Álgebra lineal
- numpy viene con un sub módulo de álgebra lineal.

In [26]:
np.linalg?

# Scipy
El módulo scipy es una colección de algoritmos y funciones especiales, de uso habitual en ciencia. Esta librería esta construida sobre numpy.

Los sub módulos de scipy:

- cluster: Algoritmos para creación y manejo de clusters
- constants: constantes físicas y matemáticas predefinidas.
- fftpack: Rutinas que implementan la transformada de fourier en varios algoritmos.
- integrate: integración numérica.
- interpolate: Interpolación 
- io: entrada y salida de datos
- linalg: álgebra lineal a través de LAPACK y BLAS
- ndimage: Manejo de imagenes
- odr: orthogonal distance regression
- optimize: optimización y busqueda de raíces.
- signal: procesamiento de señales
- sparce: rutinas optimizadas para matrices sparce
- special: implementación de funciones especiales

Los sub módulos deben ser importados por separado.

## Integración

- Podemos obtener un resumen de las funciones del modulo mediante la ayuda de Ipython o el comando help

In [38]:
import scipy as sc
import scipy.integrate as scint

## Ejemplos ilustrativos.

- Integración de funciones de una sola variable con quad 

In [40]:
scint.quad?

In [41]:
def f(x):
    return x**2

In [42]:
scint.quad(f,0,1)

(0.33333333333333337, 3.700743415417189e-15)

- La rutina soporta la integración entre $\pm \infty$, si la función es de cuadrado integrable

In [43]:
def f(x):
    return np.exp(-x**2)

In [44]:
scint.quad(f, -np.inf, +np.inf)

(1.7724538509055159, 1.4202636780944923e-08)

### ODE Problema de valores iniciales

- scipy implementa la rutina odeint, para integrar sistemas de ecuaciones diferenciales de primer orden
$$
\frac{\text{d} \mathbf{y}}{\text{d} t} = \mathbf{f}(\mathbf{y}, t)
$$

- Como ejemplo, considere el sistema de ecuaciones diferenciales:
\begin{align}
    \frac{\text{d} x}{\text{d} t} = v, &&& \frac{\text{d} v}{\text{d} t} = - \omega^2 x
\end{align}

In [45]:
# definimos el vector de funciones derivada
def f(y,t):
    omega= 1
    return np.array([y[1], - omega * y[0]])

In [46]:
# debemos especificar los tiempos en los que queremos tener evaluada las funciones
tiempos= np.linspace(0,10,1000)
# Planteamos una condición inicial
yo=np.array([0,1])

In [48]:
y= scint.odeint(f,yo,tiempos)

In [49]:
y

array([[ 0.        ,  1.        ],
       [ 0.01000983,  0.9999499 ],
       [ 0.02001867,  0.99979961],
       ..., 
       [-0.5271149 , -0.8497942 ],
       [-0.5355948 , -0.84447529],
       [-0.54402103, -0.83907176]])

Esto nos da los valores del sistema $(x,v)$ para los tiempos solicitados

# Visualización de datos con matplotlib

Para ver el resultado de la integración anterior de una forma mas clara, podemos hacer una gráfica. El módulo matplotlib es indicado para esto.

In [50]:
import matplotlib.pylab as plt
plt.plot(tiempos,y)
label=["x","v"]
plt.legend(label)
plt.show()

## Optimización

In [55]:
import scipy.optimize as scopt

In [56]:
scopt.minimize?

In [66]:
# Minimización
def f(x):
    return (x-2)**2

scopt.minimize(f, 10)

      fun: 5.552228233152667e-17
 hess_inv: array([[ 0.5]])
      jac: array([ -1.49391610e-12])
  message: 'Optimization terminated successfully.'
     nfev: 12
      nit: 2
     njev: 4
   status: 0
  success: True
        x: array([ 1.99999999])

## Mínimos cuadrados y ajuste no lineal

In [57]:
def f(x):
    return np.exp(-(x-2)**2/2) + 0.1*(np.random.rand(len(x)) - 0.5)
def f2(x):
    return np.exp(-(x-2)**2/2)

In [58]:
xx=np.linspace(-4,7,300)
y=f(xx)
plt.plot(xx,y,"r.")
plt.show()

- Definimos la función de ajuste

In [53]:
def modelo(x, a, b, c):
    return a*np.exp( -b* (x-c)**2)

In [59]:
opt_fun=scopt.curve_fit(modelo,xx,y)

- Ahora comparamos la curva con los datos experimentales

In [60]:
a,b,c=opt_fun[0]
x2=np.linspace(-4,7,1500)
plt.plot(x2, modelo(x2,a,b,c), "k-", label="modelo")
plt.plot(xx,y,"r.", label="experimento")
plt.plot(x2, f2(x2), label="real")
plt.legend()
plt.show()