## Álgebra lineal

El módulo de álgebra lineal se solapa un poco con funciones similares en **Numpy**. Ambos usan finalmente una implementación de bibliotecas conocidas (LAPACK, BLAS). La diferencia es que **Scipy** asegura que utiliza las optimizaciones de la librería ATLAS y presenta algunos métodos y algoritmos que no están presentes en **Numpy**. 

Una de las aplicaciones más conocidas por nosotros es la rotación de vectores. Como bien sabemos rotar un vector es equivalente a multiplicarlo por la matriz de rotación correspondiente. Esquemáticamente:


![](https://imgs.xkcd.com/comics/matrix_transform.png)

(Gentileza de [xkcd](https://www.xkcd.com/184/))

In [None]:
from scipy import linalg

Este módulo tiene funciones para trabajar con matrices, descriptas como *arrays* bidimensionales.

In [None]:
arr = np.array([[3, 2,1],[6, 4,1],[12, 8, 13.3]])
print(arr)

In [None]:
A = np.array([[1, -2,-3],[1, -1,-1],[-1, 3, 1]])
print(A)

In [None]:
# La matriz transpuesta
A.T

### Productos y normas

#### Norma de un vector

La norma está dada por
$$||v|| = \sqrt{v_1^2+...+v_n^2}$$ 

In [None]:
v = np.array([2,1,3])
linalg.norm(v)                  # Norma

In [None]:
linalg.norm(v) == np.sqrt(np.sum(np.square(v)))

#### Producto interno

El producto entre una matriz y un vector está definido en **Numpy** mediante las funciones `dot()`, o `matmul()`, o mediante el operador `@`:

In [None]:
w1 = np.dot(A, v)                # Multiplicación de matrices
w1

In [None]:
np.allclose(np.dot(A,v), np.matmul(A,v))  # dot y matmul son equivalentes

In [None]:
np.allclose(A @ v, np.matmul(A,v))  # También son equivalentes al operador @

In [None]:
w2 = np.dot(v,  A)
w2

In [None]:
np.dot(v.T,  A) == np.dot(v,  A)  # Si es unidimensional, el vector se transpone automáticamente


In [None]:
print(v.shape, A.shape)

El producto interno entre vectores se calcula de la misma manera
$$ \langle v, w \rangle$$

In [None]:
np.dot(v,w1)

y está relacionado con la norma
$$||v|| = \sqrt{ \langle v, v \rangle}$$

In [None]:
linalg.norm(v) == np.sqrt(np.dot(v,v))

In [None]:
np.dot(v,A)

In [None]:
v.shape

In [None]:
v2 = np.reshape(v, (3,1))

In [None]:
v2.shape

In [None]:
np.dot(A, v2)

In [None]:
np.dot(A, v2).shape

Ahora las dimensiones de `v2` y `A` no coinciden para hacer el producto matricial
```python
np.dot(v2, A)
```

In [None]:
np.dot( v2,A)

Notemos que el producto interno se puede pensar como un producto de matrices. En este caso, el producto de una matriz de 3x1, por otra de 1x3:

$$ v^{t} \, w = \begin{pmatrix} -9&-2&4 \end{pmatrix} \begin{pmatrix} 2\\1\\3 \end{pmatrix} $$

donde estamos pensando al vector como columna.

#### Producto exterior

El producto exterior puede ponerse en términos de multiplicación de matrices como
$$v\otimes w = vw^{t} = \begin{pmatrix} -9\\-2\\4 \end{pmatrix} \begin{pmatrix} 2&1&3 \end{pmatrix}$$

In [None]:
oprod = np.outer(v,w1)
print(oprod)

### Aplicación a la resolución de sistemas de ecuaciones

Vamos a usar `scipy.linalg` permite obtener determinantes e inversas de matrices. Veamos como resolver un sistema de ecuaciones lineales:

$$
\left\{
\begin{array}{rl}
a_{11} x_1 + a_{12} x_2 + a_{13} x_3 &= b_1 \\
a_{21} x_1 + a_{22} x_2 + a_{23} x_3 &= b_2 \\
a_{31} x_1 + a_{32} x_2 + a_{33} x_3 &= b_3
\end{array}
\right.
$$

Esta ecuación se puede escribir en forma matricial como

$$ \begin{pmatrix}a_{11}&a_{12} & a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}
\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} = \begin{pmatrix}b_1\\b_2\\b_3\end{pmatrix}
$$

Veamos un ejemplo concreto. Supongamos que tenemos el siguiente sistema
$$
\left\{
\begin{array}{rl}
 x_1 + 2 x_2 + 3 x_3 &= 1 \\
2 x_1 +  x_2 + 3 x_3 &= 2 \\
4 x_1 +  x_2 - x_3 &= 1
\end{array}
\right.
$$
por lo que, en forma matricial será:
$$ A = \begin{pmatrix} 1 &2 &3 \\ 2& 1& 3 \\ 4& 1& -1 \end{pmatrix} $$
y 
$$ b =  \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix} $$

In [None]:
A = np.array([[1,2,3],[2,1,3],[4,1,-1]])
b = np.array([[1,2,3]]).T
print('A=', A,"\n")
print('b=', b,"\n")

In [None]:
x = np.dot(linalg.inv(A), b)
print('Resultado:\n', x)

### Descomposición de matrices

Si consideramos el mismo problema de resolución de ecuaciones
$$A x = b $$
pero donde debemos resolver el problema para un valor dado de los coeficientes (la matriz $A$) y muchos valores distintos del vector $b$, suele ser útil realizar lo que se llama la descompocición $LU$ de la matriz.

Si escribimos a la matriz $A$ como el producto de tres matrices $A = PLU$ donde $P$ es una permutación de las filas, $L$ es una matriz triangular inferior (Los elementos por encima de la diagonal son nulos) y $U$ una triangular superior.
En este caso los dos sistemas:
$$ Ax = b \qquad  \mathrm{ y } \qquad P A x = Pb  $$
tienen la misma solución. Entonces podemos resolver el sistema en dos pasos:

$$ Ly=b $$ 
con
$$ y = Ux. $$

En ese caso, resolvemos una sola vez la descompocición $LU$, y luego ambas ecuaciones se pueden resolver eficientemente debido a la forma de las matrices.

In [None]:
A = np.array([[1,3,4],[2,1,3],[4,1,2]])

print('A=', A,"\n")

P, L, U = linalg.lu(A)
print("PLU=", np.dot(P, np.dot(L, U)))
print("\nLU=", np.dot(L, U))
print("\nL=",L)
print("\nU=", U)

### Autovalores y autovectores

La necesidad de encontrar los autovalores y autovectores de una matriz aparece en muchos problemas de física e ingeniería. Se trata de encontrar el escalar $\lambda$ y el vector (no nulo) $v$ tales que

$$ A v = \lambda v$$



In [None]:
with np.printoptions(precision=3):
  B = np.array([[0,1.,1],[2,1,0], [3,4,5]])
  print(B,'\n')
  u, v = linalg.eig(B)
  c = np.dot(v,np.dot(np.diag(u), linalg.inv(v)))
  print(c,'\n')
  print(np.real_if_close(c),'\n')
  print('')
  print('Autovalores=', u,'\n')
  print('Autovalores=', np.real_if_close(u))


Veamos como funciona para la matriz definida anteriormente

In [None]:
print(A)
u, v = linalg.eig(A)
print(np.real_if_close(np.dot(v,np.dot(np.diag(u), linalg.inv(v)))))
print("Autovalores=" , np.real_if_close(u))
print("Autovectores=", np.real_if_close(v))

In [None]:
np.real_if_close?

### Rutinas de resolución de ecuaciones lineales

**Scipy** tiene además de las rutinas de trabajo con matrices, rutinas de resolución de sistemas de ecuaciones. En particular la función `solve()`

```python
 solve(a, b, sym_pos=False, lower=False, overwrite_a=False, overwrite_b=False,
       debug=False, check_finite=True)

Solve the equation ``a x = b`` for ``x``.

Parameters
----------
a : (M, M) array_like
    A square matrix.
b : (M,) or (M, N) array_like
    Right-hand side matrix in ``a x = b``.
...
```

In [None]:
a = np.array([[3, 2, 0], [1, -1, 0], [0, 5, 1]])
b = np.array([2, 4, -1])
x = linalg.solve(a, b)
x

In [None]:
np.allclose(np.dot(a, x) , b)

In [None]:
np.dot(a,x) == b

Para sistemas de ecuaciones grandes, la función `solve()` es más rápida que invertir la matriz

In [None]:
A1 = np.random.random((2000,2000))
b1 = np.random.random(2000)

In [None]:
%timeit linalg.solve(A1,b1)

In [None]:
%timeit np.dot(linalg.inv(A1),b1)

## Entrada y salida de datos

### Entrada/salida con *Numpy*

#### Datos en formato texto

Veamos un ejemplo (apenas) más complicado, de un archivo en formato de texto, donde antes de la lista de números hay un encabezado

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
!head ../data/tof_signal_5.dat

In [None]:
X0 = np.loadtxt('../data/tof_signal_5.dat')

In [None]:
X0.shape, type(X0)

In [None]:
X0[0].shape

In [None]:
X0[0]

In [None]:
plt.plot(X0[:,0], X0[:,1])

La manera más simple de leer datos de un archivo es a través de `loadtxt()`.

```python
np.info(np.loadtxt)
 loadtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None,
         converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0,
         encoding='bytes')
Load data from a text file.

Each row in the text file must have the same number of values.
```

En su forma más simple sólo necesita como argumento el nombre del archivo. En este caso, había una primera línea que fue ignorada porque empieza con el caracter "#" que indica que la línea es un comentario.

Veamos otro ejemplo, donde las líneas que son parte de un encabezado se saltean, utilizando el argumento `skiprows`

In [None]:
fdatos= '../data/exper_col.dat'
!head ../data/exper_col.dat

In [None]:
X1 = np.loadtxt(fdatos, skiprows=5)
print(X1.shape)
print(X1[0])

Como el archivo tiene cuatro columnas el array `X` tiene dimensiones `(74, 4)` correspondiente a las 74 filas y las 4 columnas. Si sólo necesitamos un grupo de estos datos podemos utilizar el argumento `usecols = (c1, c2)` que nos permite elegir cuáles son las columnas a leer:

In [None]:
x, y = np.loadtxt(fdatos, skiprows=5, usecols=[0, 2], unpack=True)
print (x.size, y.size)

In [None]:
Y = np.loadtxt(fdatos, skiprows=5, usecols=[0, 2])
print (Y.size, Y[0])

En este ejemplo, mediante el argumento `unpack=True`, le indicamos a la función `loadtxt`que desempaque lo que lee en variables diferentes (`x,y` en este caso)

In [None]:
plt.plot(x,y, 'o-')

Como numpy se especializa en manejar números, tiene muchas funciones para crear arrays a partir de información numérica a partir de texto o archivos (como los CSV, por ejemplo). Ya vimos como leer datos con `loadtxt`. También se pueden generar desde un string:

In [None]:
np.fromstring(u"1.0 2.3   3.0 4.1   -3.1", sep=" ", dtype=float)

Para guardar datos en formato texto podemos usar, de la misma manera,

In [None]:
Y = np.vstack((x,y)).T
print(Y.shape)

In [None]:
np.savetxt('tmp.dat', Y)

In [None]:
!head tmp.dat

La función `savetxt()`tiene varios argumentos opcionales:

```python
np.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# ', encoding=None)
```

Por ejemplo, podemos darle un formato de salida con el argumento `fmt`, y darle un encabezado con `header`

In [None]:
np.savetxt('tmp.dat', Y, fmt='%.6g', header="Energ Exper")
!head tmp.dat

#### Datos en formato binario

In [None]:
np.save('test.npy', X1)  # Grabamos el array a archivo 
X2 = np.load('test.npy')     # Y lo leemos

In [None]:
# Veamos si alguno de los elementos difiere
print('X1=', X1[:10])
print('X2=', X2[:10])

In [None]:
print('¿Alguna differencia?', np.any(X1-X2))

### Ejemplo de análisis de palabras

In [None]:
# %load scripts/10_palabras.py
#! /usr/bin/ipython
import numpy as np
import matplotlib.pyplot as plt
import gzip
ifiname = '../data/palabras.words.gz'

letras = [0] * 512
with gzip.open(ifiname, mode='r') as fi:
  for l in fi.readlines():
    c = ord(l.decode('utf-8')[0])
    letras[c] += 1

nmax = np.nonzero(letras)[0].max() + 1
z = np.array(letras[:nmax])
# nmin = z.nonzero()[0].min()     # Máximo valor diferente de cero
nmin = np.argwhere(z != 0).min()
#plt.ion()
with plt.style.context(['seaborn-talk', 'presentation']):
  fig = plt.figure(figsize=(10, 8))
  #plt.clf()
  plt.bar(np.arange(nmin, nmax), z[nmin:nmax])
  plt.xlabel('Letras con y sin acentos')
  plt.ylabel('Frecuencia')

  labels = ['A', 'Z', 'a', 'o', 'z', 'á', 'ú']
  ll = [r'$\mathrm{{{}}}$'.format(t) for t in labels]
  ts = [ord(t) for t in labels]
  plt.xticks(ts, ll, fontsize='xx-large')

  x0 = 0.5 * ord('á') + ord('z')
  y0 = 0.2 * z.max()
  umbral = 0.25
  lista = (z > umbral * z.max()).nonzero()[0]

  dx = [10, 40, 70]
  dy = [-550, -350, -100]

  for j, t in enumerate(reversed(lista)):
    plt.annotate('{} ({})'.format(chr(t), z[t]), xy=(t, z[t]), xycoords='data',
                 xytext=(t + dx[j % 3], z[t] + dy[j % 3]), bbox=dict(boxstyle="round", fc="0.8"),
                 arrowprops=dict(arrowstyle="simple", fc="0.5")
                 )


### Entrada y salida en Scipy

El submódulo `io` tiene algunas utilidades de entrada y salida de datos que permite interactuar con otros paquetes/programas. Algunos de ellos son:

- Archivos IDL ([Interactive Data Language](https://hesperia.gsfc.nasa.gov/hessi/solar_cd/FAQ/IDL_FAQ.htm))
   - `scipy.io.readsav()`

- Archivos de sonido wav, con `scipy.io.wavfile`
   - `scipy.io.wavfile.read()`
   - `scipy.io.wavfile.write()`

- Archivos fortran sin formato, con `scipy.io.FortranFile`

- Archivos Netcdf (para gran número de datos), con  `scipy.io.netcdf`

- Archivos de matrices de Matlab

In [None]:
from scipy import io as sio
a = np.ones((3, 3)) + np.eye(3,3)
print(a)
sio.savemat('datos.mat', {'a': a}) # savemat espera un diccionario
data = sio.loadmat('datos.mat', struct_as_record=True)
print(data['a'])

In [None]:
data

-----

## Ejercicios 11 (b)

2. En el archivo `palabras.words.gz` hay una larga lista de palabras, en formato comprimido.
Siguiendo la idea del ejemplo dado en clases realizar un histograma de las longitudes de las palabras.

3. Modificar el programa del ejemplo de la clase para calcular el histograma de frecuencia de letras en las palabras (no sólo la primera). Considere el caso insensible a la capitalización: las mayúsculas y minúsculas corresponden a la misma letra ('á' es lo mismo que 'Á' y ambas corresponden a 'a').

3. Utilizando el mismo archivo de palabras, Guardar todas las palabras en un array y obtener los índices de las palabras que tienen una dada letra (por ejemplo la letra 'j'), los índices de las palabras con un número dado de letras (por ejemplo 5 letras), y los índices de las palabras cuya tercera letra es una vocal. En cada caso, dar luego las palabras que cumplen dichas condiciones.

4. En el archivo `colision.npy` hay una gran cantidad de datos que corresponden al resultado de una simulación. Los datos están organizados en trece columnas. La primera corresponde a un parámetro, mientras que las 12 restantes corresponde a cada una de las tres componentes de la velocidad de cuatro partículas. Calcular y graficar:
  1. la distribución de ocurrencias del primer parámetro.
  2. la distribución de ocurrencias de energías de la tercera partícula.
  3. la distribución de ocurrencias de ángulos de la cuarta partícula, medido respecto al tercer eje.
  4. la distribución de energías de la tercera partícula cuando la cuarta partícula tiene un ángulo menor a 90 grados con el tercer eje.

  Realizar los cuatro gráficos utilizando un formato adecuado para presentación (charla o poster).

5. Leer el archivo `colision.npy` y guardar los datos en formato texto con un encabezado adecuado. Usando el comando mágico `%timeit` o el módulo timeit, comparar el tiempo que tarda en leer los datos e imprimir el último valor utilizando el formato de texto y el formato original `npy`. Comparar el tamaño de los dos archivos.
  
1. El submódulo **scipy.constants** tiene valores de constantes físicas de interés. 
Usando este módulo compute la constante de Stefan-Boltzmann $\sigma$ utilizando la relación:
$$\sigma = \frac{2 \pi^5 k_B^4}{15 h^3 c^2}$$
Confirme que el valor obtenido es correcto comparando con la constante para esta cantidad en ``scipy.constants``

2. Usando **Scipy** y **Matplotlib** grafique las funciones de onda del oscilador armónico unidimensional para las cuatro energías más bajas ($n=1,2,3,4$), en el intervalo $[-5,5]$. Asegúrese de que están correctamente normalizados.

Las funciones están dadas por:

$$ \psi _{n}(x)={\frac {1}{\sqrt {2^{n}\,n!}}}\cdot \left({\frac {\omega }{\pi}}\right)^{1/4}\cdot e^{-{\frac {\omega x^{2}}{2 }}}\cdot H_{n}\left({\sqrt{\omega}}\, x\right),\qquad n=0,1,2,\ldots .$$

donde $H_{n}$ son los polinomios de Hermite, y usando $\omega = 2$.

Trate de obtener un gráfico similar al siguiente (tomado de [wikipedia](https://en.wikipedia.org/wiki/Quantum_harmonic_oscillator). Realizado por By AllenMcC. - File:HarmOsziFunktionen.jpg, [CC BY-SA 3.0](https://commons.wikimedia.org/w/index.php?curid=11623546))

![](figuras/HarmOsziFunktionen.png)

-----

.