# Numpy #
Es quizá la librería más importante de Python afín a la computación científica, pero su utilidad no radica en este campo únicamente. Tiene funciones muy importantes en lo que respecta a análisis de archivos de texto, excel, entre otros. Además, sirve para llevar a otro nivel la matemática en la programación.

In [None]:
import numpy as np

## Arreglos ##
El objeto más importante de Numpy es el arreglo multidimensional. Es como una lista, pero sólo puede tener un tipo de dato dentro y no se puede alterar su tamaño, como si fuera un arreglo de algún lenguaje de bajo nivel.

In [None]:
a=np.array([1,2,3,4])
b=np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]])

Los arreglos se comportan de manera distinta que las listas, como por ejemplo:

In [None]:
print("Se multiplican todos los elementos por 3, en vez de concatenar tres veces")
print(3*a) 

print("Se multiplica cada fila de la matriz por el vector a")
print(a*b)

print("Se eleva cada elemento de los arreglos al cuadrado")
print(a**2, a*a)

Es posible "deformar" un arreglo para cambiar su "forma". Por ejemplo:

In [None]:
print(a.reshape(2,2))
print(b.reshape(2,8))

La forma de un arreglo de *numpy* se puede determinar mediante la instrucción:
```python
a.shape
```
y para saber la dimensión (cantidad de listas anidadas), se usa
```python
a.ndim
```

In [None]:
c=np.array([1])
print(c.ndim)

c=np.array([[1]])
print(c.ndim)

c=np.array([[[1]]])
print(c.ndim)

Para saber el número total de elementos en un arreglo, se usa
```python
a.size
```

A pesar de que no se puede modificar el tamaño de un arreglo, se puede modificar su contenido del mismo modo a como se haría con una lista

In [None]:
m=np.array([2,3,4,5], dtype=int) #Se le ingresa como kwarg el tipo de dato dentro del arreglo
m[2]=60
print(m)

## Booleanos y arreglos ##
Los arreglos de Numpy son muy versátiles trabajando con booleanos.

In [None]:
a=np.arange(3,10)
print(a>5)

Podemos usar una condición para seleccionar elementos de un arreglo

In [None]:
# "|" simboliza or, "&" simboliza and
print(a[(a%2==0) | (a>5)]) 

El código anterior implica de fondo que los booleanos se pueden usar como índices de un arreglo

In [None]:
print(a[np.array([True,True,False,False,False,True,True])])

## Arreglos "vacíos" y/o útiles ##
Generalmente no se sabe la información que debe contener un arreglo, por lo que se desea crear un arreglo provisional, y llenarlo más adelante. También puede que se necesite alguno de los arreglos mencionados a continuación. 

In [None]:
a=np.empty((5,6,6)) #Arreglo con información arbitraria, de "forma" (5,6,6)
b=np.zeros((2,2), dtype=complex) #Arreglo de ceros complejos, de "forma" (2,2)
c=np.ones((1,2), dtype=float) #Arreglo de unos flotantes, de "forma" (1,2)

In [None]:
print(a)

In [None]:
print(b)

In [None]:
print(c)

*arange* recrea `range`, pero en vez de generar un objeto `range` genera un arreglo de numpy. *linspace* es útil cuando se desea hacer una partición equispaciada de tamaño n de un intervalo. 

In [None]:
a=np.arange(2,7,3)
b=np.linspace(2,8,20)
print(a)
print(b)

## Operaciones matemáticas con arreglos ##
Numpy contiene casi todas las funciones, constantes y operaciones matemáticas que conoces. Aplicarlas a arreglos es bastante intuitivo.

In [None]:
a=np.array([2,3,4,5,6])
b=np.array([8,7,6,5,4])

print(np.sin(a))
print(b-a)
print(np.pi**a)

## Álgebra Lineal ##
Numpy es bastante sólido en lo que refiere al trabajo con matrices, haciéndole competencia Matlab. Un arreglo se comporta como una matriz cuando se le pide hacerlo.

In [None]:
a=np.arange(1,17).reshape(4,4)
b=np.identity(4) # La matriz identidad (4x4)
c=np.arange(3,17+2).reshape(4,4)
d=np.array([2,1,3,4]).reshape(2,2)

print(a.dot(b)) #Multiplicamos a con b (matricialmente)

In [None]:
#En general, el producto de matrices no es conmutativo
print("a*c")
print(a.dot(c))
print("c*a")
print(c.dot(a))

In [None]:
print(a.transpose()) #La transpuesta de una matriz
print(a.trace()) #La traza de una matriz
print(np.linalg.inv(d)) #La inversa de una matriz

In [None]:
#En ciertas versiones de Numpy se puede usar @ para denotar la multiplicación matricial
print(d @ np.linalg.inv(d))

In [None]:
print(np.linalg.det(a)) #Determinante de la matriz a

### Sistemas de ecuaciones lineales ###
Suponga que se quiere hallar los valores de $x,y,z$ que satisfacen
$$3x+y+z=4$$
$$2x+z=3$$
$$6x+4y+3z=0$$
Este sistema puede verse como un producto de matrices del siguiente modo


$$\begin{bmatrix}
    3&1&1 \\
    2&0&1 \\
    6&4&3 
\end{bmatrix}\begin{bmatrix}
x\\
y\\
z
\end{bmatrix}=\begin{bmatrix}
4\\
3\\
0
\end{bmatrix}
$$

El módulo de álgebra lineal de Numpy puede afrontar estos típicos problemas de Facebook.

In [None]:
a=np.array([[3,1,1],[2,0,1],[6,4,3]])
b=np.array([4,3,0])

In [None]:
m=np.linalg.solve(a,b)
print(m)

In [None]:
print(a @ m)

### Autovalores y autovectores ###
Si $A$ es una matriz cuadrada, considere la ecuación

$$Av=\lambda v,$$
con $v$ un vector y $\lambda$ un número real o complejo. Todos los vectores y números que satisfagan esta ecuación se conocen como autovectores y autovalores de $A$, respectivamente. Muchos problemas matemáticos requieren conocer estos objetos, como por ejemplo para obtener la solución de un sistema de ecuaciones diferenciales ordinarias, diagonalizar una matriz o calcular la estabilidad de una ecuación diferencial linealizada. 

In [None]:
w, v = np.linalg.eig(np.diag((1, 2, 3))) #np.diag((1, 2, 3) es la matriz cuadrada con los elementos 1,2,3 en la diagonal

print(w) #w es un arreglo de los autovalores
print(v) #v es una matriz con los autovectores

## Números aleatorios y probabilidad ##
Numpy posee unos métodos dedicados a analizar los números aleatorios y la probabilidad. A continuación, veremos algunas aplicaciones útiles de varios de ellos.

In [None]:
random_numbers=np.random.random(size=(10,10)) #Aquí imprimimos números aleatorios
#desde 0 hasta 1, y los ponemos en una matriz 10x10.

#Seleccionemos todos los números menores o iguales que 0.5:
less_or_equal=random_numbers[random_numbers<=0.5]
print(less_or_equal)#Note que arroja los resultados en 1darray.


print(less_or_equal.size) #¿Cuánto debería dar?

Lo anterior fue un ejemplo con números aleatorios uniformes. Numpy tiene un montón de distribuciones para generar números aleatorios. [Aquí](http://docs.scipy.org/doc/numpy/reference/routines.random.html) están todas las soportadas. A continuación un ejemplo con la distribución normal.

In [None]:
print(np.random.normal(5, 5, size=(5,5))) #(media, desviación estándar, dimensión)

## Redes, mallas ##
Una herramienta interesante para la matemática dimensional es el método `meshgrid(a,b)`. Este método hace una correspondencia de todos los elementos de _a_ con todos los de _b_. Así creamos una superficie bidimensional, si los arreglos son unidimensionales. Quizá con un ejemplo quede más claro.

In [None]:
a=np.arange(3,6)
b=np.arange(9,12)

X,Y=np.meshgrid(a,b)

In [None]:
print(X)
print(Y)

## Arreglos Estructurados ##
Lo más similar que se encontrará en Numpy a los diccionarios. Son un tipo de arreglo que admite indexación de sus columnas por cadenas, y sus filas por números, como es usual. Se inicializan de la siguiente manera:

In [None]:
l=[(1, 123, 50.0),(2, 456, 33.3333), (3, 789, 44.8)]
m=np.array(l, dtype=[("orden", int), ("nombre", int), ("nota", float)])

In [None]:
print(m["orden"])
print(m[0])

## Lector de txt ##
La manera más sencilla y conveniente de almacenar información es mediante archivos de texto simple (txt). Python es capaz de analizar este tipo de archivos por sí mismo, pero resulta más conveniente hacerlo con Numpy. Dejé en esta carpeta un archivo llamado m67.txt, vamos a verlo, y a analizarlo.

In [None]:
m=np.loadtxt("m67.txt", skiprows=1, usecols=range(16), dtype=float) #Saltamos la primera fila y consideramos únicamente
#las primeras 16 columnas.

In [None]:
#¿Cómo almacena la información este método en m?
print(m.shape)

In [None]:
#Accedamos a la ascención recta de las estrellas (columna 1)
print(m[:,1]) #Fila, Columna

In [None]:
#Ahora accedamos a la información de la estrella número 12
print(m[11,:])

Si no se desea toda la información, y se la quiere en arreglos separados, se usa el kwarg unpack. Suponga que sólo se quiere  V     B-V    U-B    V-R    R-I en arreglos distintos, con lo que se usa:

In [None]:
V,B_V,U_B,V_R,R_I=np.loadtxt("m67.txt", skiprows=1, usecols=range(6,11), dtype=float, unpack=True) 

In [None]:
#Veamos
print(V)

## Creador de txt ##
Crear documentos de texto simple es tan importante como leerlos, puesto que a veces se hace necesario transmitir el resultado de un código a otro. De nuevo, Python puede hacerlo por sí mismo, pero es mucho más sencillo usar Numpy para esta labor. 


En este caso, supongamos que queremos organizar las estrellas del catálogo por su índice R-I, siendo la primera la que tiene el menor índice, y la última el mayor. Al final se desea escribir el resultado en un txt llamado resultado.txt

In [None]:
ID, R_I=np.loadtxt("m67.txt", usecols=[0, 10], unpack=True, skiprows=1, dtype=float)
R_I

In [None]:
index=np.argsort(R_I) #Nos genera un arreglo con las posiciones de R_I organizado de menor a mayor
data=np.vstack((ID[index],R_I[index])) #Hacemos una matriz len(ID)x2, cuyas columnas son ID y R_I

In [None]:
print(data)

In [None]:
#Necesitamos esta matriz transpuesta, para que cada columna se corresponda con ID y R-I
data=data.transpose()
print(data)

In [None]:
#Y lo colocamos todo en un txt
np.savetxt("resultado.txt", data, "%.3f", header="ID R-I", comments="") #Header es la primera línea del documento

## Anexo: archivos de excel (Pandas) ##
Para analizar archivos de formato xlsx se debe usar una librería aparte, pandas. Referencia: https://pandas-docs.github.io/pandas-docs-travis/generated/pandas.read_excel.html

In [None]:
import pandas as pd

Primero veamos cómo crear un documento xlsx. Se usará el objeto Dataframe para almacenar la información que será impresa en el documento.

In [None]:
#Entendamos la forma en la cual se ingresan los datos:

data = pd.DataFrame([("Barranquilla", 1232766, 27.4), ("Cali", 2445281, 24),
                     ("Tunja", 195496, 12.9)], columns=["Ciudad", "Habitantes", "Temperatura media (C)"])

In [None]:
#Veamos el resultado
data

In [None]:
#Y escribámoslo en un xlsx
data.to_excel("Ciudades.xlsx")

In [None]:
#Hay muchos más formatos disponibles, por si a alguien le suena
data.to_

Ahora leamos el archivo "Ciudades.xlsx" que acabamos de crear.

In [None]:
new_data=pd.read_excel("Ciudades.xlsx") #r de read

In [None]:
new_data.get

Unas cuantas consideraciones adicionales. Como se puede ver, los datos se acceden a través de la cadena de cada columna, o del número de cada fila.

In [None]:
new_data["Ciudad"]

In [None]:
new_data.loc[1]

Finalmente, algunos kwargs útiles para `pd.read_excel` son:
```python
pd.read_excel("filename", index_col=None, header=None)
```
`index_col=None` omite que se use como llaves las cadenas de la primera fila del documento, y `header=None` indica que no se debe omitir nada del documento. También se puede usar `dtype` para decir explícitamente el tipo de dato de cada columna, aunque Python debería encargarse de eso. 