# Introducción a Numpy y Scipy

- Numpy es la biblioteca central de computación científica en Python
- Contiene (entre muchas otras cosas): 
  - Un poderoso objeto array (arreglo) multidimensional
  - Funciones de álgebra linea, transformada de Fourier y otras funciones matemáticas de alto nivel para trabajar con estos arrays
  
<img src="numpy.jpg">

# Convención de importación
- Existe un estándar de importación de numpy (no es obligatorio, pero en mucha de la documentación e información en línea se encontrará así)


In [21]:
import numpy as np

# Arrays
- Al igual que una lista, es un conjunto ordenado de valores, pero existen algunas diferencias importantes entre listas y arrays:
    - El número de elementos en un array es fijo
    - Los elementos de un array deben de ser todos del mismo tipo. No se pueden mezclar distintos tipos de datos en un mismo array y una vez que se crea, el tipo de datos no se puede cambiar
    
- Las ventajas que presenta utilizar arrays sobre listas normales de python incluyen:
    - Pueden ser n-dimensionales, desde matrices bidimensionales hasta estructuras más complejas. Por contraste, las listas siempre son unidimensionales
    - Los arrays se comportan como vectores o matrices en álgebra: Se le pueden aplicar operaciones aritméticas
    - Funcionan más rápido que las listas. Especialmente si se tiene una cantidad de datos muy grande

In [2]:
# Creamos un array de una dimensión con cero en cada una de sus entradas
a = np.zeros(4)
print (a)
print (a.dtype) ## Indica el tipo de datos del array
print("------------------------------------------------")
a = np.zeros(4, int)
print (a)
print (a.dtype)
print("------------------------------------------------")
a = np.zeros(4, complex)
print(a)
print (a.dtype)
print("------------------------------------------------")


[ 0.  0.  0.  0.]
float64
------------------------------------------------
[0 0 0 0]
int64
------------------------------------------------
[ 0.+0.j  0.+0.j  0.+0.j  0.+0.j]
complex128
------------------------------------------------


- Nótese que los arrays se imprimen en consola de manera distinta a las listas, no hay comas entre los valores, sólo espacios
- No es necesario indicar el tipo de datos que se desea crear (como en el caso primero), por defecto se crean floats

- También se pueden crear arreglos multidimensionales

In [7]:
a = np.zeros((2,3))
print(a)
print("------------------------------------------------")

a = np.zeros((4,3,5))
print (a)

[[ 0.  0.  0.]
 [ 0.  0.  0.]]
------------------------------------------------
[[[ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]]

 [[ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]]

 [[ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]]

 [[ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]
  [ 0.  0.  0.  0.  0.]]]


### Nótese que el argumento de tamaño es un único valor (lista o tupla) que contiene el tamaño del array en todas las dimensiones que se desee


- Se le puede especificar un conjunto de valores a partir de los cuales se creará el array
- O se puede crear especificándole un rango mediante la función arange


In [15]:
lista = [[1.2, 3.5, 5.1],[4.4, 6.3, 9.8]]
b = np.array(lista) # Creación a partir de valores
print (b)
print("------------------------------------------------")
c = np.arange(15)
print(c)
print("------------------------------------------------")
c = c.reshape((3,5))
print(c)
print("------------------------------------------------")
aleatorios = np.random.random((2,2))  # Creación a partir de números aleatorios
print(aleatorios) 

[[ 1.2  3.5  5.1]
 [ 4.4  6.3  9.8]]
------------------------------------------------
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]
------------------------------------------------
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
------------------------------------------------
[[ 0.80525388  0.42434442]
 [ 0.6946299   0.60633299]]


# Ejercicio

### Cree dos arrays de numpy de la misma longitud a partir de listas de números secuenciales, pero que tengan distintos números

### Si utilizamos el operador suma (+) en listas, pasa lo siguiente:

In [20]:
lista1 = [1,2,3]
lista2 = [4,3,22]
lista3 = lista1 + lista2

print(lista3)

[1, 2, 3, 4, 3, 22]


### Con arrays de numpy pasa lo siguiente

In [21]:
array1 = np.array(lista1)
array2 = np.array(lista2)
array3 = array1 + array2

print (array3)

[ 5  5 25]


# Operaciones
- Las operaciones de suma, resta, multiplicación y división de escalares se aplican a todos los elementos
- Las operaciones entre arrays, se aplican elemento por elemento
- También algunas de las operaciones que se aplican a las listas normales, y otras operaciones más complejas

In [25]:
a = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
a = a+5 # le suma el número 5 a todas las entradas del array
print (a)
print("\n-------Suma---------")
print (a.sum()) # suma todas las entradas del array
print("\n-------Máximo---------")
print (a.max()) # retorna el valor máximo
print("\n--------Mínimo--------")
print (a.min()) # retorna el valor mínimo
print("\n--------Raíz Cuadrada--------")
print (np.sqrt(a)) # retorna un array cuyos valores son la raíz cuadrada de cada uno de los valores del array original
print("\n--------Cant. Datos--------")
print (a.size) # retorna la cantidad de datos que tiene el array (independientemente de la forma)
print("\n-------Forma del array---------")
tamaño_x = a.shape
print(len(tamaño_x))
print (tamaño_x) # retorna la forma que tienen los datos en el array, si tiene más de una dimensión, devuelve la magnitud de cada dimensión
print("\n-------Cambiar el array de forma---------")
a = a.reshape((3,4))
print ("Tamaño: " + str(a.size))
tamaño_x, tamaño_y = a.shape
print("Tamaño en x: " + str(tamaño_x))
print("Tamaño en y: " + str(tamaño_y))
print(a.shape)
print("\n-------Así se ve el array luego de cambiar de forma---------")
print (a)

[ 6  7  8  9 10 11 12 13 14 15 16 17]

-------Suma---------
138

-------Máximo---------
17

--------Mínimo--------
6

--------Raíz Cuadrada--------
[ 2.44948974  2.64575131  2.82842712  3.          3.16227766  3.31662479
  3.46410162  3.60555128  3.74165739  3.87298335  4.          4.12310563]

--------Cant. Datos--------
12

-------Forma del array---------
Imprimo el len 1
(12,)

-------Cambiar el array de forma---------
Tamaño: 12
(3, 4)
Tamaño en x: (12,)
Tamaño en y: 4
Imprimo el len2

-------Así se ve el array luego de cambiar de forma---------
[[ 6  7  8  9]
 [10 11 12 13]
 [14 15 16 17]]


# Indexación en arrays
### Para acceder a los elementos de un array, se puede utilizar una forma de indexación que es parecida a la que se utiliza en listas

In [26]:
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
# Para acceder al elemento en la posición 0, 0:
print (a[0,0])

# Se pueden hacer cambios en los datos accediéndolos mediante los índices
a[1,1] = 99

print(a)

1
[[ 1  2  3  4]
 [ 5 99  7  8]
 [ 9 10 11 12]]


# Ejercicio
### Cree una función que reciba como parámetro 2 arrays de numpy de 2 dimensiones (de igual forma y tamaño) y retorne un array nuevo que sea el mayor de las entradas comparándolas una a una.
Por ejemplo, se compara la posición [0, 0] del primer array con el segundo, y se escoge el mayor para ponerlo en la posición [0, 0] del nuevo array

In [30]:
a = np.random.random((3,4))
print(a)
print("------------------------------------------------")
b = np.random.random((3,4))
print(b)
print("------------------------------------------------")
def mayores(arr1, arr2):
    resultado = np.zeros(arr1.shape)
    tam_x, tam_y = arr1.shape
    for x in range(tam_x):
        for y in range(tam_y):
            if arr1[x,y] > arr2[x,y]:
                resultado[x,y] = arr1[x,y]
            else:
                resultado[x,y] = arr2[x,y]
            
    return resultado

print (mayores(a,b))
        

[[ 0.9242911   0.75932181  0.97576194  0.22011463]
 [ 0.92184219  0.66030474  0.95026202  0.26358248]
 [ 0.77033746  0.67362099  0.03232018  0.8883799 ]]
------------------------------------------------
[[ 0.7108384   0.24276432  0.28925321  0.93800711]
 [ 0.05042628  0.82972549  0.31819938  0.48343274]
 [ 0.50331832  0.23754635  0.03387236  0.47487488]]
------------------------------------------------
[[ 0.9242911   0.75932181  0.97576194  0.93800711]
 [ 0.92184219  0.82972549  0.95026202  0.48343274]
 [ 0.77033746  0.67362099  0.03387236  0.8883799 ]]


# Existen operaciones más complejas y combinaciones de varias operaciones
### Por ejemplo, considere este cálculo de matrices
<img src = mat2.png>

In [31]:

a = np.array([[1,3], [2,4]])
b = np.array([[4,-2], [-3,1]])
c = np.array([[1,2], [2,1]])

# dot es la función de multiplicación de matrices, si la multiplicación se hiciera 
# a*b, sería una multiplicación elemento por elemento
resultado = np.dot(a,b)+2*c
print(resultado)

[[-3  5]
 [ 0  2]]


In [32]:
# Transpuesta de una matriz

print(resultado.T)

[[-3  0]
 [ 5  2]]


# Existen formas de crear datos secuenciales en rangos


In [33]:
vector = np.linspace (-1, 1, 9)
print(vector)

[-1.   -0.75 -0.5  -0.25  0.    0.25  0.5   0.75  1.  ]


In [36]:
vector2 = np.linspace(0,1,20)
#print(vector2)

print(np.meshgrid(vector,vector2))

[array([[-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,  1.  ],
       [-1.  , -0.75, -0.5 , -0.25,  0.  ,  0.25,  0.5 ,  0.75,

## - Linspace crea un vector con valores entre el primer y segundo valor que recibe como parámetro
## - Crea N valores (N siendo el tercer parámetro)
## - Todos los valores adyacentes van a tener la misma distancia entre sí

# Se puede mezclar la creación de matrices y vectores de numpy con list comprehension

# Ejemplo:

In [37]:
a = [4.25, 0.323, 0.21]
b = np.array([np.sqrt(i) for i in a])
print (b)

[ 2.06155281  0.56833089  0.45825757]


# Ejercicio
Cree una matriz de tamaño 2 x 2 como array de numpy y calcule su determinante.



In [41]:
matriz = np.array([[2,1],[3,1]])

def determinante(matriz):
    return matriz[0,0]*matriz[1,1] - matriz[1,0]*matriz[0,1]

def inversa(matriz):
    mat_inversa = np.zeros(matriz.shape)
    mat_inversa[0,0] = matriz[1,1]
    mat_inversa[1,1] = matriz[0,0]
    mat_inversa[0,1] = -matriz[0,1]
    mat_inversa[1,0] = -matriz[1,0]
    
    return (1/determinante(matriz))*mat_inversa

matriz_inversa = inversa(matriz)

print(matriz)
print("------------------------------------------------")
print(matriz_inversa)
print("------------------------------------------------")
print(np.dot(matriz,matriz_inversa))

[[2 1]
 [3 1]]
------------------------------------------------
[[-1.  1.]
 [ 3. -2.]]
------------------------------------------------
[[ 1.  0.]
 [ 0.  1.]]


# Datos desde un archivo
- Numpy permite cargar valores desde un archivo de texto
- Estos datos se almacenan en un array que puede ser posteriormente manipulado igual que cualquier otro array de numpy


In [54]:
valores = np.loadtxt(open("entrada.csv", "r"), delimiter=",")
#print(valores)
print ("---------------------------- Valor promedio -------------------------------")
#promedio = np.average(valores) #la función average calcula el promedio de los valores de la matriz
#print("Promedio: " + str(promedio))

#print(valores)

print ("-----------------------------------------------------------")


print(" -------------- luego del cambio ---------------- ")
matriz_nueva = valores*9
#print (matriz_nueva)

np.savetxt("archivo_salida.csv", matriz_nueva, delimiter="*")



---------------------------- Valor promedio -------------------------------
-----------------------------------------------------------
 -------------- luego del cambio ---------------- 


### Para cargar datos desde un csv con encabezados en las columnas, se puede utilizar genfromtxt

- genfromtxt es un poco más poderoso que loadtxt
- loadtxt recibe como 1er parámetro un objeto de tipo file, genfromtxt recibe la ruta del archivo

In [5]:
import numpy as np
datos = np.genfromtxt("prueba_sismos.csv", dtype=float, delimiter=',', names=True)

print(datos)

[( 1990.,   5.,   6.,   1.,  56.,  3.,  9.7489,  83.7534)
 ( 1991.,   4.,  30.,   1.,  55.,  5.,  9.7489,  83.7534)
 ( 1992.,   8.,  31.,   2.,  44.,  3.,  9.7489,  83.7534)
 ( 1993.,   7.,   3.,   3.,  21.,  4.,  9.7489,  83.7534)
 ( 1993.,   9.,  24.,   4.,  39.,  5.,  9.7489,  83.7534)
 ( 1993.,  11.,  15.,   5.,  17.,  3.,  9.7489,  83.7534)
 ( 1993.,   1.,  16.,   8.,  45.,  7.,  9.7489,  83.7534)
 ( 1997.,   2.,  22.,   9.,  44.,  4.,  9.7489,  83.7534)
 ( 1998.,   3.,  12.,  15.,  54.,  2.,  9.7489,  83.7534)
 ( 1999.,  11.,  13.,  15.,  21.,  3.,  9.7489,  83.7534)
 ( 2000.,   2.,  14.,  16.,  10.,  8.,  9.7489,  83.7534)]


In [73]:
tam_x = datos.size
for x in range(tam_x):
    datos[x][7] = -datos[x][7]

print(datos)
#np.savetxt("prueba_sismos.csv", datos, delimiter=",")

[( 1990.,   5.,   6.,   1.,  56.,  3.,  9.7489,  83.7534)
 ( 1991.,   4.,  30.,   1.,  55.,  5.,  9.7489,  83.7534)
 ( 1992.,   8.,  31.,   2.,  44.,  3.,  9.7489,  83.7534)
 ( 1993.,   7.,   3.,   3.,  21.,  4.,  9.7489,  83.7534)
 ( 1993.,   9.,  24.,   4.,  39.,  5.,  9.7489,  83.7534)
 ( 1993.,  11.,  15.,   5.,  17.,  3.,  9.7489,  83.7534)
 ( 1993.,   1.,  16.,   8.,  45.,  7.,  9.7489,  83.7534)
 ( 1997.,   2.,  22.,   9.,  44.,  4.,  9.7489,  83.7534)
 ( 1998.,   3.,  12.,  15.,  54.,  2.,  9.7489,  83.7534)
 ( 1999.,  11.,  13.,  15.,  21.,  3.,  9.7489,  83.7534)
 ( 2000.,   2.,  14.,  16.,  10.,  8.,  9.7489,  83.7534)]


### Como lo cargamos con encabezados, podemos acceder a las columnas por los nombres que la función tomó desde el csv

In [15]:
datos["longitud"] = datos["longitud"] * -1

print(datos["longitud"])

[-83.7534 -83.7534 -83.7534 -83.7534 -83.7534 -83.7534 -83.7534 -83.7534
 -83.7534 -83.7534 -83.7534]


#### Se puede acceder a los nombres de los encabezados de esta manera:

In [12]:
datos.dtype.names

('anio', 'mes', 'dia', 'hora', 'minuto', 'escala', 'latitud', 'longitud')

In [22]:
f = open("prueba_sismos.csv", "r")

texto = f.read()
f.close()
#print(texto)

lineas = texto.splitlines()
#print(lineas)
for indice in range(len(lineas)):
    lineas[indice] = lineas[indice].split(",")
    
for linea in lineas:
    linea[7] = "-"+linea[7]
#print(lineas)

arr = np.array(lineas)
print(arr)


np.savetxt("prueba_sismos.csv", arr, delimiter=",")

[['anio' 'mes' 'dia' 'hora' 'minuto' 'escala' 'latitud' '-longitud']
 ['1990' '5' '6' '1' '56' '3' '9.7489' '-83.7534']
 ['1991' '4' '30' '1' '55' '5' '9.7489' '-83.7534']
 ['1992' '8' '31' '2' '44' '3' '9.7489' '-83.7534']
 ['1993' '7' '3' '3' '21' '4' '9.7489' '-83.7534']
 ['1993' '9' '24' '4' '39' '5' '9.7489' '-83.7534']
 ['1993' '11' '15' '5' '17' '3' '9.7489' '-83.7534']
 ['1993' '1' '16' '8' '45' '7' '9.7489' '-83.7534']
 ['1997' '2' '22' '9' '44' '4' '9.7489' '-83.7534']
 ['1998' '3' '12' '15' '54' '2' '9.7489' '-83.7534']
 ['1999' '11' '13' '15' '21' '3' '9.7489' '-83.7534']
 ['2000' '2' '14' '16' '10' '8' '9.7489' '-83.7534']]


# Ejercicio
- Cargue los datos del archivo prueba_sismos.csv en objetos de tipo sismo (definidos por usted) 
- Luego ponga en un archivo nuevo (csv) los que sucedieron después del año 95 y fueron de magnitud 4 o más

# SciPy
## El paquete SciPy contiene varias herramientas dedicadas a resolver problemas comunes en computación científica
## Esta biblioteca trabaja en conjunto con NumPy
## Algunos de los módulos con los que cuenta esta biblioteca son
- constants (constantes matemáticas y físicas)
- fftpack (transformada de Fourier)
- integrate (integración)
- interpolate (interpolación)
- io (entrada/salida de datos)
- linalg (álgebra lineal)
- ndimage (imágenes n-dimensionales)
- optimize (optimización)
- signal (procesamiento de señales)
- stats (estadística)

# Álgebra lineal
### Tiene operaciones para inversión de matrices, cálculo de determinantes, etc.

In [None]:
from scipy import linalg

matriz = np.matrix([[1,2],
                  [3,4]])

############ Cálculo de determinante ############
print ("\n ---------- Determinante ----------- ")
print (linalg.det(matriz)) 
## Da error si se intenta computar el determinante de una matriz no cuadrada

############ Cálculo de la inversa de una matriz cuadrada ############
print ("\n ---------- Matriz Inversa ----------- ")
matriz_inversa = linalg.inv(matriz)
print (matriz_inversa)
## Para asegurarnos de que es la inversa, la multiplicamos por la original
## y observamos el resultado

print ("\n ---------- Multiplicación de matrices ----------- ")
matrices_multiplicadas = np.dot(matriz, matriz_inversa) # multiplicación matricial
print(matrices_multiplicadas) ## Esto no va a dar exactamente la identidad


# FFT

### SciPy tiene un módulo para transformada de Fourier

In [None]:
%matplotlib inline
from scipy.fftpack import fft
# Cantidad de puntos de muestra
N = 600
# espaciado de la muestra
T = 1.0 / 800.0
x = np.linspace(0.0, N*T, N)
y = np.sin(50.0 * 2.0*np.pi*x) + 0.5*np.sin(80.0 * 2.0*np.pi*x) #Función que vamos a transformar
yf = fft(y) # Transformada de Fourier


# Matplotlib
### Es una biblioteca de graficación para Python
### Provee una manera rápida de visualizar datos

- En los cuadernos de jupyter es necesario indicar que la visualización se debe de hacer en las celdas del cuaderno de esta forma --> %matplotlib inline
- Se pueden graficar funciones en dominios limitados (y discretos)

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
xf = np.linspace(0.0, 1.0/(2.0*T), N//2)
import matplotlib.pyplot as plt #
plt.plot(xf, 2.0/N * np.abs(yf[0:N//2]))
plt.grid()
plt.savefig("ejercicio_plt.png", dpi=72) # Para salvar la figura como una imagen (dpi es la resolución en puntos por pulgada)
plt.show()

# Ejercicio

Grafique la FFT de una función que usted creó (o si tiene datos reales que puede graficar, ¡úselos!)