# [Numpy](https://numpy.org/doc/stable/index.html)



In [None]:
import numpy as np

Tipos de numpy

In [None]:
np.bool_, np.byte, np.ubyte, np.short, np.ushort, np.intc, np.uintc, np.int_, np.uint, np.longlong, np.ulonglong, np.half, np.float16, np.single, np.double, np.longdouble, np.csingle, np.cdouble, np.clongdouble

## [Arrays](https://numpy.org/doc/stable/reference/arrays.html)

Los arrays son el tipo de datos más importante que provee NumPy. En su versión más básica representan vectores pero pueden tener más dimensiones y representar matrices y tensores en general.

El tipo se llama ndarray pero también se lo conoce en la librería simplemente como array.

En su versión más simple podemos pensar que no es más que una lista de python pero:

* A diferencia de las listas en python, solo pueden tener un tipo de datos adentro.
* Existen un montón de operaciones matemáticas definidas y optimizadas para trabajar con este tipo de datos.

Al ser una clase de python, además de métodos tiene atributos. Veamos algunos de ellos

In [None]:
an_array = np.arange(20)
an_array

In [None]:
an_array.shape

In [None]:
an_array.ndim

In [None]:
an_array.size

In [None]:
an_array.dtype

### [Armando arrays](https://numpy.org/doc/stable/user/basics.creation.html)

Por un lado, tenemos el constructor de la clase que admite como parámetro listas de valores. Por otro lado, existen diversas funciones que crean arrays. Veamos algunas.

In [None]:
np.array([1,2,3,4])

In [None]:
np.arange(10,30,2)

In [None]:
np.linspace(0.1,0.5,4)

In [None]:
np.logspace(1,10,10)

In [None]:
np.zeros((3,2))

In [None]:
np.ones((2,3))

In [None]:
np.random.rand(3,2) # random entre 0 y 1

In [None]:
np.random.randint(1,10,(3,2)) # enteros random entre [1 y 10)

In [None]:
np.random.standard_normal((8,2))

Propiedades de un arreglo

In [None]:
an_array = np.ones((2,3))
print('dimensiones: ', an_array.shape)
print('cantidad de dimensiones: ', an_array.ndim)
print('cantidad de elementos: ', an_array.size)
print('tipo: ', an_array.dtype)

Se puede cambiar el tipo de un array

In [None]:
np.arange(0,10,0.5)

In [None]:
np.arange(0,10,0.5).astype(np.int32)

## Matrices

Las matrices no son más que array con 2 dimensiones. Si bien existe un tipo específico para matrices en numpy cayó en desuso (y obsolescencia).

In [None]:
a_matrix = np.array([[ 0,  1,  2,  3],
                    [ 4,  5,  6,  7],
                    [ 8,  9, 10, 11],
                    [12, 13, 14, 15]])
a_matrix

In [None]:
print(a_matrix.shape, a_matrix.ndim, a_matrix.size, a_matrix.dtype)

### Matrices especiales

In [None]:
np.eye(3) # Identidad de 3x3

In [None]:
np.diag([77,90]) # Matriz diagonal

In [None]:
np.diag(np.ones(3),1) # Superdiagonal 1

In [None]:
np.vander(np.arange(4),increasing=True) # Matriz de Vandermonde (veremos al final de la materia qué significa)

## Cambio de dimensiones

Algunos métodos que modifican las dimensiones:
* reshape: Devuelve un nuevo array con las dimensiones indicadas como
parámetro. Si alguno de los parámetros es igual a -1, se calculan las
dimensiones para que sea factible el cambio.

* resize: el mismo efecto que “reshape” pero modifica el array en vez de devolver
uno nuevo.

* T: sirve para transponer una matriz.

* ravel, flattened: “aplana” el array devolviendo todo en una sola dimensión.

In [None]:
a_matrix

In [None]:
a_matrix.reshape(1,16)

In [None]:
a_matrix.T

In [None]:
a_matrix.ravel()

In [None]:
a_matrix.resize(1,16)
a_matrix

## Operaciones con arrays

Existen muchísimas operaciones definidas para arrays.

### Operadores básicos

Los operadores básicos de sumas, restas, potencias, etc se encuentran sobrecargados.

In [None]:
v = np.arange(1,7)
w = np.ones(6)
v, w

In [None]:
v + w

In [None]:
v > w

In [None]:
v - w

In [None]:
v ** 2

In [None]:
np.sqrt(v)

In [None]:
print(np.sin(v), "\n", np.cos(v), "\n", np.floor(np.cos(v)), "\n", np.round(np.cos(v)))

### Operaciones entre vectores

In [None]:
np.dot(v,w) #Producto iterno (o escalar)

In [None]:
np.outer(v,w) #Producto externo

### Multiplicación de matrices

Existe la multiplicación clásica entre matrices (con
el símbolo @) o el producto elemento a elemento (producto Hadamard)

In [None]:
M1 = np.arange(1,10).reshape(3,3)
M2 = np.ones((3,3))
M1, M2

In [None]:
M1 * M2 #Producto Hadamard o elemento a elemento

In [None]:
np.matmul(M1,M2) #Producto interno de matrices

In [None]:
M1 @ M2 #Producto interno de matrices

**EJERCICIO**: Multiplicar $M_{1}v$ siendo $v = (1,1,1)$ como columna

In [None]:
...

## [Indexación de arreglos](https://numpy.org/doc/stable/user/basics.indexing.html)

Los arrays en NumPy se pueden acceder a posiciones particulares o mediante 'slicing' de maneras parecidas a las listas nativas. Observar los siguientes comandos e interpretar.

In [None]:
an_array = np.arange(0,40,2)
an_array

In [None]:
an_array[6]

In [None]:
start = 2
end = 18
step = 2

an_array[start:end:step]

In [None]:
# Son equivalentes
#an_array[0:end:]
#an_array[:end:]
an_array[:end]

In [None]:
an_array[:-1]

In [None]:
an_array[::]

In [None]:
an_array[::-1]

In [None]:
for element in an_array[:5]:
    print(element)

In [None]:
a_matrix = np.arange(16).reshape((4,4))
a_matrix

In [None]:
a_matrix[:,2]

In [None]:
a_matrix[:,1:3]

In [None]:
a_matrix[-1,:]

In [None]:
for row in a_matrix:
    print(row)

In [None]:
a_matrix[1:3,2:4]

## Máscaras

Es posible seleccionar elementos de un arreglo utilizando como índice otro arreglo de booleanos. Esto es mucho más eficiente que realizar un ciclo que recorra todo el arreglo y ejecute una condición en cada posición.

In [None]:
import time

an_array = np.arange(4)
mask = np.array([False,True,True,False])
an_array[mask]

Las operaciones con máscaras son más rápidas que operar elemento a elemento con condiciones

In [None]:
an_array = np.arange(100)
an_array

In [None]:
np.array([x for x in an_array if x>50])

In [None]:
an_array[an_array>50]

In [None]:
%timeit np.array([x for x in an_array if x>50])

In [None]:
%timeit an_array[an_array>50]

## Tipos de asignación

### Referencia

In [None]:
an_array = np.arange(10)
an_array

In [None]:
another_array = an_array

In [None]:
another_array[3] = 8
an_array

### [Vista](https://numpy.org/doc/stable/user/basics.copies.html)

In [None]:
an_array = np.arange(10)
an_array

In [None]:
another_array = an_array.view()

In [None]:
another_array = another_array.reshape((5,2))
another_array

In [None]:
an_array[3] = 8

In [None]:
another_array

### [Copia](https://numpy.org/doc/stable/user/basics.copies.html)


In [None]:
another_array = np.arange(10)

In [None]:
an_array = another_array.copy()

In [None]:
an_array[3] = 8

In [None]:
an_array, another_array

## Operaciones matemáticas

In [None]:
np.sum(np.arange(1000)) # suma los elementos de un arreglo

In [None]:
arr = np.arange(16).reshape(4,4,)
np.sum(arr,0) #  de un arreglo 2d, suma solo un eje, el 0, el primero

In [None]:
np.diff(np.arange(10)) # resta elementos consecutivos

In [None]:
np.cumsum(np.arange(10)) # suma acumulada

## Álgebra Lineal

Numpy utiliza BLAS y LAPACK para las operaciones de álgebra lineal

https://numpy.org/doc/stable/reference/routines.linalg.html#module-numpy.linalg

Descomposiciones, autovalores, normas, determinante, rango, sistemas de ecuaciones, inversa, ...

In [None]:
import numpy.linalg as lng

In [None]:
A = np.random.randint(1,10,(3,3))
A

In [None]:
lng.inv(A)  # Inversa

In [None]:
lng.det(A)  # Determinante

## Resolver sistemas de ecuaciones

In [None]:
A = np.random.randint(-9,10,(4,4))
x = np.random.randint(-9,10,(4,1))
b = A@x
A, x, b

In [None]:
x_solve = lng.solve(A,b)
print(x_solve)
np.allclose(x,x_solve)

## Ejercicios

Realizar el ejercicio 3 de la práctica 1, ejecutando los comandos indicados.

Realizar el ejercicio 21 de la Práctica 1. Utilizar ejercicio21_P1.py, completarlo y ejecutarlo en Spyder. Si surgen errores, hacer debugging en Spyder.

Realizar el ejercicio 4 de la práctica 1.

## Programita para escalonar matrices: row_echelon


In [None]:
import numpy as np

def row_echelon(M):
    """ 
        Retorna la Matriz Escalonada por Filas 
    """
    A = np.copy(M)
    if (issubclass(A.dtype.type, np.integer)):
        A = A.astype(float)
    # Si A no tiene filas o columnas, ya esta escalonada
    f, c = A.shape
    if f == 0 or c == 0:
        return A
    # buscamos primer elemento no nulo de la primera columna
    i = 0
    while i < f and A[i,0] == 0:
        i += 1
    if i == f:
        # si todos los elementos de la primera columna son ceros
        # escalonamos filas desde la segunda columna
        B = escalonar_filas(A[:,1:])
        # y volvemos a agregar la primera columna de zeros
        return np.block([A[:,:1], B])
    # intercambiamos filas i <-> 0, pues el primer cero aparece en la fila i
    if i > 0:
        A[[0,i],:] = A[[i,0],:]
    # PASO DE TRIANGULACION GAUSSIANA:
    # a las filas subsiguientes les restamos un multiplo de la primera
    A[1:,:] -= (A[0,:] / A[0,0]) * A[1:,0:1]
    # escalonamos desde la segunda fila y segunda columna en adelante
    B = escalonar_filas(A[1:,1:])
    # reconstruimos la matriz por bloques adosando a B la primera fila 
    # y la primera columna (de ceros)
    return np.block([ [A[:1,:]], [ A[1:,:1], B] ])

In [None]:
# Lo probamos:
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(A)
print('---------------')
print(row_echelon(A))

In [None]:
# OJO... puede hacer algunas operaciones de cambios de fila!
A = np.array([[1,2,3],[4,5,6],[7,8,9]])
A = A.astype(float)
print(A)
print(A[1:,0:1])

print((A[0,:] / A[0,0]) * A[1:,0:1])

print(A[1:,:])

A[1:,:] -= (A[0,:] / A[0,0]) * A[1:,0:1]

print(A)

In [None]:
# Otro ejemplo
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(A)
print(row_echelon(A))

In [None]:
# Y otro mas
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print(A)
print(row_echelon(A))

### Complejidad de la elimación gaussiana (row_echelon) experimentalmente

In [None]:
import time # Para tomar tiempos de operaciones

In [None]:
# Matrices con numeros aleatorios
A = np.random.rand(10,10)
print(A)

In [None]:
# Probamos para 100x100
A = np.random.rand(100,100)
start = time.time()
B = row_echelon(A)
end = time.time()
t1 = end - start
print(t1)

In [None]:
# Probamos para 200x200
A = np.random.rand(200,200)
start = time.time()
B = row_echelon(A)
end = time.time()
t2 = end - start
print(t2)

In [None]:
# Probamos para 300x300
A = np.random.rand(300,300)
start = time.time()
B = row_echelon(A)
end = time.time()
t3 = end - start
print(t3)

In [None]:
# Probamos para 400x400
A = np.random.rand(400,400)
start = time.time()
B = row_echelon(A)
end = time.time()
t4 = end - start
print(t4)

Ahora que tenemos la intuición, lo hacemos sistemáticamente:

In [None]:
import time
import numpy as np
def test_row_echelon(tamano_matrices: list, cantidad_repeticiones: int):
    tiempos_medios = []
    tiempos_desvios = []
    for N in tamano_matrices: # Vamos a iterar sobre distintos tamaños
        tiempos = []
        for _ in range(cantidad_repeticiones): # Como las matrices son al azar, repetimos varias veces para calcular promedio y desvio (variabilidad)
            A = np.random.rand(N,N)
            start = time.time()
            B = row_echelon(A)
            end = time.time()
            tiempos.append(end - start)
        tiempos_medios.append(np.mean(tiempos)) # Tiempo promedio
        tiempos_desvios.append(np.std(tiempos)) # Desvio en los tiempos
    return([tiempos_medios,tiempos_desvios])


In [None]:
tamanos_matrices = [2,5,10,20,50,100,200,500,1000] # Los buenos tests toman su tiempo: este tarda unos 4 minutos
cantidad_repeticiones = 30
tiempos_medios,tiempos_desvios = test_row_echelon(tamanos_matrices,cantidad_repeticiones)

In [None]:
import matplotlib.pyplot as plt # Graficamos los tiempos medios
plt.scatter(tamanos_matrices,tiempos_medios)

In [None]:
# Mejor aun con barras de error
plt.errorbar(tamanos_matrices, tiempos_medios, yerr=tiempos_desvios, fmt='o', capsize=5, ecolor='red', markerfacecolor='blue')

In [None]:
# Y en este caso, mejor aun con barras de escala logaritmica para comparar escalas
plt.errorbar(tamanos_matrices, tiempos_medios, yerr=tiempos_desvios, fmt='o', capsize=5, ecolor='red', markerfacecolor='blue')
plt.yscale('log')
plt.xscale('log')
# Esta linea muestra que el crecimiento del tiempo es aproximadamente cúbico em eñ tamaño de la matriz (para matrices grandes)
plt.plot(np.array([10**1,10**3]),np.array([10**1,10**3])**3/10**8) 