#  Numpy

Numpy (Numeric Python) es importante porque es la librería sobre la que se construye Pandas (Sin embargo, puede ser menos intuitiva ya que da a los datos un tratamiento matricial más que de base de datos). 

Es importante saber al menos un poco de numpy porque:
- Varias aplicaciones de machine  learning se hacen puramente en numpy (como Deep Learning, o aplicaciones en computer vision).  Esto se debe a que: 
    - Es muy, muy rápido y eficiente haciendo cálculos. 
    - Provee un vector multidimensional de alto rendimiento (high performance multidimensional array). 
    
Numpy puede asemejarse a las listas, pero tiene mucho mejor almacenamiento y mayor alcance en cuanto a hacer operaciones. 

Numpy se especializa  en trabajar tipos de datos numéricos. 

## Importando numpy

In [None]:
import numpy as np

### Creando arrays

Numpy tiene la facilidad de crear arrays multidimensionales. Por ejemplo: 

In [None]:
mat_1d = np.array([1,2,3]) ## array  de 1-dimensión. 

mat_2d = np.array([[1,2,3],
                  [2,3,4]]) ## array  de 2-dimensiones. 

mat_3d = np.array([
    [
        [1,2,3], [4,5,6]
    ],
                   [
                       [7, 8, 9], [10, 11, 12]
                   ]
]
) ## array  de 3-dimensiones. 

In [None]:
mat_1d

In [None]:
print(mat_2d.shape)
print(mat_2d.ndim)
print(mat_2d.size)  


mat_2d

In [None]:
print(mat_3d.shape)
print(mat_3d.ndim)
print(mat_3d.size)

mat_3d

In [None]:
print(mat_1d.shape) ## Tamaño de cada una de las dimensiones
print(mat_1d.ndim) ## Número de dimensiones
print(mat_1d.size) ## Tamaño total

print(mat_2d.shape)
print(mat_2d.ndim)
print(mat_2d.size)  


print(mat_3d.shape)
print(mat_3d.ndim)
print(mat_3d.size) 

In [None]:
# De: Data science handbook, by JVDP
np.random.seed(2
              )  # seed for reproducibility

x1 = np.random.randint(10, size = 6)

In [None]:
x1

In [None]:
x2 = np.random.randint(10, size=(3, 4))  # Two-dimensional array
x2

In [None]:
x3 = np.random.randint(10, size = (3, 4, 5))  # Three-dimensional array
x3

### Cómo crear matrices como "placeholders" (o que serán llenadas/modificadas luego)

In [None]:
np.zeros((3,4,2)) ## np.zeros crea  una matriz de ceros

In [None]:
np.ones((2,3,4),dtype=np.int16) ## np.ones crea a una matriz de unos

In [None]:
d = np.arange(1,25,2) ## Crea un array con secuencia aritmética uniforme
d

In [None]:
np.arange(1,11) ## Crea un array con secuencia aritmética uniforme , 1-1-1

In [None]:
np.linspace(0,3,15) ## Crea un array con valores del 0 al 2, tal  que hayan 25  valores. 

In [None]:
e = np.full((2,2,2),10)
e ## Crea un array constante

In [None]:
np.eye(4) ## Crea una matrix identidad de n*n

In [None]:
 np.random.random((3,2)) # Crea array aleatorio con valores que siguen dist. normal

In [None]:
np.empty((3,2))  ### Pendiente hasta ahora 12 de enero 2024

### Seleccionando, Indexando y Rebanando un array

In [None]:
mat_1d

In [None]:
mat_1d[0]

In [None]:
mat_2d

In [None]:
mat_2d[1][0]

In [None]:
mat_2d[1,1:]

In [None]:
mat_3d

In [None]:
mat_3d[1,1,2]

In [None]:
mat_3d[1][1][2]

### - Indexación elegante (fancy indexing):
Numpy permite opciones mucho más amplias de indexar que trascienden a las de las listas. Consideremos el siguiente array



In [None]:
ejm_a = np.array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [None]:
ejm_a[[0, 4, 7]]

In [None]:
ejm_a[np.array([[0, 4, 7], [1, 2, 3]])]

In [None]:
b = np.array([(1,2,3), (4,5,6)], dtype = float)
b

In [None]:
b[[1, 0, 1, 0]]

In [None]:
b[[1, 0, 1, 0],[0, 1, 2, 0]]

In [None]:
#b[[1, 0, 1, 0]][:,[0,1,2,0]]

### Agregaciones

In [None]:
mat_2d_n = np.array([[1,2,3], [4,5,6], [7,8,9]])
mat_2d_n

In [None]:
mat_2d_n.sum() ### Suma de todo el array

In [None]:
mat_2d_n.mean() ### Resta de todo el array

In [None]:
mat_2d_n.mean(axis = 1) ## Calcula promedio de las filas

In [None]:
mat_2d_n.mean(axis = 0)  ## Calcula promedio de las columnas

### Operaciones con matrices

In [None]:
a = np.arange(0,12).reshape(3,4)
a

In [None]:
a.T

In [None]:
b = (np.arange(0,12) * 2).reshape(3,4)
b

In [None]:
a + b

In [None]:
a * b #### ESTA NO ES LA FORMA DE MULTIPLICACION MATRICIAL COMO APRENDEMOS EN MATE!! 

In [None]:
a

In [None]:
a 4*3
b 3*5

c 4*5


In [None]:
a = (np.arange(0,12)*1).reshape(4,3)
c = (np.arange(0,15)).reshape(3,5)


np.dot(a,c)

In [None]:
#### ESTA ES: 

np.dot(a,c)

In [None]:
c.T ## Trasponer un array

In [None]:
c = np.linalg.inv(np.eye(4))
c

In [None]:
## Cargando data
iris = np.loadtxt("iris.csv", skiprows=1, delimiter=",") 

In [None]:
import pandas as pd
df_iris = pd.read_csv("iris.csv")
X, y = iris[:, 0:4], iris[:, 4
                         ]

![image.png](attachment:image.png)

In [None]:
xtx = np.dot(X.T, X)

xt_x_1 = np.linalg.inv(xtx)


In [None]:
xty = np.dot(X.T, y)

In [None]:
xt_x_1

In [None]:
xty

In [None]:
beta = np.dot(xt_x_1, xty)

In [None]:
y

In [None]:
y - yhat

Fuentes de esta  sesión:

- Numpy cheatsheet de DataCamp:  https://datacamp-community-prod.s3.amazonaws.com/e9f83f72-a81b-42c7-af44-4e35b48b20b7
- Data science handbook by Jake Van der Plas https://jakevdp.github.io/PythonDataScienceHandbook/02.02-the-basics-of-numpy-arrays.html