# Numpy

Dur a terme operacions matemàtiques en Python és complicat, com podem simplificar-ho i operar amb vectors o inclús matrius? 

La resposta és la llibreria **Numpy**.

In [None]:
import numpy as np

Tornem a l'exemple anterior, com calcular $z = x + y$ on $x=(1, 2, 3), y=(2, 3, 4)$?

In [None]:
# Necessitem convertir les llistes de python a elements de numpy
x = [1, 2, 3]
y = [2, 3, 4]

x = np.array(x)
y = np.asarray(y)

# Inspeccionem que és ara x
x

In [None]:
# A partir d'ara, podem operar amb aquestes "x" i "y" com si fossin vectors matemàtics

z = x + y
z

## 1. Vectors i matrius (arrays i arrays ndimensionals)

Existeixen diferents formes de crear elements en numpy:
    
* Vectors a partir de llistes de python
* Vectors directament des de numpy
* Matrius a partir de llistes de llistes
* Matrius amb numpy

In [None]:
# Abans hem vist la creació a partir d'una llista de python
# _Les dues són equivalents_
vector = np.asarray([1, 2, 3])
vector = np.array([1, 2, 3])
print(vector)

# També es pot crear directament vectors de 0's o 1's
# Per exemple, un vector de 8 0's
zeros = np.zeros(8)
print(zeros)

# Un vector de 5 0's
ones = np.ones(5)*7
print(ones)

Fixa't que per defecte numpy crea vectors de tipus `float` quan es fa servir `ones` o `zeros`, amb la quantitat que li indiquem.

D'altra banda, si li donem una llista de python, infereix el tipus d'aquesta. Per exemple, abans la llista contenia enters, i per tant ha utilitzat el tipus `int`.

Que passaria en aquest cas?

In [None]:
np.asarray([1, 2.0])

Si hi ha tipus barrejats, com ara `int` i `float`, numpy escull sempre el tipus flotant. Podem, però, indicar un tipus diferent:

In [None]:
print('Per defecte')
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256]))

print('\nFlotants')
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=float))
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=np.float32))
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=np.float64))

print('\nEnters')
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=int))
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=np.int32))
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=np.uint32))
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=np.int8))
print(np.asarray([1.0, 2.5, 3.6, 256, -1, -256], dtype=np.uint8))

In [None]:
# En qualsevol moment podem canviar el tipus també
vector = np.asarray([1.0, 2.0, 3.0])
print(vector)
print(vector.dtype)
vector = vector.astype(np.int)
print(vector)
print(vector.dtype)

També podem crear matrius:

In [None]:
np.ones((3, 4))

In [None]:
np.zeros((2, 7))

In [None]:
np.asarray([
    [1, 2, 3, 4],
    [10, 20, 30, 40],
    [100, 200, 300, 400]
])

I podem crear matrius a partir de les dimensions d'una altra matriu

In [None]:
matriu_1 = np.ones((5, 4)) # Creem una matriu 5x4
print(matriu_1.shape)

In [None]:
matriu_2 = np.zeros_like(matriu_1) # Creem la matriu_2 a partir de la forma de la 1
print(matriu_2.shape)

També podem manipular la forma

In [None]:
mat = np.ones((3, 6))
print(mat.shape)
mat = mat.reshape((6, 3))
print(mat.shape)
mat = mat.reshape((2,3,3))
print(mat.shape)

## 2. Operacions sobre vectors i matrius

Com amb les llistes, podem fer operacions de reducció sobre vectors o matrius

In [None]:
vector = np.asarray([1, 2, 3, 4])

# És equivalent np.sum(x) i x.sum()
print("Sum")
print(np.sum(vector))
print(vector.sum())

print("\nMax")
print(np.max(vector))
print(vector.max())

print("\nMin")
print(np.min(vector))
print(vector.min())

print("\nProd")
print(np.prod(vector))
print(vector.prod())

En el cas de les matrius, les operacions actuen de forma global per defecte, però se'ls hi pot indicar sobre quina dimensió efectuar l'operació:

* **Columnes**: dimensió 0
* **Files**: dimensió 1

In [None]:
# Fem una matriu 3x4
matriu = np.asarray([[1, 2, 3, 4], [10, 20, 30, 40], [100, 200, 300, 400]])

print("Sum")
print(matriu.sum())
print(matriu.sum(axis=0))
print(matriu.sum(axis=1))

# Anàlogament per la resta de les operacions

**Atenció**: Eviteu fer servir les funcions de `python` pures!

```python
# sum(matriu)
#    vs
np.sum(matriu) # O matriu.sum()
```

Sempre tenim l'equivalent en Numpy de tot:

In [None]:
np.abs(matriu) # enlloc de abs(matriu)

## 3. Indexació

Com en Python, fent servir Numpy podem accedir a elements en particular d'un vector o matriu

In [None]:
llista = [1, 2, 3]
llista[-2] = 3
llista


In [None]:
vector

In [None]:
print(vector[0])
print(vector[3])
print(vector[-1])
print(vector[1:3])

In [None]:
matriu

In [None]:
# Un element en concret
print(matriu[0, 0]) # Fila 0, Columna 0
print(matriu[0, 1]) # Fila 0, Columna 1
print(matriu[1, 2]) # Fila 1, Columna 2
print(matriu[2, 3]) # Fila 2, Columna 3

# Rangs de files i/o columnes
print()
print(matriu[0:2, 0]) # Files 0 i 1, Columna 0
print(matriu[1, 1:3]) # Fila 1, Columnes 1 i 2
print(matriu[0:2, 1:3]) # Fila 0 i 1, Columna 1 i 2

# Quina diferència hi ha?
print()
print(matriu[1, 0:2])   # Fila 1, Columnes 0 i 1
print(matriu[1:2, 0:2]) # Fila 1, Columnes 0 i 1

# Seleccions d'elements múltiples
print()
print(matriu[[1, 2], [0, 2]]) # Element a (1, 0) i a (2, 2)

print(matriu[[(1, 2), (0, 2)]])

## 4. NUMPY FA VISTES, NO CÒPIES!

In [None]:
matriu = np.asarray([[1, 2, 3, 4], [10, 20, 30, 40], [100, 200, 300, 400]])
submatriu = matriu[1:3, 1:3]
submatriu

In [None]:
submatriu[1, 1] = 0

In [None]:
matriu

També podem fer còpies si volem

In [None]:
matriu = np.asarray([[1, 2, 3, 4], [10, 20, 30, 40], [100, 200, 300, 400]])
submatriu = matriu[1:3, 1:3]
submatriu = submatriu.copy()
submatriu[1, 1] = 0
matriu

## 5. Indexació booleana

Suposa que volem sobreescriure tots els elements negatius d'una matriu per 0, ho podem aconseguir amb indexació booleana

In [None]:
exemple = np.random.uniform(-1, 1, size=(3, 4))
exemple

In [None]:
# 1. Trobem els elements negatius
negatius = exemple < 0
negatius

Ara, podem fer servir aquesta matriu `negatius` com a índexs. Numpy "seleccionarà" únicament aquelles posicions on hi hagi un `True`

In [None]:
exemple[negatius]

I, com que Numpy no fa còpies, podem directament canviar els valors d'aquests elements

In [None]:
exemple[exemple < 0] = 0
exemple

## 6. Operacions element a element

Es diu que les operacions estan "vectoritzades", és a dir que actuen per a cada element de l'array (i de forma ràpida)

In [None]:
vector + 1

In [None]:
vector * 2

In [None]:
vector ** 2

In [None]:
vector + vector

In [None]:
vector * vector

I per matrius:

In [None]:
matriu + 1

In [None]:
matriu * 2

In [None]:
matriu ** 2

In [None]:
matriu + matriu

In [None]:
matriu * matriu

**Nota**: Quan treballem amb matrius l'operador * actua per cada element, no és la multiplicació matricial, aquesta es pot fer de dues formes (equivalents)

In [None]:
matriu.T

In [None]:
np.dot(matriu, matriu.T)

In [None]:
matriu @ matriu.T

In [None]:
# On `matriu.T` indica la transposada de la matriu:
matriu.T

In [None]:
matriu.shape

In [None]:
matriu.T[0, 0] = 3333

In [None]:
matriu

## 7. Difusió de regles (broadcasting)

Abans hem vist l'ús bàsic de la difusió de regles, actuar element a element, però numpy permet fer operacions molt més avançades.

Per exemple, per fer una operació a cada columna (o fila) no és necessari (i MAI s'hauria de fer) un bucle.

In [None]:
matriu = np.random.uniform(size=(3, 4))
matriu

Volem fer una operació que consisteix a **normalitzar** la matriu per columnes, per tal que la suma de la columna sigui 1.

**Com NO fer-ho:** Obtenim primer la suma de les columnes, bucle per cada columna i dividim

In [None]:
sumes = matriu.sum(axis=0)
sumes

In [None]:
matriu = np.random.uniform(size=(3, 4))
sumes = matriu.sum(axis=0)

for j in range(matriu.shape[1]): # Shape retorna (nº files, nº columnes)
    matriu[:, j] = matriu[:, j] / sumes[j]
    
matriu

In [None]:
matriu.sum(axis=0)

**Com SÍ fer-ho:** Obtenim la suma per columnes i dividir directament
    
Farem la divisió d'una matriu $(3, 4)$ amb un vector de $4$ elements

In [None]:
matriu.shape, sumes.shape

In [None]:
matriu = np.random.uniform(size=(3, 4))
sumes = matriu.sum(axis=0)
norm = matriu / sumes
norm

In [None]:
norm.sum(axis=0)

#### I per files?

Numpy fa la difusió per columnes sempre, mai per files, pel que si intentem fer l'operació de divisió entre una matriu $(3, 4)$ i un vector de $3$ elements, fallarà:

In [None]:
matriu = np.random.uniform(size=(3, 4))
sumes = matriu.sum(axis=1)
norm = matriu / sumes
norm

La solució (1)? Transposem la matriu per tenir-la $(3, 4)$, operem i transposem de nou

In [None]:
norm = (matriu.T / sumes).T
norm

In [None]:
norm.sum(axis=1)

La solució (2)? Canviar la forma del vector de $(3)$ a $(3, 1)$. D'aquesta manera estem fent una operació entre dues matrius, una $(3, 4)$ i una $(3, 1)$: numpy el que farà és a cada columna de la matriu (la dimensió que no quadra), aplicar l'operació que li demanem amb tota la columna de les sumes.

In [None]:
sumes.reshape((3,1))

In [None]:
norm = matriu / sumes.reshape((3, 1))
norm

In [None]:
norm.sum(axis=1)

## 8. Not-a-Number (NaN)

NaN és un valor especial que serveix per indicar la falta de dades. Segons el tipus de dades, no sempre podem fer servir un valor per defecte. Per exemple, si deixem que l'usuari introdueixi **opcionalment** una valoració numèrica, de valor lliure, no podem fer servir 0 (o qualsevol altre nombre) per indicar que no ha introduït res.

In [None]:
np.nan

NaN, però, té alguns trucs:

In [None]:
a = np.nan
a == np.nan, np.isnan(a)

In [None]:
vector = np.asarray([np.nan, 2, np.nan, 3])
vector

In [None]:
vector[0] == np.nan

In [None]:
np.isnan(vector[0])

In [None]:
np.isnan(vector)

Exercici: Posar a 0 tots els nans, sense modificar el vector original

In [None]:
np.isnan(vector)

In [None]:
vector2 = vector.copy()
# AQUÍ EL TEU CODI
vector2 = ...

# Exercicis

**Exercici 1:** La següent funció retorna el següent càlcul element a element pel vector o matriu d'entrada,

$$\begin{equation} x^2+2x+1 \end{equation}$$

In [None]:
def calcular(x):
    """
    Calcula, per cada element de `x` de forma individual, la funció
    x^2+2x+1
    
    *NO* es poden fer servir bucles ni list-comprehensions
    
    :param x: np.array amb els elemnts a calcular
    :return: np.array amb el càlcul fet
    """
    # AQUÍ EL TEU CODI
    raise NotImplementedError

In [None]:
print(calcular(np.random.random((2, 2))))

**Exercici 2:** Una altra forma de normalitzar vectors és fer que la seva mitja sigui 0 i la seva desviació estàndard sigui 1. Donat un vector $x$, el vector normalitzat $\bar{x}$ es calcula

$$\bar{x} = \frac{x - \mu_x}{\sigma_x}$$

On $\mu_x$ és la mitja i $\sigma_x$ la desviació estandard

In [None]:
def normalitzar(x):
    """
    Normalitza el vector d'entrada `x` segons la definició
    anterior.
    
    *NO* es poden fer servir bucles ni list-comprehensions
    
    :param x: np.array en forma de vector (unidimensional)
    :return: np.array en forma de vector (unidimensional)
    """
    # AQUÍ EL TEU CODI
    raise NotImplementedError

In [None]:
print(normalitzar(np.random.random(5)))

In [None]:
def normalitzar_matriu_per_columnes(x):
    """
    Normalitza, segons la definició d'abans, les columnes de la
    matriu de forma independent (cada columna es normalitza per la seva
    pròpia mitja i desviació estàndard)
    
    *NO* es poden fer servir bucles ni list-comprehensions
    
    :param x: np.array en forma matricial (bidimensional)
    :return: np.array en forma matricial (bidimensional)
    """
    # AQUÍ EL TEU CODI
    raise NotImplementedError

In [None]:
norm_matrix = normalitzar_matriu_per_columnes(np.random.random((5, 5)))

print(norm_matrix)

print(np.sum(norm_matrix, axis = 0))

In [None]:
def normalitzar_matriu_per_files(x):
    """
    Normalitza, segons la definició d'abans, les files de la
    matriu de forma independent (cada fila es normalitza per la seva
    pròpia mitja i desviació estàndard)
    
    *NO* es poden fer servir bucles ni list-comprehensions
    
    :param x: np.array en forma matricial (bidimensional)
    :return: np.array en forma matricial (bidimensional)
    """
    
    # AQUÍ EL TEU CODI
    raise NotImplementedError

In [None]:
norm_matrix = normalitzar_matriu_per_files(np.random.random((5, 5)))
print(norm_matrix)
print(np.sum(norm_matrix, axis = 1))

**Exercici 3:** Calcula la mitja del vector d'entrada, però qualsevol element NaN ha de ser tractat com si fos un 0.

In [None]:
def calcular_mitja(x):
    """
    Calcula la mitja del vector d'entrada `x`, però qualsevol element
    NaN ha de ser tractat com si fos un 0. NO es pot modificar el
    vector original que es passa per paràmetre
    
    *NO* es poden fer servir bucles ni list-comprehensions
    
    :param x: np.array en forma vectorial (unidimensional)
    :return: float amb la mitja
    """
    # AQUÍ EL TEU CODI
    raise NotImplementedError

In [None]:
vec = np.random.random(5)
vec[np.random.randint(0, 5)] = np.nan
print(calcular_mitja(vec))