# Introducció a NumPy

Creació manipulació de càlculs vectors i matrius

In [None]:
import numpy as np

## Ndarray (N-dimensional array)

In [None]:
llista1 = [1, 2, 3, 4]
array1 = np.array(llista1)
print(llista1)
print(array1)

In [None]:
llista2 = [[1, 2, 3], [4, 5, 6.0]]
array2 = np.array(llista2)
print(llista2)
print(array2)

L'objecte que es crea és de tipus `np.ndarray` i no `np.array`

In [None]:
type(array1)

També es poden crear `ndarrays` amb: `np.zeros` i `np.ones`,

In [None]:
(
    np.zeros((3, 3)),
    np.ones(15),
)

amb `np.arange(inici, final*, pas)` -  final no inclòs, decimals permesos
crea un array generant números amb float entre un interval

In [None]:
np.arange(20)

In [None]:
np.arange(1, 30, 4)

In [None]:
np.arange(1, 10, 0.7)

![array.png](attachment:d310bdf3-cded-47bf-9366-67a38829aa72.png)

`np.linspace(inici, final, num elements)` final inclòs,
crea un array amb un numero de elements exacte amb valors entre un interval

In [None]:
np.linspace(1, 10, 15)

Es pot canviar la forma d'un array amb `.reshape()`

In [None]:
np.linspace(1, 10, 15).reshape((3, 5))

In [None]:
np.linspace(1, 10, 15).reshape((5, 3))

## Propietats

In [None]:
# dimensió
print(array1.ndim, array2.ndim)

# forma
print(array1.shape, array2.shape)

# nombre d'elements
print(array1.size, array2.size)

## no és el mateix que len(), que dona només la primera dimensió
print(len(array1), len(array2))

# tipus de dades
print(array1.dtype, array2.dtype)

# canviar el tipus de dades
print(array1.astype(float))

S'accedeix als elements, o es fa `slicing` 
de la mateixa manera que per llistes de python, però també **amb comes entre dimensions**

In [None]:
array2[1][1], array2[1, 1]

In [None]:
np.arange(100).reshape((10, 5, 2))[::2, 2::-1]

A més NumPy permet indexar una mateixa dimensió diverses vegades a partir d'una llista o array

In [None]:
np.arange(10)[[1, 1, 1, 3, 5]]

In [None]:
np.arange(10)[np.array([1, 1, 1, 3, 5])]

## Molt bé, però per què ens interessa?

Fent servir llistes de python, fer operacions és feixuc, numpy ho facilita molt.

Per exemple, suposem que volem sumar dos vectors. Com ho faríeu?

In [None]:
v1 = [8, 8, 9]
v2 = [1, 3, 2]

I dues matrius?

In [None]:
m1 = [[8, 8, 9], [7, 2, 3], [2, 2, 3]]
m2 = [[1, 3, 2], [0, 9, 8], [7, 3, 5]]

Amb numpy, podem fer servir les operacions estàndard com si féssim àlgebra.

Les operacions es fan element a element.

In [None]:
v1 = np.array(v1)
v2 = np.array(v2)
m1 = np.array(m1)
m2 = np.array(m2)

In [None]:
print(1 + v1)
print(3 * v1)
print(v1 + v2)
print(v1 * v2)

In [None]:
print(m1 - 10)
print(m1 / 1.2)
print(m1**2)
print(m1 + m2)

També hi ha operacions unitàries

In [None]:
m1.sum(), m1.min(), m1.max()

## Bucles

Si volem iterar sobre els elements d'un array ho farem per dimensions

In [None]:
for fila in m1:
    print(fila)

In [None]:
for fila in m1:
    for element in fila:
        print(element)

Podem iterar directament sobre els elements **aplanant** l'array

In [None]:
for element in m1.flatten():
    print(element)

## Arrays booleans

Podem crear arrays amb valors booleans a partir dels operadors `==`, `<`, `>`, etc.

In [None]:
np.array([2, 4, 6, 8]) < 5

In [None]:
a = np.array([2, 4, 6, 8])
mask = a < 5
a[mask]

In [None]:
a[a > 5]

## Canviar valors

Es poden canviar els valors un per un

In [None]:
m1 = np.zeros((4, 4))
m1[1, 2] = 10
m1

Però també podem canviar diversos valors de cop

In [None]:
m1[0] = 1
m1[0, :] = 1  # equivalent

m1[:, 1] = 11

m1

O fent servir un array booleà

In [None]:
m2 = np.random.random((5, 5))
m2[m2 > 0.5] = 1
m2

Altres maneres de modificar un array són:

TODO: explicar

| Operator | Description |
|:---- |:---- |
| **`np.append(a,b)`**               | **Append items to array** |
| **`np.insert(array, 1, 2, axis)`** | **Insert items into array at axis 0 or 1** |
| **`np.delete(array,1,axis)`**      | **Deletes items from array** |

| Operator | Description |
|:---- |:---- |
| **`np.concatenate((a,b),axis=0)`** | **Split an array into multiple sub-arrays.** |
| **`np.vstack((a,b))`**             | **Split an array in sub-arrays of (nearly) identical size** |
| **`np.hstack((a,b))`**             | **Split the array horizontally at 3rd index** |

### Exercici

In [None]:
# Genera la matriu:

###    1  2  3  4  5
###    6  7  8  9 10
###   11 12 13 14 15
###   16 17 18 19 20
###   21 22 23 24 25
###   26 27 28 29 30

# Accedeix a
###  11 12
###  16 17

# Accedeix a
###    1
###       7
###         13
###            19
###               25

# Accedeix a
###            4  5


###            24 25
###            29 30

#### Solució

In [None]:
arr = np.arange(1, 31).reshape(6, 5)

print(arr[2:4, :2])
print()
print(arr[np.arange(5), np.arange(5)])
print()
print(arr[[0, 4, 5], -2:])

## Matemàtiques

NumPy té les funcions matemàtiques més comuns:

- **`np.add(x,y)`**        
- **`np.substract(x,y)`**  
- **`np.divide(x,y)`**     
- **`np.multiply(x,y)`**   
- **`np.sqrt(x)`**         
- **`np.sin(x)`**          
- **`np.cos(x)`**          
- **`np.log(x)`**          
- **`np.dot(x,y)`**        

I també per estadística bàsica:

| Operator | Description |
|:---- |:---- |
| **`np.mean(array)`**   | **Mitjana** |
| **`np.median(array)`** | **Mediana** |
| **`array.corrcoef()`** | **Coeficient de Correlació** |
| **`np.std(array)`**    | **Desviació Estàndard** |

Per més funcions vegeu el paquet SciPy

## Incís: funcions i mutabilitat

Compara les següents cel·les, què hi passa?

In [None]:
def concat_i(s):
    s += " i"


s = "en Pol"
concat_i(s)
s

In [None]:
def suma_1(x):
    x += 1


x_int = 2
suma_1(x_int)
x_int

- Els arrays de NumPy són mutables
- Quan fem slicing, per defecte obtenim una `view`, no una còpia

In [None]:
arr = np.array([1, 2, 3, 4]).astype(float)


def normalize(x):
    x /= np.sum(x)


normalize(arr)
arr

In [None]:
# Comparem una llista i un array
llista = [1, 2, 3, 4]
arr = np.array(llista)

# Fem el mateix tall
slice_llista = llista[1:-1]
slice_arr = arr[1:-1]

# I canviem un índex
slice_llista[0] = 9
slice_arr[0] = 9

# Mirem els originals
print(llista)
print(arr)

## *Còpies

NumPy facilita una mica el problema de les còpies i còpies profundes.
Si tenim una matriu del mateix tipus de dades `.copy()` és suficient per fer una còpia.

In [None]:
a = np.zeros((2, 3))
b = a.copy()
a[0][0] = 3
a, b, id(a) == id(b)

Per tant, si volem copiar un slice podem fer:

In [None]:
llista = [1, 2, 3, 4]
arr = np.array(llista)

slice_arr = arr[1:-1].copy()
slice_arr[0] = 9

arr, slice_arr

Però cal tenir en compte que podem tenir arrays amb estructures més complexes, on caldrà `deepcopy`

In [None]:
a = np.array([1, "m", [2, 3, 4]], dtype=object)
b = a.copy()
b[2][0] = 10
a

In [None]:
from copy import deepcopy

a = np.array([1, "m", [2, 3, 4]], dtype=object)
b = deepcopy(a)
b[2][0] = 10
a