# Noen tips og tricks med NUMPY

Vi skal her gå gjennom noen kommandoer i Numpy som kan være nyttige i Prosjekt 2.

Når man regner med matriser og vektorer er det numpy arrays som gjelder. De er enkle å opprette og å sette av plass til, og regneoperasjoner kan gjøres på et relativt høyt nivå, dvs få programmeringslinjer. 
For eksempel er det sjelden vi trenger å lage for-løkker for å løpe gjennom alle indeksene i en matrise, det fins gjerne kommandoer som utfører den operasjonen vi trenger, for eksempel som å multiplisere matriser.
Det gjelder bare å vite om hva slags kommandoer man skal bruke. Vi begynner enkelt med noe som de aller fleste sikkert kjenner godt til allerede, og illustrerer alt gjennom eksempler

In [1]:
import numpy as np

# Lag en gitt vektor med 3 komponenter
v = np.array([1,2,3])
print('v=',v,'\n')

# Så lager vi en 3x3-matrise A
A = np.array([[1,2,3],[2,3,4],[3,4,5]])
print('A=\n',A)
# La oss også lage en matrise B 
B = np.array([[1,1,1],[1,-1,1],[1,-1,-1]])
print('\nB=\n',B)


v= [1 2 3] 

A=
 [[1 2 3]
 [2 3 4]
 [3 4 5]]

B=
 [[ 1  1  1]
 [ 1 -1  1]
 [ 1 -1 -1]]


Vi kan gange sammen matrise med vektor, og matrise med matrise ved å bruke @ (vanlig matrise-multiplikasjon)

In [9]:
w=A @ v
print(w,'\n')

C = A @ B
print(C)

[14 20 26] 

[[ 6 -4  0]
 [ 9 -5  1]
 [12 -6  2]]


Vi kan også beregne elementvis produkt av matriser eller vektorer, det såkalte Hadamard-produktet $A\odot B$

In [15]:
AB = A*B
print(AB,'\n')

# Det samme kunne vært gjort med np.multiply som er ekvivalent
print(np.multiply(A,B))

[[ 1  2  3]
 [ 2 -3  4]
 [ 3 -4 -5]] 

[[ 1  2  3]
 [ 2 -3  4]
 [ 3 -4 -5]]


Det samme prinsippet gjelder med divisjon, både / og np.divide skal fungere, men pass på at det med $A/B$ ikke fins 0-elementer i $B$.

**Sette av plass til matriser.** I prosjektet skal vi bruke samlinger av matriser for eksempel $W_k,\ k=0,\ldots,K$ som alle har dimensjon $d\times d$. En måte å gjøre dette på er å definere et 3-dimensjonalt numpy-array, det vil si et array med tre indekser. Den første kan være for $k$, og de to andre for matrise-elementene i matrise nr $k$. Vi må allokere plass i minnet til dette numpy-arrayet, og det kan gjøres på flere måter. En måte er å lage et array $W$ som vi fyller initialiserer med nuller. Da er np.zeros en hendig funksjon. La oss prøve et lite eksempel med et array av typen $K \times d \times d$ der vi prøver $K=3$, $d=2$.

In [18]:
K = 3
d = 2
W = np.zeros( (K,d,d) )
# vi skriver først ut dimensjonen til W
print('W sin dimensjon:',W.shape,'\n')
# så skriver vi ut W selv
print('W=',W)

W sin dimensjon: (3, 2, 2) 

W= [[[0. 0.]
  [0. 0.]]

 [[0. 0.]
  [0. 0.]]

 [[0. 0.]
  [0. 0.]]]


Vi kan også fylle ut W med tilfeldige verdier slik vi skal gjøre i prosjektet, for eksempel etter normalfordeling

In [23]:
K = 3
d = 2
W = np.random.randn(K,d,d)
print(W)

[[[-0.68260625 -0.2864547 ]
  [ 0.12497256  0.05194185]]

 [[ 0.35675829 -1.48941953]
  [ 0.91744306 -1.37345701]]

 [[ 1.45279505 -0.56885206]
  [ 0.42048682  2.05447151]]]


Merk forskjellen i syntaks på np.zeros og np.random.randn. Den første krever at dimensjonene står inne i en egen parentes, dvs np.zeros( (K,d,d) ), mens dette trengs ikke for np.random.rand(K,d,d).

Typisk vil vi få bruk for å hente ut $W_k$ for en gitt $k$, kanskje fordi vi trenger å multiplisere den med, tja, la oss si en 2-vektor. Det er heldigvis enkelt. Nedenfor henter vi ut $W_0$ og multipliserer den med $x=[1,1]^T$

In [44]:
x=np.array([1,1])
k=0
print(W[k,:,:],'\n')
print(W[k,:,:] @ x)

[[-0.68260625 -0.2864547 ]
 [ 0.12497256  0.05194185]] 

[-0.96906096  0.17691441]


Når vi setter inn : for en indeks så betyr det at denne indeksen løper over alle verdier, så W[0,:,:] gir ut hele matrisen $W_0$.


**Ferdigdefinerte funksjoner i numpy - matriser som input**. De fleste elementære funksjoner du kan tenke deg, slik som $e^x$, $\sin x$, $\cos x$, $\tan x$, $\sinh x$ osv fins i numpy-biblioteket og kan kalles uten videre. En annen veldig nyttig egenskap ved disse er at du kan kalle dem med matriser og vektorer som input. Da fungerer de rett og slett ved at funksjonen anvendes på hvert element i matrisen/vektoren og det returneres en tilsvarende matrise. La oss teste et eksempel (og merk deg samtidig at også tallet $\pi$ fins i numpy, som np.pi.

In [34]:
A = np.array([[np.pi,np.pi/2],[np.pi/3,np.pi/6]])
print('A=',A,'\n')
sinA = np.sin(A)
print('sin(A)=',sinA,'\n')
tanhA = np.tanh(A)
print('tanh(A)=',tanhA)

A= [[3.14159265 1.57079633]
 [1.04719755 0.52359878]] 

sin(A)= [[1.22464680e-16 1.00000000e+00]
 [8.66025404e-01 5.00000000e-01]] 

tanh(A)= [[0.99627208 0.91715234]
 [0.78071444 0.48047278]]


**Relevante numpy-funksjoner for Prosjekt 2.**
Vi tror at følgende funksjoner kan være nyttige å vite om
* [numpy.transpose](https://docs.scipy.org/doc/numpy-1.17.0/reference/generated/numpy.transpose.html "transpose of matrix")
* [numpy.outer](https://docs.scipy.org/doc/numpy-1.17.0/reference/generated/numpy.outer.html?highlight=outer#numpy.outer "outer product")
* [numpy.random.randn](https://numpy.org/devdocs/reference/random/generated/numpy.random.randn.html "normal distribution")
* [numpy.linalg.norm](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.norm.html "norm")
* [numpy.zeros](https://docs.scipy.org/doc/numpy/reference/generated/numpy.zeros.html "fill with zeros")
* [numpy.ones](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ones.html "fill with ones")
* [numpy.tanh](https://docs.scipy.org/doc/numpy/reference/generated/numpy.tanh.html "tanh function")

Utover dette så kan det være greit å vite litt om plottefunksjoner i matplotlib, men dette får vi heller komme tilbake til.