### NumPy i N-dimenzioni nizovi

Nizovi u Numpy-u su donekle slični listama, ali postoje važne razlike sa prednostima i manama. Za razliku od lista, nizovi u NumPy obično imaju isti tip podataka (dtype), obično brojeve (celi brojevi ili decimalni brojevi) i povremeno karaktere. Kod NumPy niza je veličina, oblik i tip fiksiran kada se kreira.

Zapamtite, možemo definisati listu:

L=[]

zatim joj dodavati po želji koristeći metodu L.append( ). Komplikovanije je (ali i dalje moguće) proširivati NumPy nizove.

Zašto koristiti NumPy nizove umesto listi? Nizovi su računarski efikasniji od listi, posebno za stvari poput matematičkih operacija s matricama. Možete izvršiti izračunavanja na celom nizu odjednom umesto prolaska kroz element po element, kao što je slučaj s listama.

Osim čitanja podataka iz datoteke pomoću NumPy-a, kao što smo radili u prošlom predavanju, postoji mnogo različitih načina kreiranja nizova. Evo nekoliko primera:

In [2]:
import numpy as np
#3x3 matrica
A= np.array([[1, 2, 3],[4,2,0],[1,1,2]])
print (A)

# primetite kako nema zareza u outputu

[[1 2 3]
 [4 2 0]
 [1 1 2]]


In [8]:
#1D niz
#Range() kreira listu sa integerima
B=list(range(10)) 
print ("Lista kreirana pomocu range': ",B)
#np.arange(start, end, step)
B_integers=np.arange(0,10,1) #arange( ) je np funkcija koja kreira niz integera
print ("Niz napravljen np.arange( ): ", B_integers)
B_real=np.arange(0,10,.2) #  i sa float
print ("Niz sa realnim brojevima \n",B_real) 

Lista kreirana pomocu range':  [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
Niz napravljen np.arange( ):  [0 1 2 3 4 5 6 7 8 9]
Niz sa realnim brojevima 
 [0.  0.2 0.4 0.6 0.8 1.  1.2 1.4 1.6 1.8 2.  2.2 2.4 2.6 2.8 3.  3.2 3.4
 3.6 3.8 4.  4.2 4.4 4.6 4.8 5.  5.2 5.4 5.6 5.8 6.  6.2 6.4 6.6 6.8 7.
 7.2 7.4 7.6 7.8 8.  8.2 8.4 8.6 8.8 9.  9.2 9.4 9.6 9.8]


In [5]:
D=np.zeros((2,3)) # Dimenzija je specificirana sa zapisom (tuple) brojeva za vrste i kolone 
print (D)

[[0. 0. 0.]
 [0. 0. 0.]]


In [6]:
E=np.ones((2,3))
print (E)

[[1. 1. 1.]
 [1. 1. 1.]]


In [7]:
print (E*42)

[[42. 42. 42.]
 [42. 42. 42.]]


In [10]:
#p.linspace(start,end,N)
F=np.linspace(0,10,14) # generise 14 brojeva od 0 do 10 ukljucujuci 0 i 10.
print  (F)
print (len(F))

[ 0.          0.76923077  1.53846154  2.30769231  3.07692308  3.84615385
  4.61538462  5.38461538  6.15384615  6.92307692  7.69230769  8.46153846
  9.23076923 10.        ]
14


In [11]:
#### ZAKLJUCAK #### PRAVITI RAZLIKU IZMEDJU RANGE(), np.arrange() i np.linspace()

In [14]:
print(np.arange(0,11,1))
print(np.arange(0.,11.,1))

print (np.arange(0,11,1,dtype='float')) #odredjujem i tip podataka u NumPy nizu
print (np.arange(0,11,1,dtype='int'))


[ 0  1  2  3  4  5  6  7  8  9 10]
[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
[ 0  1  2  3  4  5  6  7  8  9 10]


## OBJECT array u NumPy (kombinacija brojeva i karaktera) <br> Matematicke operacije se ne mogu obavljati nad njima

In [28]:
A=np.array([[0,1,2],[0,1,3],['3','NaN','NaN']],dtype='object')
print(A)

[[0 1 2]
 [0 1 3]
 ['3' 'NaN' 'NaN']]


In [30]:
#Sta se desava ako ne inicijalizujemo NumPy niz

In [33]:
G=np.ndarray(shape=(2,2), dtype=float) 
print  (G)   
#mali brojevi ali nisu tacno nula

[[4.67236161e-310 0.00000000e+000]
 [6.92799716e-310 6.92799793e-310]]


Kada kreirate numpy niz koristeći **np.ndarray**, inicijalizacija elemenata nije automatski postavljena na nule. Umesto toga, vrednosti elemenata mogu biti bilo koje vrednosti koje se nalaze u memoriji u trenutku kreiranja niza. Ako želite da inicijalizujete sve elemente niza na nule, možete koristiti np.zeros funkciju. 

In [34]:
np.zeros((2,2),dtype=float)

array([[0., 0.],
       [0., 0.]])

### Atributi NumPy niza

Kao i svi objekti u Python-u, NumPy nizovi imaju svoje atribute i metode. Atributi nemaju zagrade dok metodi imaju! <br>
Array.dtype govori o tipu podataka koji se nalazi u NumPy nizu.

### dtype

In [37]:
A=np.zeros((2,3))
print(A,A.dtype)

[[0. 0. 0.]
 [0. 0. 0.]] float64


In [40]:
A=np.ones((2,3),dtype='float32')
print(A,A.dtype)

[[1. 1. 1.]
 [1. 1. 1.]] float32


### ndim

Kao što već možda pretpostavljate, nizovi imaju i dimenzije i oblik. Dimenzije definišu broj osa, kao što je prikazano u ilustraciji ispod.

![image.png](attachment:5fcbb3be-bd76-44ba-a018-c241b82fce2d.png)

In [45]:
A= np.array([[1,2,3],[4,2,0],[1,1,2]]) 
print ("Dimenzije A matrice ",A.ndim)

Dimenzije A matrice  2


### shape

In [46]:
A.shape

(3, 3)

## Metodi kod NumPy niza

In [49]:
D=np.zeros((2,3))
print ('D: \n',D)
print ('\n')
print ('D posle append \n',np.append(D,[2,2,2]))

D: 
 [[0. 0. 0.]
 [0. 0. 0.]]


D posle append 
 [0. 0. 0. 0. 0. 0. 2. 2. 2.]


Primetite kako sada imamo **1-D niz**! Nije baš ono što ste očekivali, zar ne? Možemo se nositi s tim problemom restrukturiranjem niza (reshape), kako ćemo videti. Ali prvo, možete i konkatenacijom nizova proširiti svoj niz, što može biti jednostavniji način:

### concatenate()

In [54]:
E=np.ones((1,3))*2
print (np.concatenate((D,E)))

[[0. 0. 0.]
 [0. 0. 0.]
 [2. 2. 2.]]


### reshape()
Da biste rešili problem oblika (2D naspram 1D), možete preurediti 1D niz u 2D niz (**pod uslovom da je ukupan broj elemenata isti**). Da biste to uradili, koristimo metodu array.reshape():

In [64]:
# Mozemo uzeti 1D niz sa 50 elemenata i reshape ga npr u 5x10 2D
B=np.full(50,2) # a ako pravim matricu 2D np.full((n,m),clan niza) ili B=np.array(50*[2]) 
B2D=B.reshape((5,10))
print ('B \n',B)
print ('\n B posle reshape() \n',B2D)

B 
 [2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2]

 B posle reshape() 
 [[2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]]


In [66]:
D=np.zeros((2,3))
print ('D: \n',D)
print ('\n')
print ('D posle append \n',np.append(D,[2,2,2]).reshape(3,3))


D: 
 [[0. 0. 0.]
 [0. 0. 0.]]


D posle append 
 [[0. 0. 0.]
 [0. 0. 0.]
 [2. 2. 2.]]


### FLATTEN()

Možete ići i obrnutim putem, uzimanjem 2D (ili više) niza i pretvaranjem ga u jedan dug 1D niz koristeći funkciju **array.flatten()**.

In [68]:
B2D.flatten()

array([2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2])

### TRANSPOSE()

Još jedna izuzetno korisna metoda za nizove je **array.transpose()** [ekvivalentno array.T()], koja menja redove i kolone:

In [72]:
print ('B_real_2D: \n',B2D, B2D.shape)
print ('\n B_real_2D transposed: \n',B2D.transpose(), B2D.transpose().shape)

B_real_2D: 
 [[2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]
 [2 2 2 2 2 2 2 2 2 2]] (5, 10)

 B_real_2D transposed: 
 [[2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]
 [2 2 2 2 2]] (10, 5)


### MASKIRANJE NumPy nizova

Možemo takođe "maskirati" nizove. Ovo je korisna stvar slična izvođenju if uslova za niz. Na primer, možemo napraviti niz brojeva, recimo, vremena, između 0 i 10 minuta, a zatim tražiti samo vremena veća od 5 minuta.

In [75]:
time=np.linspace(0,10,11)
print(time,'\n',time[time>5])

[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10.] 
 [ 6.  7.  8.  9. 10.]


Ako su dva niza istog oblika, možemo koristiti jedan niz da "maskiramo" drugi niz. Na primer, možemo napraviti niz pređenih udaljenosti pri konstantnoj brzini od 20 milja na sat i maskirati ga da prikaže samo udaljenosti tokom poslednjih 5 minuta.

In [78]:
distance=time/3
print(distance)
lateDistance=distance[time>5]
print(lateDistance)

[0.         0.33333333 0.66666667 1.         1.33333333 1.66666667
 2.         2.33333333 2.66666667 3.         3.33333333]
[2.         2.33333333 2.66666667 3.         3.33333333]


Kako ovo funkcioniše? Možemo zaviriti u to posmatranjem rezultata kada ispišemo (time>5). Ispostavlja se da ovo stvara niz vrednosti True i False koji programu govori koje elemente niza odabrati.

In [79]:
boolTime=time>5
print(boolTime)

[False False False False False False  True  True  True  True  True]


Za dublji uvid o svim metodima i atributima u NumPy biblioteci, pogledajte [link](https://numpy.org/doc/stable/reference/)

### Konvertovanje 

In [80]:
A=np.ones((3,3))
L=A.tolist()
print ("Originalni niz \t", type(A)) # the '\t' inserts a tab
print ("Lista \t\t", type(L))
print (A)
print (L)


Originalni niz 	 <class 'numpy.ndarray'>
Lista 		 <class 'list'>
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
[[1.0, 1.0, 1.0], [1.0, 1.0, 1.0], [1.0, 1.0, 1.0]]


In [81]:
AfromL=np.array(L)# from a list
print ('AfromL: ')
print (AfromL)

AfromL: 
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]


In [82]:
AfromT=np.array((4,2)) # from a tuple to NumPy array
print ('AfromT: ')
print (AfromT)

AfromT: 
[4 2]


### Cuvanje NumPy niza u txt fajl

In [93]:
A = np.ones((3, 3), dtype=float)
np.savetxt('A.txt', A, fmt='%.2f') #ili %10.2f
#A=np.ones((3,3),dtype=int)
#np.savetxt('A.txt',A,fmt='%d')

### Zadatak za vezbu

1. Pomocu numpy modula izracunati srednju julsku temperaturu i standardnu devijaciju julskih temperatura za Beograd za period 1991-2020. Zatim izracunati anomaliju julske temperature ako se zna da je srednja julska temperatura u Beogradu za 2023. godinu iznosila 26C. Input podaci su dati u fajlu ifile/Beograd.txt gde su prva kolona godine, druga meseci, treca dani, cetvrta dnevne maksimalne temperature, peta dnevne minimalne temperature, sesta srednje dnevne temperature, itd. U ovom zadatku koristiti srednje dnevne temperature. Stampati na ekran kolika je srednja julska temperatura za 1991-2020, standardna devijacija julskih temperatura i kolika je anomalija julske temperature tokom 2023. godine u odnosu na 1991-2020. Zatim ispitati da li je data anomalija veca od standardne devijacije. <br> <br> U drugom delu zadatka nacrtati grafik normalne raspodele julskih temperatura za period 1991-2020 sa vertikalnom crvenom linijom koja predstavlja srednju vrednost julskih temperatura, i vertikalnim sivim isprekidanim linijama koje predstavljaju tmean+std i tmean-std. Na x osi ce biti predstavljene julske temperature u periodu od 1991-2020 a na y osi gustine verovatnoce. Takodje izracunati gustinu verovatnoce za srednju julsku temperaturu za 2023. godinu i predstaviti je kao tacku na grafiku.


[np.loadtxt()](https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html) <br>
[np.axvline()](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.axvline.html) <br>
[array.astype()](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.astype.html) <br>
[plt.scatter()](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html)<br>
[plt.hist()](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html) <br>
x_smooth=np.linspace(min(x),max(x),1000) # mora da bi linija bila glatka! pokazi kako izgleda bez ovoga!! <br>
from scipy.stats import norm <br>
pdf_values=norm.pdf(x_smooth,t7_mean,t7_std) <br>


**Raspodela temperatura u vidu histograma** <br>
plt.hist se koristi za kreiranje histograma. Parametar bins određuje broj intervala u histogramu. Parametar density=True normalizuje histogram kako bi predstavljao gustinu verovatnoće a ne ucestalost. Parametri alpha i color služe za postavljanje transparentnosti i boje histograma. <br>
**plt.hist(x, bins=8, density=True, alpha=0.7, color='grey', edgecolor='black')**


KAKO TREBA REZULTAT DA IZGLEDA?

![image.png](attachment:a0ad8b22-dd55-4b41-a4bb-77b00dd2f672.png)

2. TAKMICENJE za najlepsu sliku <br>
Napraviti ovakvu sliku za Beograd za anomalije u periodu 1961-2023 u odnosu na period 1991-2020. Koristiti srednje dnevne temperature. Naznaciti na grafiku najtopliju godinu. <br>
Dodatak, slika2: Napraviti standardizovane anomalije tako sto se anomalije podele sa standardnom devijacijom klimatoloskog perioda.

![image.png](attachment:8a2282a8-c86f-4ac8-aeec-626efd9259d0.png) 

![image.png](attachment:17cfdec8-4add-436e-8f81-b7a7c85bbf38.png)