# Calcul Numeric - Laborator 2 - Funcții. Pachetul NumPy.

## Funcții

Funcțiile se definesc prin statement-ul ```def``` 

#### Argumentul unei funcții
Un obiect transmis unei funcții nu creează un obiect nou accesibil doar în aceea funcție. Imaginați-vă că aveți o listă ```x=[1, 2, 3]```, adică un obiect mutabil. Dacă în interiorul funcției se schimbă conținutul listei, de exemplu ```x[0] = 9```, atunci ```x``` se schimbă și în afara funcției.

Aceste obiecte sunt transmise ca argument al funcției sub formă de variabilă sau direct. Argumentele acestea pot fi simple, adică argumente poziționale, care se identifică pe baza poziției, sau pot fi de tip „keyword”. În acest caz se identifică printr-un cuvant-cheie .


Mai jos avem câteva funcții care ilustrează diferite moduri în care putem apela o funcție.

#### Exemplul 1: funcție fără argument

In [None]:
import random
def propozitie_random():
    subiecte = ["Un pinguin", "O girafă", "Un extraterestru", "O maimuță", "Un cățel"]
    predicate = ["a dansat", "a cântat", "a căzut", "a râs", "a făcut o glumă"]
    complemente = ["pe o minge", "într-un hamac", "sub ploaie", "cu o chitară", "cu o pizza"]

    subiect_aleatoriu = random.choice(subiecte)
    predicat_aleatoriu = random.choice(predicate)
    complement_aleatoriu = random.choice(complemente)

    return f"{subiect_aleatoriu} {predicat_aleatoriu} {complement_aleatoriu}!"

In [None]:
# în acest caz, funcția nu are niciun argument:
propozitie_random()

#### Exemplul 2: funcție cu un argument pozițional

In [None]:
def salutare(nume):  # argumentul este nume 
    """
    Funcție care salută pe cineva după nume.
    """
    mesaj_salutare = f"Salut, {nume}! Cum îți merge astăzi?"
    return mesaj_salutare

In [None]:
salutare('Marian')  # obiectul este definit în apelarea funcției

In [None]:
nume = 'Mirel'
salutare(nume) # variabila nume este folosită în apelarea funcției, obiectul fiind definit/creat înainte

#### Exemplul 3: funcție cu un argument pozițional și un argument cheie

In [None]:
def mesaj_personalizat(mesaj, urgent=False):
    """
    Funcție care afișează un mesaj personalizat și, dacă este specificat, un MESAJ URGENT.
    MESAJELE URGENTE SUNT SCRISE CU MAJUSCULE.
    """
    if urgent:
        mesaj = mesaj.upper()
        mesaj = "[URGENT] " + mesaj

    print(mesaj)

In [None]:
mesaj_personalizat('nu uita sa iti faci tema', urgent=True)

#### Exemplul 4: o funcție generală

In [None]:
def exemplu_functie(arg1, arg2, cheie1=None, cheie2=None):
    """O funcție exemplu cu argumente pozitionale și cheie."""
    print("Argumente poziționale:", arg1, arg2)
    print("Argumente cheie:", cheie1, cheie2)

exemplu_functie("B", "A", cheie1="C", cheie2="D")
exemplu_functie("B", "A", "C", cheie2="D")
exemplu_functie("B", "A", "C", "D")

### Momentul Zen

După cum am menționat la laboratorul precedent, Python e ZEN. Luați o pauză să reflectați asupra exemplelor de mai sus și să le înțelegeți. 

<img width=200 src='https://i.imgflip.com/8gesrj.jpg'/>

Experimentați lucruri noi răspunzând la următoarele întrebări:
- Încearcă sa apelezi funcția din exemplul 3 fără argument cheie (doar cu mesajul). Ce se întâmplă?
- Ce se întâmplă dacă apelezi funcția din exemplul 3 doar cu argumentul cheie, fără cel pozițional?
- Care sunt diferențele dintre argumentul pozițional și cel cheie?
- Gândește-te la un argument pe care l-ai putea folosi în funcția din exemplul 1.
- Apelați funcția din exemplul 4 doar prin argumente poziționale: ```exemplu_functie("B", "A", "C", "D")```. Ce observați?
- Apelați funcția din exemplul 4 specificând un argument cheie înaintea unuia pozițional: ```exemplu_functie("B", cheie1="A", "C", "D")```
- Cum decizi dacă un argument ar trebui să fie pozițional sau cheie? 

In [None]:
# Experimentele tale:






### Funcții anonime (lambda)
Există adesea nevoia de a crea funcții specifice care îndeplinesc o anumită sarcină și servesc ca intrare pentru o funcție de ordin superior (HOF), cum ar fi map sau filter. În astfel de cazuri, aceste funcții sunt adesea scrise sub formă de funcții anonime sau lambda. Sintaxa este următoarea:

`lambda argumente : expresie`

În situații complexe, s-ar putea să fie dificil de înțeles pentru ce este folosită o anumită funcție lambda. Din acest motiv ar putea fi rescrisă ca o funcție normală.

In [None]:
sum = lambda x, y: x + y
sum(3, 4)

In [None]:
for i in map(lambda x: x*x, range(5)): print (i)

In [None]:
# funcție care filtrează string-urile dintr-o listă
y = [1, 'two', 'three', 4, 5]
s = list(filter(lambda x: type(x) == str, y))
print(s)

### Exercițiu
- scrieți o funcție lambda care verifică dacă un număr este par (returnează True dacă numărul este par)
- folosiți map pentru a găsi valorile funcției `y = 0.5 * x + 0.2` pentru `x` în intervalul [0, 1), folosește pasul de 0.01 când creezi valorile pentru `x` cu funcția `range`
- rescrieți funcția `salutare` din exemplul 2 ca o funcție anonimă

In [None]:
# Exercițiu








## Module/Pachete/Biblioteci
Definiții:

- Module: Un modul este un fișier care conține funcții Python, variabile globale etc. Este pur și simplu un fișier .py care conține cod/executabil Python.

- Pachete: Un pachet este un spațiu de nume care conține mai multe pachete/module. Este un director care conține un fișier special init.py.

- Biblioteci: O bibliotecă este o colecție de diferite pachete. Conceptual, nu există diferență între pachet și bibliotecă în Python.

Modulele/pachetele/bibliotecile pot fi ușor "importate" și făcute funcționale în codul tău Python. Un set de biblioteci este inclus în fiecare instalare Python. Altele pot fi instalate local și apoi importate. Propriul tău cod aflat în altă parte pe computerul tău (local) poate fi de asemenea importat.

In [None]:
###### toate "chestiile" din biblioteca math pot fi utilizate
import math
print(math.pi)

# poți atribui o etichetă bibliotecii math pentru comoditate
import math as m
print(m.pi)

# alternativ, poți importa doar un anumit "element" din bibliotecă
from math import pi    # poți adăuga mai multe elemente deodată, le listezi separate prin ","
# from math import pi, sqrt
print(pi)

# sau poți importa totul (foarte periculos!!!)
from math import *
print(sqrt(7))

## NumPy

NumPy este un pachet fundamental pentru calculul științific în Python. Conține, printre altele:

- obiecte array de tip tablou N-dimensional
- operații sofisticate și rapide cu array-uri
- instrumente pentru integrarea codului C/C++ și Fortran (nu le vom discuta în acest laborator din păcate)
- generare de numere (pseudo-)aleatoare
- algebră liniară, transformate Fourier și multe altele


Link către documentația NumPy: https://numpy.org/doc/stable/user/whatisnumpy.html

Există convenția ca denumirea acestui pachet să se prescurteze cu alias-ul `np`. NumPy se importă cu următoarea comandă: 

In [None]:
import numpy as np 

Dacă nu aveți instalat pachetul, folosiți `pip`:

In [None]:
!pip install numpy

### Array-urile NumPy

Array-urile NumPy diferă de listele Python, deoarece NumPy oferă:

- suport complet pentru tablouri multidimensionale
- eficiență
- proiectat pentru calcul științific (comoditate)

Similar altor limbaje de programare care au un focus specific (de exemplu, "orientat pe obiect"), array-urile în numpy sunt atât de centrale încât dezvoltarea aplicațiilor științifice poate fi considerată "orientată pe array-uri".

Array-urile (tablourile) NumPy au o dimensiune fixă la creare, spre deosebire de listele Python (care pot crește dinamic). Modificarea dimensiunii unui ndarray va crea un nou tablou și va șterge originalul.

Elementele dintr-un tablou NumPy trebuie să fie de același tip de date și, astfel, vor avea aceeași dimensiune în memorie. Excepția: se pot avea tablouri de obiecte (Python, inclusiv NumPy), permițând astfel tablouri de elemente de dimensiuni diferite.

Tablourile NumPy facilitează operațiile matematice avansate și alte tipuri de operații pe un număr mare de date. În mod tipic, astfel de operații sunt executate mai eficient și cu mai puțin cod decât este posibil utilizând secvențele încorporate în Python.

O demonstrație a eficienței NumPy:

In [None]:
# standard python
L = range(1000)
print('cu python normal: ')
%timeit [i**2 for i in L]

# numpy
a = np.arange(1000)
print('cu numpy: ')
%timeit a**2

#### De câte ori este mai rapid NumPy decât Python-ul standard?

### Tipuri de date în NumPy

Un array NumPy este o grilă de valori omogene (toate de același tip) și este indexat printr-un tuplu de numere întregi pozitive.

Toate tipurile de date standard sunt disponibile:

In [None]:
# Tipul trebuie specificat atunci când se creează tabloul
a = np.array([1, 2, 3], 'float64')
print(a, a.dtype, '\n')
a = np.array([1, 2, 3], 'uint32')
print(a, a.dtype, '\n')

# Alternativ, putem lăsa Python să deducă tipul:
a = np.array([1, 2, 3.3])
print(a, a.dtype, '\n')

# Sunt permise și numerele complexe
a = np.array([1+2j, 3+4j, 5+6*1j])
print(a, a.dtype, '\n')

# Booleene
a = np.array([True, False, False, True])
print(a, a.dtype, '\n')

# Tipuri non-numerice sunt, de asemenea, permise: șiruri de caractere
a = np.array(['bonjour messieurs dames', 'Hello', 'Hallo'])
print(a, a.dtype, '\n')

### Dimensiuni
Numărul de dimesiuni este rank-ul array-ului. Forma (shape-ul) unui array este o pereche (tuplu) de întregi care indică dimensiunea tabloului de-a lungul fiecărei dimensiuni.
#### Tablouri 1D

In [None]:
a1 = np.array([0, 1, 2, 3])
print("array: \n", a1)
print("rank:", a1.ndim)
print("shape:", a1.shape)
print("marimea primei dim (axis):", len(a1)) # not recommended in >1D

#### Tablouri 2D

In [None]:
a2_3 = np.array([[0, 1, 2], [3, 4, 5]])
print("2 x 3 array: \n", a2_3)
print("rank:", a2_3.ndim)
print("shape:", a2_3.shape)
print("marimea primei dim (axis):", len(a2_3))

#### Tablouri 3D

In [None]:
a2_3_4 = np.array([[[1, 10, 100, 1000], [2, 20, 200, 2000], [3, 30, 300, 3000]], 
                   [[4, 40, 400, 4000], [5, 50, 500, 5000], [6, 60, 600, 6000]]])
print("2 x 3 x 4 array:\n", a2_3_4)
print("rank:", a2_3_4.ndim)
print("shape:", a2_3_4.shape)
print("marimea primei dim (axis):", len(a2_3_4))

### Inițializarea tablourilor
Tablourile pot fi create din liste, dar și liste pot fi obținute din tablouri (cu toate acestea, amintiți-vă că cele două nu sunt echivalente, deoarece un tablou NumPy nu este o listă):

In [None]:
l = [0, 1, 2, 3]
a = np.array(l)
print(a.tolist(), type(a.tolist()))

Folosind `arange` și `linspace`:

In [None]:
# distanțat uniform:
print(np.arange(1, 9, 2)) # la fel ca "range": start, end (exclusiv), pas

# la fel, dar precizând numărul de elemente:
print(np.linspace(0, 1, 2)) # start, end, nr elemente 



### Exercițiu
- creați un tablou NumPy cu toate numerele pare de la 1 la 100 (inclusiv 100)

<img width=200 src='https://i.imgflip.com/8gogcy.jpg'/>

In [None]:
# Exercițiu







Inițializarea unor tablouri triviale:

In [None]:
# matrice 3x3 de 1
ones = np.ones((3, 3))
print(ones, '\n')

# matrice 2x2 de zerouri
zeros = np.zeros((2, 2))
print(zeros, '\n')

# matricea unitate 3x3
unity3d = np.eye(3)
#unity3d = np.identity(3) # np.identity este echivalent cu np.eye
print(unity3d, '\n')

# matrice diagonală
diagonal = np.diag(np.array([1, 20, 3, 4]))
print(diagonal, '\n')

# matrice creată din compresiune de listă
array = np.array([(i, j) for i in range(2) for j in range(3)])
print(array, '\n')

# matrice creată cu ajutorul unei funcții anonime
fromfunct = np.fromfunction(lambda i, j: (i - 2)**2 + (j - i)**2, (5, 5))
print(fromfunct, '\n')

### Redimensionarea și concatenarea
Un tablou 1D poate fi redimensionat într-un array cu mai multe dimensiuni

In [None]:
a = np.arange(0, 6)
m = a.reshape(3, 2) 
# Aveți grijă, redimensionarea trebuie să fie validă. Numărul total de elemente rămâne la fel: 1 x 6 = 3 x 2. 
# e.g. nu puteți redimensiona un tablou cu 100 de elemente într-unul cu dimensiunile 3x50, deoarece sunt necesare 3x50=150 elemente

print("original:", a, '\n')
print("reshaped:", m, '\n')

a_from_m = m.flatten()
print("flattened array (înapoi la original):", a_from_m, '\n')

# când aplicam flatten(), array-urile multidimensionale se reduc la o singură dimensiune - obținem un tablou 1D cu toate elementele

### Exercițiu

- redimensionați următorul tablou într-un tablou tridimensional:

In [None]:
# Exercițiu

a = np.zeros((5, 90))







Operația de concatenare:

1D

In [None]:
# concatenare 1D
a = np.array([1, 2])
b = np.array([3, 4, 5, 6])
c = np.array([7, 8, 9])

print(f"a={a}")
print(f"b={b}")
print(f"c={c}")
print("concatenare unidimensională (a+b+c):", np.concatenate((a, b, c)))

2D

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])
print(f"a={a}")
print(f"b={b}")

print("concatenare default 2D (a+b):",'\n', np.concatenate((a, b)))
print("concatenare după prima axă (a+b):",'\n', np.concatenate((a, b), axis=0))
print("concatenare după a doua axă (a+b):",'\n', np.concatenate((a, b), axis=1))

### Copii și vederi
Fiind obiecte mutabile, tablourile NumPy pot avea **copii (copies)** și **vederi (views)**:

In [None]:
a = np.array([1, 2, 3])
b = a # aceasta este o vedere - un view
c = a.copy() # aceasta este o copie

# Modificările aplicate tabloului a modifică și tabloul b
# (care, de fapt, sunt același PyObject)
a[0] = 7
print(a, b, c)

# ... și invers
b[1] = 7
print(a, b, c)

# Modificările asupra lui c nu modifică tabloul a
c[0] = 9
print(a, b, c)

# Obiectul Python este același pentru a și b, dar diferit pentru c:
print("Sunt a și b același obiect?", np.may_share_memory(a, b))
print("Sunt a și c același obiect?", np.may_share_memory(a, c))

**Atenție!** metoda copy se folosește doar asupra tablourilor NumPy, nu și pentru temele de laborator ale colegilor

### Exercițiu
- verificați dacă np.array.reshape returnează o vedere sau o copie

In [None]:
# Exercițiu




Rețineți că, pentru obiectele numpy, funcția id() nu funcționează întotdeauna (no idea why). Pentru a verifica dacă două variabile indică același PyObject, utilizați np.may_share_memory().

### Indexare
Elementele unui tablou pot fi accesate și atribuite în aceeași manieră ca și alte secvențe Python (de exemplu, liste):

In [None]:
a = np.arange(10)
print(a[0], a[2], a[-1])

# reminder: [start:stop:step] funcționează la fel de bine.
print(a[2:9:3])
print(a[::-1]) # step poate fi negativ și se obține astfel o secvență inversată.

![](https://i.ibb.co/23qjk2P/numpy-indexing.png)

### Exercițiu

- crează NumPy array-ul folosit în exemplul de mai sus și afișează cele patru subarray-uri


In [None]:
# Exercițiu








Pentru tablourile multidimensionale, indecșii sunt tupluri de întregi.

Notă:

- în 2D, prima dimensiune corespunde rândurilor, iar a doua coloanelor.
- pentru un tablou multidimensional a, a[0] este interpretat prin luarea tuturor elementelor în dimensiunile nespecificate.

### Feliere (Slicing)
Operația de feliere (slicing) creează o vedere asupra tabloului original, care este doar o modalitate de a accesa datele tabloului. Atunci când se modifică o vedere, tabloul original este de asemenea modificat.

In [None]:
a = np.diag(np.arange(3))
print(a, '\n')
print(a[1, 1], '\n')
print(a[2], '\n')

# feliază tabloul original, creând o vedere
b = a[1:, 1:]
print(b, '\n')

# modificarea vederii modifică și tabloul original
b[-1, -1] = 10
print(a, '\n')

# verifică dacă b este efectiv o vedere a lui a
print("Sunt a și b același obiect?", np.may_share_memory(a, b))

In [None]:
a = np.arange(35).reshape(7, 5)
print('a = ', a)
print('Extragem primele 4 elemente de pe rândul cu index 2 (al treila rând):', a[2, :4])
print('Extragem elementele cu index 2,3 de pe ultimile două rânduri:', a[-2:, 2:4])

### Exercițiu
- Extrage rândul central. Verifică shape-ul tabloului extras.
- Extrage coloana centrală. Verifică shape-ul tabloului extras.
- Extrage ultimele 3 elemente de pe primele 4 rânduri.

In [None]:
# Exercițiu
a = np.arange(35).reshape(7, 5)






### Indexare avansată (Fancy indexing)
Tablourile NumPy pot fi indexate cu feliere (slices), dar și cu șiruri booleane sau șiruri de întregi (măști). Această metodă se numește indexare avansată (fancy indexing) și creează copii, nu vederi.

In [None]:
a = np.arange(0, 21, 2)
print("array original:", a,'\n')

mask = (a % 3 == 0)
print("mask:", mask,'\n')

filtered_a = a[mask]
# echivalent cu a[a%3==0]
print("tabloul fitrat:", filtered_a,'\n')

# verifică dacă indexarea avansată creează copie 
print("Sunt a și filtered_a același obiect?", np.may_share_memory(a, filtered_a), '\n')

# indexarea cu o mască poate fi folosită pentru asignarea a noi valori pentru sub-tablouri.
a[a % 3 == 0] = -1
print("array modificat:", a, '\n')

Indexarea poate fi realizată cu un șir de numere întregi, unde același index poate fi repetat de mai multe ori.

In [None]:
a = np.arange(0, 100, 10)
l = [2, 3, 2, 4, 2] # listă python cu indecși
print("selecția cu indecșii de mai sus: ", a[l], '\n')

Atunci când se creează un tablou nou prin indexarea cu un șir de numere întregi, noul tablou are aceeași formă ca și șirul de întregi:

In [None]:
a = np.arange(0, 20, 2)
idx = np.array([[3, 4],[9, 7]])
a[idx]

![](https://i.ibb.co/7p3X8R0/numpy-fancy-indexing.png)

### Operații cu tablouri
#### Operații elementare
În mod implicit, toate operațiile (adunări, scăderi, înmulțiri, ...) cu tablouri sunt efectuate element-cu-element:

In [None]:
# operații cu scalari
a = np.arange(4)
print(a, '\n')
print(a * 5, '\n')

# ridicarea la putere
print(2 ** a, '\n')

In [None]:
# operații între tablouri unidimensionale. De asemenea, și în acest caz, toate operațiile sunt efectuate element-cu-element
a = np.arange(4)
b = np.ones(4) + 1
print(a, b)
print("a - b:", a - b)
print("a * b:", a * b)

**Atenție!** 
deoarece operațiile sunt efectuate element-cu-element în toate dimensiunile, înmulțirea tablourilor nu este înmulțire matriceală:

In [None]:
ones = np.ones((3,3))
print ('matrice orginală:','\n',ones,'\n')

print ('produsul element-cu-element "*": ','\n',ones*ones,'\n')

print ('produsul matematic: ','\n',ones.dot(ones),'\n')

#### Comparații


In [None]:
# element-cu-element
print('egalitate?:', np.array([1, 3, 2, 5]) == np.array([3, 1, 2, 5]))
print('mai mare ca?:', np.array([1, 3, 2, 5]) > np.array([3, 1, 2, 1]))

# comparație între array-uri
print(np.array_equal(np.array([1, 3, 2, 5]), np.array([3, 1, 2, 1])))

#### Operații logice

In [None]:
a = np.array([1, 1, 0, 0], bool)
b = np.array([1, 0, 1, 0], bool)
print("SAU logic:", np.logical_or(a, b))
print("ȘI logic:", np.logical_and(a, b))

#### Aplicarea de funcții 

In [None]:
# funcțiile matematice există și în NumPy, și se pot aplica unui între array (element-cu-element)
a = np.arange(1, 9)
print("sin:", np.sin(a))
print("log:", np.log(a))

# funcționează și pe tablouri multi-dimensionale
m = a.reshape(2, 4)
print("exp:", np.exp(m))

#### Transpusa unei matrice

In [None]:
# extragere
a = np.arange(16).reshape(4,4)

print ("a:", '\n', a , '\n')

print ("transpusa:", '\n', a.T , '\n') # a.T este o vedere

Există un pachet de algebră liniară în NumPy și se numește `numpy.linalg`. Cu toate acestea, în ceea ce privește performanța, pachetul inclus în scipy, numit și `scipy.linalg`, este mai bun și mai eficient.

#### Reduceri (reduction)
Operațiile care reduc dimensionalitatea tablourilor sunt numite reduceri. Funcțiile de reducere operează asupra elementelor unui tablou și returnează un (set de) scalar(i), și sunt disponibile fie ca metode ale clasei de tablouri, fie ca funcții NumPy.

Pentru tablouri multi-dimensionale, axa trebuie specificată.

In [None]:
a = np.arange(1,7)
print(a)
print("suma:", a.sum(), np.sum(a))
print("min:", a.min(), np.min(a))
print("max:", a.max(), np.max(a))
print("index arg min:", a.argmin(), np.argmin(a))
print("index arg max:", a.argmax(), np.argmax(a))
print("media:", a.mean(), np.mean(a))
print("mediana:", np.median(a)) 
print("deviația standard:", a.std(), np.std(a))
# și multe altele... pentru detalii întrebați ChatGPT (sau consultați documentația)

In [None]:
# pentru mai multe dimensiuni:

m = a.reshape(3,2)
print(m, '\n')

print("suma pe coloane:", m.sum(axis=0))
print("suma pe rânduri:", m.sum(axis=1))

#### Broadcasting
Ați văzut că am folosit operațiile element-cu-element doar pe tablouri de același rang și formă. Cu toate acestea, este, de asemenea, posibil să se facă operații pe tablouri de dimensiuni diferite dacă NumPy poate transforma (extinde) aceste tablouri astfel încât toate să aibă aceeași dimensiune.

![](https://i.ibb.co/PxL2dsJ/numpy-broadcasting.png)

In [None]:
a = np.tile(np.arange(0, 40, 10), (3, 1)).T # consultă documentația să vezi ce face np.tile
print("array inițial:", '\n', a, '\n')
print("suma obținută prin broadcasting:", '\n', a + np.arange(3), '\n')

In [None]:
a = np.reshape(np.arange(0, 40, 10), (4, 1)) # aplicăm reshape pentru a transforma în coloană
# sau cu transpusa
# a = np.array([np.arange(0, 40, 10)]).T
# sau cu np.newaxis - vezi celula următoare

print(a, a.shape)

b = np.arange(3)
print(b, b.shape)

# broadcasting - suma între o coloană și un rând este o matrice
# rândul/coloana se multiplică astfel încât însumarea să fie posibilă - vezi figura de mai sus
a + b

#### Manipularea formei

In [None]:
# adăugarea unei dimensiuni 
print("dimensiune nouă pentru axa 1:", '\n', np.arange(1,4)[:,np.newaxis], '\n')
print("dimensiune nouă pentru axa 0:", '\n', np.arange(1,4)[np.newaxis,:], '\n')

# resizing
print ("resizing:", '\n', np.resize(np.arange(4), (9,)), '\n')  
# elementele încep să se repete dacă dimensiunea finală este mai mare

### Generare de numere random
Există două module pentru numere (pseudo)aleatoare. Modulul `numpy.random` este cel mai simplu de utilizat.

In [None]:
import numpy.random as npr
npr.seed(123) # seed pentru reproducerea rezultatelor, modifica-l în numărul tău favorit și vezi ce se întâmplă

In [None]:
# generare numere random din intervalul [0.0, 1.0) pentru un tablou cu forma de 3,4
print ("distributie uniforma:",'\n', npr.rand(3, 4), '\n') # shape=(3,4)
 
# valori random generate dintr-o distributie normala (gaussiană)
print ("distributie normala:",'\n', npr.randn(2, 5), '\n') # shape=(2,5)

# generare de numere întregi între 1 și 50
print ("nr intregi:",'\n', npr.randint(1, 50, size=(3, 6)), '\n') # shape=(3,6)

In [None]:
# shuffle
x = np.arange(10)
npr.shuffle(x)
print ("reshuffling:",'\n', x,'\n')
# npr.permutation se poate folosi pentru același scop, dar scrii mai mult

x = np.arange(10,20)
print ("alegere fără înlocuire",'\n',npr.choice(x, 10, replace=False),'\n')
print ("alegere cu înlocuire",'\n',npr.choice(x, (5, 10), replace=True),'\n') # default

### Exercițiu
- scrie o funcție care să genereze random N numere pare în intervalul 1 - 100
- folosește funcția pentru a genera N=1000 numere pare
- cu numere generate, creează o un tablou NumPy tridimensional de forma (10,10,10)
- înlocuiește cu -1 toate numerele pare divizible cu 5 și afișează rezultatul obținut

In [None]:
# Exercițiu






Pentru mai multe exerciții rezolvate consultați următorul link: https://www.kaggle.com/code/themlphdstudent/learn-numpy-numpy-50-exercises-and-solution

## BONUS

Acesta este un exercițiu opțional. Rezolvarea completă a acestui exercițiu vă poate aduce pâna la **0.5 puncte în plus** la nota finală de la laborator.

## SQuAD dataset 
Stanford Question Answering Dataset (SQuAD) este un set de date pentru înțelegerea textelor, format din întrebări formulate de diferite persoane cu privire la un set de articole Wikipedia. Răspunsul la fiecare întrebare este un segment scurt de text, preluat dintr-un paragraf. Unele întrebări ar putea să nu aibă un răspuns clar. Pentru fiecare paragraf sunt formulate mai multe întrebări.

Mai multe detalii găsiți aici: https://rajpurkar.github.io/SQuAD-explorer/

Pentru a începe, descarcă în aceeași locație fișierul dev-v2.0 de pe moodle.

#### Citirea fișierului JSON 

In [None]:
import json
f = open('dev-v2.0.json')  # deschidem fișierul de pe moodle
data = json.load(f)['data']  # datele vor fi încărcate sub formă de dicționar în Python - de fapt va fi o listă de dicționare

In [None]:
# fiecare dicționar are un subiect specific (title) - primul este despre normanzi și conține doar întrebări legate de acest subiect
# titlul primului dicționar
data[0]['title']

### Task 1: Explorează setul de date
- Aruncă o privire asupra setului de date și explică modul în care este organizat.
- Extrage primul set de întrebări corespunzător primului paragraf.
- Extrage prima întrebare și răspunsurile la aceasta.

#### Descriere set de date:

Completează aici ...

In [None]:
# Solutia ta





### Task 2: Pre-procesarea datelor
Probabil ai observat că multe răspunsuri se repetă.
- Șterge toate răspunsurile duplicat (dacă sunt două sau mai multe la fel, păstreaza unul singur)

In [None]:
# Soluția ta






### Task 3: Statistici
- Câte subiecte (dicționare cu paragrafe) există în dataset?
- Pentru fiecare subiect, extrage numărul de paragrafe.
- Creează un tablou NumPy unidimensional cu dimensiunea (shape-ul) egală cu numărul total de paragrafe.
- Parcurge toate paragrafele și inserează în array-ul creat numărul total de întrebări pentru fiecare paragraf. 
- Folosește metode NumPy pentru a calcula numărul mediu de întrebări per paragraf.
- Calculează media numărului de cuvinte per paragraf.
- Calculează procentul de întrebări fără răspuns.

In [None]:
# Soluția ta



