## PCLP3  Laboratorul 3 : NumPy


- Andrei-Daniel Voicu: <andrei.voicu133@gmail.com>
- Mihai Nan: <mihai.nan@upb.ro>

## Ce este NumPy?

**NumPy** este un pachet Python folosit în principal pentru calcul științific și numeric. Este foarte popular în rândul oamenilor de știință din domeniul datelor și al analiștilor pentru eficiența sa și gama largă de operații pe array-uri pe care le oferă.

In [None]:
import numpy as np

# Definirea unui tablou unidimensional
a = np.array([1,2,3])
print(type(a))
print(a)

# Definirea unui tablou bidimensional, cu elemente de tip float
b = np.array([(1.5,2,3), (4,5,6)], dtype = float)
print(b)

<class 'numpy.ndarray'>
[1 2 3]
[[1.5 2.  3. ]
 [4.  5.  6. ]]


## De ce utilizam NumPy?

| Avantaje | Dezavantaje |
| --- | --- |
| Operații vectorizate eficient | Necesită timp pentru a-l învăța |
| Simplificarea lucrului cu tablouri multi-dimensionale | Listele NumPy sunt omogene |
| Gamă largă de funcții matematice | Suport restrâns pentru alte tipuri decât cele numerice |
| Performanțe uluitoare | Nu este adecvat pentru colectii de date tabelare (unde pot lipsi valori) |

Mai întâi, să luăm în considerare modul în care listele Python și vectorii Numpy stochează datele. O listă Python stochează elemente ca obiecte separate, fiecare poate fi de orice tip. Cu toate acestea, un vector NumPy este un vector de tip omogen, ceea ce înseamnă că toate elementele din vector sunt de același tip, reducând semnificativ utilizarea memoriei.

De exemplu, să presupunem că dorim să stocăm un interval de 1000 de numere întregi. Să comparăm utilizarea memoriei unei liste Python și a unui vector Numpy:

In [None]:
import sys
import numpy as np

list_of_numbers = []
for i in range(1000000):
    list_of_numbers.append(i)
sys.getsizeof(list_of_numbers)

arr = np.zeros((1000000,))
for i in range(1000000):
    arr[i] = i

print(sys.getsizeof(list_of_numbers))
print(sys.getsizeof(arr))

8448728
8000104


Acum să trecem la viteza de calcul. Deoarece Numpy utilizează blocuri continue de memorie, acesta poate profita de operațiunile vectorizate, care sunt procesate utilizând instrucțiuni SIMD (Single Instruction, Multiple Data). Acest lucru duce la calcule mai rapide. Listele Python, pe de altă parte, nu beneficiază de acest lucru din cauza stocării lor împrăștiată în memorie .

In [None]:
import numpy as np
import time

# Define two Python lists
py_list1 = list(range(1000000))
py_list2 = list(range(1000000, 2000000))

# Define two Numpy arrays
np_array1 = np.arange(1000000)
np_array2 = np.arange(1000000, 2000000)

# Adding Python lists
start_time = time.time()
result_list = [a + b for a, b in zip(py_list1, py_list2)]
print("Time taken to add Python lists: ", time.time() - start_time)

# Adding Numpy arrays
start_time = time.time()
result_array = np_array1 + np_array2
print("Time taken to add Numpy arrays: ", time.time() - start_time)

Time taken to add Python lists:  0.08071351051330566
Time taken to add Numpy arrays:  0.003309011459350586


## Operatii NumPy

### Operații matematice

In [None]:
arr1 = np.array([7, 3, 2, 6, 5])
arr2 = np.array([2, 5, 1, 4, 10])

# Operații matematice
arr_add = arr1 + arr2
arr_sub = arr1 - arr2
arr_mul = arr1 * arr2
arr_div = arr1 / arr2

print(f"Adunare: {arr_add}")
print(f"Scadere: {arr_sub}")
print(f"Inmultire: {arr_mul}")
print(f"Impartire: {arr_div}")

# Funcții statistice
mean = np.mean(arr1)
sum = np.sum(arr1)
max = np.max(arr1)
min = np.min(arr1)

print(f"Medie: {mean}")
print(f"Suma: {sum}")
print(f"Max: {max}")
print(f"Min: {min}")

Adunare: [ 9  8  3 10 15]
Scadere: [ 5 -2  1  2 -5]
Inmultire: [14 15  2 24 50]
Impartire: [3.5 0.6 2.  1.5 0.5]
Medie: 4.6
Suma: 23
Max: 7
Min: 2


### Transformări

Extragerea elementelor este identică cu extragerea elementelor din listele Python clasice:

In [None]:
# Extragerea unui element din vector.
a = np.array([4,6,9])
print(a[0])

# Extragerea unui element in cazul unui tablou multi-dimensional.
a = np.array([(1,2,3), (4,5,6)], dtype = int)
print(a[0][1])

4
2


Putem sa utilizăm "slicing" tot în același mod cum utilizăm pe listele Python.

In [None]:
a = np.array( [4,6,9] )
print(a[0:2])

O funcționalitate foarte puternică o reprezintă posibilitatea filtrării datelor printr-o expresie logică (formă și mai compactă asemănătoare cu list comprehensions).

In [None]:
numbers = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# Crearea unei copii.
numbers_copy = numbers.copy()

# Modificarea valorilor pare la 0.
numbers_copy[numbers % 2 == 0] = 0

print(numbers_copy)

Există și câteva funcții des utilizate pentru a modifica forma tablourilor.

In [None]:
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# Transformă array-ul 2D într-unul 1D
flattened = arr.flatten()

# Transpune array-ul 2D
transposed = arr.T

# Transformă array-ul 2D într-unul 1D
reshaped = arr.reshape(1, 9)

print(f"Flatten: {flattened}")
print(f"Transpose:\n {transposed}")
print(f"Reshape: {reshaped}")

## Exerciții propuse

1. Construiți un vector cu primele 16 numere naturale nenule. Pentru acest vector aplicați o operație care să-l transforme într-o matrice cu 4 linii și 4 coloane.

In [None]:
# TODO 1

2. Pornind de la matricea definită la exercițiul anterior, scrieți instrucțiuni pentru afișarea elementelor colorate în următoarea imagine.

<a href="https://ibb.co/mNtNfh5"><img src="https://i.ibb.co/qJ9JTmY/Screenshot-from-2024-04-22-01-19-12.png" alt="Screenshot-from-2024-04-22-01-19-12" border="0"></a>

In [None]:
# TODO 2

3. Implementați funcția care calculează descompunerea $L \cdot U$ pentru o matrice $A$. Pentru acest lucru, urmăriți pașii:

1. Inițializăm matricea $L$ cu matricea identitate $I$.
2. Inițializăm $U$ cu $A$
3. Pentru $i = 1, \dots, n$
	4. Pentru $j = i+1, \dots, n$
		5. $L_{ji} = \frac{U_{ji}}{U_{ii}}$
		6. $U_j = (U_j - L_{ji}U_{i})$, unde $U_{i}$ reprezintă linia $i$ din $U$   
7. Returnăm tuplul cu $L$ și $U$

In [None]:
# TODO 3
def lu(A):
    pass

4. Implementați o funcție care preia ca input un array unidimensional și returnează o matrice bidimensională. Transformarea din array unidimensional în matrice bidimensională se va face folosind conceptul de "strides" sau pași.
Pentru context, fiecare "pas" reprezintă o deplasare în array-ul unidimensional, iar "lungimea ferestrei" indică numărul de elemente din array care vor fi incluse în fiecare sub-array al matricei bidimensionale.

**Hint:**
  *numpy.lib.stride_tricks*

In [None]:
def gen_strides(a, stride_len, window_len):
  # TODO 4
  pass

5. Citiți de la intrare două matrici de dimensiuni diferite, prima de dimensiune (n, m) și a doua de dimensiune (p, q). Implementați o funcție care să calculeze și să returneze produsul Kronecker între cele două matrici introduse.

**Intrare:**
- Prima linie conține două numere întregi, n și m, reprezentând dimensiunile primei matrici.
- Următoarele n linii conțin câte m numere fiecare, reprezentând elementele primei matrici.
- Linia următoare conține două numere întregi, p și q, reprezentând dimensiunile celei de-a doua matrici.
- Următoarele p linii conțin câte q numere fiecare, reprezentând elementele celei de-a doua matrici.

**Ieșire:**
- Matricea rezultată din calcularea produsului Kronecker între cele două matrici introduse.


**Hint:**
- Produsul Kronecker între două matrici este o operație care combină două matrici pentru a produce o nouă matrice. Mai multe detalii despre cum se calculează produsul Kronecker între două matrici puteți găsi [aici](https://en.wikipedia.org/wiki/Kronecker_product).
- În Python, produsul Kronecker între două matrici se poate calcula cu ajutorul funcției numpy.kron.

In [None]:
# TODO 5

6. Implementați un algoritm de detecție a contururilor dintr-o imagine folosind operatorul Sobel. Programul ar trebui să încarce o imagine de la intrare, să aplice filtrul Sobel pentru a detecta marginile și apoi să salveze imaginea rezultată.

**Hint:**
- Operatorul Sobel: https://homepages.inf.ed.ac.uk/rbf/HIPR2/sobel.htm
  

In [None]:
import numpy as np
from PIL import Image

def sobel_edge_detection(img):
    # TODO 6
    pass

def main():
    # Load the image
    img = Image.open("test.png").convert('L')
    img = np.array(img)

    # Apply Sobel edge detection
    sobel_img = sobel_edge_detection(img)

    # Convert the result to an image and save it
    sobel_img = Image.fromarray(sobel_img)
    sobel_img.convert('RGB').save("output.jpg")

if __name__ == "__main__":
    main()