# NumPy alapok

## Mátrixok használata, motiváló példa

Mátrix: számok téglalap alakú elrendezése. Mátrixokat listák vagy tuple-ök egymásba ágyazásával készíthetünk.

(A [Matlab](https://uk.mathworks.com/products/matlab.html) alaptípusa a mátrix, mert sok matematikai probléma megoldása így egyszerűbb, kifejezőbb.)

Egy lineáris egyenletrendszer megoldható [Gauss-eliminációval](https://hu.wikipedia.org/wiki/Gauss-elimin%C3%A1ci%C3%B3). Ebben az esetben az együtthatók ábrázolhatók mátrixban (*A*), az egyenletek jobb oldala (*b*) pedig vektorban.



In [1]:
from typing import List

def gauss(a : List[List[float]], b : List[float]) -> List:
  n = len(a)
  x = [None]*n
  for k in range(n-1):
    for i in range(k+1, n):
      if a[k][k] == 0.: # A sorok átrendezése talán segítene
        return x
      l = a[i][k] / a[k][k]
      b[i] -= l*b[k]
      for j in range(k, n):
        a[i][j] -= l*a[k][j]
  for i in range(n-1, -1, -1):
    s = 0
    for j in range(i+1, n):
      s += a[i][j]*x[j]
    x[i] = (b[i]-s)/a[i][i]
  return x

a = [
     [1,  5,  -2],
     [2,  3,  1],
     [2,  4,  -3]
]
b = [
     2,
     5,
     2
]
x = gauss(a, b)
print(x)

[1.3478260869565215, 0.47826086956521746, 0.8695652173913044]


## NumPy

Numerikus számításokhoz készített függvénykönyvtár
- Alacsony szintű megvalósítás -> gyors
- Alaptípusa az *n* dimenziós tömb
- Kiválthatja a Matlab kódokat
- Számos magasabb szintű függvénykönyvtár épül rá, vagy képes használni (pl. Matplotlib)

Ha telepíteni szükséges (Colab-ban nem lesz rá szükség), próbálkozni lehet pl. az alábbiakkal:
> pip3 install numpy --user

Python csomag telepítése kizárólag az aktív felhasználó részére

> sudo apt-get install python3-numpy

Debian-alapú Linux rendszereken a szükséges csomag telepítése

> conda install numpy

[Conda](https://docs.conda.io) csomagkezelővel történő telepítés

### Tömbök létrehozása

- NumPy tömböt létrehozni egymásba ágyazott listákat/tuple-öket felhasználva lehet, esetleg valamilyen függvénnyel lehet adott tulajdonságú tömböket generáltatni.
- A tárolt adatok típusát a *dtype* tulajdonság mondja meg. A lehetséges értékeket lásd pl. [itt](https://numpy.org/doc/stable/user/basics.types.html#array-types-and-conversions-between-types) és [itt](https://numpy.org/doc/stable/reference/arrays.scalars.html#sized-aliases)
- A dimenziószám könnyen megállapítható az *ndim* tulajdonság értékének lekérdezésével.
- Az egyes dimenziók mentén mért elemszámot szolgáltatja a *shape* tulajdonság.

In [2]:
import numpy as np

np_b = np.array([
  2, 
  5, 
  2
])

np_a = np.array([
  [1,  5,  -2],
  [2,  3,  1],
  [2,  4,  -3]
])

print('Összetett típusok: ', type(b), type(np_b))

print('Alaptípusok: ', type(a[0][0]), np_a.dtype)

Összetett típusok:  <class 'list'> <class 'numpy.ndarray'>
Alaptípusok:  <class 'int'> int64


In [3]:
nullak = np.zeros((3, 2), np.int32) # Az alaptípus elhagyható; https://numpy.org/doc/stable/reference/generated/numpy.zeros.html
egyesek = np.ones((3, 2)) # https://numpy.org/doc/stable/reference/generated/numpy.ones.html
egyesek2 = np.array([[1.] * 2] * 3)
egysegmatrix = np.eye(3) # https://numpy.org/doc/stable/reference/generated/numpy.eye.html

print('Nullmátrix:\n', nullak)
print('Egyesekből álló mátrix:\n', egyesek)
print('Egyesek másképp létrehozva:\n', egyesek2)
print('Egységmátrix:\n', egysegmatrix)

Nullmátrix:
 [[0 0]
 [0 0]
 [0 0]]
Egyesekből álló mátrix:
 [[1. 1.]
 [1. 1.]
 [1. 1.]]
Egyesek másképp létrehozva:
 [[1. 1.]
 [1. 1.]
 [1. 1.]]
Egységmátrix:
 [[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


Ha az eredeti elemtípus nem megfelelő, később is át lehet alakítani a tömböt.

In [4]:
print(nullak.astype('float32'))

[[0. 0.]
 [0. 0.]
 [0. 0.]]


In [5]:
from typing import List

def tartomanyLepeskoz(tol: float, ig: float, lepes: float) -> List[float]:
  lista = []
  while tol < ig:
    lista.append(tol)
    tol += lepes
  return lista

tartomany1 = tartomanyLepeskoz(-1, 1, 0.2)
np_tartomany1 = np.arange(-1, 1, 0.2) # https://numpy.org/doc/stable/reference/generated/numpy.arange.html

print('Adott tartományba tartozó értékek előállítása a lépésköz megadásával:\n', tartomany1, '\n', np_tartomany1)

Adott tartományba tartozó értékek előállítása a lépésköz megadásával:
 [-1, -0.8, -0.6000000000000001, -0.4000000000000001, -0.20000000000000007, -5.551115123125783e-17, 0.19999999999999996, 0.39999999999999997, 0.6, 0.8] 
 [-1.00000000e+00 -8.00000000e-01 -6.00000000e-01 -4.00000000e-01
 -2.00000000e-01 -2.22044605e-16  2.00000000e-01  4.00000000e-01
  6.00000000e-01  8.00000000e-01]


In [6]:
def tartomanyElemszam(tol: float, ig: float, elemszam: int) -> List[float]:
  szelesseg = ig-tol
  return [tol+(szelesseg*e)/(elemszam-1) for e in range(0, elemszam)]

tartomany2 = tartomanyElemszam(-1, 1, 9)
np_tartomany2 = np.linspace(-1, 1, 9) # https://numpy.org/doc/stable/reference/generated/numpy.linspace.html

print('Adott tartományba tartozó értékek előállítása az elemszám megadásával:\n', tartomany2, '\n', np_tartomany2)

Adott tartományba tartozó értékek előállítása az elemszám megadásával:
 [-1.0, -0.75, -0.5, -0.25, 0.0, 0.25, 0.5, 0.75, 1.0] 
 [-1.   -0.75 -0.5  -0.25  0.    0.25  0.5   0.75  1.  ]


In [7]:
!wget -q https://raw.githubusercontent.com/sze-info/gknb_intm023/main/adatfajlok/engine.csv
import csv

def betolt(fnev: str, elvalaszto: str, fejlec: int) -> List[List[float]]:
  with open(fnev, 'r') as f:
    olvaso = csv.reader(f, delimiter=elvalaszto)
    for i in range(fejlec):
      next(olvaso)
    mtx = []
    for sor in olvaso:
      mtx.append(sor)
    return mtx

motor = betolt('engine.csv', ';', 1)

# https://numpy.org/doc/stable/reference/generated/numpy.loadtxt.html
# https://numpy.org/doc/stable/reference/generated/numpy.genfromtxt.html
np_motor = np.genfromtxt(fname='https://raw.githubusercontent.com/sze-info/gknb_intm023/main/adatfajlok/engine.csv',
                      delimiter=';', skip_header=1)

print('Szövegfájlból betöltött adatok:\n', motor, '\n', np_motor)

Szövegfájlból betöltött adatok:
 [['1500', '97.8', '15.355'], ['2000', '115.3', '24.136'], ['2500', '116.1', '30.380'], ['3000', '114.2', '35.859'], ['3500', '118.4', '43.395'], ['4000', '120.4', '50.407'], ['4500', '119.3', '56.190'], ['5000', '115.7', '60.550'], ['5500', '109.2', '63.200']] 
 [[1500.      97.8     15.355]
 [2000.     115.3     24.136]
 [2500.     116.1     30.38 ]
 [3000.     114.2     35.859]
 [3500.     118.4     43.395]
 [4000.     120.4     50.407]
 [4500.     119.3     56.19 ]
 [5000.     115.7     60.55 ]
 [5500.     109.2     63.2  ]]


In [8]:
# https://numpy.org/doc/stable/reference/generated/numpy.savetxt.html
np.savetxt('np_motor.csv', np_motor, fmt='%.3f', delimiter=';', header='Engine speed (RPM);Torque (Nm);Shaft power (kW)')
!cat np_motor.csv

# Engine speed (RPM);Torque (Nm);Shaft power (kW)
1500.000;97.800;15.355
2000.000;115.300;24.136
2500.000;116.100;30.380
3000.000;114.200;35.859
3500.000;118.400;43.395
4000.000;120.400;50.407
4500.000;119.300;56.190
5000.000;115.700;60.550
5500.000;109.200;63.200


In [9]:
def dimenzio(tomb : List, d=1) -> int:
  if isinstance(tomb[0], list):
    return dimenzio(tomb[0], d+1)
  return d

print('Dimenziók: ', dimenzio(a), np_a.ndim)

Dimenziók:  2 2


In [10]:
def meret(tomb : List):
  vissza = [len(tomb)]
  if isinstance(tomb[0], list):
      vissza += meret(tomb[0])
  return vissza

print('Méretek: ', meret(a), np_a.shape)

Méretek:  [3, 3] (3, 3)


### Mentés és betöltés

In [11]:
np.save("np_motor", np_motor) # A kiterjesztés elhagyható, alapértelmezetten npy
np_motor2 = np.load("np_motor.npy") # Itt már kötelező megadni a kiterjesztést
print(np_motor2)

[[1500.      97.8     15.355]
 [2000.     115.3     24.136]
 [2500.     116.1     30.38 ]
 [3000.     114.2     35.859]
 [3500.     118.4     43.395]
 [4000.     120.4     50.407]
 [4500.     119.3     56.19 ]
 [5000.     115.7     60.55 ]
 [5500.     109.2     63.2  ]]


## Indexelés, elemek elérése

In [12]:
ma = np.array((
    (11, 12), 
    (21, 22), 
    (31, 32)))

print('Bal felső elem:', ma[0][0])
print('Első sor:', ma[0], 'vagy', ma[0, :])
print('Első és utolsó sor:\n', ma[[0, -1], :])
print('Első oszlop:', ma[:, 0])
print('Utolsó oszlop:', ma[:, -1])

Bal felső elem: 11
Első sor: [11 12] vagy [11 12]
Első és utolsó sor:
 [[11 12]
 [31 32]]
Első oszlop: [11 21 31]
Utolsó oszlop: [12 22 32]


A tömbelemek módosíthatók.

In [13]:
mMod = np.array([
  [1, 2],
  [3, 4],
  [5, 6]
])
mMod[0][0] = -1
print(mMod[0][0])
mMod[:,1] = [10, 20, 30]
print(mMod)

-1
[[-1 10]
 [ 3 20]
 [ 5 30]]


Arra viszont figyeljünk, hogy az értékadás nem jelenti új tömb létrehozását.

In [14]:
mMasolat = mMod
mMod[0][0] = -2
print('mMasolat tartalma:\n', mMasolat)

mMasolat tartalma:
 [[-2 10]
 [ 3 20]
 [ 5 30]]


In [15]:
mMasolat = mMod.copy() # https://numpy.org/doc/stable/reference/generated/numpy.copy.html
mMod[0][0] = -3
print('mMasolat tartalma:\n', mMasolat)
mMasolat[0][0] = -4
print('mMasolat tartalma:\n', mMasolat)
print('maMod tartalma:\n', mMod)

mMasolat tartalma:
 [[-2 10]
 [ 3 20]
 [ 5 30]]
mMasolat tartalma:
 [[-4 10]
 [ 3 20]
 [ 5 30]]
maMod tartalma:
 [[-3 10]
 [ 3 20]
 [ 5 30]]


## Logikai kifejezések

In [16]:
mb = np.array((
    (0, 12),
    (0, 22),
    (31, 0)
))

print('Mely elemek nagyobbak 12-nél?\n', ma > 12)
print('Melyek az egyforma elemek?\n', ma == mb)
print('A 12-nél nagyobb elemek\n', ma[ma > 12])
print('Csak az egyforma elemek\n', ma[ma == mb])
print('11 és 32 értékű elemek index:\n', (ma==11) | (ma==32))
print('Páros és 20-nál nagyobb elemek:\n', (ma%2==0) & (ma>20))
print('Nem 22 értékű elemek:\n', ma != 22)

Mely elemek nagyobbak 12-nél?
 [[False False]
 [ True  True]
 [ True  True]]
Melyek az egyforma elemek?
 [[False  True]
 [False  True]
 [ True False]]
A 12-nél nagyobb elemek
 [21 22 31 32]
Csak az egyforma elemek
 [12 22 31]
11 és 32 értékű elemek index:
 [[ True False]
 [False False]
 [False  True]]
Páros és 20-nál nagyobb elemek:
 [[False False]
 [False  True]
 [False  True]]
Nem 22 értékű elemek:
 [[ True  True]
 [ True False]
 [ True  True]]


In [17]:
mc = np.array((
    (1, 2),
    (3, 4),
    (5, 6)
))

# https://numpy.org/doc/stable/reference/generated/numpy.where.html
print('A páratlan számok ma-ból, a többi mc-ből származik:\n', np.where(mc%2 == 1, ma, mc))

idx = np.where(ma > 30)
print('A 30-nál nagyobb elemek indexei: ', idx)
print('Maguk az értékek pedig:')
for i in range(2):
  print(ma[idx[0][i], idx[1][i]])

A páratlan számok ma-ból, a többi mc-ből származik:
 [[11  2]
 [21  4]
 [31  6]]
A 30-nál nagyobb elemek indexei:  (array([2, 2]), array([0, 1]))
Maguk az értékek pedig:
31
32


## Műveletek tömbökkel

### Vektor - skalár

A vektor minden elemén végrehajtja a műveletet egy skalár értékkel.

In [18]:
va = np.array((1, 2, 3))
vb = np.array((4, 5, 6))

print('va + 3 =', va + 3)
print('vb - 3 =', vb - 3)
print('va * 2 =', va * 2)
print('va / 2 =', va / 2)

va + 3 = [4 5 6]
vb - 3 = [1 2 3]
va * 2 = [2 4 6]
va / 2 = [0.5 1.  1.5]


### Vektor - vektor

Két vektor elemei között elemenként elvégzi a kért műveletet.

In [19]:
print('va + vb =', va + vb)
print('va - vb =', va - vb)
print('va * vb =', va * vb)
print('va / vb =', va / vb)

va + vb = [5 7 9]
va - vb = [-3 -3 -3]
va * vb = [ 4 10 18]
va / vb = [0.25 0.4  0.5 ]


Vektorok [skaláris szorzata](https://hu.wikipedia.org/wiki/Skal%C3%A1ris_szorzat)

In [20]:
print('Skaláris szorzat:', va @ vb)

Skaláris szorzat: 32


### Mátrix - mátrix

[Mátrixszorzás](https://hu.wikipedia.org/wiki/M%C3%A1trix_(matematika)#M%C3%A1trixszorz%C3%A1s)

In [21]:
md = np.array([
  [1, 1, 1],
  [1, 1, 1]
])
print(ma)
print('Mátrixok szorzata:\n', ma @ md)

[[11 12]
 [21 22]
 [31 32]]
Mátrixok szorzata:
 [[23 23 23]
 [43 43 43]
 [63 63 63]]


### Néhány egyoperandusos művelet

[Transzponálás](https://hu.wikipedia.org/wiki/M%C3%A1trix_(matematika)#Transzpon%C3%A1l%C3%A1s), egyedi elemek

In [22]:
print('ma transzponáltja:\n', ma.T)
print('md egyedi eleme:', np.unique(md)) # https://numpy.org/doc/stable/reference/generated/numpy.unique.html

ma transzponáltja:
 [[11 21 31]
 [12 22 32]]
md egyedi eleme: [1]


Statisztikai jellegű műveletek

In [23]:
print('Elemek összege:', np.sum(ma), ma.sum()) # https://numpy.org/doc/stable/reference/generated/numpy.sum.html
print('Legkisebb elem:', np.min(ma), ma.min()) # https://numpy.org/doc/stable/reference/generated/numpy.ndarray.min.html
print('Legnagyobb elem:', np.max(ma), ma.max()) # https://numpy.org/doc/stable/reference/generated/numpy.ndarray.max.html
print('Átlag:', np.average(ma)) # https://numpy.org/doc/stable/reference/generated/numpy.average.html
print('Szórás', np.std(ma), ma.std()) # https://numpy.org/doc/stable/reference/generated/numpy.std.html
print('Medián:', np.median(ma)) # https://numpy.org/doc/stable/reference/generated/numpy.median.html

Elemek összege: 129 129
Legkisebb elem: 11 11
Legnagyobb elem: 32 32
Átlag: 21.5
Szórás 8.180260794538684 8.180260794538684
Medián: 21.5


A trigonometrikus függvények elemenként dolgoznak

In [24]:
import math
mSzogek = np.linspace(0, 2*math.pi, 7)
print('Szögek radiánban:', mSzogek)
print('Ezek szinusza:', np.sin(mSzogek)) # https://numpy.org/doc/stable/reference/generated/numpy.sin.html
print('Koszinusza:', np.cos(mSzogek)) # https://numpy.org/doc/stable/reference/generated/numpy.cos.html

Szögek radiánban: [0.         1.04719755 2.0943951  3.14159265 4.1887902  5.23598776
 6.28318531]
Ezek szinusza: [ 0.00000000e+00  8.66025404e-01  8.66025404e-01  1.22464680e-16
 -8.66025404e-01 -8.66025404e-01 -2.44929360e-16]
Koszinusza: [ 1.   0.5 -0.5 -1.  -0.5  0.5  1. ]


Rendezés

In [25]:
import random
mRendezetlen = np.array([random.randint(1, 100) for i in range(5)])
print('Rendezetlen adatok:', mRendezetlen)
mRendezett = np.sort(mRendezetlen) # https://numpy.org/doc/stable/reference/generated/numpy.sort.html
print('Növekvő sorrend:', mRendezett)
print('Fordított sorrendben:', np.flip(mRendezett)) # https://numpy.org/doc/stable/reference/generated/numpy.flip.html
mRendezetlen.sort()
print('Növekvő sorrend, helyben rendezés:', mRendezetlen)

Rendezetlen adatok: [92 72 72 65 99]
Növekvő sorrend: [65 72 72 92 99]
Fordított sorrendben: [99 92 72 72 65]
Növekvő sorrend, helyben rendezés: [65 72 72 92 99]


## Tömbök elemeinek összefűzése

In [26]:
print('Vektorok elemeinek egymás után írása:', np.concatenate([va, vb])) # https://numpy.org/doc/stable/reference/generated/numpy.concatenate.html
print('Mátrixok elemeinek egymás után írása:\n', np.concatenate([ma, mc]))
print('Vízszintesen egymás után írt vektorok', np.hstack([va, vb])) # https://numpy.org/doc/stable/reference/generated/numpy.hstack.html
print('Vízszintesen egymás után írt mátrixok\n', np.hstack([ma, mc]))
print('Függőlegesen egymás után írt vektorok\n', np.vstack([va, vb])) # https://numpy.org/doc/stable/reference/generated/numpy.vstack.html
print('Függőlegesen egymás után írt mátrixok\n', np.vstack([ma, mc]))

Vektorok elemeinek egymás után írása: [1 2 3 4 5 6]
Mátrixok elemeinek egymás után írása:
 [[11 12]
 [21 22]
 [31 32]
 [ 1  2]
 [ 3  4]
 [ 5  6]]
Vízszintesen egymás után írt vektorok [1 2 3 4 5 6]
Vízszintesen egymás után írt mátrixok
 [[11 12  1  2]
 [21 22  3  4]
 [31 32  5  6]]
Függőlegesen egymás után írt vektorok
 [[1 2 3]
 [4 5 6]]
Függőlegesen egymás után írt mátrixok
 [[11 12]
 [21 22]
 [31 32]
 [ 1  2]
 [ 3  4]
 [ 5  6]]
