# Data terminologie
## Verduidelijking van termen die veel gebruikt worden met neural networks
Vaak zijn er verschillen in terminologie binnen verschillende disciplines. Zo worden er binnen computer science en wiskunde verschillende termen gebruikt voor hetzelfde concept. Een voorbeeld is:

|Computer Science|Wiskunde|index|
|-------|----|--|
|number| scalar|0|
|array| vector|1|
|2d-array| matrix|2|
|nd-array| nd-tensor|n|

Voortaan gaan we alleen maar gebruik maken van tensors. Aangezeien nd-tensor de overkoepelende term is, kan je een matrix ook zien als een 2d-tensor en een scalar als een 0d-tensor. Voor versimpeling geldt: het aantal indices die je nodig hebt om een element uit de tensor te halen is gelijk aan `n`. Dit heet ook wel *rank*. Zie dit als voorbeeld:

In [5]:
scalar = 4 # kan niet op geïndexeerd worden: rank = 0

vector = [2,4,6,3,2,56,7]
vector[1] # indexeer met 1 index: rank = 1

matrix = [[1, 1, 1],
          [1, 2, 3],
          [1, 4, 9],
          [1, 8, 27]]
matrix[2][1] # indexeer met 2 indexen: rank = 2
print(scalar, vector[1], matrix[2][1])

4 4 4


Wanneer rank $\gt 1$ kan je praten over *Axes* en *Length of Axes*. Met axes praat je over een specifieke dimensie.<br>
`matrix[0] <- axis 1`<br>
`matrix[1] <- axis 1`<br>
`matrix[2] <- axis 1`<br>
`matrix[3] <- axis 1`<br>
Length of axis 1 = 4 <br>
<br>
`matrix[0][0] <- axis 2`<br>
`matrix[0][1] <- axis 2`<br>
`matrix[0][2] <- axis 2`<br>
<br>
`matrix[1][0] <- axis 2`<br>
`matrix[1][1] <- axis 2`<br>
`matrix[1][2] <- axis 2`<br>
<br>
`matrix[2][0] <- axis 2`<br>
`matrix[2][1] <- axis 2`<br>
`matrix[2][2] <- axis 2`<br>
<br>
`matrix[3][0] <- axis 2`<br>
`matrix[3][1] <- axis 2`<br>
`matrix[3][2] <- axis 2`<br>
Length of axis 2 = 3

De elementen van de laatste axis zijn altijd scalars (of 0d-tensors). Dit kan je generaliseren tot:<br> Axis $k$ bij een nd-tensor bestaat uit ($n-k$)d-tensors.

Door de lengte van alle axes te lezen wordt de *shape* van de tensor achterhaald. Dit is hoe groot de tensor is. In ons geval is `matrix`:
- een 2d-tensor
- met rank = 2
- axis 1 heeft een lengte van 4
- axis 2 heeft een lengte van 3
- de shape is (4, 3)

In [7]:
import torch
t = torch.tensor(matrix)
print(t)
print(type(t))
print(t.shape)

tensor([[ 0,  0,  0],
        [ 1,  2,  3],
        [ 1,  4,  9],
        [ 1,  8, 27]])
<class 'torch.Tensor'>
torch.Size([4, 3])
