Notebook zu Python: Erzeugung von numpy Arrays

Version 1.2, 5. Januar 2024, Informatik, EAH Jena

(c) Christina B. Class

In diesem Notebook wird `numpy` verwendet, daher ist folgende `import` Zeile relevant. 

In [None]:
import numpy as np

# Erzeugung von `numpy` Arrays

In diesem Notebook lernen Sie die verschiedenen Funktionen kennen, um ein `numpy` Array zu erzeugen.

### 1. Die Funktion `array()`

`array(object)` erzeugt ein `numpy` Array aus den in `object` übergebenen Daten. Häufig übergibt man eine verschachtelte Liste von Werten.

In [None]:
import numpy as np

a=np.array([1,2,3])
print(a)

Bitte beachten Sie:
- Werte in einem `numpy` Array können verändert werden.
- **Die Anzahl Elemente kann nicht verändert werden.** Obiges Array hat also permanent 3 Werte.

Testen Sie folgenden Code:

In [None]:
print(a)
a[1]=15
print(a)

Nun testen Sie bitte folgenden Code:

In [None]:
print(a)
a[0]=3.75
print(a)

Sie werden feststellen, dass `a[0]` nun den Wert 3 und **nicht** den Wert 3.75 hat.

**Der Datentyp der Werte eines `numpy` Arrays wird bei der Erzeung festgelegt und kann nicht verändert werden.** Da bei der Definition des `numpy` Arrays oben nur ganzzahlige Werte übergeben werden, enthält unser Array nur ganze Zahlen:

In [None]:
print(a.dtype)

Werden Kommazahlen in das Array geschrieben, wird der *abgerundete* Quotient gespeichert.

In [None]:
print(a)
a[0]=3.99999999
print(a)

Sollen in einem `numpy` Array Kommazahlen gespeichert werden, was meistens der Fall ist, muss man also entweder

- von vornherein mindestens eine Kommazahl abspeichern

In [None]:
import numpy as np

a=np.array([1.0,2,3]) # oder: a=np.array([1.,2,3])
print(a)
print(a.dtype)

oder aber 

- den Datentyp mit Hilfe des `dtype` Parameters setzen

In [None]:
a=np.array([1,2,3], dtype='float')
print(a)
print(a.dtype)

Matrizen können Sie mit verschachtelten Listen erzeugen:

In [None]:
a2=np.array([[1,2,3], [3,4.5,2], [3,4,21]])
print(a2)

Hierbei gilt, dass die Dimensionen aller Listen gleich sein müssen. 

Selbstverständlich können Sie auch `range()`, `tuple` etc. zur Erzeugung von `numpy` Arrays nutzen:

In [None]:
import numpy as np

a3=np.array(range(1,12,3))
a4=np.array(range(1,12,3),dtype='float')
a5=np.array((1,3,4,5,6,2,1.3))

print('a3:')
print(a3)
print('a4:')
print(a4)
print('a5:')
print(a5)

### 2. Die Funktion `linspace()`

Die Funktion `linspace()` erzeugt ein Array mit `num` Werten, die in einem gegebenen Intervall gleichverteilt sind, also gleiche Abstände zueinander aufweisen.

Die Funktion erhält drei Parameter:

- `start`: Anfangswert des Intervalls (inklusive)
- `stop`: Endwert des Intervalls (ebenfalls *inklusive*)
- `num`: Anzahl der Datenpunkte

Das erzeugte Array enthält Elemente vom Typ `float`: 


In [None]:
import numpy as np

#Beispiel 1
a=np.linspace(1,10,10)
print(a)

In [None]:
import numpy as np

# Beispiel 2
a=np.linspace(1,2,15)
print(a)

### 3. Die Funktion `empty()` 

Wie bereits weiter oben erwähnt, ist die Größe eines `numpy` Arrays unveränderlich. Es kann also notwendig sein, von Beginn an ein großes Array zu erzeugen, weil im Laufe einer Berechnung viele Daten in das Array geschrieben werden müssen. Geht es aber nur darum, die Anzahl Elemente zu reservieren, müssen diese nicht mit einem spezifischen Wert initialisiert werden. Diese "Reservation" übernimmt die Funktion `empty()`.

Natürlich ist in einem Speicher nicht wirklich etwas leer ("empty"). Die Funktion `empty()` reserviert einfach den Speicherplatz. Die dort befindliche Information wird nicht verändert. Wenn Sie das Array direkt ausgeben, werden die dort stehenden Bitmuster dann als Zahl interpretiert (standardmäßig erzeugt `empty()` Arrays vom Datentyp `float`) und dies kann zufällig *erscheinende* Werte ergeben. Sie dürfen sich auf keinen Fall darauf verlassen, dass ein mit `empty()` erzeugtes Array spezifische Werte hat. Diese sind andererseits auch nicht wirklich zufällig. `empty()`  reserviert einfach nur Speicher und überschreibt die in diesem Speicher stehenden Bits nicht. 

Für die Erzeugung des Arrays muss die Größe angegeben werden. Die erfolgt als `int` bei einem eindimensionalen Array bzw. als `tuple` bei mehrdimensionalen Arrays.

In [None]:
import numpy as np

a=np.empty(3)
b=np.empty((3,4))
print('a:')
print(a)
print('b:')
print(b)

**Hinweis:** Auch falls eines oder beide Arrays, die erzeugt wurden, nur Nullen enthält, dürfen Sie von keinem bestimmten Wert ausgehen.

Wenn Sie Arrays erzeugen wollen, die nur Nullen enthalten, verwenden Sie bitte die Funktion `zeros()`.

### 4. Die Funktionen `zeros()` und `ones()`

Mit den Funktionen `zeros()` und `ones()` erzeugen Sie Arrays einer gegebenen Größe, die nur Nullen (`zeros()`) bzw. nur Einsen (`ones()`) enthalten.

Die Angabe der Größe erfolgt analog zur Angabe in der Funktion `empty()`.

In [None]:
import numpy as np

a=np.zeros(4)
b=np.zeros((2,6))
c=np.ones((3,4))

print('a:')
print(a)
print('b:')
print(b)
print('c:')
print(c)

"Sparse" nennt man eine Matrix, die fast nur aus Nullen und aus wenigen Elementen ungleich 0 besteht. Diese kann man mit Hilfe von `zeros()` sehr bequem erzeugen.

In [None]:
import numpy as np

a=np.zeros((5,8))
a[1,3]=-3
a[1,5]=15.4
a[4,7]=12
print(a)

### 5. Die Funktion `eye()`

Eine wichtige Matrix der Mathematik ist die sogenannte Einheitsmatrix. Es ist eine $N \times N$ Matrix, deren  Elemente auf der Hauptdiagonalen 1, alle anderen Elemente 0 sind.

Die Einheitsmatrix können Sie mit `eye()` erzeugen, indem Sie die Größe ($N$) als Parameter übergeben:

In [None]:
import numpy as np

a=np.eye(5)
print(a)

Python erlaubt es auch, eine $N \times M$ Matrix mit Nullen zu definieren, die an der Hauptdiagonalen Einsen hat. Natürlich gibt es dann Zeilen (falls $N>M$) oder Spalten (falls $N<M$), die nur aus Nullen bestehen.

$M$ wird als zweiter, optionaler, Parameter (d.h. der Parameter hat einen Defaultwert), übergeben:

In [None]:
import numpy as np

a=np.eye(4,5)
b=np.eye(5,4)
print('a:')
print(a)
print('b:')
print(b)

`eye()` hat einen weiteren optionalen Parameter `k`. Mit `k` kann die Diagonale der Einsen verschoben werden. Defaultmäßig hat `k` den Wert 0. Hat `k` einen positiven Wert, wird die Diagonale nach rechts verschoben, ist `k` negativ, wird sie nach unten verschoben.

In [None]:
import numpy as np

# k=0
a=np.eye(6)
print('6x6 Matrix')
print(a)

In [None]:
import numpy as np

# k=1
a=np.eye(6,k=1)
print('6x6 Matrix, Diagonale um 1 nach rechts')
print(a)

In [None]:
import numpy as np

# k=3
a=np.eye(6,k=3)
print('6x6 Matrix, Diagonale um 3 nach rechts')
print(a)

In [None]:
import numpy as np

# k=-2
a=np.eye(6,k=-2)
print('6x6 Matrix, Diagonale um -2 nach unten')
print(a)

### 6. Die Funktion `diag()` 

Die Funktion `diag()` erhält ein "Iterable" (eindimensionales Array, Liste, Tupel) und erzeugt eine $N \times N$ Matrix mit diesen Werten an der Hauptdiagonalen und 0en sonst. Die Größe der Matrix ergibt sich durch die Anzahl Elemente im übergebenen Array:

In [None]:
import numpy as np

a=np.diag([1,2,3])
print('Laenge der Vektors: 3')
print(a)

In [None]:
import numpy as np

a=np.diag(range(1,7))
print('Laenge der Vektors: 6')
print(a)

Wie bei `eye()` gibt es auch hier einen Parameter `k`, der es erlaubt, die Diagonale nach rechts oder unten zu verschieben. Die Größe der Matrix wird in der entsprechenden Dimension angepasst. Es wird also sichergestellt, dass die Matrix alle übergebenen Werte enthält. 

Wird also die Diagonale nach rechts verschoben, erhält die Matrix zusätzliche Spalten. Wird sie nach unten verschoben, zusätzliche Zeilen.

In [None]:
import numpy as np

a=np.diag([1,2,3])
b=np.diag([1,2,3],k=-1)
c=np.diag([1,2,3],k=2)
print('Laenge der Vektors: 3')
print(a)
print('Laenge der Vektors: 3, k=-1, verschieben nach unten, eine zusaetzliche Zeile')
print(b)
print('Laenge der Vektors: 3, k=2, verschieben nach rechts, zwei zusaetzliche Spalten')
print(c)

**Information:** Auch andere Sprachen, wie z.B. die Sprache von Matlab, bieten Funktionen an, um direkt spezifische Arrays / Matrizen zu erzeugen.

*Ende des Notebooks*

<a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/4.0/"><img alt="Creative Commons Lizenzvertrag" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-nd/4.0/88x31.png" /></a><br /><span xmlns:dct="http://purl.org/dc/terms/" property="dct:title">Dieses Notebook wurde von Christina B. Class für die Lehre an der EAH Jena erstellt. Es ist lizenziert unter einer <a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/4.0/">Creative Commons Namensnennung - Nicht kommerziell - Keine Bearbeitungen 4.0 International Lizenz</a>.