Numpy und Matplotlib (+ Beispiele)
==============

**Numpy** ist eine Bibliothek, die eine einfache Handhabung von Vektoren, Matrizen oder generell großen mehrdimensionalen Arrays ermöglicht. Neben den Datenstrukturen bietet NumPy auch effizient implementierte Funktionen für numerische Berechnungen an.

**Matplotlib** erlaubt es mathematische Darstellungen aller Art anzufertigen. 

Eine andere zentrale Bibliothek ist **SciPy**. Sie wird hauptsächlich für wissenschaftliche und technische Berechnungen verwendet. SciPy enthält Module für Optimierung, lineare Algebra, Integration, Interpolation, spezielle Funktionen, FFT, Signal- und Bildverarbeitung, ODE-Löser und andere in Wissenschaft und Technik übliche Aufgaben.

# 1. Numpy

## 1.1 Zentrale Datenstruktur:  "array"

Ein Array kann auf verschiedene Art erzeugt werden, zum Beispiel mit der Funktion `array` aus einer Liste von Zahlen. Von anderen Arten wird gleich noch die Rede sein.

Ein solches Array ist eine Speicherstruktur, in der Zahlen (oder andere Objekte) in Abhängigkeit
von einer gewissen Zahl von Indices gespeichert sind. Eine Matrix als rechteckige Anordnung von Zahlen ist der Spezialfall eines Arrays mit zwei Indices.  Ein Array mit drei Indizes könnte man sich als quaderförmige Anordnung von Zahlen vorstellen.  Allgemeiner ist ein Array dessen Einträge mit n Indices adressiert werden können, ein n-dimensionales Array.

Ist `a` ein solches Array, so liefert das Attribut (Achtung! keine runden Klammern, keine Funktion!)

    a.shape
    
ein Tupel, dessen Länge die Dimension des Arrays ist, die sich auch direkt mit `a.ndim` erfragen lässt. Jeder Eintrag `a.shape[i]` des Tupels gibt an, welche Werte der i. Index annehmen kann, nämlich `range(a.shape[i])`. Die folgende Liste der Attribute eines Arrays aus der Dokumentation erlaubt, noch mehr Informationen über die Datenstruktur zu erhalten:

    ndarray.flags 	   Information about the memory layout of the array.
    ndarray.shape 	   Tuple of array dimensions.
    ndarray.strides 	 Tuple of bytes to step in each dimension when traversing an array.
    ndarray.ndim    	 Number of array dimensions.
    ndarray.data 	    Python buffer object pointing to the start of the array’s data.
    ndarray.size 	    Number of elements in the array.
    ndarray.itemsize 	Length of one array element in bytes.
    ndarray.nbytes   	Total bytes consumed by the elements of the array.
    ndarray.base 	    Base object if memory is from some other object.

Auf die Elemente eines Arrays `A` kann zugegriffen werden mit
  
    A[i1,i2,...,ik]
    
    oder
    
    A[i1][i2]...[ik]
    
Die letzte Schreibweise zeigt noch einmal die Verwandschaft eines Arrays mit einer Liste von Listen
von Listen...



Wichtige Funktionen


Erzeugen von Arrays:

      np.array([....])        erzeugt ein Array aus den Elementen einer (verschachtelten) Liste
      np.zeros(shape)         erzeugt ein Array aus Nullen, dessen Shape durch das Tupel `shape` gegeben ist
      np.ones(shape)          erzeugt ein Array aus Einsen, dessen Shape durch das Tupel `shape` gegeben ist
      np.zeros_like(A)        erzeugt ein Array aus Nullen mit der selben Shape wie A
      np.ones_like(A)         erzeugt ein Array aus Einsen mit der selben Shape wie A
      
      np.arange(anfang, [ende, [sprung]])  erzeugt das Array [anfang, anfang+sprung,anfang +2*sprung,...],
                                           wobei 'ende' nicht dazu gehört.
      np.linspace(anfang, ende, n)         erzeugt ein Array mit n Elementen
                                           und gleichen Abständen, das erste ist anfang, das letzte ist ende.
      np.random.rand(n1,n2,...,nk)         erzeugt eine Matrix der Shape (n1,...,nk), die mit Zufallszahlen 
                                           aus der Gleichverteilung auf [0,1] gefüllt ist
      np.random.randn(n1,....,nk)          erzeugt eine Matrix der Shape (n1,...,nk), die mit Zufallszahlen 
                                           aus der Gauß'schen Normalverteilung gefüllt ist
                                           
Aus Arrays neue Arrays berechnen:      
                                           
      np.concatenate((A,B,...), axis=...)  nimmt die Arrays A,B,... und fügt
                                           sie längs der Achse 'axis' zu einem Array zusammen.  
                                           axis=0 hieße für 2-dim Arrays, sie übereinander zu stapeln, 
                                           axis=1 bedeutet, sie hintereinander zu hängen.

      np.dot(A,B) bzw. A.dot(B)   gibt das Matrizenprodukt zweier Arrays zurück, bzw.das Skalarprodukt zweier 
                                  eindimensionaler Arrays.
                                
      A.reshape(new_shape)    gibt ein Array zurück, das aus der Umordnung von A zur neuen Shape new_shape 
                              entsteht; die Shapes müssen kompatibel sein.               
                              
      A.copy() oder np.copy(A)  gibt eine Kopie des Arrays A zurück.
      

In [None]:
import numpy as np

In [None]:
v = np.arange(100)   # liefert die Liste 0..99 als Vektor
v

In [None]:
type(v)

In [None]:
v.flags

In [None]:
v.shape

In [None]:
v[2]

In [None]:
w = v.reshape((2, 50))  # beachtet: die neue Matrix wird zeilenweise befüllt
w

In [None]:
w[1, 0]  # erstes Element der zweiten Zeile

In [None]:
w[1][0]  # dito

In [None]:
w.flags  # hier sieht man, dass in der neuen Matrix die Einträge der
# Matrix im Speicher hintereinander stehen, die der Spalten nicht
# Das bedeutet C_CONTIGUOUS, denn so ist es in der Programmiersprace C.
# In Fortran wäre es umgekehrt.

In [None]:
v.dot(v)  # Skalarprodukt mit sich selbst

In [None]:
np.ones_like(v)

In [None]:
# Anwenden einer numpy-Funktion ('universal function') auf ein Array bedeutet,
sinuswerte = np.sin(0.1*v)
print(sinuswerte)          # sie auf jedes Element anzuwenden.

In [None]:
v2 = np.concatenate((v, v))  # Aneinanderhängen zweier Vektoren
print(v2)
print(v2.shape)

## 1.2 Lineare Algebra 

Zunächst noch ein paar Beispiel zu `np.dot`, was ja die zentrale algebraische Operation für Matrizen ist.

In [None]:
A = np.array([[1, 2], [3, 4]])
print(A)

In [None]:
v = np.array([[2], [3]])
print(v)

In [None]:
print(np.dot(A, v))  # Matrix-Vektor-Produkt

In [None]:
A.dot(v)  # alternative Schreibweise

Transponieren geht nicht über eine Funktion, sondern über ein Attribut. **Achtung!** Dieses legt kein neues Objekt im Speicher an, sondern nur eine andere 'View' auf dasselbe Objekt. Wenn Sie also das Transponierte verändern, verändern Sie das ursprüngliche Objekt auch. Wollen Sie das nicht, müssen Sie explizit mit `np.copy` eine Kopie anfertigen.

In [None]:
v.T  # transponieren

In [None]:
# v und v.T beziehen sich auf dasselbe Objekt im Speicher:
w = v.T
w[0, 0] = 5  # verändert v und w
print(v, w)

In [None]:
# Diesmal wird v.T kopiert: w bezieht sich auf ein anderes Objekt im Speicher.
w = np.copy(v.T)
print(w, v)
w[0, 0] = 6   # verändert nur w
print(w, v)

Für weitergehende Operationen der linearen Algebra gibt es ein Unterpaket: `numpy.linalg`

In [None]:
help(np.linalg)

Eine Funktion, die sehr wichtig ist, ist  `numpy.linalg.solve`. Sie löst ein lineares Gleichungssystem mit einer schnellen, in C programmierten Variante des Gauß'schen Algorithmus.

In [None]:
A = np.array([[1, 2], [3, 4]])
v = np.array([[2], [3]])
np.linalg.solve(A, v)

In [None]:
# Probieren wir mal, wie lange ein 10000x10000-Gleichungssystem dauert

v = np.random.rand(10000)

In [None]:
v[:100]

In [None]:
A = np.random.rand(10000, 10000)

In [None]:
A.shape

In [None]:
v.shape

In [None]:
v = v.reshape((10000, 1))

In [None]:
%time np.linalg.solve(A, v)  #das dauert eine Weile ...

## 1.3 Slicing

Wie bei Listen und Strings ist Slicing eine wichtige Operation, die hier noch flexibler ist, denn man kann auch 
mit einem Tupel (t1,t2,...,tk) für die entsprechende Dimension gerade die Einträge mit den Indices t1,...,tk auswählen.

In [None]:
A = np.arange(20).reshape((5, 4))
print(A)

In [None]:
A[:2, :]

In [None]:
A[:, 1:3]

In [None]:
A[0, 1:4]

In [None]:
A[:, (0, 3)]  # slicing mit tupel: Spalten 0 und 3

In [None]:
A[(1, 2, 3), :] = A[(2, 3, 1), :]  # slicing mit Tupel bei Zuweisung
# die Zeilen 2,3,1 treten an die Stelle
# der Zeilen 1,2,3

In [None]:
print(A)

## 1.4 Kumulierende Funktionen

     numpy.sum(..., [axis=...])     summiert die Einträge, gegebenenfalls längs axis
     numpy.mean(..., [axis=...])    Mittelwert über die Einträge, ggf. längs axis
     numpy.std(..., [axis=...])     Standardabweichung ü.d. Einträge, ggf. längs axis
     
Dabei ist axis entweder eine Zahl oder ein Tupel, wenn über mehre Dimension summiert werden soll. Es gibt noch viel mehr solcher Funktionen, aber hier wird keine Vollständigkeit angestrebt.


In [None]:
np.sum(A, axis=1)

In [None]:
np.sum(A, axis=0)

In [None]:
np.mean(A)

In [None]:
np.mean(A, axis=1)

## 1.5 Daten aus Tabelle lesen

Da numpy unter anderem zur Datenverarbeitung gut ist, gibt es auch Funktionen, die beim Lesen von Daten helfen, etwa aus einer 'komma-separierten Liste' csv.

     np.genfromtxt(dateiname, [delimiter=...,[skip_header=...])

In [None]:
%ls *.csv

In [None]:
daten = np.genfromtxt("algebuei.csv", delimiter=";", skip_header=True)

In [None]:
daten

In [None]:
np.mean(daten, axis=0)

## 1.6 numpy.random

Oben wurden schon zufällige Arrays erzeugt. `numpy.random` kann natürlich viel mehr.
Zufallsverteilungen spielen eine große Rolle in Simulationen (Verkehr, Populationen, Physik), könnten daher auch für ein Projekt wichtig sein. Daher die Auflistung aus der offiziellen Dokumentation:

Random sampling (numpy.random)

Simple random data

    rand(d0, d1, …, dn) 	Random values in a given shape.
    randn(d0, d1, …, dn) 	Return a sample (or samples) from the “standard normal” distribution.
    randint(low[, high, size, dtype]) 	Return random integers from low (inclusive) to high (exclusive).
    random_integers(low[, high, size]) 	Random integers of type np.int between low and high, inclusive.
    random_sample([size]) 	Return random floats in the half-open interval [0.0, 1.0).
    random([size]) 	Return random floats in the half-open interval [0.0, 1.0).
    ranf([size]) 	Return random floats in the half-open interval [0.0, 1.0).
    sample([size]) 	Return random floats in the half-open interval [0.0, 1.0).
    choice(a[, size, replace, p]) 	Generates a random sample from a given 1-D array
    bytes(length) 	Return random bytes.
    
Permutations

    shuffle(x) 	Modify a sequence in-place by shuffling its contents.
    permutation(x) 	Randomly permute a sequence, or return a permuted range.
    Distributions
    beta(a, b[, size]) 	Draw samples from a Beta distribution.
    binomial(n, p[, size]) 	Draw samples from a binomial distribution.
    chisquare(df[, size]) 	Draw samples from a chi-square distribution.
    dirichlet(alpha[, size]) 	Draw samples from the Dirichlet distribution.
    exponential([scale, size]) 	Draw samples from an exponential distribution.
    f(dfnum, dfden[, size]) 	Draw samples from an F distribution.
    gamma(shape[, scale, size]) 	Draw samples from a Gamma distribution.
    geometric(p[, size]) 	Draw samples from the geometric distribution.
    gumbel([loc, scale, size]) 	Draw samples from a Gumbel distribution.
    hypergeometric(ngood, nbad, nsample[, size]) 	Draw samples from a Hypergeometric distribution.
    laplace([loc, scale, size]) 	Draw samples from the Laplace or double exponential distribution with specified location (or mean) and scale (decay).
    logistic([loc, scale, size]) 	Draw samples from a logistic distribution.
    lognormal([mean, sigma, size]) 	Draw samples from a log-normal distribution.
    logseries(p[, size]) 	Draw samples from a logarithmic series distribution.
    multinomial(n, pvals[, size]) 	Draw samples from a multinomial distribution.
    multivariate_normal(mean, cov[, size, …) 	Draw random samples from a multivariate normal distribution.
    negative_binomial(n, p[, size]) 	Draw samples from a negative binomial distribution.
    noncentral_chisquare(df, nonc[, size]) 	Draw samples from a noncentral chi-square distribution.
    noncentral_f(dfnum, dfden, nonc[, size]) 	Draw samples from the noncentral F distribution.
    normal([loc, scale, size]) 	Draw random samples from a normal (Gaussian) distribution.
    pareto(a[, size]) 	Draw samples from a Pareto II or Lomax distribution with specified shape.
    poisson([lam, size]) 	Draw samples from a Poisson distribution.
    power(a[, size]) 	Draws samples in [0, 1] from a power distribution with positive exponent a - 1.
    rayleigh([scale, size]) 	Draw samples from a Rayleigh distribution.
    standard_cauchy([size]) 	Draw samples from a standard Cauchy distribution with mode = 0.
    standard_exponential([size]) 	Draw samples from the standard exponential distribution.
    standard_gamma(shape[, size]) 	Draw samples from a standard Gamma distribution.
    standard_normal([size]) 	Draw samples from a standard Normal distribution (mean=0, stdev=1).
    standard_t(df[, size]) 	Draw samples from a standard Student’s t distribution with df degrees of freedom.
    triangular(left, mode, right[, size]) 	Draw samples from the triangular distribution over the interval [left, right].
    uniform([low, high, size]) 	Draw samples from a uniform distribution.
    vonmises(mu, kappa[, size]) 	Draw samples from a von Mises distribution.
    wald(mean, scale[, size]) 	Draw samples from a Wald, or inverse Gaussian, distribution.
    weibull(a[, size]) 	Draw samples from a Weibull distribution.
    zipf(a[, size]) 	Draw samples from a Zipf distribution.
    
Random generator

    RandomState([seed]) 	Container for the Mersenne Twister pseudo-random number generator.
    seed([seed]) 	Seed the generator.
    get_state() 	Return a tuple representing the internal state of the generator.
    set_state(state) 	Set the internal state of the generator from a tuple.

# 2. Matplotlib (pyplot)

In [None]:
import matplotlib.pyplot as plt
%matplotlib notebook

# try (after restart) %matplotlib inline
#                  or %matplotlib qt
#                  or %matplotlib notebook

In [None]:
x = np.linspace(0, 10, 1000)

In [None]:
y = np.sin(x)

In [None]:
plt.figure()
plt.plot(x, y)
plt.show()

Bei den meisten graphischen "Backends" erscheint die Graphik erst
beim Aufruf von plt.show()
Vorher existiert sie nur als Datenstruktur

In Jupyter-Notebooks entfällt show() meistens, da es automatisch
aufgerufen wird. Für eine interaktive Umgebung zur Datenanalyse
(und zum Ausprobieren) ist das sinnvoll.

In [None]:
plt.figure()
plt.hist(daten[:, 3], bins=50)

In [None]:
plt.show() #das braucht ihr in einem "normalen" Python-Skript um den Plot anzuzeigen

In [None]:
daten.shape

In [None]:
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

x = np.linspace(-3, 3, 500)
y = np.linspace(-3, 3, 500)
xx, yy = np.meshgrid(x, y)
z = np.sin(xx*xx+yy*yy)
ax.plot_surface(xx, yy, z)
plt.show()

# 3. Anwendungen und Beispiele

## 3.1 Schall und ein Beispiel für 'concatenate'

In [None]:
from schallwerkzeuge import *

In [None]:
y = recordsnd(None, 1)

In [None]:
playsnd(y, RATE)

In [None]:
plt.figure()
plt.plot(y)
plt.show()

In [None]:
y.shape

In [None]:
x = np.linspace(0, 1, 44100) #erzeugt eine Liste die dann Sekunden entspricht

In [None]:
plt.figure()
plt.plot(x, y)
plt.show()

In [None]:
y2 = y*np.sin(40*2*np.pi*x)

In [None]:
playsnd(y2, RATE)

In [None]:
playsnd(y[::-1], RATE) #reverse

In [None]:
z = np.zeros(0)
for i in range(4):
    z = np.concatenate((z, y, y[::-1], y2))

In [None]:
playsnd(z, RATE)

z = 0.5*(z+z[list(range(5000, z.shape[0]))+list(range(5000))]) #was ist das ... ??

In [None]:
z = 0.5*(z+z[list(range(5000, z.shape[0]))+list(range(5000))])

playsnd(z, RATE)

## 3.2 Bilder

In [None]:
from scipy import ndimage  #hier taucht scipy auf!
import imageio

In [None]:
bild = imageio.imread('IMGP2821.JPG', pilmode='F')
# tragen Sie doch hier den Namen eines Bildes ein, das sich im
# Verzeichnis befindet.

In [None]:
bild.shape

In [None]:
plt.figure()
plt.imshow(bild, cmap=plt.get_cmap('gray'))

In [None]:
plt.figure()
plt.imshow(bild)
plt.show()

In [None]:
a = np.abs(bild[10:, :]-bild[:-10])
# Was koennte diese Rechnung bewirken -- bevor Sie sich das Ergebnis ansehen?

In [None]:
plt.figure()
plt.imshow(a, cmap=plt.get_cmap('gray'))

## Schall

Wer mit Daten von Tonaufnahmen umgehen will, könnte das interessant finden.

In [None]:
from schallwerkzeuge import *

In [None]:
help(recordsnd)

In [None]:
y = recordsnd(None, 2)

In [None]:
y.shape

In [None]:
%matplotlib notebook
import matplotlib.pyplot as plt

In [None]:
plt.plot(y)
plt.show()

In [None]:
help(playsnd)

In [None]:
playsnd(y, RATE)

In [None]:
playsnd(y, 2*RATE)

### Aufgabe

Erzeugen Sie einen numpy-Vektor von reellen Zahlen, das beim Abspielen mit playsnd(...)
    einen Kammerton (a, 440 Hz) ergibt. 