### 6. Einfache statistische Kennwerte

##### 6.1. Statistische Kennwerte
Folgende Kennwerte einer Zahlenfolge $_{x1}, ..., x_{n}$ sind zu berechnen:


|Kennwert| Berechnungsvorschrift|
|--------|----------------------|
|Minimum|kleinster Wert der Zahlenfolge|
|Maximum| größter Wert der Zahlenfolge|
|Spanne|Maximum - Minimum|
|Arithmetischer Mittelwert| $ am = \frac{1}{n} \sum\limits_{i=1}^{n}x_{i}$ |
|Geometrischer Mittelwert | $gm = \sqrt[n]{x_{1} \cdot x_{2} \cdot ... \cdot x_{n}}$<br>Zur Berechnung siehe [Abschnitt 6.3.](#63-berechnung-des-geometrischen-mittelwertes)|
|Quadratischer Mittelwert | $qm = \sqrt{ \frac{1}{n} \sum\limits_{i=1}^{n} x_{i}^{2} }$ |
|Mittlere Abweichung| $ ma = \frac{1}{n} \sum\limits_{i=1}^{n} \left\| { x_{i} - am } \right\| $ |
| Median | Der Median einer Menge von Zahlen, die der Größe nach sortiert sind, ist bei ungerader Anzahl der Wert in der Mitte, bei gerader Anzahl das arithmetische Mittel der beiden Werte in der Mitte.<br>Zur Sortierung siehe [Abschnitt 6.2.](#62-sortieren-durch-vertauschen) |

Bei der Programmerstellung ist folgendermaßen vorzugehen:<br>
* Verwenden Sie zur Berechnung der Kennwerte jeweils eine eigene Funktion. Weiterhin wird das
Füllen, Ausgeben und Sortieren eines des Feldes, sowie der Wertetausch zweier `float`-Variablen
jeweils in einer eigenen Funktion dargestellt (siehe unten)
* Es sollen 200 `float`-Werte berücksichtigt werden, die mit Hilfe des Zufallsgenerators `random()` (`import random`)
erzeugt werden können (Wertebereich 0 bis 100; eine Nachkommastelle,
die ungleich Null sein kann).
* Zur Berechnung der Quadratwurzel wird die Funktion `sqrt()` verwendet (`import math`).
* Zur Berechnung des Betrages einer `float`-Größe wird die Funktion `abs()` verwendet.
* Die nachfolgenden Prototypen sind zu verwenden.
```
def fill_field(field, count, lower_value, upper_value):
    ...
def print_field(field):
    ...

def change(field, idx1, idx2):
    ...

def sort_field_ascending(field):
    ...

def sort_field_descending(field):
    ...

def minimum(field):
    ...
    retrun result

def maximum(field):
    ...
    retrun result

def spread (field):
    ...
    retrun result

def arith_mean(field):
    ...
    retrun result

def geo_mean(field):
    ...
    retrun result

def square_mean(field):
    ...
    retrun result

def mean_aberration(field):
    ...
    retrun result

def median (field):
    ...
    retrun result
```
* Die Funktion `fill_field` füllt das übergebene Feld mit Zufallswerten die zwischen unten und
oben liegen sollen.
* Die Funktion `print_field` gibt das übergebene Feld in Zeilen zu 10 Werten aus.
* Die Funktion `change` tauscht die Werte mit den Indizees `idx1` und `idx2` im Feld `field` aus.
* Die beiden Sortierfunktionen `sort_field_ascending`und `sort_field_descending` verwenden das Verfahren, welches in [Abschnitt 6.2](#62-sortieren-durch-vertauschen) dargestellt ist.
* Die Funktion `median` ruft zur Sortierung eine der beiden Sortierfunktionen auf. Die Daten
werden dabei im Originalfeld sortiert, das heißt es soll kein Hilfsfeld angelegt werden.

##### 6.2 Sortieren durch Vertauschen

![alt text](cpp1_a6_abb_6_1_sortieren_durch_vertauschen.png)<br>
Abbildung 6.1.: Sortieren durch Vertauschen

**Vorgehensweise.** Das erste und das zweite Element der vorgelegten Liste werden verglichen. Ist das erste größer als das zweite, so werden die beiden vertauscht. Der gleiche Vorgang wird auf das (nunmehr) zweite und dritte Element der Liste angewandt, dann auf das (nunmehr) dritte und vierte. Dies wird bis zum Vergleich des $(n-1)$-ten mit dem n-ten Element fortgesetzt. Nach $(n-1)$ Vergleichen befindet sich das größte Element am Ende der Liste.<br>
Nach dem gleichen Verfahren wird nun in der um eine Position verkürzten Liste das zweitgrößte Element auf die vorletzte Position gebracht. Dies wird fortgesetzt an einer immer kürzer werdenden Restliste bis diese schließlich nur noch aus einem Element besteht.<br>
Bei der Implementierung soll die Funktion `change()` verwendet werden.

**Aufwand.** Bei einer Liste mit $n$ Elementen sind $(n-1)$ Durchläufe erforderlich. Beim ersten Durchlauf werden $(n-1)$ Vergleiche durchgeführt, beim letzten nur noch ein Vergleich. Der Sortieraufwand A ergibt sich durch das Aufsummieren der anfallenden **Vergleichsschritte:**<br>

$ A= \sum\limits_{i=1}^{n-1} (n-i) = \sum\limits_{i=1}^{n-1} i 0 \frac{n(n-1)}{2} \approx \frac{n^{2}}{2}$

**Vorteil.** Das Verfahren hat den Vorteil, daß es keinerlei zusätzlichen Speicher benötigt. Der Sortiervorgang läuft innerhalb der vorgelegten Originalliste ab. Das Verfahren ist außerdem sehr einfach
zu implementieren.

**Nachteil.** Ein schwerwiegender Nachteil ist die Zunahme des Aufwandes mit dem Quadrat der Listenlänge $n$. Das Verfahren ist daher nur für kurze, selten zu sortierende Listen geeignet.

##### 6.3 Berechnung des geometrischen Mittelwertes


Durch Logarithmieren der Gleichung

$gm = \sqrt[n]{x_{1} \cdot x_{2} \cdot ... \cdot x_{n}}$

mit dem natürlichen Logarithmus ln (Basis e) erhält man
$$$
 GM = \ln gm = \ln \sqrt[n]{x_{1} \cdot x_{2} \cdot ... \cdot x_{n}} 

 = \frac{1}{n} (\ln x_{1} + \ln x_{2} + ... + \ln x_{n})

 = \frac{1}{n} \sum\limits_{i=1}^{n} \ln x_{i}
$$$

das heißt man berechnet zunächst den Logarithmus von $gm$ als arithmetisches Mittel der Summe der
Logarithmen der Größen $x_{i}$ . Man erhält nun das gesuchte Ergebnis $gm$ durch Potenzierung:

$gm = e^{GM} = e^{\ln gm}$

Natürliche Logarithmus, Exponentialfunktion: log(), exp(), Prototypen in cmath .
Noch mehr im Skript...