
# FMZ Übung 2: **Beschreibende Statistik für uni- und bivariate Daten**
---

### Ziel der Übung  
- Verschiedene Mittelwerte (arithmetisch, geometrisch, harmonisch, quadratisch, Median, Modus)  
- Streuungsmaße (SD, MAD, IQR, min/max, Varianz)  
- Schiefe und Wölbung  
- Histogramme, Boxplots, QQ-Plots  
- Analyse eines realen Datensatzes zur Fußgängerdynamik  

---
### Benötigte Pakete
```R
#install.packages(c("ggplot2", "dplyr", "e1071"))
library(ggplot2)
library(dplyr)
library(e1071) # skewness, kurtosis
```

---

## 1. Mittelwerte und Streuungsmaße


Verwenden Sie `mtcars$mpg`:
   ```R
   data(mtcars)
   x <- mtcars$mpg
   ```

### Aufgaben

---
1. Mittelwerte
   ```R
   mean(x)
   median(x)
   prod(x^(1/length(x))) # Geometrisches Mittel
   1/mean(1/x) # harmonisches Mittel
   sqrt(mean(x^2)) # quadratisches Mittel
   ```
   Histogramm mit allen Mittelwerten markiert
   ```R
   hist(x, breaks=10, main="Histogramm von mpg mit Mittelwerten", col="lightblue")
   abline(v=mean(x), col="red", lwd=2, lty=2)
   abline(v=median(x), col="green", lwd=2, lty=2)
   abline(v=prod(x^(1/length(x))), col="purple", lwd=2, lty=2)
   abline(v=1/mean(1/x), col="orange", lwd=2, lty=2)
   abline(v=sqrt(mean(x^2)), col="brown", lwd=2, lty=2)
   legend("topright",
     legend=c("Mean","Median","Geometric","Harmonic","Quadratic"),
     col=c("red","green","purple","orange","brown"), lty=2, lwd=2)
   ```

---
2. Streuungsmaße
   ```R
   sd(x)
   mad(x)
   IQR(x)
   range(x)
   var(x)
   ```

---
3. Schiefe und Wölbung
   ```R
   skewness(x)
   kurtosis(x)
   ```





## 2. QQ-Plot und Streuungsdiagramme

### Aufgaben

---
1. QQ-Plot
   ```R
   qqnorm(x)
   qqline(x, col="red")
   ```

---
2. Scatterplot
   ```R
   plot(mtcars$hp, mtcars$mpg, main="Leistung vs Verbrauch", xlab="PS", ylab="mpg", pch=19, col="steelblue")
   abline(lm(mpg ~ hp, data=mtcars), col="red", lwd=2)
   ```

---
3. Bivariate Analyse: Kovarianz & Korrelation
   ```R
   cov(mtcars$hp, mtcars$mpg)
   cor(mtcars$hp, mtcars$mpg)
   ```

## 3. Empirische Wahrscheinlichkeitsmaße und Boxplots

### Aufgaben

---
1. Histogramm + Kerndichte
   ```R
   hist(x, breaks=10, probability=T, col="lightgreen", main="Histogramm von mpg", xlab="mpg")
   lines(density(x), col="darkred", lwd=2)
   ```

---
2. Empirische Verteilungsfunktion (EDF)
   ```R
   plot(ecdf(x), verticals=TRUE, do.points=FALSE, main="Empirische Verteilungsfunktion von mpg")
   ```

---
3. Boxplot nach Zylinderzahl
   ```R
   boxplot(mpg ~ cyl, data=mtcars, col=c("pink","lightblue","lightgreen"), main="mpg nach Zylinderzahl")
   ```


## 4. Aufgabe: Datensatz iris

Analysieren Sie den Datensatz iris:
   - Berechnen Sie Mittelwert, Median, Varianz, Schiefe, Wölbung für Sepal.ength.
   - Erstellen Sie Boxplots nach Species.
   - Erstellen Sie ein Scatterplot Sepal.Length vs Petal.Length mit Farbe nach Species.

   ```R
   data(iris)
   summary(iris$Sepal.Length)
   boxplot(Sepal.Length ~ Species, data=iris, col=c("orange","green","blue"))
   ggplot(iris, aes(x=Sepal.Length, y=Petal.Length, color=Species)) +
     geom_point(size=3) +
     theme_minimal() +
     labs(title="Sepal vs Petal Länge nach Species")
   ```

## 5. Aufgabe: Fußgängerdynamik


### Datensatz
   ```R
   ped <- read.table("https://raw.githubusercontent.com/antoinetordeux/Datasets/refs/heads/main/ped_data.txt", header=TRUE)
   head(ped)
   str(ped)
   ```

### Aufgaben

---
1. Beschreiben Sie die Variablen `Speed` und `Spacing`:
   - Mittelwerte (arithmetisch, geometrisch, harmonisch, quadratisch, Median, Modus)  
   - SD, MAD, IQR, min/max  
   - Schiefe & Wölbung

---
2. Visualisierung:
   - Histogramm mit Mittelwerten
   - Boxplot
   - Dichteplot
   - QQ-Plot

---
3. Bivariate Analyse:
   - Streuungsdiagramm
   - Kovarianz & Korrelation
