
# Pandas Typ `Series`

Eine Pandas `Series` Instanz stellt eine Folge von Werten dar, ähnlich wie
eine Python-Liste. Die Elemente einer Serie können über ihren numerischen
Index abgerufen werden, aber zusätzlich kann eine Serie einen semantisch
sinnvollen Index haben (z. B. für Zeitreihen).

Intern wird eine Pandas-Serie durch ein Numpy-Array unterstützt, daher sind
die meisten der Numpy-Operationen auch auf Serien anwendbar sind.

Darüber hinaus ist es einfach (und billig), Serien nach Numpy zu konvertieren.

In [None]:
import numpy as np
import pandas as pd

## Erzeugung

### Aus Listen

In [None]:
pd.Series(data=[10, 20, 30, 40])

In [None]:
pd.Series(["a", "b", "c"])

### Aus Listen mit Index

In [None]:
pd.Series(data=[1, 2, 3, 4], index=["w", "x", "y", "z"])

### Aus Range oder Iterable

In [None]:
pd.Series(data=range(1, 201, 2))

In [None]:
data = pd.Series(data=range(1, 201, 2))
data.head()

In [None]:
data.tail()

### Aus Dictionary

In [None]:
pd.Series(data={"Ice Cream": 2.49, "Cake": 4.99, "Fudge": 7.99})

## Indizes und Operationen

In [None]:
food1 = pd.Series({"Ice Cream": 2.49, "Cake": 4.99, "Fudge": 7.99})
food2 = pd.Series({"Cake": 4.99, "Ice Cream": 3.99, "Pie": 3.49, "Cheese": 1.99})

In [None]:
food1

In [None]:
food1.index

In [None]:
food1.size

In [None]:
food1.sum()

In [None]:
food1.mean()

In [None]:
food1.name

In [None]:
food1.name = "Deserts"

In [None]:
food1.name

In [None]:
food1

In [None]:
food1.plot.bar(legend=True)

In [None]:
import random
data = pd.Series(data=[random.gauss(0.0, 10.0) for _ in range(2_000)])
data.plot.hist(legend=False, bins=20)

In [None]:
food1["Cake"]

In [None]:
food1.loc["Cake"]

In [None]:
# Error!
# food1["Pie"]

In [None]:
food1.argmin()

In [None]:
food1[0]

In [None]:
food1.iloc[0]

In [None]:
confusing = pd.Series(data=np.linspace(0, 5, 11), index=np.arange(-5, 6))
confusing

In [None]:
confusing[0]

In [None]:
confusing.loc[0]

In [None]:
confusing.iloc[0]

In [None]:
food_sum = food1 + food2
food_sum

In [None]:
food1 + 0.5

In [None]:
food1

In [None]:
def discount(price):
    return price * 0.9

food1.apply(discount)

In [None]:
food1

In [None]:
food1.apply(lambda price: price * 0.9)

In [None]:
pd.concat([food1, pd.Series({"Chocolate": 3.99, "Ice Cream": 1.99})])

In [None]:
food1

In [None]:
all_food = pd.concat([food1, food2])

In [None]:
all_food

### Mehrfach vorkommende Index-Werte

In [None]:
all_food.index

In [None]:
all_food.is_unique

In [None]:
food1.is_unique

In [None]:
all_food["Cake"]

In [None]:
type(all_food["Cake"])

In [None]:
all_food["Pie"]

In [None]:
type(all_food["Pie"])

In [None]:
all_food.groupby(all_food.index).max()

### Sortierte und unsortierte Indizes

In [None]:
all_food.index.is_monotonic_increasing

In [None]:
sorted_food = all_food.sort_index()

In [None]:
sorted_food

In [None]:
sorted_food.index.is_monotonic_increasing

In [None]:
all_food.sort_values()

In [None]:
all_food.sort_values().is_monotonic_increasing

In [None]:
all_food[["Pie", "Cake"]]

In [None]:
all_food

In [None]:
all_food[1:3]

In [None]:
# all_food['Cake':'Fudge']

In [None]:
sorted_food["Cake":"Fudge"]


**Wichtig:** Der ober Wert der Slice, `"Fudge"` ist im Resultat enthalten!

## Fehlende Werte

In [None]:
food = food1 + food2

In [None]:
food.isna()

In [None]:
food.isna().sum()

In [None]:
food.dropna()