In [7]:
import pandas as pd
import numpy as np

### `numpy.nan` (Not a Number)
Wird hauptsächlich bei numerischen Datentypen verwendet.<br>
Vor allem für float-Daten geeignet;Achtung bei anderen Datentypen (wie int oder boolean) , da es diese Datentypen automatisch in float konvertiert werden.

In [8]:
df1 = pd.DataFrame({
    'A': [1, 2, np.nan, 4],
    'B': [5, np.nan, 7, 8]
})
print(df1) # aus den Integer Werten sind floats geworden

     A    B
0  1.0  5.0
1  2.0  NaN
2  NaN  7.0
3  4.0  8.0


### `pandas.NA` (Not Available)
`pandas.NA` ist eine neue Art von fehlendem Wert, die in Pandas v1.0 eingeführt wurde. Sie unterstützt Integer, Boolean und string-Datentypen, ohne die Datentypen in float zu ändern.<br>
NA speziell dafür entwickelt wurde und keine unerwünschten Konvertierungen vornimmt.

In [14]:
df2 = pd.DataFrame({
    'A': pd.Series([1, 2, pd.NA, 4], dtype="Int64"),
    'B': pd.Series([True, pd.NA, False, True], dtype="boolean")
})
print(df2)

      A      B
0     1   True
1     2   <NA>
2  <NA>  False
3     4   True


Beide Bezeichner ermöglichen uns mit der Datenreihe mathematische Berechnungen durchzuführen ohne dass ein Fehler (wegen fehlendem Wert) dabei erzeugt wird:

In [15]:
df1.sum()

A     7.0
B    20.0
dtype: float64

In [16]:
df2.sum()

A    7
B    2
dtype: Int64

`None` Werte werden automatisch umgewandelt:

In [18]:
df3 = pd.DataFrame({
    'A': pd.Series([1, 2, None, 4], dtype="Int64"),
    'B': pd.Series([True, pd.NA, False, True], dtype="boolean")
})
print(df3)

      A      B
0     1   True
1     2   <NA>
2  <NA>  False
3     4   True


### Methodenübersicht für Fehlwert-Erkennung:
`isnull()` und `isna()`: Diese beiden Methoden sind identisch und erkennen `nan`, `NA` und `None` als Fehlwerte.<br>
`notnull()` und `notna()`: Umgekehrt geben diese Methoden True für alle nicht-fehlenden Werte zurück und False für Fehlwerte

In [20]:
df4 = pd.DataFrame({
    'A': pd.Series([1, 2, pd.NA, 4, np.nan], dtype="Int64"),
    'B': pd.Series([True, pd.NA, False, True], dtype="boolean")
})
print(df4.isnull())
print("\n", df4.isna())

       A      B
0  False  False
1  False   True
2   True  False
3  False  False
4   True   True

        A      B
0  False  False
1  False   True
2   True  False
3  False  False
4   True   True
