In [None]:
import pandas as pd
import numpy as np
from sklearn.impute import SimpleImputer
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
from sklearn.pipeline import Pipeline

**Imputer**

* Для замены `пропусков` в признаках `feat_num` и `feat_cat` используем разные стратегии:
    * `feat_num` - `strategy="mean"`
    * `feat_cat` - `strategy="most_frequent"`
        * 
* strategy="mean" — заполнять пропуски средним по колонке

* strategy="median" — заполнять медианой

* strategy="most_frequent" — заполнять самым частым значением (мода)

* strategy="constant" — заполнять константой (fill_value=...)

In [7]:
# Замена пропусков с помощью SimpleImputer
df = pd.DataFrame({
    "A": [np.nan, "F", "W", "F", "W"],   # категориальный
    "B": [20, None, 30, 40, 50],         # числовой
    "C": [300, 200, 300, None, pd.NA]    # числовой (с pd.NA)
})

# 1) Заменяем pd.NA -> np.nan
df = df.replace({pd.NA: np.nan})

# TODO Определяем типы колонок
# 2) Импутация: mean для числовых, most_frequent для категориальных
cat_cols = ["A"]
num_cols = ["B", "C"]

# TODO 1-й вариант
# preprocessor = ColumnTransformer(
#     transformers=[
#         ("num", SimpleImputer(strategy="mean"), num_cols),
#         ("cat", SimpleImputer(strategy="most_frequent"), cat_cols)
#     ]
# )


# TODO 2-й вариант
# Импутеры
cat_imputer = SimpleImputer(strategy="most_frequent")
num_imputer = SimpleImputer(strategy="mean")

# Трансформер
preprocessor = ColumnTransformer(
    transformers=[
        ("num", num_imputer, num_cols),
        ("cat", cat_imputer, cat_cols)
    ]
)


# TODO обратно собираем в DF cat и num признаки
result = preprocessor.fit_transform(df)
df_filled = pd.DataFrame(result, columns=num_cols + cat_cols)

print(result)


[[20.0 300.0 'F']
 [35.0 200.0 'F']
 [30.0 300.0 'W']
 [40.0 266.6666666666667 'F']
 [50.0 266.6666666666667 'W']]
