In [1]:
import pandas as pd

In [3]:
# Feature creating
data = pd.DataFrame({
    'оценка': ['низкая', 'низкая', 'средняя', 'средняя', 'высокая']
}, index=['низкая', 'низкая', 'средняя', 'средняя', 'высокая'])

# Dict of scale mapping
scale_mapper = {
    'низкая': 1,
    'средняя': 2,
    'высокая': 3
}

# Replace the feature values by the dict values
data['оценка'].replace(scale_mapper)

низкая     1
низкая     1
средняя    2
средняя    2
высокая    3
Name: оценка, dtype: int64

Важно, чтобы выбор числовых значений основывался на имеющейся априорной информации о порядковых классах. В нашем решении метка высокая буквально в три раза больше метки низкая. Это нормально в обычных случаях, но может нарушится, если принятые интервалы между классами не равны

In [4]:
data = pd.DataFrame({
    'оценка': ['низкая', 'низкая', 'средняя', 'средняя', 'высокая', 'чуть больше средней']
})

scale_mapper = {
    'низкая': 1,
    'средняя': 2,
    'чуть больше средней': 3,
    'высокая': 4
}

data['оценка'].replace(scale_mapper)

0    1
1    1
2    2
3    2
4    4
5    3
Name: оценка, dtype: int64

В этом примере расстояние между низкой и средней равно расстоянию между средней и чуть больше средней, что почти наверняка не является точным. Лучший подход состоит в том, чтобы учитывать числовые значения, сопоставленные классам

In [5]:
scale_mapper = {
    'низкая': 1,
    'средняя': 2,
    'чуть больше средней': 2.1,
    'высокая': 3
}

data['оценка'].replace(scale_mapper)

0    1.0
1    1.0
2    2.0
3    2.0
4    3.0
5    2.1
Name: оценка, dtype: float64