In [1]:
import pandas as pd

In [2]:
csv = "data/1day_data.csv"
df = pd.read_csv(csv)


In [3]:
alt_inaccuracy = 50 # погрешность в изменении высоты
# Функция для получения доли участков, где самолёт менял высоту
def get_altitude_rate(id, df):
    rows = df.loc[df['id'] == id]
    point_amount = len(rows)
    if point_amount <= 1:
        return 1.
    altitudes = rows['altitude']
    alt_delta_ratio = 0
    for i in range(1, point_amount):
        if abs(altitudes.iloc[i] - altitudes.iloc[i-1]) < alt_inaccuracy:
            alt_delta_ratio += 1
    return alt_delta_ratio / (point_amount - 1)

In [4]:
heading_inaccuracy = 2 # погрешность в изменении направления
# Функция для получения доли участков, где самолёт менял направление
def get_heading_rate(id, df):
    rows = df.loc[df['id'] == id]
    point_amount = len(rows)
    if point_amount <= 1:
        return 1.
    headings = rows['heading']
    head_delta_ratio = 0
    for i in range(1, point_amount):
        if abs(headings.iloc[i] - headings.iloc[i-1]) < heading_inaccuracy:
            head_delta_ratio += 1
    return head_delta_ratio / (point_amount - 1)

In [5]:
# Функция для получения доли участков, где самолёт менял высоту и направление
def get_heading_altitude_rate(id, df):
    return get_heading_rate(id, df) * get_altitude_rate(id, df)

In [6]:
ids = {id: df['id'].unique() for id in df['id']}
altitude_rates = []
heading_rates = []
heading_altitude_rates = []

# создаём новый датафрейм, группируя информацию по id полётов

for id in ids:
    altitude_rates.append(get_altitude_rate(id, df))
    heading_rates.append(get_heading_rate(id, df))
    heading_altitude_rates.append(get_heading_altitude_rate(id, df))
print(altitude_rates)
print(heading_rates)
print(heading_altitude_rates)

df = pd.DataFrame(list(zip(ids, altitude_rates, heading_rates, heading_altitude_rates)),
    columns = ['ids', 'altitude_rates', 'heading_rates', 'heading_altitude_rates'])
df = df[df['heading_altitude_rates'] != 0]
display(df)


[1.0, 0.8837209302325582, 1.0, 1.0, 0.45, 0.8260869565217391, 0.46875, 1.0, 0.8823529411764706, 1.0, 0.7857142857142857, 1.0, 0.45454545454545453, 0.16666666666666666, 1.0, 1.0, 0.88, 0.3333333333333333, 0.8275862068965517, 0.925, 1.0, 1.0, 0.5645161290322581, 1.0, 1.0, 0.9347826086956522, 0.9622641509433962, 1.0, 0.16666666666666666, 1.0, 1.0, 1.0, 0.9743589743589743, 0.6507936507936508, 0.14285714285714285, 1.0, 0.76, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 0.9791666666666666, 0.56, 1.0, 0.6428571428571429, 0.5714285714285714, 1.0, 1.0, 1.0, 0.7878787878787878, 1.0, 1.0, 1.0, 1.0, 1.0, 0.8846153846153846, 1.0, 1.0, 1.0, 1.0, 0.375, 1.0, 1.0, 1.0, 1.0, 0.7407407407407407, 1.0, 1.0, 1.0, 0.9387755102040817, 0.42857142857142855, 1.0, 1.0, 1.0, 1.0, 1.0, 0.7708333333333334, 1.0, 1.0, 0.7948717948717948, 0.7, 0.7307692307692307, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 0.9019607843137255, 1.0, 0.9622641509433962, 1.0, 1.0, 1.0, 1.0, 0.9411764705882353, 1.0, 0.8269230769230769, 1.0, 1.0, 1.0, 1.0, 0.53571

Unnamed: 0,ids,altitude_rates,heading_rates,heading_altitude_rates
0,3265ef91,1.000000,0.955556,0.955556
1,3265cea8,0.883721,0.906977,0.801514
2,3265ac16,1.000000,1.000000,1.000000
3,32657ea3,1.000000,0.962963,0.962963
4,32662398,0.450000,0.750000,0.337500
...,...,...,...,...
894,32695334,0.961538,0.730769,0.702663
895,3269593e,0.739130,1.000000,0.739130
896,32699897,1.000000,1.000000,1.000000
897,3269a80b,1.000000,1.000000,1.000000


In [7]:
print("Описание доли маршрута полёта без изменения высоты")
print(df['altitude_rates'].describe())
print("Описание доли маршрута полёта без поворота")
print(df['heading_rates'].describe())
print("Описание доли маршрута полёта без поворота и без снижения высоты")
print(df['heading_altitude_rates'].describe())


Описание доли маршрута полёта без изменения высоты
count    874.000000
mean       0.879401
std        0.193948
min        0.125000
25%        0.818182
50%        1.000000
75%        1.000000
max        1.000000
Name: altitude_rates, dtype: float64
Описание доли маршрута полёта без поворота
count    874.000000
mean       0.892505
std        0.135009
min        0.200000
25%        0.841208
50%        0.938776
75%        1.000000
max        1.000000
Name: heading_rates, dtype: float64
Описание доли маршрута полёта без поворота и без снижения высоты
count    874.000000
mean       0.794154
std        0.228763
min        0.046875
25%        0.666408
50%        0.872678
75%        1.000000
max        1.000000
Name: heading_altitude_rates, dtype: float64
