In [None]:
import pandas as pd
import numpy as np

In [None]:
df1 = pd.DataFrame({'x_1': ['A', 'B', 'C'] * 3, 
                    'y_1': ['D', 'E', 'F'] * 3, 
                    'z': np.random.randint(0, 20, 9)})
df1

Unnamed: 0,x_1,y_1,z
0,A,D,5
1,B,E,3
2,C,F,15
3,A,D,1
4,B,E,11
5,C,F,9
6,A,D,17
7,B,E,1
8,C,F,14


In [None]:
df2 = pd.DataFrame({'x_2': ['A', 'B', 'C'] * 4, 
                    'y_2': ['D', 'E'] * 6, 
                    'z': np.random.randint(0, 20, 12)})
df2

Unnamed: 0,x_2,y_2,z
0,A,D,16
1,B,E,4
2,C,D,2
3,A,E,13
4,B,D,10
5,C,E,17
6,A,D,17
7,B,E,13
8,C,D,5
9,A,E,8


## 1. Объединение двух Pandas датафреймов (df1 и df2) по двум столбцам (x_1, y_1 и x_2, y_2)

In [None]:
# остаются общие строки (создается df3)

df_3 = pd.merge(df1, df2, 
                how='inner',
                left_on=['x_1', 'y_1'],
                right_on=['x_2', 'y_2'],
                suffixes=['_left', '_right'])
df_3

Unnamed: 0,x_1,y_1,z_left,x_2,y_2,z_right
0,A,D,5,A,D,16
1,A,D,5,A,D,17
2,A,D,1,A,D,16
3,A,D,1,A,D,17
4,A,D,17,A,D,16
5,A,D,17,A,D,17
6,B,E,3,B,E,4
7,B,E,3,B,E,13
8,B,E,11,B,E,4
9,B,E,11,B,E,13


In [None]:
# остаются все строки (создается df4)

df_4 = pd.merge(df1, df2, 
                how='outer',
                left_on=['x_1', 'y_1'],
                right_on=['x_2', 'y_2'],
                suffixes=['_left', '_right'])
df_4

Unnamed: 0,x_1,y_1,z_left,x_2,y_2,z_right
0,A,D,5.0,A,D,16.0
1,A,D,5.0,A,D,17.0
2,A,D,1.0,A,D,16.0
3,A,D,1.0,A,D,17.0
4,A,D,17.0,A,D,16.0
5,A,D,17.0,A,D,17.0
6,B,E,3.0,B,E,4.0
7,B,E,3.0,B,E,13.0
8,B,E,11.0,B,E,4.0
9,B,E,11.0,B,E,13.0


## 2. Нахождение в датафрейме df4 позиций всех отсутствующих значений и замена их значением 0

In [None]:
# список из «координат» значений NaN в датафрейме df4

data = df_4.stack(dropna=False) 
list_coordinates = [list(i) for i in data.index[data.isna()]]
list_coordinates

[[12, 'x_2'],
 [12, 'y_2'],
 [12, 'z_right'],
 [13, 'x_2'],
 [13, 'y_2'],
 [13, 'z_right'],
 [14, 'x_2'],
 [14, 'y_2'],
 [14, 'z_right'],
 [15, 'x_1'],
 [15, 'y_1'],
 [15, 'z_left'],
 [16, 'x_1'],
 [16, 'y_1'],
 [16, 'z_left'],
 [17, 'x_1'],
 [17, 'y_1'],
 [17, 'z_left'],
 [18, 'x_1'],
 [18, 'y_1'],
 [18, 'z_left'],
 [19, 'x_1'],
 [19, 'y_1'],
 [19, 'z_left'],
 [20, 'x_1'],
 [20, 'y_1'],
 [20, 'z_left'],
 [21, 'x_1'],
 [21, 'y_1'],
 [21, 'z_left'],
 [22, 'x_1'],
 [22, 'y_1'],
 [22, 'z_left']]

In [None]:
# замена всех отсутствующих значений в датафрейме df4 значением 0

def replacement_val(A, lst):
    for i in lst:
        a, b = i
        A.loc[a, b] = 0
    return A
replacement_val(df_4, list_coordinates)   

Unnamed: 0,x_1,y_1,z_left,x_2,y_2,z_right
0,A,D,5.0,A,D,16.0
1,A,D,5.0,A,D,17.0
2,A,D,1.0,A,D,16.0
3,A,D,1.0,A,D,17.0
4,A,D,17.0,A,D,16.0
5,A,D,17.0,A,D,17.0
6,B,E,3.0,B,E,4.0
7,B,E,3.0,B,E,13.0
8,B,E,11.0,B,E,4.0
9,B,E,11.0,B,E,13.0


## 3. Добавление к датафрейму df4 столбца z_avg, в котором вычисляется среднее арифметическое z_left и z_right

In [None]:
df_4['z_avg'] = (df_4['z_left'] + df_4['z_right']) / 2
df_4

Unnamed: 0,x_1,y_1,z_left,x_2,y_2,z_right,z_avg
0,A,D,5.0,A,D,16.0,10.5
1,A,D,5.0,A,D,17.0,11.0
2,A,D,1.0,A,D,16.0,8.5
3,A,D,1.0,A,D,17.0,9.0
4,A,D,17.0,A,D,16.0,16.5
5,A,D,17.0,A,D,17.0,17.0
6,B,E,3.0,B,E,4.0,3.5
7,B,E,3.0,B,E,13.0,8.0
8,B,E,11.0,B,E,4.0,7.5
9,B,E,11.0,B,E,13.0,12.0
