# 简介

用于对齐两个 DataFrame 或 Series 对象的索引（index）。

```
函数名称：pd.align
函数功能：对两个 Pandas 对象进行对齐操作，使它们具有相同的行和列索引。
参数：
    join：指定对齐时使用的连接方式，默认为 'outer'，可选值为 'outer' 和 'inner'。
    axis：指定对齐的轴方向，默认为 0（行方向），可选值为 0 和 1。
    copy：指定是否复制输入数据，默认为 True，即返回对齐后的副本。
返回值：对齐后的两个 Pandas 对象，具有相同的行和列索引。
```

In [2]:
import pandas as pd

# 创建两个示例 Series 对象
s1 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s2 = pd.Series([4, 5, 6], index=['b', 'c', 'd'])

# 对齐两个 Series 对象的索引
aligned_s1, aligned_s2 = s1.align(s2, join='outer')

print("aligned_s1:")
print(aligned_s1)
print("aligned_s2:")
print(aligned_s2)


aligned_s1:
a    1.0
b    2.0
c    3.0
d    NaN
dtype: float64
aligned_s2:
a    NaN
b    4.0
c    5.0
d    6.0
dtype: float64


In [5]:
import pandas as pd

# 创建训练集和验证集的 DataFrame
X_train = pd.DataFrame({'A': [1, 2, 3],
                        'B': [4, 5, 6]})
X_valid = pd.DataFrame({'B': [7, 8, 9],
                        'C': [10, 11, 12]})

# 对训练集和验证集的特征进行对齐操作
X_train_aligned, X_valid_aligned = X_train.align(X_valid, join='left', axis=1)
print("对齐后的训练集：")
print(X_train_aligned)
print('====')
print(X_valid_aligned)



X_train_aligned, X_valid_aligned = X_train.align(X_valid, join='outer', axis=1)
print("对齐后的训练集：")
print(X_train_aligned)
print('====')
print(X_valid_aligned)

对齐后的训练集：
   A  B
0  1  4
1  2  5
2  3  6
====
    A  B
0 NaN  7
1 NaN  8
2 NaN  9
对齐后的训练集：
   A  B   C
0  1  4 NaN
1  2  5 NaN
2  3  6 NaN
====
    A  B   C
0 NaN  7  10
1 NaN  8  11
2 NaN  9  12
