## 数据筛选与过滤

在 Pandas 中，数据筛选与过滤是非常常见且重要的操作，可以帮助你从 DataFrame 中提取满足特定条件的数据行。以下是一些常用的方法来进行数据筛选和过滤。

### 1. 使用布尔索引

你可以通过布尔条件直接对 DataFrame 进行过滤。这种方式非常直观。

In [6]:
import pandas as pd

# 示例 DataFrame
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8]
})
print("原始数据:")
print(df)

# 筛选出 A 列大于 2 的行
print("选择情况")
print(df['A'] > 2)
filtered_df = df[df['A'] > 2]
print("筛选出 A 列大于 2 的行:")
print(filtered_df)

原始数据:
   A  B
0  1  5
1  2  6
2  3  7
3  4  8
选择情况
0    False
1    False
2     True
3     True
Name: A, dtype: bool
筛选出 A 列大于 2 的行:
   A  B
2  3  7
3  4  8


### 2. 使用 query() 方法
使用 query() 方法可以用一种类似 SQL 的语法进行数据筛选，这在处理复杂条件时特别方便。

In [10]:
# 使用 query 筛选
filtered_df_query = df.query('A > 2')

print("\n使用 query 筛选出 A 列大于 2 的行:")
print(filtered_df_query)


使用 query 筛选出 A 列大于 2 的行:
   A  B
2  3  7
3  4  8


### 3. 多条件筛选
你也可以通过逻辑运算符（& 和 |）来进行多条件筛选，需要注意的是在使用这些运算符时要将条件用括号括起来。

In [13]:
# 多条件筛选，A 列大于 2 且 B 列小于 8
filtered_df_multi = df[(df['A'] > 2) & (df['B'] < 8)]

print("\n筛选出 A 列大于 2 且 B 列小于 8 的行:")
print(filtered_df_multi)


筛选出 A 列大于 2 且 B 列小于 8 的行:
   A  B
2  3  7


### 4. 使用 isin() 方法
如果你想基于一组特定值进行过滤，可以使用 isin() 方法。

In [15]:
# 筛选 B 列中值为 5 或 6 的行
filtered_df_isin = df[df['B'].isin([5, 6])]

print("\n筛选出 B 列中值为 5 或 6 的行:")
print(filtered_df_isin)


筛选出 B 列中值为 5 或 6 的行:
   A  B
0  1  5
1  2  6


### 5. 使用 loc[] 和 iloc[]

* loc[] 用于标签索引，可以用于选择行和列。

In [18]:
# 使用 loc 筛选 A 列大于 2 的行，并选择特定的列
filtered_loc = df.loc[df['A'] > 2, ['B']]

print("\n使用 loc 筛选并选择特定列:")
print(filtered_loc)


使用 loc 筛选并选择特定列:
   B
2  7
3  8


- iloc[] 用于位置索引，可以基于行和列的整数位置进行筛选。

In [26]:
# 使用 iloc 筛选前两行
filtered_iloc = df.iloc[:2]

print("\n使用 iloc 筛选前两行:")
print(filtered_iloc)


使用 iloc 筛选前两行:
   A  B
0  1  5
1  2  6


数据筛选与过滤是数据分析中的基本技能。通过布尔索引、query() 方法、多条件筛选等方式，你可以灵活地从 DataFrame 中提取出满足特定条件的数据行。这些技巧将帮助你更有效地处理和分析数据。