# Pandas 查询数据

## Pandas查询数据的几种方法
1.df.loc方法，根据行、列的标签值查询<br>
2.df.iloc方法，根据行列的数字位置查询<br>
3.df.where方法<br>
4.df.query方法

loc既能查询，又能覆盖写入，强烈推荐！

## Pandas使用df.loc查询数据的方法

1.使用单个`label`值查询数据<br>
2.使用值列表批量查询<br>
3.使用数值区间进行范围查询<br>
4.使用条件表达式查询<br>
5.调用函数查询

# 注意
* 以上查询方法，既适用于行，也适用于列
* 注意观察降维`dataFrame`->`Series`->值

In [None]:
import pandas as pd

## 0. 读取数据

In [None]:
df = pd.read_csv("../datas/weather_20230115134249.csv", encoding='utf-8')

In [None]:
df.head()

In [None]:
# 设定索引为日期，方便日期筛选
df.set_index('日期', inplace=True)

In [None]:
df.index

In [None]:
# df["气温(度)"]
df.loc[:, "气温(度)"]

In [None]:
df.loc[:, "气温(度)"] = df["气温(度)"].str.replace("℃", "").astype("float")

In [None]:
df.dtypes

In [None]:
df.head()

## 1. 使用单个label值查询数据
行或者列，都可以只传入单个值，实现精确匹配

In [None]:
# 得到单个值
df.loc['2015-05-12', '气温(度)']

In [None]:
# 得到一个Series
df.loc['2015-05-12', ['气温(度)', '相对湿度(%)']]

## 2. 使用值列表批量查询

In [None]:
# 得到Series
df.loc[['2015-05-12', '2015-10-10'], '气温(度)']

In [None]:
# 得到DataFrame
df.loc[['2015-05-12', '2015-10-10'], ['气温(度)', '相对湿度(%)']]

## 3. 使用数值区间进行范围查询
注意：区间既包含开始，也包含结束

In [None]:
# 行index按区间
df.loc['2015-05-11':'2015-05-15', '气温(度)']

In [None]:
# 列index按区间
df.loc['2015-10-10', '气温(度)':'累积雨量(mm)']

In [None]:
# 行和列都按区间查询
df.loc['2015-05-12':'2015-05-13', '气温(度)':'累积雨量(mm)']

## 4. 使用条件表达式查询
boolean列表的长度得等于行数或者列数

**简单条件查询，最低温度低于-10度的列表**

In [None]:
df.loc[df["气温(度)"].astype(float) < -10, :]

In [None]:
# 观察一些这里的boolean条件
df["气温(度)"].astype(float) < -10

**复杂查询条件，查一下我心中的目标天气**

In [None]:
# 查询最高温度小于30度，最低温度大于15度的天气数据
# ':' 代表所有列
# df.loc[(df["气温(度)"].astype(float) < 30) & (df["气温(度)"].astype(float) > 15), ["城市", "行政区", "气温(度)"]]
df.loc[(df["气温(度)"].astype(float) < 30) & (df["气温(度)"].astype(float) > 15), :]

In [None]:
# 再次观察这里的boolean条件
(df["气温(度)"].astype(float) < 30) & (df["气温(度)"].astype(float) > 15)

## 5. 调用函数查询

In [None]:
# 直接写lambda表达式
df.loc[lambda df: (df["气温(度)"].astype(float) < 30) & (df["气温(度)"].astype(float) > 15), :]

In [None]:
df["累积雨量(mm)"] == 0.0

In [None]:
#函数式编程的本质：
#    函数自身可以像变量一样传递

# 编写自己的函数，查询九月份累计雨量为0的数据
def query_my_data(df):
    return (df.index.str.startswith("2015-04")) & (df["累积雨量(mm)"] == 0.0)


df.loc[query_my_data, :]