# 时间序列处理

## 日期时间数据的处理

在 Pandas 中，我们可以使用 pd.to_datetime() 函数将字符串转换为日期时间类型，这样可以进行更复杂的日期时间操作

In [26]:
import pandas as pd

# 创建日期时间字符串的列表
date_strings = ['2023-01-01', '2023-02-01', '2023-03-01']

# 转换为日期时间对象
dates = pd.to_datetime(date_strings)
print("\n转换后的日期时间数据:")
print(dates)

# 创建一个带有日期的 DataFrame
data = {
    '日期': dates,
    '销量': [100, 150, 200]
}
df_dates = pd.DataFrame(data)

print("\nDataFrame 示例:")
print(df_dates)


转换后的日期时间数据:
DatetimeIndex(['2023-01-01', '2023-02-01', '2023-03-01'], dtype='datetime64[ns]', freq=None)

DataFrame 示例:
          日期   销量
0 2023-01-01  100
1 2023-02-01  150
2 2023-03-01  200


## 使用 Pandas 进行时间序列分析

Pandas 提供了丰富的功能来处理时间序列数据，包括索引设置、切片、筛选等。设置日期为索引后，我们可以利用 Pandas 的时间序列功能。

In [27]:
# 将日期设置为 DataFrame 的索引
df_dates.set_index('日期', inplace=True)

# 查看 DataFrame
print("\n设置索引后的 DataFrame:")
print(df_dates)

# 切片操作
print("\n选择特定日期的数据:")
print(df_dates.loc['2023-02-01'])


设置索引后的 DataFrame:
             销量
日期             
2023-01-01  100
2023-02-01  150
2023-03-01  200

选择特定日期的数据:
销量    150
Name: 2023-02-01 00:00:00, dtype: int64


## 重采样与频率转换

Pandas 提供了丰富的功能来处理时间序列数据，包括索引设置、切片、筛选等。设置日期为索引后，我们可以利用 Pandas 的时间序列功能。

示例：

In [43]:
# 创建一个示例 DataFrame
date_range = pd.date_range(start='2023-01-01', periods=10, freq='D')
sales_data = [100, 120, 140, 130, 150, 165, 180, 200, 220, 240]
df_sales = pd.DataFrame({'销量': sales_data}, index=date_range)

print("\n示例销售数据:")
print(df_sales)

# 重采样为每周的总销量  'D' 表示天，'W' 表示周，'ME' 表示月
weekly_sales = df_sales.resample('1W').sum()
print("\n每周销售总额:")
print(weekly_sales)



示例销售数据:
             销量
2023-01-01  100
2023-01-02  120
2023-01-03  140
2023-01-04  130
2023-01-05  150
2023-01-06  165
2023-01-07  180
2023-01-08  200
2023-01-09  220
2023-01-10  240

每周销售总额:
              销量
2023-01-01   100
2023-01-08  1085
2023-01-15   460


## 时间序列的移动窗口操作

移动窗口操作允许我们对数据应用滚动计算，例如计算移动平均、移动标准差等。可以使用 rolling() 方法实现。

In [46]:
# 计算移动平均
rolling_mean = df_sales.rolling(window=3).mean()
print("\n3日移动平均:")
print(rolling_mean)


3日移动平均:
                    销量
2023-01-01         NaN
2023-01-02         NaN
2023-01-03  120.000000
2023-01-04  130.000000
2023-01-05  140.000000
2023-01-06  148.333333
2023-01-07  165.000000
2023-01-08  181.666667
2023-01-09  200.000000
2023-01-10  220.000000
