輸出時間範圍內指定間隔的時間列表

In [12]:
import pandas as pd

# 時間範圍
_range = pd.date_range('9:00', '12:00', freq='15min')
print(_range, '\n')

DatetimeIndex(['2024-04-29 09:00:00', '2024-04-29 09:15:00',
               '2024-04-29 09:30:00', '2024-04-29 09:45:00',
               '2024-04-29 10:00:00', '2024-04-29 10:15:00',
               '2024-04-29 10:30:00', '2024-04-29 10:45:00',
               '2024-04-29 11:00:00', '2024-04-29 11:15:00',
               '2024-04-29 11:30:00', '2024-04-29 11:45:00',
               '2024-04-29 12:00:00'],
              dtype='datetime64[ns]', freq='15T') 



In [13]:
# 指定間隔1小時
_range = pd.date_range('9:00', '12:00', freq='H')
print(_range)
# 取出其中的時數部分
print(_range.hour, '\n')

DatetimeIndex(['2024-04-29 09:00:00', '2024-04-29 10:00:00',
               '2024-04-29 11:00:00', '2024-04-29 12:00:00'],
              dtype='datetime64[ns]', freq='H')
Int64Index([9, 10, 11, 12], dtype='int64') 



In [14]:
# 指定間隔30秒
_range = pd.date_range('9:00', '9:03', freq='30S')
print(_range, '\n')
# 取出其中的秒數
print(_range.second)
# 取出其中的分
print(_range.minute)

DatetimeIndex(['2024-04-29 09:00:00', '2024-04-29 09:00:30',
               '2024-04-29 09:01:00', '2024-04-29 09:01:30',
               '2024-04-29 09:02:00', '2024-04-29 09:02:30',
               '2024-04-29 09:03:00'],
              dtype='datetime64[ns]', freq='30S') 

Int64Index([0, 30, 0, 30, 0, 30, 0], dtype='int64')
Int64Index([0, 0, 1, 1, 2, 2, 3], dtype='int64')


### 陣列轉時間

_to_datetime_

In [4]:
import pandas as pd

# 建立資料
dates = {
    'date': ['2023-01-01', '2023-02-01', '2023-03-01'],
    'value': [10, 20, 30]
}
# 轉換為 DataFrame
dates = pd.DataFrame(dates)
# 轉換
dates['date'] = pd.to_datetime(dates['date'])
# 輸出
print(dates['date'])


0   2023-01-01
1   2023-02-01
2   2023-03-01
Name: date, dtype: datetime64[ns]


### 重新採樣

_resample_

In [6]:
import pandas as pd

# 一月每日銷售額
data = {
    'Date': pd.date_range(start='2023-01-01', end='2023-01-31'),
    'Sales': [200, 220, 210, 210, 190, 200, 230, 250, 240, 230, 220, 210, 205, 215, 225, 235, 230, 210, 215, 220, 225, 210, 215, 210, 220, 230, 240, 250, 260, 270, 280]
}

# 建立 DataFrame
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# 重新採樣並計算平均數
monthly_average = df.resample('M').mean()
print('重新採樣並計算平均數：')
print(monthly_average, '\n')

# 重新採樣並計算加總
monthly_total = df.resample('M').sum()
print('重新採樣並計算加總：')
print(monthly_total, '\n')


重新採樣並計算平均數：
            Sales
Date             
2023-01-31  225.0 

重新採樣並計算加總
            Sales
Date             
2023-01-31   6975 



### 進階範例

1. 下面程式碼中，resample 提供數據聚合和時間頻率轉換的功能，resample 根據指定的時間頻率將原始的日銷售數據進行重新組織和聚合。

2. 處理時間序列數據時常見的步驟，可將數據從一個較高頻率（每天）轉換到一個較低頻率（月或年）。

In [9]:
import pandas as pd
import numpy as np

# 假設跨多年的日銷售數據，採用隨機模擬生成
data = {
    'Date': pd.date_range(start='2023-01-01', periods=1000, freq='D'),
    'Sales': np.random.randint(100, 300, size=1000)
}
# 轉換
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# 輸出每日銷售額
print('每日銷售額：')
# 只展示前幾行
print(df.head(), '\n')

# 計算每月平均銷售額
monthly_average = df.resample('M').mean()
print('每月平均銷售額：')
# 只展示前幾行
print(monthly_average.head(), '\n')

# 計算每年總銷售額
# 'A'代表年度
annual_total = df.resample('A').sum()
print('每年總銷售額：')
print(annual_total.head(), '\n')

每日銷售額：
            Sales
Date             
2023-01-01    224
2023-01-02    170
2023-01-03    254
2023-01-04    188
2023-01-05    285 

每月平均銷售額：
                 Sales
Date                  
2023-01-31  214.354839
2023-02-28  201.000000
2023-03-31  188.580645
2023-04-30  181.866667
2023-05-31  204.580645 

每年總銷售額：
            Sales
Date             
2023-12-31  71955
2024-12-31  74079
2025-12-31  52295 



### 資料平移

_shift_

In [10]:
import pandas as pd

# 建立日期範圍和相應的數據
date_range = pd.date_range(start='2023-01-01', periods=10, freq='D')
data = {
    'Sales': [200, 220, 210, 210, 190, 200, 230, 250, 240, 230]
}
df = pd.DataFrame(data, index=date_range)

# 顯示原始數據
print("原始數據:")
print(df)

# 使用 shift 將數據向後平移三天
shifted_df = df.shift(3)

# 顯示平移後的數據
print("\n向後平移三天的數據:")
print(shifted_df)


原始數據:
            Sales
2023-01-01    200
2023-01-02    220
2023-01-03    210
2023-01-04    210
2023-01-05    190
2023-01-06    200
2023-01-07    230
2023-01-08    250
2023-01-09    240
2023-01-10    230

向後平移三天的數據:
            Sales
2023-01-01    NaN
2023-01-02    NaN
2023-01-03    NaN
2023-01-04  200.0
2023-01-05  220.0
2023-01-06  210.0
2023-01-07  210.0
2023-01-08  190.0
2023-01-09  200.0
2023-01-10  230.0


### 差值

_diff_

In [11]:
import pandas as pd

# 假設這是某股票的收盤價數據
data = {
    'Date': pd.date_range(start='2023-10-01', periods=5, freq='D'),
    'Close': [100, 102, 101, 105, 107]
}
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# 顯示原始收盤價數據
print("原始收盤價數據:")
print(df)

# 使用 diff() 計算日收益率
df['Daily Change'] = df['Close'].diff()

# 顯示含日收益率的數據
print("\n含日收益率的數據:")
print(df)

# 計算百分比收益率，將差分結果除以前一天的價格
# 計算百分比收益率
df['Percentage Change'] = df['Close'].diff() / df['Close'].shift(1) * 100

# 顯示含百分比收益率的數據
print("\n含百分比收益率的數據:")
print(df)

原始收盤價數據:
            Close
Date             
2023-10-01    100
2023-10-02    102
2023-10-03    101
2023-10-04    105
2023-10-05    107

含日收益率的數據:
            Close  Daily Change
Date                           
2023-10-01    100           NaN
2023-10-02    102           2.0
2023-10-03    101          -1.0
2023-10-04    105           4.0
2023-10-05    107           2.0

含百分比收益率的數據:
            Close  Daily Change  Percentage Change
Date                                              
2023-10-01    100           NaN                NaN
2023-10-02    102           2.0           2.000000
2023-10-03    101          -1.0          -0.980392
2023-10-04    105           4.0           3.960396
2023-10-05    107           2.0           1.904762


滾動數據

_rolling_

1. 在金融分析中，移動平均線（Moving Average, MA）和移動標準差是用來平滑數據序列和識別趨勢的常見工具，在 Pandas 中，可以使用 rolling() 來計算。
2. 除了以下平均數 `mean()`、標準差 `std()` 的方法外，還有滾動的加總 `sum()`、最大值 `max()`、最小值 `min()`、變異數 `var()`、計次 `count()`、相關係數 `corr()`、共變數 `cov()`。

In [12]:
import pandas as pd

# 假設這是某股票的收盤價數據
data = {
    'Date': pd.date_range(start='2023-10-01', periods=10, freq='D'),
    'Close': [100, 102, 101, 105, 107, 108, 110, 109, 111, 115]
}
df = pd.DataFrame(data)
df.set_index('Date', inplace=True)

# 顯示原始收盤價數據
print("原始收盤價數據:")
print(df)

# 計算5天移動平均線
df['5-Day MA'] = df['Close'].rolling(window=5).mean()

# 計算5天移動標準差
df['5-Day Std'] = df['Close'].rolling(window=5).std()

# 顯示含移動平均線和移動標準差的數據
print("\n含移動平均線和移動標準差的數據:")
print(df)



原始收盤價數據:
            Close
Date             
2023-10-01    100
2023-10-02    102
2023-10-03    101
2023-10-04    105
2023-10-05    107
2023-10-06    108
2023-10-07    110
2023-10-08    109
2023-10-09    111
2023-10-10    115

含移動平均線和移動標準差的數據:
            Close  5-Day MA  5-Day Std
Date                                  
2023-10-01    100       NaN        NaN
2023-10-02    102       NaN        NaN
2023-10-03    101       NaN        NaN
2023-10-04    105       NaN        NaN
2023-10-05    107     103.0   2.915476
2023-10-06    108     104.6   3.049590
2023-10-07    110     106.2   3.420526
2023-10-08    109     107.8   1.923538
2023-10-09    111     109.0   1.581139
2023-10-10    115     110.6   2.701851
