In [1]:
# 数値計算に使うライブラリ
import numpy as np
import pandas as pd

In [2]:
# 表示設定
np.set_printoptions(linewidth=80)
pd.set_option("display.width", 80)

from matplotlib.pylab import rcParams

rcParams["figure.figsize"] = 8, 4

In [3]:
type("2020-01-01")

str

In [4]:
# pandas の Timestamp オブジェクトを作成

# pd.Timestamp:
#   - pandas が提供する日時型 (datetime64[ns] と互換)
#   - Python 標準の datetime よりも高機能で、
#     時系列データのインデックスや演算に広く使われる
#   - '2020-05-11' のような文字列を渡すと、その日付の Timestamp を生成する

my_time = pd.Timestamp("2020-05-11")
my_time  # → 2020-05-11 00:00:00 として表示される

Timestamp('2020-05-11 00:00:00')

In [5]:
type(my_time)

pandas._libs.tslibs.timestamps.Timestamp

In [6]:
# pandas の to_datetime を使って日付文字列を Timestamp に変換

# pd.to_datetime:
#   - 文字列や配列 (リスト, Series) を pandas の日時型 Timestamp に変換する関数
#   - 柔軟に日付フォーマットを解釈できる
#   - '2020-05-11' という文字列を与えると Timestamp('2020-05-11 00:00:00') が返る

my_time2 = pd.to_datetime("2020-05-11")
my_time2  # → 2020-05-11 00:00:00

Timestamp('2020-05-11 00:00:00')

In [7]:
# 日本語表記の日付文字列を pandas の Timestamp に変換する例

# pd.to_datetime:
#   - 日付文字列を pandas.Timestamp に変換する関数
#   - "format" 引数を指定することで、任意の書式に従ってパースできる
#   - Python の datetime.strftime / strptime と同じ書式指定子を利用する

# '%Y年%m月%d日':
#   - %Y: 西暦 (4桁)
#   - %m: 月 (2桁)
#   - %d: 日 (2桁)
#   - '年', '月', '日' はそのまま文字として扱う

my_time3 = pd.to_datetime("2020年6月8日", format="%Y年%m月%d日")
my_time3  # → 2020-06-08 00:00:00 として Timestamp が返る

Timestamp('2020-06-08 00:00:00')

In [8]:
# 英語の省略月を含む日付文字列を Timestamp に変換する例

# '2020 Feb 7':
#   - 西暦 2020 年
#   - 月は英語3文字表記 "Feb" (February)
#   - 日は 7 日

# format='%Y %b %d':
#   - %Y: 西暦 (4桁)
#   - %b: 月 (英語3文字表記, Jan, Feb, Mar, …)
#   - %d: 日 (ゼロ埋めありでもOK)

my_time4 = pd.to_datetime("2020 Feb 7", format="%Y %b %d")
my_time4  # → 2020-02-07 00:00:00 として Timestamp が返る

Timestamp('2020-02-07 00:00:00')

In [9]:
# 複雑な日本語文章の中から日付と時刻を抜き出して Timestamp に変換する例

# 入力文字列:
#   '時間は14時28分14秒だよ。ちなみに2020年の6月8日です。'
#   → 年月日だけでなく、時刻 (14:28:14) も含まれている

# format 引数:
#   '時間は%H時%M分%S秒だよ。ちなみに%Y年の%m月%d日です。'
#   - %H : 時 (24時間表記, 14)
#   - %M : 分 (28)
#   - %S : 秒 (14)
#   - %Y : 西暦 (2020)
#   - %m : 月 (06)
#   - %d : 日 (08)
#   - 文章中の「時間は」「だよ。ちなみに」「年の」「月」「日です。」などは
#     文字列としてそのままマッチさせる

my_time5 = pd.to_datetime(
    "時間は14時28分14秒だよ。ちなみに2020年の6月8日です。",
    format="時間は%H時%M分%S秒だよ。ちなみに%Y年の%m月%d日です。",
)

my_time5  # → 2020-06-08 14:28:14 として Timestamp が返る

Timestamp('2020-06-08 14:28:14')

In [10]:
pd.Timestamp.now()

Timestamp('2025-09-29 20:37:30.085953')

In [11]:
my_time3 = pd.to_datetime("2020-09-08 14:11:04")
my_time3

Timestamp('2020-09-08 14:11:04')

In [12]:
# my_time3 は Timestamp 型のオブジェクト
# 例: 2020-06-08 00:00:00
# これに対して日付や時間に関する属性を参照できる

print("年", my_time3.year)  # year 属性 → 西暦 (2020)
print("月", my_time3.month)  # month 属性 → 月 (6)
print("日", my_time3.day)  # day 属性 → 日 (8)

print("時", my_time3.hour)  # hour 属性 → 時間 (0) ここでは指定していないので 0
print("分", my_time3.minute)  # minute 属性 → 分 (0)
print("秒", my_time3.second)  # second 属性 → 秒 (0)

print(
    "1年の何日目か", my_time3.dayofyear
)  # dayofyear 属性 → その年の通算日 (2020/6/8 → 160日目)

# 注意: weekofyear は将来的に廃止予定 (FutureWarning が出ることがある)
# 代わりに isocalendar().week を使うのが推奨される
print("1年の何週目か", my_time3.weekofyear)

print("曜日(月曜が0)", my_time3.dayofweek)  # dayofweek 属性 → 曜日 (0=月曜, 6=日曜)
print("四半期　　　 ", my_time3.quarter)  # quarter 属性 → 四半期 (1〜4)

年 2020
月 9
日 8
時 14
分 11
秒 4
1年の何日目か 252
1年の何週目か 37
曜日(月曜が0) 1
四半期　　　  3


In [13]:
# daysinmonth 属性を使うと、その月に「何日あるか」を取得できる
# うるう年 (2020年) と平年 (2021年) の 2 月を比較する例

print("2020年2月", pd.to_datetime("2020-02").daysinmonth)  # うるう年なので 29
print("2021年2月", pd.to_datetime("2021-02").daysinmonth)  # 平年なので 28

2020年2月 29
2021年2月 28


In [14]:
# pd.date_range を使って日付の範囲を生成する例
# 引数:
#   start='2020-01-01' → 開始日を 2020年1月1日 とする
#   end='2020-03-01'   → 終了日を 2020年3月1日 とする
#   freq='MS'          → "Month Start" の略で「各月の初日」を意味する頻度

time_range = pd.date_range(start="2020-01-01", end="2020-03-01", freq="MS")
print(time_range)

DatetimeIndex(['2020-01-01', '2020-02-01', '2020-03-01'], dtype='datetime64[ns]', freq='MS')


In [15]:
type(time_range)

pandas.core.indexes.datetimes.DatetimeIndex

In [16]:
# endを含まない
pd.date_range(start="2020-01-01", end="2020-03-01", freq="MS", inclusive="left")

DatetimeIndex(['2020-01-01', '2020-02-01'], dtype='datetime64[ns]', freq='MS')

In [17]:
# startを含まない
pd.date_range(start="2020-01-01", end="2020-03-01", freq="MS", inclusive="right")

DatetimeIndex(['2020-02-01', '2020-03-01'], dtype='datetime64[ns]', freq='MS')

In [18]:
# start,endを含まない
pd.date_range(start="2020-01-01", end="2020-03-01", freq="MS", inclusive="neither")

DatetimeIndex(['2020-02-01'], dtype='datetime64[ns]', freq='MS')

In [19]:
# pd.date_range の使い方（periods を指定する例）
# 引数:
#   start='2020-01-01' → 開始日を 2020年1月1日とする
#   periods=3          → 3 期間分を生成する
#   freq='MS'          → "Month Start" 各月の初日を意味する頻度

pd.date_range(start="2020-01-01", periods=3, freq="MS")

DatetimeIndex(['2020-01-01', '2020-02-01', '2020-03-01'], dtype='datetime64[ns]', freq='MS')

In [20]:
# pd.date_range で「月の終わり」（月末日）を指定する例
# 引数:
#   start='2020-01-01' → 開始日を 2020年1月1日とする
#   periods=3          → 3 期間分を生成する
#   freq='M'           → "Month End" を意味し、各月の最終日を返す

pd.date_range(start="2020-01-01", periods=3, freq="M")

  pd.date_range(start="2020-01-01", periods=3, freq="M")


DatetimeIndex(['2020-01-31', '2020-02-29', '2020-03-31'], dtype='datetime64[ns]', freq='ME')

In [21]:
# pd.date_range で「1日単位」の日付を生成する例
# 引数:
#   start='2020-01-01' → 開始日を 2020年1月1日とする
#   periods=3          → 3 日分を生成する
#   freq='D'           → "Day" を意味し、日ごとの間隔を指定する

pd.date_range(start="2020-01-01", periods=3, freq="D")

DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03'], dtype='datetime64[ns]', freq='D')

In [22]:
# 日付生成: pd.date_range の freq を変えることでさまざまな時間単位を扱える
# 引数:
#   start='2020-01-01' → 開始日
#   periods=3          → 3 期間分生成
#   freq=...           → 時間の単位を指定

# 1日単位
print(pd.date_range(start="2020-01-01", periods=3, freq="D"))  # Day（日ごと）

# 1週間単位
print(
    pd.date_range(start="2020-01-01", periods=3, freq="W")
)  # Week（週ごと、デフォルトは日曜日が週末）

# 半月単位（15日ごと）
print(
    pd.date_range(start="2020-01-01", periods=3, freq="SME")
)  # Semi-Month-End（各月の15日と月末）
print(
    pd.date_range(start="2020-01-01", periods=3, freq="SMS")
)  # Semi-Month-Start（各月の1日と15日）

# 月単位
print(pd.date_range(start="2020-01-01", periods=3, freq="ME"))  # Month-End（各月末）
print(pd.date_range(start="2020-01-01", periods=3, freq="MS"))  # Month-Start（各月初）

# 四半期単位
print(
    pd.date_range(start="2020-01-01", periods=3, freq="QE")
)  # Quarter-End（各四半期の末）
print(
    pd.date_range(start="2020-01-01", periods=3, freq="QS")
)  # Quarter-Start（各四半期の初め）

# 年単位
print(
    pd.date_range(start="2020-01-01", periods=3, freq="YE")
)  # Year-End（年末: 12/31）
print(
    pd.date_range(start="2020-01-01", periods=3, freq="YS")
)  # Year-Start（年初: 1/1）

DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03'], dtype='datetime64[ns]', freq='D')
DatetimeIndex(['2020-01-05', '2020-01-12', '2020-01-19'], dtype='datetime64[ns]', freq='W-SUN')
DatetimeIndex(['2020-01-15', '2020-01-31', '2020-02-15'], dtype='datetime64[ns]', freq='SME-15')
DatetimeIndex(['2020-01-01', '2020-01-15', '2020-02-01'], dtype='datetime64[ns]', freq='SMS-15')
DatetimeIndex(['2020-01-31', '2020-02-29', '2020-03-31'], dtype='datetime64[ns]', freq='ME')
DatetimeIndex(['2020-01-01', '2020-02-01', '2020-03-01'], dtype='datetime64[ns]', freq='MS')
DatetimeIndex(['2020-03-31', '2020-06-30', '2020-09-30'], dtype='datetime64[ns]', freq='QE-DEC')
DatetimeIndex(['2020-01-01', '2020-04-01', '2020-07-01'], dtype='datetime64[ns]', freq='QS-JAN')
DatetimeIndex(['2020-12-31', '2021-12-31', '2022-12-31'], dtype='datetime64[ns]', freq='YE-DEC')
DatetimeIndex(['2020-01-01', '2021-01-01', '2022-01-01'], dtype='datetime64[ns]', freq='YS-JAN')


In [23]:
# さまざまな時間単位（1日未満の単位）
# freq の指定により、時間・分・秒などの粒度で DatetimeIndex を生成できる

# 1時間ごとに3つ
print(pd.date_range(start="2020-01-01", periods=3, freq="h"))  # Hour（時単位）

# 1分ごとに3つ
print(pd.date_range(start="2020-01-01", periods=3, freq="min"))  # Minute（分単位）

# 1秒ごとに3つ
print(pd.date_range(start="2020-01-01", periods=3, freq="s"))  # Second（秒単位）

# --- 以下は補足: より細かい単位も可能 ---

# 1ミリ秒ごとに3つ
print(
    pd.date_range(start="2020-01-01", periods=3, freq="ms")
)  # milli-second（ミリ秒単位）

# 1マイクロ秒ごとに3つ
print(
    pd.date_range(start="2020-01-01", periods=3, freq="us")
)  # micro-seconds（マイクロ秒単位）

# 1ナノ秒ごとに3つ
print(
    pd.date_range(start="2020-01-01", periods=3, freq="ns")
)  # nanoseconds（ナノ秒単位）

DatetimeIndex(['2020-01-01 00:00:00', '2020-01-01 01:00:00',
               '2020-01-01 02:00:00'],
              dtype='datetime64[ns]', freq='h')
DatetimeIndex(['2020-01-01 00:00:00', '2020-01-01 00:01:00',
               '2020-01-01 00:02:00'],
              dtype='datetime64[ns]', freq='min')
DatetimeIndex(['2020-01-01 00:00:00', '2020-01-01 00:00:01',
               '2020-01-01 00:00:02'],
              dtype='datetime64[ns]', freq='s')
DatetimeIndex([       '2020-01-01 00:00:00', '2020-01-01 00:00:00.001000',
               '2020-01-01 00:00:00.002000'],
              dtype='datetime64[ns]', freq='ms')
DatetimeIndex([       '2020-01-01 00:00:00', '2020-01-01 00:00:00.000001',
               '2020-01-01 00:00:00.000002'],
              dtype='datetime64[ns]', freq='us')
DatetimeIndex([          '2020-01-01 00:00:00',
               '2020-01-01 00:00:00.000000001',
               '2020-01-01 00:00:00.000000002'],
              dtype='datetime64[ns]', freq='ns')


In [24]:
# freq の詳細な設定例（曜日を基準にした週単位のインデックス作成）

# 'W-SUN' : 週単位で日曜日を区切り（つまり各要素が日曜日になる）
print(pd.date_range(start="2020-01-01", periods=4, freq="W-SUN"))  # Week-Sunday

# 'W-MON' : 週単位で月曜日を区切り（つまり各要素が月曜日になる）
print(pd.date_range(start="2020-01-01", periods=4, freq="W-MON"))  # Week-Monday

DatetimeIndex(['2020-01-05', '2020-01-12', '2020-01-19', '2020-01-26'], dtype='datetime64[ns]', freq='W-SUN')
DatetimeIndex(['2020-01-06', '2020-01-13', '2020-01-20', '2020-01-27'], dtype='datetime64[ns]', freq='W-MON')


In [25]:
# freq='15min' を指定すると、15分間隔で時系列インデックスを生成できる
# 引数:
#   start='2020-01-01' → 基準となる開始時刻（2020年1月1日 00:00:00）
#   periods=6          → 6 つの時点を生成
#   freq='15min'       → 15分ごとの間隔

print(pd.date_range(start="2020-01-01", periods=6, freq="15min"))  # 15 Minute

DatetimeIndex(['2020-01-01 00:00:00', '2020-01-01 00:15:00',
               '2020-01-01 00:30:00', '2020-01-01 00:45:00',
               '2020-01-01 01:00:00', '2020-01-01 01:15:00'],
              dtype='datetime64[ns]', freq='15min')


In [26]:
my_ts = pd.Series([1, 2, 3, 4, 5])
my_ts

0    1
1    2
2    3
3    4
4    5
dtype: int64

In [27]:
# Series に日付インデックスを付与する例
#
# pd.date_range(start='2020-01-01', periods=5, freq='D')
#   → 2020年1月1日から始まる 5日分の日付インデックスを生成（日単位）
#
# これを my_ts.index に代入することで、数値だけの Series に
# 「日付インデックス」を割り当て、時系列データとして扱えるようにする。

my_ts.index = pd.date_range(start="2020-01-01", periods=5, freq="D")
my_ts

2020-01-01    1
2020-01-02    2
2020-01-03    3
2020-01-04    4
2020-01-05    5
Freq: D, dtype: int64

In [28]:
my_mts = pd.DataFrame({"product_a": [1, 4, 7, 4, 8], "product_b": [4, 9, 3, 1, 0]})
my_mts.index = pd.date_range(start="2020-01-01", periods=5, freq="MS")
print(my_mts)

            product_a  product_b
2020-01-01          1          4
2020-02-01          4          9
2020-03-01          7          3
2020-04-01          4          1
2020-05-01          8          0


In [29]:
my_mts.index = pd.date_range(start="2020-01-01", periods=5, freq="W")
print(my_mts)

            product_a  product_b
2020-01-05          1          4
2020-01-12          4          9
2020-01-19          7          3
2020-01-26          4          1
2020-02-02          8          0


In [30]:
# 月次時系列データの読み込みと頻度設定である

ts_month = pd.read_csv(
    "2-4-1-time-series-month.csv",  # 読み込むCSVファイル名である
    index_col="time",  # 'time' 列を行インデックスとして使用するである
    parse_dates=True,  # インデックスを日付型 (datetime64[ns]) に変換するである
    dtype="float",  # データ本体は浮動小数点として読み込むである
)

# インデックスの「頻度（freq）」メタ情報を明示するである
# 'MS' は Month Start（各月初日）の略である
# 注意: ここで設定するのは“メタ情報”に過ぎず、実データの欠損月を自動補完はしないである。
# 欠損月を明示的に作りたい／詰めたい場合は ts_month = ts_month.asfreq('MS') を用いるである。
# また、読み込み後に pandas が推定した頻度を確認したい場合は ts_month.index.inferred_freq を見ると良いである。
ts_month.index.freq = "MS"

# 結果の確認である
print(ts_month)

            sales
time             
2000-01-01   10.0
2000-02-01    5.0
2000-03-01    8.0
2000-04-01   14.0
2000-05-01    9.0


In [31]:
# 日単位の時系列データを読み込む処理である

ts_day = pd.read_csv(
    "2-4-2-time-series-day.csv",  # CSVファイルのパスを指定
    index_col="time",  # 'time'列を行インデックスに設定
    parse_dates=True,  # インデックスを日付型 (datetime64) として解釈
    dtype="float",  # データ本体は浮動小数点型にする
)

# インデックスの「頻度」メタ情報を明示的に設定
# 'D' は日単位 (Day) を意味する
ts_day.index.freq = "D"

# データの確認
# head(3) → 先頭3行を表示
# tail(3) → 末尾3行を表示
print(ts_day.head(3))
print(ts_day.tail(3))

            value
time             
1990-01-01    1.0
1990-01-02    2.0
1990-01-03    3.0
             value
time              
1999-12-29  3650.0
1999-12-30  3651.0
1999-12-31  3652.0


In [32]:
ts_month.index

DatetimeIndex(['2000-01-01', '2000-02-01', '2000-03-01', '2000-04-01',
               '2000-05-01'],
              dtype='datetime64[ns]', name='time', freq='MS')

In [33]:
# 参考：indexの型
type(ts_month.index)

pandas.core.indexes.datetimes.DatetimeIndex

In [34]:
# 列ごとに分かれて記録されている日付データを読み込む例

# CSVを読み込み（この時点では 'year', 'month', 'day' などが別々の列として入っている想定）
separate_day = pd.read_csv("2-4-3-separate-time-day.csv")

# 先頭3行を表示して内容を確認
# → どのように「年月日」が分割されて格納されているかをチェックする
print(separate_day.head(3))

   year  month  day  value
0  1990      1    1      1
1  1990      1    2      2
2  1990      1    3      3


In [35]:
# 列ごとに分かれていた年月日をまとめて日付型に変換してインデックスに設定する

# 'year', 'month', 'day' から datetime 型のインデックスを作成
separate_day.index = pd.to_datetime(separate_day[["year", "month", "day"]])

# インデックスの頻度を「日単位（D）」と明示的に指定
# → 時系列解析で resample や shift などを利用するときに有効
separate_day.index.freq = "D"

# 先頭3行を表示して確認
print(separate_day.head(3))

            year  month  day  value
1990-01-01  1990      1    1      1
1990-01-02  1990      1    2      2
1990-01-03  1990      1    3      3


In [36]:
# すでに 'year', 'month', 'day' から日時インデックスを作成したため、
# これらの列は不要となるので削除する

# axis=1 は「列方向」を指定している
separate_day = separate_day.drop(["year", "month", "day"], axis=1)

# 先頭3行を表示して確認
print(separate_day.head(3))

            value
1990-01-01      1
1990-01-02      2
1990-01-03      3


In [37]:
# 時間情報がわかれたデータの読み込み
separate_month = pd.read_csv("2-4-4-separate-time-month.csv")

# 結果の確認
print(separate_month.head(3))

   year  month  value
0  1990      1      1
1  1990      2      2
2  1990      3      3


In [38]:
# 月単位のデータを扱うため、'year' と 'month' を結合して日時インデックスを作成する。
# 'day' はダミーとして 1 を代入（各月の1日を代表日とする）。

separate_month.index = pd.to_datetime(
    {
        "year": separate_month["year"],  # 年
        "month": separate_month["month"],  # 月
        "day": np.tile(1, len(separate_month)),  # 日は全て1に固定
    }
)

# インデックスが「各月の初日」になるので freq を "MS" (Month-Start) に設定
separate_month.index.freq = "MS"

# すでにインデックスに変換した 'year' と 'month' 列は不要になるので削除
separate_month = separate_month.drop(["year", "month"], axis=1)

# 先頭3行を表示して確認
print(separate_month.head(3))

            value
1990-01-01      1
1990-02-01      2
1990-03-01      3


In [39]:
print(ts_day.head(3))
print(ts_day.tail(3))

            value
time             
1990-01-01    1.0
1990-01-02    2.0
1990-01-03    3.0
             value
time              
1999-12-29  3650.0
1999-12-30  3651.0
1999-12-31  3652.0


In [40]:
# loc を使って特定の日付のデータを取得する
# '1990-01-02' という日付に対応する行を抽出して表示

print(ts_day.loc["1990-01-02"])

value    2.0
Name: 1990-01-02 00:00:00, dtype: float64


In [41]:
# loc を使って日付の範囲を指定
# '1990-01-02' から '1990-01-04' までのデータを抽出して表示
print(ts_day.loc["1990-01-02":"1990-01-04"])

            value
time             
1990-01-02    2.0
1990-01-03    3.0
1990-01-04    4.0


In [42]:
# loc で月単位のデータを抽出
# '1990-01' を指定すると、1990年1月全体のデータが取得できる
print(ts_day.loc["1990-01"])

            value
time             
1990-01-01    1.0
1990-01-02    2.0
1990-01-03    3.0
1990-01-04    4.0
1990-01-05    5.0
1990-01-06    6.0
1990-01-07    7.0
1990-01-08    8.0
1990-01-09    9.0
1990-01-10   10.0
1990-01-11   11.0
1990-01-12   12.0
1990-01-13   13.0
1990-01-14   14.0
1990-01-15   15.0
1990-01-16   16.0
1990-01-17   17.0
1990-01-18   18.0
1990-01-19   19.0
1990-01-20   20.0
1990-01-21   21.0
1990-01-22   22.0
1990-01-23   23.0
1990-01-24   24.0
1990-01-25   25.0
1990-01-26   26.0
1990-01-27   27.0
1990-01-28   28.0
1990-01-29   29.0
1990-01-30   30.0
1990-01-31   31.0


In [43]:
# 15分ごとの時間インデックスを作成
time_idx = pd.date_range(
    start="2020-01-01",  # 開始日
    end="2021-01-01",  # 終了日（含まない設定）
    freq="15min",  # 15分ごとの頻度
    inclusive="left",  # end を含まない（デフォルトは 'both'）
)

# 作成したインデックスを使って時系列データを生成
# 値は 0 から順にカウントアップ
long_ts = pd.Series(np.arange(0, len(time_idx), 1), index=time_idx)

# 先頭3件を表示
print(long_ts.head(3))

# 最後の3件を表示
print(long_ts.tail(3))

2020-01-01 00:00:00    0
2020-01-01 00:15:00    1
2020-01-01 00:30:00    2
Freq: 15min, dtype: int64
2020-12-31 23:15:00    35133
2020-12-31 23:30:00    35134
2020-12-31 23:45:00    35135
Freq: 15min, dtype: int64


In [44]:
# データの長さ
366 * 24 * 4

35136

In [45]:
# 特定の日付・時刻を指定して値を取得
long_ts.loc["2020-12-31 23:30:00"]

35134

In [46]:
# Timestampオブジェクトの作成
pd.Timestamp(2020, 12, 31, 23, 30, 0)

Timestamp('2020-12-31 23:30:00')

In [47]:
# Timestampを利用したデータの抽出
# long_ts は DatetimeIndex を持つ時系列データ（Series）
# loc に pd.Timestamp を指定することで、特定の日時に対応する値を取り出す
# 今回は 2020年12月31日 23時30分 に対応するデータを抽出する
long_ts.loc[pd.Timestamp(2020, 12, 31, 23, 30, 0)]

35134

In [48]:
# Timestampを利用した範囲指定によるデータ抽出
# long_ts は 15分刻みで生成された時系列データ
# loc に範囲 (start:end) を与えることで、その範囲内のデータを取得できる
# 今回は 2020年12月30日 00:00 から 2020年12月31日 10:00 までのデータを抽出する
long_ts.loc[pd.Timestamp(2020, 12, 30) : pd.Timestamp(2020, 12, 31, 10)]

2020-12-30 00:00:00    34944
2020-12-30 00:15:00    34945
2020-12-30 00:30:00    34946
2020-12-30 00:45:00    34947
2020-12-30 01:00:00    34948
                       ...  
2020-12-31 09:00:00    35076
2020-12-31 09:15:00    35077
2020-12-31 09:30:00    35078
2020-12-31 09:45:00    35079
2020-12-31 10:00:00    35080
Freq: 15min, Length: 137, dtype: int64

In [49]:
# 特定の時刻（10:00:00）のデータのみ抽出する
# at_time('10:00:00') は、全ての日付のうち「時刻が 10:00:00 に一致する行」だけを取り出すメソッド
# long_ts は 15分刻みのデータなので、毎日 10:00:00 に相当する値が抽出される
long_ts.at_time('10:00:00')

2020-01-01 10:00:00       40
2020-01-02 10:00:00      136
2020-01-03 10:00:00      232
2020-01-04 10:00:00      328
2020-01-05 10:00:00      424
                       ...  
2020-12-27 10:00:00    34696
2020-12-28 10:00:00    34792
2020-12-29 10:00:00    34888
2020-12-30 10:00:00    34984
2020-12-31 10:00:00    35080
Freq: 1440min, Length: 366, dtype: int64

In [50]:
# 毎日「10:00:00 以上 11:00:00 未満」のデータを抽出する
# between_time(start_time, end_time) は「各日付における指定時間帯のデータ」を取り出すメソッド
# inclusive='left' により、開始時刻(10:00:00)は含むが、終了時刻(11:00:00)は含まない
# つまり、各日ごとに 10:00:00, 10:15:00, ..., 10:45:00 のデータが抽出される
long_ts.between_time(start_time="10:00:00", end_time="11:00:00", inclusive="left")

2020-01-01 10:00:00       40
2020-01-01 10:15:00       41
2020-01-01 10:30:00       42
2020-01-01 10:45:00       43
2020-01-02 10:00:00      136
                       ...  
2020-12-30 10:45:00    34987
2020-12-31 10:00:00    35080
2020-12-31 10:15:00    35081
2020-12-31 10:30:00    35082
2020-12-31 10:45:00    35083
Length: 1464, dtype: int64

In [51]:
# 月を表す列を追加する処理

# ts_day.index は DatetimeIndex なので、そこから月情報を直接取得できる
# .month を使うと、各行の日付に対応する「月（1〜12）」が整数で得られる
# これを新しい列 'month' として追加する
ts_day["month"] = ts_day.index.month

# 先頭3行を確認して、month列が正しく追加されたことを確認
print(ts_day.head(3))

            value  month
time                    
1990-01-01    1.0      1
1990-01-02    2.0      1
1990-01-03    3.0      1


In [52]:
# 月ごとの合計値を計算する

# groupby('month') により、追加した 'month' 列をキーにしてデータをグループ化
# つまり、同じ月（1月, 2月, …, 12月）ごとにデータをまとめる
# その後 .sum() を適用することで、各月に属するデータを合計する
# （例えば売上や観測値の合計を計算するようなイメージ）
print(ts_day.groupby("month").sum())

          value
month          
1      514445.0
2      475961.0
3      532797.0
4      524760.0
5      551707.0
6      543060.0
7      570617.0
8      580227.0
9      570660.0
10     599137.0
11     588960.0
12     618047.0
