In [1]:
import pandas as pd
import numpy as np
import seaborn

### `Datetime` 인덱스
시계열 객체인 `Series`는 시계열 데이터를 관리하는 객체이기 때문에 데이터가 시간에 의해 관리되어져야 함  

지금까지는 단순한 인덱스로 사용하였는데 이를 시계열로 표현하기 위해서 `DatetimeIndex`를 사용해야 함

`DatetimeIndex`는 시계열 인덱스를 사용하기 위한 인덱스이며 `pandas.to_datetime`, `pandas.date_range` 메서드를 사용하여 생성할 수 있음

`to_datetime()` 메서드는 날짜 및 시간을 나타내는 문자여을 Datetime 자료형으로 변경한 후 `DatetimeIndex`를 생성함

In [2]:
date_str = ['2018, 1, 1', '2018, 1, 4', '2018, 1, 5', '2018, 1, 6']
idx = pd.to_datetime(date_str)
idx

DatetimeIndex(['2018-01-01', '2018-01-04', '2018-01-05', '2018-01-06'], dtype='datetime64[ns]', freq=None)

In [3]:
date_str = ['2018/1/1', '2018/1/4', '2018/1/5', '2018/1/6']
idx = pd.to_datetime(date_str)
idx

DatetimeIndex(['2018-01-01', '2018-01-04', '2018-01-05', '2018-01-06'], dtype='datetime64[ns]', freq=None)

In [9]:
date_str = ['2018.1.1', '2018.1.4', '2018.1.5', '2018.1.6']
idx = pd.to_datetime(date_str)
idx

DatetimeIndex(['2018-01-01', '2018-01-04', '2018-01-05', '2018-01-06'], dtype='datetime64[ns]', freq=None)

In [None]:
# 문자 오류
date_str = ['2018년1월1일', '2018년1월4일', '2018년1월5일', '2018년1월6일']
idx = pd.to_datetime(date_str)
idx

In [None]:
# 문자타입 오류
date_str = ['2018.1.1', '2018/1/4', '2018,1,5', '2018.1.6']
idx = pd.to_datetime(date_str)
idx

In [7]:
# 인덱스 타입 : datetime 타입
s = pd.Series(np.random.randn(4), index=idx)
s

2018-01-01   -0.048697
2018-01-04    0.998262
2018-01-05    0.046862
2018-01-06    0.243245
dtype: float64

In [10]:
# 인덱스 타입 : string 타입
s = pd.Series(np.random.randn(4), index=date_str)
s

2018.1.1    0.748241
2018.1.4   -1.111446
2018.1.5   -0.489745
2018.1.6    1.097259
dtype: float64

`date_range` 메서드는 날짜 및 시간에 대해서 시작일과 종료일/ 시작일과 기간을 입력하여 범위 내의 `DatetimeIndex`를 생성

In [11]:
pd.date_range('2024-01-01','2024-03-31')

DatetimeIndex(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04',
               '2024-01-05', '2024-01-06', '2024-01-07', '2024-01-08',
               '2024-01-09', '2024-01-10', '2024-01-11', '2024-01-12',
               '2024-01-13', '2024-01-14', '2024-01-15', '2024-01-16',
               '2024-01-17', '2024-01-18', '2024-01-19', '2024-01-20',
               '2024-01-21', '2024-01-22', '2024-01-23', '2024-01-24',
               '2024-01-25', '2024-01-26', '2024-01-27', '2024-01-28',
               '2024-01-29', '2024-01-30', '2024-01-31', '2024-02-01',
               '2024-02-02', '2024-02-03', '2024-02-04', '2024-02-05',
               '2024-02-06', '2024-02-07', '2024-02-08', '2024-02-09',
               '2024-02-10', '2024-02-11', '2024-02-12', '2024-02-13',
               '2024-02-14', '2024-02-15', '2024-02-16', '2024-02-17',
               '2024-02-18', '2024-02-19', '2024-02-20', '2024-02-21',
               '2024-02-22', '2024-02-23', '2024-02-24', '2024-02-25',
      

In [12]:
pd.date_range('2024-01-01', periods = 30)

DatetimeIndex(['2024-01-01', '2024-01-02', '2024-01-03', '2024-01-04',
               '2024-01-05', '2024-01-06', '2024-01-07', '2024-01-08',
               '2024-01-09', '2024-01-10', '2024-01-11', '2024-01-12',
               '2024-01-13', '2024-01-14', '2024-01-15', '2024-01-16',
               '2024-01-17', '2024-01-18', '2024-01-19', '2024-01-20',
               '2024-01-21', '2024-01-22', '2024-01-23', '2024-01-24',
               '2024-01-25', '2024-01-26', '2024-01-27', '2024-01-28',
               '2024-01-29', '2024-01-30'],
              dtype='datetime64[ns]', freq='D')

`freq` 인수로 특정한 날짜만 생성되도록 할 수 있음

In [13]:
# s : 초
# T : 분
# H : 시간
# D : 일(day)
pd.date_range('2024-02-29 09:48:00', '2024-02-29 09:48:10', freq='s')

DatetimeIndex(['2024-02-29 09:48:00', '2024-02-29 09:48:01',
               '2024-02-29 09:48:02', '2024-02-29 09:48:03',
               '2024-02-29 09:48:04', '2024-02-29 09:48:05',
               '2024-02-29 09:48:06', '2024-02-29 09:48:07',
               '2024-02-29 09:48:08', '2024-02-29 09:48:09',
               '2024-02-29 09:48:10'],
              dtype='datetime64[ns]', freq='s')

In [14]:
# B : 평일
pd.date_range('2024-02-01', '2024-02-29', freq= 'B')

DatetimeIndex(['2024-02-01', '2024-02-02', '2024-02-05', '2024-02-06',
               '2024-02-07', '2024-02-08', '2024-02-09', '2024-02-12',
               '2024-02-13', '2024-02-14', '2024-02-15', '2024-02-16',
               '2024-02-19', '2024-02-20', '2024-02-21', '2024-02-22',
               '2024-02-23', '2024-02-26', '2024-02-27', '2024-02-28',
               '2024-02-29'],
              dtype='datetime64[ns]', freq='B')

In [17]:
# Q_DEC : 각 분기별 마지막 날
pd.date_range('2024-01-01', '2024-12-31', freq='QE-DEC')

DatetimeIndex(['2024-03-31', '2024-06-30', '2024-09-30', '2024-12-31'], dtype='datetime64[ns]', freq='QE-DEC')