# 시계열 데이터를 다루기 위한 도구

날짜와 시간 데이터의 종류
- 타임스탬프 : 특정 시간 (예: 2018년 4월 26일)
- 시간 간격과 기간 : 특정 시작점과 종료점 사이의 시간의 길이 (예: 2018년, 24시간)
- 시간 델타(time delta), 지속기간(duration) : 정확한 시간 길이 (예: 34.56초)

## 파이썬에서 날짜와 시간을 처리하는 도구

In [10]:
from datetime import datetime
datetime(2018, 4, 27)
# datetime(year=2018, month=4, day=27)

datetime.datetime(2018, 4, 27, 0, 0)

In [11]:
from dateutil import parser
date = parser.parse("27th of april, 2018")
date

datetime.datetime(2018, 4, 27, 0, 0)

In [12]:
date.strftime('%A') # 표준 문자열 포맷코드

'Friday'

## 타입이 지정된 시간 배열 : Numpy 의 datetime64

datetime64 : 날짜를 64비트 정수로 인코딩해 날짜배열을 매우 간결하게 표현
- 벡터화된 연산을 빠르게 수행할 수 있음. 특히 배열의 크기가 커질수록 더 빠름

In [13]:
import numpy as np
date = np.array('2018-04-27', dtype=np.datetime64)
date

array(datetime.date(2018, 4, 27), dtype='datetime64[D]')

In [14]:
date + np.arange(12) 

array(['2018-04-27', '2018-04-28', '2018-04-29', '2018-04-30',
       '2018-05-01', '2018-05-02', '2018-05-03', '2018-05-04',
       '2018-05-05', '2018-05-06', '2018-05-07', '2018-05-08'], dtype='datetime64[D]')

## Pandas 에서의 날짜와 시간

In [15]:
import pandas as pd
date = pd.to_datetime("27th of april, 2018")
date

Timestamp('2018-04-27 00:00:00')

In [16]:
date.strftime('%A')

'Friday'

In [17]:
date + pd.to_timedelta(np.arange(12), 'D')

DatetimeIndex(['2018-04-27', '2018-04-28', '2018-04-29', '2018-04-30',
               '2018-05-01', '2018-05-02', '2018-05-03', '2018-05-04',
               '2018-05-05', '2018-05-06', '2018-05-07', '2018-05-08'],
              dtype='datetime64[ns]', freq=None)