# 시계열 데이터
#### 시계열 데이터란
* 행과 행에 시간의 순서(흐름)가 있고
* 행과 행의 시간간격이 동일한 데이터
* Time Series 또는 Sequential Data라고 한다.

## DatetimeIndex로 변환하기
> 1. pd.date_range()
    * date_range 함수는 시작일과 기간을 인수로 설정할 수 있고 freq 인수를 사용하면 특정 날짜만 생성되도록 할 수 있다.
    * freq 인수 종류
        * s : 초별
        * T : 분별
        * H : 시간별
        * D : 일별
        * W : 주별(일요일 기준)
        * W-MON : 주별(월요일 기준)
        * M : 월별(매월 마지막 날 기준)
        * MS : 월별(매월 첫날 기준)
        * B : 주말을 제외한 평일
        * BM : 주말을 제외한 평일 중 매월 마지막 날
        * BMS : 주말을 제외한 평일 중 매월 첫날
          
> 2. pd.to_datetime()
    * pd.to_datetime 함수를 사용하여 DatetimeIndex를 생성할 수 있다.  
    DatetimeIndex를 생성할 때 pd.to_datetime 함수를 사용하여 날짜를 나타내는 문자열을 자동으로 datetime 자료형으로 바꾸는데  
    날짜를 입력하는 방법은 YYYY.MM.DD, YYYY-MM-DD, YYYY/MM/DD, YYYY MM DD 등 다양한 방법 모두 사용 가능하기 때문에  
    개발자가 편한 방법으로 입력해도 무방하다.

In [3]:
import pandas as pd
import numpy as np

In [6]:
# pd.date_range() 사용 -> freq인자를 주지 않으면 기본값으로 범위 안의 모든 날짜의 시계열 데이터를 생성
day_idx = pd.date_range('2022-01-01', '2022-12-31')
print(day_idx)

DatetimeIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04',
               '2022-01-05', '2022-01-06', '2022-01-07', '2022-01-08',
               '2022-01-09', '2022-01-10',
               ...
               '2022-12-22', '2022-12-23', '2022-12-24', '2022-12-25',
               '2022-12-26', '2022-12-27', '2022-12-28', '2022-12-29',
               '2022-12-30', '2022-12-31'],
              dtype='datetime64[ns]', length=365, freq='D')


In [7]:
# freq = 'MS' 설정을 추가해 월별 첫 날의 날짜만 생성
dayMS_idx = pd.date_range('2022-01-01', '2022-12-31', freq = 'MS')
print(dayMS_idx)

DatetimeIndex(['2022-01-01', '2022-02-01', '2022-03-01', '2022-04-01',
               '2022-05-01', '2022-06-01', '2022-07-01', '2022-08-01',
               '2022-09-01', '2022-10-01', '2022-11-01', '2022-12-01'],
              dtype='datetime64[ns]', freq='MS')


In [None]:
# pd.to_datetime() 사용

In [12]:
date = ["2023-01-01", "2023-01-02", "2023-01-03", "2023-01-04", "2023-01-05", "2023-01-06", "2023-01-07"]
type(date)

list

In [13]:
date_idx = pd.to_datetime(date)
type(date_idx)

pandas.core.indexes.datetimes.DatetimeIndex

In [14]:
print(date_idx)

DatetimeIndex(['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04',
               '2023-01-05', '2023-01-06', '2023-01-07'],
              dtype='datetime64[ns]', freq=None)


## 날짜 요소 뽑기
* 날짜 타입의 변수를 사용하여 날짜의 요소를 뽑아낼 수 있다.
* 종류
    * df['Date'].dt.date : YYYY-MM-DD
    * df['Date'].dt.year : 연(4자리)
    * df['Date'].dt.month : 월(숫자)
    * df['Date'].dt.month_name() : 월(문자)
    * df['Date'].dt.day : 일(숫자)
    * df['Date'].dt.time : HH:MM:SS(문자)
    * df['Date'].dt.hour : 시(숫자)
    * df['Date'].dt.minute : 분(숫자)
    * df['Date'].dt.second : 초(숫자)
    * df['Date'].dt.quarter : 분기(숫자)
    * df['Date'].dt.day_name() : 요일이름(문자)
    * df['Date'].dt.weekday : 요일숫자(0-월, 1-화)(=dayofweek)
    * df['Date'].dt.weekofyear : 연 기준 몇 주째(숫자)(week)
    * df['Date'].dt.dayofyear : 연 기준 몇 일째(숫자)
    * df['Date'].dt.days_in_month : 월 일수(숫자)(=datsinmonth)