## Agenda
- TimeSeries Data
- 시간의 흐름에 따라 변화 하는 data

In [None]:
import pandas as pd
import numpy as np

np.random.seed(252)

## Time Series

- "timeseries" 데이터는 `DatetimeIndex` 또는 `PeriodIndex`로 구성된 데이터 셋이다

### to_datetime

In [None]:
date_1=pd.to_datetime("20221206")

In [None]:
print(date_1, type(date_1))

2022-12-06 00:00:00 <class 'pandas._libs.tslibs.timestamps.Timestamp'>


In [None]:
date_2=pd.to_datetime("2022년12월06일",format='%Y년%m월%d일')

### sample data 생성

In [None]:
def random_series(dts):
    res = pd.Series(np.random.randn(len(dts)), index=dts)
    return res

`Timestamp` 를 이용해 시간 객체 생성

In [None]:
ts=pd.Timestamp("2022-01-01 00:00")

In [None]:
s_1=pd.Series(100, index=[ts]) #데이터에 시계열을 인덱스(지정)함.
s_1

2022-01-01    100
dtype: int64

## Time Series의 함수들
- `date_range` : 시작일과 종료일 또는 시작일과 기간을 입력하면 범위 내의 인덱스 생성
```
s: 초
T: 분
H: 시간
D: 일(day)
B: 주말이 아닌 평일
W: 주(일요일)
W-MON: 주(월요일)
M: 각 달(month)의 마지막 날
MS: 각 달의 첫날
BM: 주말이 아닌 평일 중에서 각 달의 마지막 날
BMS: 주말이 아닌 평일 중에서 각 달의 첫날
WOM-2THU: 각 달의 두번째 목요일
Q-JAN: 각 분기의 첫달의 마지막 날
Q-DEC: 각 분기의 마지막 달의 마지막 날
```

In [None]:
a=pd.date_range("20230101","20231231",freq='M')
a

DatetimeIndex(['2023-01-31', '2023-02-28', '2023-03-31', '2023-04-30',
               '2023-05-31', '2023-06-30', '2023-07-31', '2023-08-31',
               '2023-09-30', '2023-10-31', '2023-11-30', '2023-12-31'],
              dtype='datetime64[ns]', freq='M')

## 시계열 데이터에서의 indexing 과 slicing

- indexing

In [None]:
# 날짜가 인덱스값이고 그 뒤의 값이 value 이기 때문에, 인덱싱을 하고 싶다면 날짜를 입력하면 된다. 슬라이싱도 똑같다.

a['2023-01-31']

IndexError: ignored

- slicing

- 달별 선택

- 연별 선택

## 시계열 데이터의 이동 
- `shift()` 를 이용해 이동할 수 있다. 
- [참고](https://towardsdatascience.com/all-the-pandas-shift-you-should-know-for-data-analysis-791c1692b5e)

### Lagging(후행)

In [None]:
#간격을 재조정하거나 위치를 조절할 수 있다.

### Leading(선행)

## 간격 재조정
- `resample` : 시간 간격을 재조정하는 resampling 가능

In [None]:
dts_1=pd.date_range('20220101','20220331',freq='d')
dts_1

DatetimeIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04',
               '2022-01-05', '2022-01-06', '2022-01-07', '2022-01-08',
               '2022-01-09', '2022-01-10', '2022-01-11', '2022-01-12',
               '2022-01-13', '2022-01-14', '2022-01-15', '2022-01-16',
               '2022-01-17', '2022-01-18', '2022-01-19', '2022-01-20',
               '2022-01-21', '2022-01-22', '2022-01-23', '2022-01-24',
               '2022-01-25', '2022-01-26', '2022-01-27', '2022-01-28',
               '2022-01-29', '2022-01-30', '2022-01-31', '2022-02-01',
               '2022-02-02', '2022-02-03', '2022-02-04', '2022-02-05',
               '2022-02-06', '2022-02-07', '2022-02-08', '2022-02-09',
               '2022-02-10', '2022-02-11', '2022-02-12', '2022-02-13',
               '2022-02-14', '2022-02-15', '2022-02-16', '2022-02-17',
               '2022-02-18', '2022-02-19', '2022-02-20', '2022-02-21',
               '2022-02-22', '2022-02-23', '2022-02-24', '2022-02-25',
      

- Resampling은 groupby와 비슷하게 동작한다. 

In [None]:
dts_1.resample("M")

AttributeError: ignored

## dt접근자
- datetime 자료형 시리즈에는 dt 접근자존재
- datetime 자료형이 가진 몇가지 유용한 속성과 메서드를 사용할