### 시계열
* 시간상 여러 지점을 관측하거나 측정할 수 있도록 목록 또는 그래프로 표시한 일련의 데이터
* 일정한 간격의 연속적이고 동등한 점들로 이루어진 시퀀스
* 빅데이터에서 일반적으로 동등한 시간 간격으로 배치된 연속적 사건으로 나타남
* ex) 금융시장 주가예측, 일기 예보, 전력에너지 소비추이, 웹 사이트 방문자 수 등 ...

### pandas 로 날짜 데이터 다루기
> #### 1) 시계열 자료와 pandas
> * 년도별, 월별, 일별, 시별, 분별, 초별 등 시간의 흐름에 따라 관측된 자료
> * pandas 에서 시계열 자료를 손쉽게 다룰 수 있도록 **datetime(datetime64)** 자료형 제공
>  * pd.to_datetime() 함수를 사용해, 날짜와 시간을 나타내는 문자열을 datetime(datetime64) 자료형으로 변경

In [1]:
import pandas as pd

##### 1 - 날짜 인덱스 지정

In [3]:
pd.Series(range(3), index=pd.date_range('2022', freq='D', periods=3))

2022-01-01    0
2022-01-02    1
2022-01-03    2
Freq: D, dtype: int64

##### 2 - 날짜 values 지정

In [4]:
pd.Series(pd.date_range('20220701', freq='D', periods=3))

0   2022-07-01
1   2022-07-02
2   2022-07-03
dtype: datetime64[ns]

##### 3 - 날짜 + 시간 values

In [5]:
pd.Series(pd.date_range('20220701 09:10:12', freq='H', periods=3))

0   2022-07-01 09:10:12
1   2022-07-01 10:10:12
2   2022-07-01 11:10:12
dtype: datetime64[ns]

##### 4 - dt

In [6]:
ser1 = pd.Series(pd.date_range('20220701 09:10:12', periods=3))
ser1

0   2022-07-01 09:10:12
1   2022-07-02 09:10:12
2   2022-07-03 09:10:12
dtype: datetime64[ns]

In [7]:
# 2일 날짜 추출
ser1[ser1.dt.day == 2]

1   2022-07-02 09:10:12
dtype: datetime64[ns]

---

In [8]:
df = pd.DataFrame({
    'order' : ['2020-01-01 07:10:00', '2020-01-08 07:20:30', '2020-02-20 11:20:00', '2020-02-20 14:12:10', '2020-03-01 06:19:30', '2020-07-08 12:54:15']
})
df

Unnamed: 0,order
0,2020-01-01 07:10:00
1,2020-01-08 07:20:30
2,2020-02-20 11:20:00
3,2020-02-20 14:12:10
4,2020-03-01 06:19:30
5,2020-07-08 12:54:15


In [11]:
pd.to_datetime(df['order'], format='%Y-%m-%d %H:%M:%S', errors)

0   2020-01-01 07:10:00
1   2020-01-08 07:20:30
2   2020-02-20 11:20:00
3   2020-02-20 14:12:10
4   2020-03-01 06:19:30
5   2020-07-08 12:54:15
Name: order, dtype: datetime64[ns]