# 시계열 데이터개요

- 시계열 데이터란
    - 시간의 흐름에 따라 수집된 데이터를 말한다.
    - 일반적으로는 시간의 간격이 균등한 **고정 빈도(fixed frequency)** 데이터가 대부분이지만 불규칙적인 데이텃세도 될 수 있다.                                    
    - 판다스는 날짜를 조작하고 다른 시구간에 대해 집계하고 다른 시간대를 샘플링 하는등의 시계열 데이터 분석을 위한 다양한 기능을 제공한다.

# 파이썬과 판다스의  날짜/시간 데이터 다루기

- **파이썬**은 `datetime` 모듈을 이용해 일시를 처리한다. datetime 모듈은 날짜/시간 관련 타입으로 <br/>`date, time, datetime` 세개의 클래스를 제공한다.
- **판다스**는 `Timestamp` 단일 타입으로 일시를 처리한다. <br/>`Timestamp`는 나노초(10억분의 1초)의 정밀도를 가진다.
- 파이썬, 판다스 모두 timedelta를 이용해 일시의 차이를 관리한다.

## 파이썬 datatime module
|클래스|설명|
|:-|-:|
|**date**|날짜타입 - 년/월/일을 저장|
|**time**|시간타입 - 시/분/초/마이크로초를 저장|
|**datetime**|날짜,시간을 저장|
|**timedelta**|두 datetime 간의 차이를 일/초/마이크로초로 표현|
|**tzinfo**|타임존-시간대-를 표현|

### 날짜 시간 객체 생성

In [4]:
import datetime  #datetime 모듈을 import
d = datetime.date(year=2023, month=1, day=2)  # 날짜
t = datetime.time(hour=14, minute=40, second=20, microsecond=99999)  # 시간
dt = datetime.datetime(year=2022, month=12, day=30, hour=11, minute=30, second=10)         
#                  데이트 타임 module에 데이트타임 class 
#                  마이크로 초는 1/100만 초
print(f"date: {d}\ntime: {t}\ndatetime: {dt}")


date: 2023-01-02
time: 14:40:20.099999
datetime: 2022-12-30 11:30:10


In [5]:
print(dt.year, dt.day, dt.second)

2022 30 10


In [8]:
from datetime import datetime, time, date
# 실행시점의 날짜, 일시 조회
print('현재날짜:' ,date.today())
print('현재일시:' ,datetime.now())

현재날짜: 2023-01-12
현재일시: 2023-01-12 14:47:38.704452


### timedetla 를 이용한 계산
- datetime간의 간격을 표현한다.
    - 특정 날짜나 시간에서 일정 기간을 더하거나 뺀 일시를 계산할 때 사용
    - 날짜/시간 간의 차이를 계산한 결과로 사용 (두 일시간의 뺄셈의 결과)
    - 차이를 day, second, microsends로 표현한다.
    - 객체 생성시  weeks, days, hours, minutes, seconds, milliseconds, microseconds 를 넣어 차이를 표현한다.

In [12]:
from datetime import timedelta
tdelta = timedelta(days=1)    # 1일차
tdelta = timedelta(weeks=1)   # 1주일차
tdelta = timedelta(weeks=2, days=3, hours=5, minutes=10, seconds=30, milliseconds=100, microseconds=100000)

c = datetime.now()  - tdelta
print(c)
print(c - tdelta)
print(c + tdelta)

2022-12-26 10:07:57.997589
2022-12-09 04:57:27.797589
2023-01-12 15:18:28.197589


In [14]:
date(2023,1,12) - date(2022, 1,1)   # 날짜 차이를 timedelta

datetime.timedelta(days=376)

In [15]:
datetime.timedelta(days=376, seconds=18002, microseconds=384577)  ### 선생님 것 ###

AttributeError: type object 'datetime.datetime' has no attribute 'timedelta'

### datetime 과 문자열간 변환

- strftime()
    - datetime, date, time 객체를 지정한 형식의 문자열로 변환
- strptime()
    - 일시 형태의 문자열로 부터 datetime 객체를 생성한다.
- 요소를 나타내는 주요 형식문자
    - %Y, %m, %d : 년, 월, 일
    - %H, %M, %S : 시, 분, 초
    - https://docs.python.org/ko/3/library/datetime.html#strftime-and-strptime-format-codes

In [42]:
today = date.today()
print(today.weekday())  #date.weekday(), datetime.weekday() ->요일을 정수반환 (0: 월, 6:일)

print(today)
print(today.strftime("%y년 %m월 %d일 %a {dow[today.weekday()]요일}"))   ###==> ### 선생님 것###
curr = datetime.now()
print(curr.strftime('%Y/%m/%D/%H, %I %p'))  ###==> ### 선생님 것###

3
2023-01-12
23년 01월 12일 Thu {dow[today.weekday()]요일}
2023/01/01/12/23/16, 04 PM


In [28]:
s = "2000년 10월 30일"
# 문자열 -> datatime
datetime.strptime(s,"%Y년 %m월 %d일")

datetime.datetime(2000, 10, 30, 0, 0)

## 판다스 Timestamp
- 날짜 시간을 나노초(10억분의 1초) 단위의 정밀도로 표현한다.
- 다양한 방식으로 객체를 생성할 수 있다.
    - 직접 원하는 일시를 넣어 생성
    - 일시 형태의 문자열을 이용해 생성
    - unix time 부터 계산하여 생성  -  1970년 1월 1일 0시 0분 0초 0나노초


In [32]:
import pandas as pd
# 직접 원하는 일시를 넣어서 생성
pd.Timestamp(year=2020, month=11, day=21)
pd.Timestamp(year=2020, month=11, day=21, hour=17, minute=30)
pd.Timestamp(year=2020, month=11, day=21, hour=17, minute=30, second=10, microsecond=1, nanosecond=1)

Timestamp('2020-11-21 17:30:10.000001001')

In [33]:
# 문자열 생성
# 날짜: '/'나 '~' 로 구분자를 사용, 시간 ~:~ 을 구분자로 사용

pd.Timestamp('2023/1/12')
pd.Timestamp('2023/1/12 12:23')
pd.Timestamp('2023/1/12 12:30.12111')   #날짜와 시간 구분: 공박아냐 T  ==> ### 선샹님 것

Timestamp('2023-01-12 12:30:07')

In [36]:
# 유닉스 타입을 기준으로 경과한 날짜
pd.Timestamp(100)  # 100나노조 경과함 일시
pd.Timestamp(10,unit='Y')    # 10년
pd.Timestamp(10,unit='M')    #10개월
pd.Timestamp(10,unit='W')    #10주      

Timestamp('1970-03-12 00:00:00')

### to_datetime()
- 날짜와 관련된 다양한 값들을 Timestamp로 변환한다.-> 타입을 변환하나는 뜻.
- Series나 리스트의 값들을 한번에 변환할 수 있다. 

In [44]:
s1 = pd.Series([10,100,1000,10000])
pd.to_datetime(s1, unit='D')

0   1970-01-11
1   1970-04-11
2   1972-09-27
3   1997-05-19
dtype: datetime64[ns]

In [50]:
s2 = pd.Series(['2000-01-01', '2001-03-10', '2023-01-12','qrioperqjg'])
result  = pd.to_datetime(s2,
                        errors='coerce')  
#  변환 못하는 문자열일 경우 어떻게 처리할지 지정 :ignore-antl, coerce-Nat결축치 처리, raise:exception발생-기본값
result

0   2000-01-01
1   2001-03-10
2   2023-01-12
3          NaT
dtype: datetime64[ns]

In [49]:
result[0]

Timestamp('2000-01-01 00:00:00')

In [51]:
### 선생님 것 ###
s3 = pd.Series(['2000년 01월 01일', '2001년 03월 10일', '2023년 01월 12일']) ## ==> 중간에 - 없으면 구분 못하는 형태
pd.to_datetime(s3.format='%Y년 %m월 %d일')   #parsing 안되는 형식의 일시는 그 형식을 지정해 준다

SyntaxError: expression cannot contain assignment, perhaps you meant "=="? (1324813702.py, line 2)

In [52]:
df = pd.read_csv('data/walmart_stock.csv')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1258 entries, 0 to 1257
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   Date       1258 non-null   object 
 1   Open       1258 non-null   float64
 2   High       1258 non-null   float64
 3   Low        1258 non-null   float64
 4   Close      1258 non-null   float64
 5   Volume     1258 non-null   int64  
 6   Adj Close  1258 non-null   float64
dtypes: float64(5), int64(1), object(1)
memory usage: 68.9+ KB


In [53]:
df.head()

Unnamed: 0,Date,Open,High,Low,Close,Volume,Adj Close
0,2012-01-03,59.970001,61.060001,59.869999,60.330002,12668800,52.619235
1,2012-01-04,60.209999,60.349998,59.470001,59.709999,9593300,52.078475
2,2012-01-05,59.349998,59.619999,58.369999,59.419998,12768200,51.825539
3,2012-01-06,59.419998,59.450001,58.869999,59.0,8069400,51.45922
4,2012-01-09,59.029999,59.549999,58.919998,59.18,6679300,51.616215


In [57]:
df2 = df.copy()

In [60]:
# Date : object ->ㅇdatetime 타입의 컬럼으로 변환
df['Date'] = pd.to_datetime(df['Date'])
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1258 entries, 0 to 1257
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype         
---  ------     --------------  -----         
 0   Date       1258 non-null   datetime64[ns]
 1   Open       1258 non-null   float64       
 2   High       1258 non-null   float64       
 3   Low        1258 non-null   float64       
 4   Close      1258 non-null   float64       
 5   Volume     1258 non-null   int64         
 6   Adj Close  1258 non-null   float64       
dtypes: datetime64[ns](1), float64(5), int64(1)
memory usage: 68.9 KB


In [62]:
df2['Date'] = df2['Date'].astype("datetime64")
df2.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1258 entries, 0 to 1257
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype         
---  ------     --------------  -----         
 0   Date       1258 non-null   datetime64[ns]
 1   Open       1258 non-null   float64       
 2   High       1258 non-null   float64       
 3   Low        1258 non-null   float64       
 4   Close      1258 non-null   float64       
 5   Volume     1258 non-null   int64         
 6   Adj Close  1258 non-null   float64       
dtypes: datetime64[ns](1), float64(5), int64(1)
memory usage: 68.9 KB


In [64]:
df3 = pd.read_csv("data/walmart_stock.csv", parse_dates=[0])  #0번째 컬럼은 datetime 타입으로 변환하라.
df3.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1258 entries, 0 to 1257
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype         
---  ------     --------------  -----         
 0   Date       1258 non-null   datetime64[ns]
 1   Open       1258 non-null   float64       
 2   High       1258 non-null   float64       
 3   Low        1258 non-null   float64       
 4   Close      1258 non-null   float64       
 5   Volume     1258 non-null   int64         
 6   Adj Close  1258 non-null   float64       
dtypes: datetime64[ns](1), float64(5), int64(1)
memory usage: 68.9 KB


### Timestamp 간 연산 및 TimeDelta
- element: wise 연산

In [67]:
s1 = pd.to_datetime(pd.Series(['2010-01-01', '2010-03-01', '2010-06-01']))
s2 = pd.to_datetime(pd.Series(['2012-01-01', '2012-03-01', '2012-06-01']))
s2.dtype

dtype('<M8[ns]')

In [68]:
result = s2 - s1  # 같은 index의 원소끼리의 날짜 차이 계산
result

0   730 days
1   731 days
2   731 days
dtype: timedelta64[ns]

In [None]:
#-------------------------------------------------------

In [71]:
# Timedalta 객체 생성
# 간격: days, seconds, millseconds, microsecond, minutes, hours, weeks)
t_dela = pd.Timedelta(days=3)
t_dela = pd.Timedelta(weeks=2, days=3)

s1 + t_dela     # s1 날짜에서 3일 후 날짜를 계산 => element-wise 연산.
s1 - t_dela     # s1 날짜에서 3일 후 날짜를 계산 => element-wise 연산.

0   2009-12-15
1   2010-02-12
2   2010-05-15
dtype: datetime64[ns]

# 시계열 데이터셋

- 판다스에서 시계열 데이터셋의 가장 기본적인 형태는 Index가 datetime 타입인 Series나 DataFrame 객체이다.
    - DateTimeIndex: datetime 타입의 index 타입

In [76]:
from datetime import datetime
import pandas as pd
import numpy as np

dates = [
    datetime(2022, 1, 1),datetime(2022, 1, 2),
    datetime(2022, 1, 3),datetime(2022, 1, 4),
    datetime(2022, 2, 1),datetime(2022, 2, 2),
    datetime(2022, 2, 3),datetime(2022, 2, 4),
    datetime(2022, 3, 1),datetime(2022, 3, 2),
    datetime(2022, 3, 3),datetime(2022, 3, 4),
    datetime(2023, 1, 1),datetime(2023, 1, 2),
    datetime(2023, 1, 3),datetime(2023, 1, 4),
    datetime(2023, 2, 1),datetime(2023, 2, 2),
    datetime(2023, 2, 3),datetime(2023, 2, 4),
    datetime(2023, 3, 1),datetime(2023, 3, 2),
    datetime(2023, 3, 3),datetime(2023, 3, 4),
]
np.random.seed(0)
values = np.random.standard_normal(size=24)  # 표준정규분포(평균:0, 표준편차:1) 난수

s = pd.Series(values, index=dates)
s.info()
s

<class 'pandas.core.series.Series'>
DatetimeIndex: 24 entries, 2022-01-01 to 2023-03-04
Series name: None
Non-Null Count  Dtype  
--------------  -----  
24 non-null     float64
dtypes: float64(1)
memory usage: 384.0 bytes


2022-01-01    1.764052
2022-01-02    0.400157
2022-01-03    0.978738
2022-01-04    2.240893
2022-02-01    1.867558
2022-02-02   -0.977278
2022-02-03    0.950088
2022-02-04   -0.151357
2022-03-01   -0.103219
2022-03-02    0.410599
2022-03-03    0.144044
2022-03-04    1.454274
2023-01-01    0.761038
2023-01-02    0.121675
2023-01-03    0.443863
2023-01-04    0.333674
2023-02-01    1.494079
2023-02-02   -0.205158
2023-02-03    0.313068
2023-02-04   -0.854096
2023-03-01   -2.552990
2023-03-02    0.653619
2023-03-03    0.864436
2023-03-04   -0.742165
dtype: float64

In [77]:
s.index

DatetimeIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04',
               '2022-02-01', '2022-02-02', '2022-02-03', '2022-02-04',
               '2022-03-01', '2022-03-02', '2022-03-03', '2022-03-04',
               '2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04',
               '2023-02-01', '2023-02-02', '2023-02-03', '2023-02-04',
               '2023-03-01', '2023-03-02', '2023-03-03', '2023-03-04'],
              dtype='datetime64[ns]', freq=None)

In [78]:
s.index[0]  #DateTimeIndex의 원소들은  Timestamp 타입.

Timestamp('2022-01-01 00:00:00')

## DatatimeIndex indexing 과 slicing
- Index가 Datetime 타입일 경우(DatetimeIndex) 날짜 시간의 각 요소들(ex: 년도, 월, 시간등등)을 이용해 다양한 조회가 가능하다.

In [79]:
# indexing - 문자열로 조회
# s[pd.Timestamp(2022, 1, 1)]
s['2022-01-02']

0.4001572083672233

In [80]:
# 부분일치 조회
s['2022']  # 2022년 원소들
s['2022-02'] # 2022년 2월 원소들

2022-02-01    1.867558
2022-02-02   -0.977278
2022-02-03    0.950088
2022-02-04   -0.151357
dtype: float64

### slicing
- 부분 매칭(날짜/시간의 특정 요소만으로 매칭)으로 slicing이 가능하다.

In [81]:
s['2022-02-02':'2023-01-03']  #start, stop 포함.
s['2022-02-02':'2023-01-03':3]

2022-02-02   -0.977278
2022-03-01   -0.103219
2022-03-04    1.454274
2023-01-03    0.443863
dtype: float64

In [82]:
s['2022-01': '2022-02']
s['2022-01': '2023-02']  # 2022년 1월 1일 ~ 2023년 2월 28(마지막날)

2022-01-01    1.764052
2022-01-02    0.400157
2022-01-03    0.978738
2022-01-04    2.240893
2022-02-01    1.867558
2022-02-02   -0.977278
2022-02-03    0.950088
2022-02-04   -0.151357
2022-03-01   -0.103219
2022-03-02    0.410599
2022-03-03    0.144044
2022-03-04    1.454274
2023-01-01    0.761038
2023-01-02    0.121675
2023-01-03    0.443863
2023-01-04    0.333674
2023-02-01    1.494079
2023-02-02   -0.205158
2023-02-03    0.313068
2023-02-04   -0.854096
dtype: float64

In [83]:
s['2022':'2023']  #2022년 1월 1일 ~ 2023년 12월 31일

2022-01-01    1.764052
2022-01-02    0.400157
2022-01-03    0.978738
2022-01-04    2.240893
2022-02-01    1.867558
2022-02-02   -0.977278
2022-02-03    0.950088
2022-02-04   -0.151357
2022-03-01   -0.103219
2022-03-02    0.410599
2022-03-03    0.144044
2022-03-04    1.454274
2023-01-01    0.761038
2023-01-02    0.121675
2023-01-03    0.443863
2023-01-04    0.333674
2023-02-01    1.494079
2023-02-02   -0.205158
2023-02-03    0.313068
2023-02-04   -0.854096
2023-03-01   -2.552990
2023-03-02    0.653619
2023-03-03    0.864436
2023-03-04   -0.742165
dtype: float64

In [84]:
df = pd.read_csv('data/walmart_stock.csv', parse_dates=[0], index_col=0)
df

Unnamed: 0_level_0,Open,High,Low,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2012-01-03,59.970001,61.060001,59.869999,60.330002,12668800,52.619235
2012-01-04,60.209999,60.349998,59.470001,59.709999,9593300,52.078475
2012-01-05,59.349998,59.619999,58.369999,59.419998,12768200,51.825539
2012-01-06,59.419998,59.450001,58.869999,59.000000,8069400,51.459220
2012-01-09,59.029999,59.549999,58.919998,59.180000,6679300,51.616215
...,...,...,...,...,...,...
2016-12-23,69.430000,69.750000,69.360001,69.540001,4803900,69.032411
2016-12-27,69.300003,69.820000,69.250000,69.699997,4435700,69.191240
2016-12-28,69.940002,70.000000,69.260002,69.309998,4875700,68.804087
2016-12-29,69.209999,69.519997,69.120003,69.260002,4298400,68.754456


In [85]:
df.index

DatetimeIndex(['2012-01-03', '2012-01-04', '2012-01-05', '2012-01-06',
               '2012-01-09', '2012-01-10', '2012-01-11', '2012-01-12',
               '2012-01-13', '2012-01-17',
               ...
               '2016-12-16', '2016-12-19', '2016-12-20', '2016-12-21',
               '2016-12-22', '2016-12-23', '2016-12-27', '2016-12-28',
               '2016-12-29', '2016-12-30'],
              dtype='datetime64[ns]', name='Date', length=1258, freq=None)

In [86]:
df.loc['2012-01-03']

Open         5.997000e+01
High         6.106000e+01
Low          5.987000e+01
Close        6.033000e+01
Volume       1.266880e+07
Adj Close    5.261924e+01
Name: 2012-01-03 00:00:00, dtype: float64

In [87]:
df.loc['2012-01-03': '2012/01/20']

Unnamed: 0_level_0,Open,High,Low,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2012-01-03,59.970001,61.060001,59.869999,60.330002,12668800,52.619235
2012-01-04,60.209999,60.349998,59.470001,59.709999,9593300,52.078475
2012-01-05,59.349998,59.619999,58.369999,59.419998,12768200,51.825539
2012-01-06,59.419998,59.450001,58.869999,59.0,8069400,51.45922
2012-01-09,59.029999,59.549999,58.919998,59.18,6679300,51.616215
2012-01-10,59.43,59.709999,58.98,59.040001,6907300,51.494109
2012-01-11,59.060001,59.529999,59.040001,59.400002,6365600,51.808098
2012-01-12,59.790001,60.0,59.400002,59.5,7236400,51.895316
2012-01-13,59.18,59.610001,59.009998,59.540001,7729300,51.930204
2012-01-17,59.869999,60.110001,59.52,59.849998,8500000,52.200581


In [88]:
df.loc['2012-01']

Unnamed: 0_level_0,Open,High,Low,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2012-01-03,59.970001,61.060001,59.869999,60.330002,12668800,52.619235
2012-01-04,60.209999,60.349998,59.470001,59.709999,9593300,52.078475
2012-01-05,59.349998,59.619999,58.369999,59.419998,12768200,51.825539
2012-01-06,59.419998,59.450001,58.869999,59.0,8069400,51.45922
2012-01-09,59.029999,59.549999,58.919998,59.18,6679300,51.616215
2012-01-10,59.43,59.709999,58.98,59.040001,6907300,51.494109
2012-01-11,59.060001,59.529999,59.040001,59.400002,6365600,51.808098
2012-01-12,59.790001,60.0,59.400002,59.5,7236400,51.895316
2012-01-13,59.18,59.610001,59.009998,59.540001,7729300,51.930204
2012-01-17,59.869999,60.110001,59.52,59.849998,8500000,52.200581


In [89]:
df.loc['2012-01': '2012/02']
df.loc['2012-01': '2012/02': 5]

Unnamed: 0_level_0,Open,High,Low,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2012-01-03,59.970001,61.060001,59.869999,60.330002,12668800,52.619235
2012-01-10,59.43,59.709999,58.98,59.040001,6907300,51.494109
2012-01-18,59.790001,60.029999,59.650002,60.009998,5911400,52.340131
2012-01-25,61.18,61.610001,61.040001,61.470001,5915800,53.613531
2012-02-01,61.790001,62.630001,61.790001,62.18,12130600,54.232785
2012-02-08,61.91,62.02,61.23,61.619999,7260000,53.744358
2012-02-15,62.32,62.439999,61.59,61.759998,5833700,53.866464
2012-02-23,58.59,58.900002,58.209999,58.540001,14880300,51.058014


## DateOffsets
- 빈도를 표현하는 타입이다.
- DateOffsets 타입 객체나 문자 별칭을 이용하여 빈도간격을 표현한다.
    - 타입: https://pandas.pydata.org/docs/user_guide/timeseries.html#dateoffset-objects
    - 별칭: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#offset-aliases

### DateOffset 이용 메소드
- **pd.date_range()**
    - 동일한 간격 일시로 구성된(고정빈도)의 DatetimeIndex 생성한다.
    - DatetimeIndex
        - 일시 타입의 Index
    - 주요 매개변수
        - start: str 또는 datetime 형식 - 시작 날짜
        - end: str 또는 datetime 형식 - 종료 날짜
        - period:  생성할 개수
            - start에서 end까지 periods에 지정한 개수에 맞춰 등분한 날짜로 구성된 DatetimeIndex를 반환한다.
            - end 대신 period로 
        - freq: str 또는 DateOffsets - 빈도 기준
            - https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#offset-aliases
        - periods와 freq는 둘중 하나만 사용한다. 둘다 생략하면 **일별**로 생성한다.

- **first(offset)**
    - offset 빈도의 앞의 N개 행을 조회한다.

## 데이터 shift
- DatetimeIndex의 index는 그대로 두고 데이터를 앞 또는 뒤로 이동시킨다.
- DataFrame/Series객체.shift() 이용
    - 매개변수
        - periods=1 : 이동할 기간 (기본값 1)
        - freq: 이동시킬 날짜/시간의 단위. DateOffset 객체/alias, timedelta
        

## resample()을 이용한 집계
- resample()은 시계열 데이터를 지정한 구간별로 나눠서 집계할 수 있도록 grouping 한다.
- groupby() 로 묶을 수도 있지만 DatetimeIndex의 경우 resample이 더 편리하다.
    - 매개변수
        - rule: group으로 묶을 기준을 offset으로 지정한다.
        - closed : "left" 또는 "right" - 간격의 시작과 끝중 어느부분을 포함시킬지(닫을지)를 설정. "left"가 기본으로 왼쪽은 포함하고 오른쪽은 포함되지 않는다.
        - on : 기준 컬럼을 지정한다. Index가 아니라 datetime 타입의 열(컬럼)을 기준으로 resample 할 때 사용

##  기간 이동 집계
- 현재값을 기준으로 N개씩 묶어서 집계를 한다.
    - 예) 이동평균 구하기
- rolling(window, min_periods=None)    
    - window: 범위. 정수
    - min_periods: 집계할 최소 개수. 생략하면 window size로 지정.
    - center: bool - 집계결과를 window의 중간에 둘지 여부. 기본값은 False로 레이블이 창 맨 뒤에 둔다. 