# 8장, 시계열

https://wesmckinney.com/book/time-series

In [1]:
!pip install -Uqq numpy pandas

In [2]:
import numpy as np
import pandas as pd

판다스는 다양한 내장 시계열 도구와 알고리즘을 제공합니다. 

대용량 시계열을 효율적으로 처리하고, 불규칙 및 고정 빈도 시계열을 쪼개고 분석하고, 집계하고, 재샘플링할 수 있습니다. 

이러한 도구 중 일부는 금융 및 경제 애플리케이션에 유용하지만, **서버 로그 데이터 분석**에도 사용할 수 있습니다.

## 11.1 날짜 및 시간 데이터 유형과 도구

datetime, time, calendar 모듈이 주요 시작점입니다. 

datetime.datetime 유형, 또는 간단히 datetime이 널리 사용됩니다.

In [None]:
from datetime import datetime

now = datetime.now()
# now
# datetime.datetime(2025, 5, 6, 22, 24, 9, 469496)
print(now)
# 2025-05-06 22:24:41.878510

now.year, now.month, now.day
# (2025, 5, 6)

2025-05-06 22:25:23.975159


(2025, 5, 6)

In [11]:
# 마이크로 초 까지 저장

# 두 시간 객체 간의 시간적 차이 계산.
delta = datetime(2011, 1, 7) - datetime(2008, 6, 24, 8, 15)

delta
# datetime.timedelta(days=926, seconds=56700)

datetime.timedelta(days=926, seconds=56700)

In [None]:
delta.days, delta.seconds
# (926, 56700)

(926, 56700)

In [None]:
from datetime import timedelta

start = datetime(2011, 1, 7)

print(start + timedelta(12))
# 2011-01-19 00:00:00
# datetime.datetime(2011, 1, 19, 0, 0)

start - 2 * timedelta(12)
# datetime.datetime(2010, 12, 14, 0, 0)

2011-01-19 00:00:00


datetime.datetime(2010, 12, 14, 0, 0)

## 문자열과 날짜/시간 간 변환

https://docs.python.org/ko/3.13/library/datetime.html#strftime-and-strptime-behavior

파이썬 datetime 과 문자열 간의 변환 방법

In [17]:
# datetime 객체 생성.
stamp = datetime(2011, 1, 3)

# datetime 객체를 문자열로.
print(str(stamp))
# '2011-01-03 00:00:00' # 지정하지 않은 시분초 파트는 0으로 초기화 됨.

# datetime 객체를 formatted 문자열로.
print(stamp.strftime("%Y, %m/%d"))
# 2011, 01/03


2011-01-03 00:00:00
2011, 01/03


In [20]:
stamp = datetime(2011, 1, 3, 13, 9, 16, 484500)
formats = [
    '%F',  # %Y-%m-%d
    '%Y', '%y',  # year
    '%m', '%d',  # month, day
    '%H', '%I', '%M', '%S', # hour-24, hour-12, minute, second
    '%f',  # microsecond
    '%j',  # day of year 001~366
    '%w', '%u', # weekday (from 0-sunday, from 1-monday)
    '%U',  # weeknum
    '%z', '%Z', # timezone (offset, name)
    '%D',  # %m/%d/%y
    ]
for fmt in formats:
    print(fmt, stamp.strftime(fmt))

%F 2011-01-03
%Y 2011
%y 11
%m 01
%d 03
%H 13
%I 01
%M 09
%S 16
%f 484500
%j 003
%w 1
%u 1
%U 01
%z 
%Z 
%D 01/03/11


In [None]:
# 문자열 -> datetime 변환
value = "2011-01-03"

print(datetime.strptime(value, "%Y-%m-%d"))
# datetime.datetime(2011, 1, 3, 0, 0)
# 2011-01-03 00:00:00

datestrs = ["7/6/2011", "8/6/2011"]

[datetime.strptime(x, "%m/%d/%Y") for x in datestrs]
# [datetime.datetime(2011, 7, 6, 0, 0),
#  datetime.datetime(2011, 8, 6, 0, 0)]

2011-01-03 00:00:00


[datetime.datetime(2011, 7, 6, 0, 0), datetime.datetime(2011, 8, 6, 0, 0)]

In [23]:
datestrs = ["2011-07-06 12:00:00", "2011-08-06 00:00:00"]

z = pd.to_datetime(datestrs)
print(type(z))
z
# DatetimeIndex(['2011-07-06 12:00:00', '2011-08-06 00:00:00'], dtype='datetime64[ns]', freq=None)

<class 'pandas.core.indexes.datetimes.DatetimeIndex'>


DatetimeIndex(['2011-07-06 12:00:00', '2011-08-06 00:00:00'], dtype='datetime64[ns]', freq=None)

## 11.2 시계열 기본 사항
## 11.3 날짜 범위, 빈도 및 이동
## 11.4 시간대 처리
## 11.5 주기 및 주기 산술
## 11.6 리샘플링 및 주파수 변환
## 11.7 이동 창 함수