# 날짜 및 시간 데이터 처리 - datetime.date

In [12]:
from datetime import date

# 생성 & 속성
d = date(2025, 8, 12)
print(d.year, d.month, d.day)   # 2025 8 12

# 오늘
today = date.today()

# 교체(replace)와 비교/산술
d_next_year = d.replace(year=2026)
print(d_next_year > d)          # True

# 날짜 차이는 timedelta
delta = d_next_year - d
print(delta.days)               # 365(윤년에 따라 366일일 수도 있다)

2025 8 12
True
365


# 날짜 및 시간 데이터 처리 - datetime.time

In [1]:
from datetime import time, timezone

# 시, 분, 초, 마이크로초, tzinfo(선택)
t = time(14, 30, 5, 123456)
print(t.hour, t.minute, t.second, t.microsecond)  # 14 30 5 123456

# 시간대 보유(time 자체에 tzinfo 가능하지만, 단독 활용성은 제한적)
t_utc = time(14, 30, tzinfo=timezone.utc)
print(t_utc.isoformat())        # '14:30:00+00:00'

14 30 5 123456
14:30:00+00:00


# 날짜 및 시간 데이터 처리 - datetime.datetime

In [2]:
from datetime import datetime, timedelta, timezone
from zoneinfo import ZoneInfo  # Python 3.9+

# 현재 시각(UTC 권장)
now_utc = datetime.now(timezone.utc)
print(now_utc)

# 시간대 변환 (Seoul)
now_seoul = now_utc.astimezone(ZoneInfo("Asia/Seoul"))
print(now_seoul)

# 명시적 생성(서울 시간대)
dt = datetime(2025, 1, 1, 9, 0, tzinfo=ZoneInfo("Asia/Seoul"))

# 요일: weekday() 월=0..일=6, isoweekday() 월=1..일=7
print(dt.weekday(), dt.isoweekday())  # 2 3 (예시)

# 파싱/포맷
parsed = datetime.strptime("2024-09-30 08:15", "%Y-%m-%d %H:%M")
print(parsed.strftime("%Y-%m-%d %H:%M:%S"))  # '2024-09-30 08:15:00'

# 두 datetime 차이
start = datetime(2025, 8, 1, 0, 0, tzinfo=ZoneInfo("Asia/Seoul"))
end   = datetime(2025, 8, 12, 14, 0, tzinfo=ZoneInfo("Asia/Seoul"))
gap = end - start
print(gap.days, gap.total_seconds())  # 일수, 총 초

2025-08-12 06:45:25.117471+00:00
2025-08-12 15:45:25.117471+09:00
2 3
2024-09-30 08:15:00
11 1000800.0


# timedelta: 기간(차이) 다루기

In [15]:
from datetime import datetime, timedelta

td = timedelta(days=2, hours=3, minutes=30)
print(td)                        # 2 days, 3:30:00

base = datetime(2025, 8, 12, 10, 0)
after = base + td                # 덧셈/뺄셈 가능
print(after)                     # 2025-08-14 13:30:00

# 일 단위 부동소수점 환산
days = td / timedelta(days=1)    # 2.145833...
print(days)

# 정수 배 스케일링
double = 2 * td                  # 4 days, 7:00:00
print(double)

2 days, 3:30:00
2025-08-14 13:30:00
2.1458333333333335
4 days, 7:00:00


# datetime 생성/포맷팅/산술 코드 

In [3]:
from datetime import date, time, datetime, timedelta

# ---------------------------------------------------------------------
# 1) 생성 (Constructor / ISO 파싱)
# ---------------------------------------------------------------------

# 1-1. 숫자 인수로 직접 생성
d = date(2023, 10, 26)
t = time(14, 30, 0)                   # 14:30:00
dt = datetime(2023, 10, 26, 14, 30)   # 2023-10-26 14:30:00

print("[직접 생성]", d, t, dt)
# [직접 생성] 2023-10-26 14:30:00 2023-10-26 14:30:00

# 1-2. ISO 문자열 -> fromisoformat()
d_iso = date.fromisoformat("2023-10-26")             # 'YYYY-MM-DD'
dt_iso = datetime.fromisoformat("2023-10-26 14:30:00")  # 공백 또는 'T' 허용
print("[ISO 파싱]", d_iso, dt_iso)
# [ISO 파싱] 2023-10-26 2023-10-26 14:30:00

# time에도 fromisoformat 사용 가능
t_iso = time.fromisoformat("14:30:00.123456")
print("[time ISO]", t_iso)
# [time ISO] 14:30:00.123456

# ---------------------------------------------------------------------
# 2) 포맷팅(strftime) / 파싱(strptime)
# ---------------------------------------------------------------------

# 2-1. datetime -> 문자열 (strftime)
fmt = "%Y-%m-%d %H:%M:%S"
s = dt.strftime(fmt)
print("[포맷팅]", s)
# [포맷팅] 2023-10-26 14:30:00

# 2-2. 문자열 -> datetime (strptime)
s2 = "2024-09-30 08:15:00"
dt_parsed = datetime.strptime(s2, fmt)
print("[파싱]", dt_parsed)
# [파싱] 2024-09-30 08:15:00

# 포맷 코드 예: %Y=연, %m=월, %d=일, %H=시(00-23), %M=분, %S=초

# ---------------------------------------------------------------------
# 3) 산술 연산 (timedelta)
# ---------------------------------------------------------------------

# 3-1. 더하기/빼기: date 혹은 datetime ± timedelta
one_week = timedelta(days=7)
d_plus_7 = d + one_week
dt_minus_90m = dt - timedelta(minutes=90)
print("[산술] 날짜+7일:", d_plus_7, "| datetime-90분:", dt_minus_90m)
# [산술] 날짜+7일: 2023-11-02 | datetime-90분: 2023-10-26 13:00:00

# 3-2. 두 datetime의 차이 -> timedelta
start = datetime(2023, 10, 1, 9, 0, 0)
end   = datetime(2023, 10, 26, 14, 30, 0)
diff = end - start
print("[차이] days:", diff.days, "| total_seconds:", int(diff.total_seconds()))
# [차이] days: 25 | total_seconds: 2190600

# 3-3. timedelta 연산/스케일링
td = timedelta(days=2, hours=3, minutes=30)
print("[timedelta]", td, "| 일 단위:", td / timedelta(days=1))
# [timedelta] 2 days, 3:30:00 | 일 단위: 2.1458333333333335

# ---------------------------------------------------------------------
# 4) (선택) 속성 접근/유틸
# ---------------------------------------------------------------------

print("[속성] year/month/day:", d.year, d.month, d.day)
print("[속성] hour/minute/second:", t.hour, t.minute, t.second)
print("[요일] weekday(월=0):", dt.weekday(), "| isoweekday(월=1):", dt.isoweekday())
# [속성] year/month/day: 2023 10 26
# [속성] hour/minute/second: 14 30 0
# [요일] weekday(월=0): 3 | isoweekday(월=1): 4

# 4-1. replace로 일부만 교체(불변 객체이므로 새 객체 반환)
dt_next_year_same_time = dt.replace(year=2024)
print("[replace] 연도만 변경:", dt_next_year_same_time)
# [replace] 연도만 변경: 2024-10-26 14:30:00


[직접 생성] 2023-10-26 14:30:00 2023-10-26 14:30:00
[ISO 파싱] 2023-10-26 2023-10-26 14:30:00
[time ISO] 14:30:00.123456
[포맷팅] 2023-10-26 14:30:00
[파싱] 2024-09-30 08:15:00
[산술] 날짜+7일: 2023-11-02 | datetime-90분: 2023-10-26 13:00:00
[차이] days: 25 | total_seconds: 2179800
[timedelta] 2 days, 3:30:00 | 일 단위: 2.1458333333333335
[속성] year/month/day: 2023 10 26
[속성] hour/minute/second: 14 30 0
[요일] weekday(월=0): 3 | isoweekday(월=1): 4
[replace] 연도만 변경: 2024-10-26 14:30:00


# Pandas의 Timestamp 및 Timedelta 예제

In [7]:
import pandas as pd

# 1. 숫자 구성 요소를 사용하여 생성
ts_by_numbers = pd.Timestamp(2024, 8, 12, 10, 30)
print(f"숫자로 생성: {ts_by_numbers}")

# 2. 문자열로 생성
ts_by_string = pd.Timestamp('2024-08-12 10:30:00')
print(f"문자열로 생성: {ts_by_string}")

# 3. 유닉스 타임스탬프(초 단위)로 생성
ts_by_unix = pd.to_datetime(1723468200, unit='s')
print(f"유닉스 타임스탬프로 생성: {ts_by_unix}")

# 핵심 속성 접근
print(f"연도: {ts_by_numbers.year}, 요일: {ts_by_numbers.day_name()}")

숫자로 생성: 2024-08-12 10:30:00
문자열로 생성: 2024-08-12 10:30:00
유닉스 타임스탬프로 생성: 2024-08-12 13:10:00
연도: 2024, 요일: Monday


# Timedelta 객체 생성 및 산술 연산

In [4]:
import pandas as pd

# Timedelta 객체 생성
td = pd.Timedelta(days=5, hours=2, minutes=30)
print(f"생성된 Timedelta:\n{td}\n")

# Timestamp에 Timedelta 더하기/빼기
ts = pd.Timestamp('2024-03-22')
ts_after = ts + td
print(f"5일 2시간 30분 후:\n{ts_after}\n")

# 두 Timestamp의 차이 계산
ts_start = pd.Timestamp('2024-03-20 09:00')
ts_end = pd.Timestamp('2024-03-22 15:30')
duration = ts_end - ts_start
print(f"두 시점 간의 차이:\n{duration}\n")

생성된 Timedelta:
5 days 02:30:00

5일 2시간 30분 후:
2024-03-27 02:30:00

두 시점 간의 차이:
2 days 06:30:00



# Pandas DataFrame에서 시계열 데이터 준비

In [5]:
import pandas as pd

# 잘못된 형식이 포함된 날짜 데이터
date_series = pd.Series(['2024-03-22', '2024/03/23', 'invalid-date', '2024-03-25'])

# errors='coerce'를 사용해 잘못된 값 처리
clean_dates = pd.to_datetime(date_series, errors='coerce')
print("오류 처리 전:\n", date_series)
print("\n오류 처리 후 (NaT로 변환):\n", clean_dates)

오류 처리 전:
 0      2024-03-22
1      2024/03/23
2    invalid-date
3      2024-03-25
dtype: object

오류 처리 후 (NaT로 변환):
 0   2024-03-22
1          NaT
2          NaT
3   2024-03-25
dtype: datetime64[ns]


# DatetimeIndex를 활용한 시계열 DataFrame 생성 및 슬라이싱

In [6]:
import pandas as pd
import numpy as np

# 임의의 시계열 데이터 생성
dates = pd.date_range('2024-01-01', periods=100, freq='D')
data = np.random.randint(1, 100, size=100)
df = pd.DataFrame({'value': data}, index=dates)

print("원본 DataFrame의 일부:\n", df.head())

# DatetimeIndex를 이용한 슬라이싱
# 2024년 1월 데이터 선택
january_data = df.loc['2024-01']
print("\n2024년 1월 데이터:\n", january_data.head())

# 2024년 2월 15일부터 20일까지의 데이터 선택
feb_slice = df.loc['2024-02-15':'2024-02-20']
print("\n2월 15일부터 20일까지의 데이터:\n", feb_slice)

원본 DataFrame의 일부:
             value
2024-01-01      6
2024-01-02     47
2024-01-03     68
2024-01-04     66
2024-01-05     82

2024년 1월 데이터:
             value
2024-01-01      6
2024-01-02     47
2024-01-03     68
2024-01-04     66
2024-01-05     82

2월 15일부터 20일까지의 데이터:
             value
2024-02-15     28
2024-02-16      4
2024-02-17     44
2024-02-18     36
2024-02-19     33
2024-02-20     52


# DatetimeIndex: 시계열 DataFrame의 초석

In [8]:
import pandas as pd
import numpy as np

# 1. pd.date_range()를 사용해 DatetimeIndex 생성
date_index = pd.date_range(start='2024-01-01', end='2024-03-31', freq='D')

# 2. DatetimeIndex를 인덱스로 갖는 DataFrame 생성
df = pd.DataFrame(
    np.random.randn(len(date_index), 2),
    index=date_index,
    columns=['컬럼1', '컬럼2']
)
print("원본 DataFrame (일부):\n", df.head())

# 3. DatetimeIndex의 강력한 슬라이싱 기능
# 2024년 2월 전체 데이터 선택
feb_data = df.loc['2024-02']
print("\n2024년 2월 데이터 (일부):\n", feb_data.head())

# 특정 날짜 범위 선택 (시작점, 끝점 모두 포함)
q1_data = df.loc['2024-01-15':'2024-03-05']
print("\n1월 15일 ~ 3월 5일 데이터 (일부):\n", q1_data.head())

# 특정 분기 선택
q1_data_by_quarter = df.loc['2024-Q1']
print("\n2024년 1분기 데이터 (일부):\n", q1_data_by_quarter.head())

원본 DataFrame (일부):
                  컬럼1       컬럼2
2024-01-01  1.214814 -0.308477
2024-01-02  0.778174  0.278353
2024-01-03  1.127639  0.044161
2024-01-04  0.793930 -0.248022
2024-01-05 -0.995856  0.398784

2024년 2월 데이터 (일부):
                  컬럼1       컬럼2
2024-02-01 -1.712177 -1.423068
2024-02-02 -0.188229 -0.826394
2024-02-03 -0.329011 -0.207715
2024-02-04  1.943865  1.722075
2024-02-05 -1.298734  0.150676

1월 15일 ~ 3월 5일 데이터 (일부):
                  컬럼1       컬럼2
2024-01-15  0.353750  0.343467
2024-01-16  0.330194  0.062035
2024-01-17 -1.111314 -0.887502
2024-01-18 -1.889161 -0.538003
2024-01-19  1.359102  1.300417

2024년 1분기 데이터 (일부):
                  컬럼1       컬럼2
2024-01-01  1.214814 -0.308477
2024-01-02  0.778174  0.278353
2024-01-03  1.127639  0.044161
2024-01-04  0.793930 -0.248022
2024-01-05 -0.995856  0.398784


# Timedelta 및 TimedeltaIndex: 기간 표현