In [1]:
import pandas as pd
import numpy as np
from pathlib import Path
from pandas.testing import assert_frame_equal
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.stats as ss
p1 = Path.cwd() / 'back_data'

In [2]:
import datetime
import time
from datetime import datetime, date, timedelta

In [3]:
# 날짜와 시간 기능의 경우 파이썬은 datetime 모듈 활용
# 반면 pandas에는 Timestamp라는 단일 객체 존재 -> numpy의 datetime64 데이터 형식에서 파생

In [5]:
# pandas 날짜 및 시간의 경우 주로 to_datetime() 함수 활용
pd.to_datetime('2022-08-05')
# 해당 Timestamp 객체를 파이썬의 datetime 형식으로 바꾸고 싶은 경우 to_pydatetime() 메서드 활용
pd.to_datetime('2022-08-05').to_pydatetime()

datetime.datetime(2022, 8, 5, 0, 0)

In [6]:
# to_datetime() 함수의 경우 dayfirst, unit, origin 파라미터 등 활용하여 여러 형식 가능
pd.to_datetime('2022-08-05'), pd.to_datetime('2022-05-08', dayfirst=True), pd.to_datetime(1000, unit='D', origin='2020-01-01')

(Timestamp('2022-08-05 00:00:00'),
 Timestamp('2022-05-08 00:00:00'),
 Timestamp('2022-09-27 00:00:00'))

In [7]:
# Series를 전달하여 Timestamp 객체를 가진 Series로 반환 가능
series1 = pd.Series([10, 100, 1000, 10000])
# pandas가 리스트 내 자료들을 자동으로 날짜로 상황에 맞게 변환해주나, 이러한 방식은 가급적 기피해야 -> 같은 날짜 형식으로 배치 필요
series2 = pd.Series(['12-5-2015', '14-1-2013', '20/12/2017', '40/23/2017'])
pd.to_datetime(series1, unit='D'), pd.to_datetime(series2, errors='coerce')

  pd.to_datetime(series1, unit='D'), pd.to_datetime(series2, errors='coerce')


(0   1970-01-11
 1   1970-04-11
 2   1972-09-27
 3   1997-05-19
 dtype: datetime64[ns],
 0   2015-12-05
 1   2013-01-14
 2   2017-12-20
 3          NaT
 dtype: datetime64[ns])

In [8]:
# pandas의 to_timedelta() 함수를 이용하여 시간량 처리(offset) 가능 -> pandas의 Timedelta 객체 활용
pd.to_timedelta('67:15:45.454')

Timedelta('2 days 19:15:45.454000')

In [10]:
# offset의 경우 DateOffset() 함수도 이용 가능 -> years, months, days, hours, minutes, seconds 파라미터 활용
date_offset = pd.DateOffset(years=3, months=2, days=15)
pd.to_datetime('2020-01-01') + date_offset

Timestamp('2023-03-16 00:00:00')

In [11]:
# Timedelta 객체의 경우 각각을 더하거나 나누는 것도 가능
pd.to_timedelta('12 days') / pd.to_timedelta('3 days')

4.0

In [15]:
# Timestamp 및 Timedelta 객체는 속성과 메서드에 많은 특징 보유
timestamp = pd.to_datetime('2022-08-05 23:10:11')
# ceil(), round(), floor() 메서드 활용하여 올림 등 가능
# year, month, day, hour, minute, second 속성 활용하여 추출 가능
# dayofweek, dayofyear, dayofweek, daysinmonth 속성 활용하여 추출 가능
timestamp.ceil('12h'), timestamp.year, timestamp.day, timestamp.dayofweek

(Timestamp('2022-08-06 00:00:00'), 2022, 5, 4)

In [18]:
# Timestamp 및 Timedelta 객체는 속성과 메서드에 많은 특징 보유
timedelta = pd.to_timedelta('5 days 05:52:20')
# ceil(), round(), floor() 메서드 활용하여 올림 등 가능
# components 속성 활용하여 내용 파악 가능
# total_seconds() 메서드 이용하여 총 초수 확인 가능
timedelta.round('min'), timedelta.components, timedelta.total_seconds()

(Timedelta('5 days 05:52:00'),
 Components(days=5, hours=5, minutes=52, seconds=20, milliseconds=0, microseconds=0, nanoseconds=0),
 453140.0)