# Pandas 시계열 데이터 처리
- datetime
- strftime(), strptime()
- timestamp
- timezone
- timedelta
- pandas 의 시계열 데이터 처리
- DatetimeIndex
- DateOffset 객체
- 시계열 관련 인스턴스 메소드
- .dt 접근자

# Pandas 시계열 데이터 처리

파이썬의 날짜 및 시간 관련 객체
| 클래스 | 내용|
|--|--|
|datetime.date | 그레고리력으로 날짜를 다룹니다. (year, month, day) |
|datetime.time | 특정일과 관련없이 모든 날(day)을 24x60x60초로 다루는 시간입니다. (hour, minute, second, microsecond, tzinfo)|
|datetime.datetime | 날짜와 시간의 조합입니다. (year, month, day, hour, minute, second, microsecond, tzinfo) |
|datetime.timedelta | date인스턴스간, time인스턴스간, 또는 datetime 인스턴스간의 차이를 microsecond 로 나타내는 기간입니다.|
|datetime.tzinfo | 시간대 정보 객체에 대한 추상 기본 클래스로서 사용자 정의로 시간을 조정하기 위해 사용됩니다.|
|datetime.timezone| UTC (Universal Time Coordinated) 의 고정 오프셋으로 tzinfo를 실행하는 클래스입니다.|

In [None]:
from datetime import datetime

# 현재 날짜와 시간 가져오기
datetime.now()

In [None]:
# 날짜와 시간 구성하기
from datetime import datetime
dt = datetime(2023, 8, 1, 13, 0, 0)

In [None]:
dt.year

In [None]:
dt.month

In [None]:
dt.day

In [None]:
dt.hour

In [None]:
dt.minute

In [None]:
dt.second

## strftime(), strptime() 

파이썬의 `datetime` 모듈에서 `날짜`와 `시간`을 `문자열`로 `변환`하 파싱하는 데 사용되는 함수들입니다.

### strftime (String Format Time)

strftime 함수는 `datetime 객체`를 원하는 형식의 `문자열`로 변환하는 데 사용됩니다.
포맷 문자열을 사용하여 날짜와 시간을 원하는 형식으로 표현할 수 있습니다.
주요 포맷 코드 예시:
- `%Y`: 년 (4자리)
- `%m`: 월 (2자리)
- `%d`: 일 (2자리)
- `%a`: 요일 (3자리 문자열)
- `%A`: 요일 (문자열)
- `%H`: 시간 (24시간 형식, 2자리)
- `%M`: 분 (2자리)
- `%S`: 초 (2자리)

In [None]:
from datetime import datetime

datetime.now().strftime("%Y-%m-%d %H:%M:%S")

In [None]:
datetime.now().strftime("%Y-%m-%d %a %H:%M:%S")

In [None]:
datetime.now().strftime("%Y/%m/%d %A %H:%M:%S")

### strptime (String Parse Time)

strptime 함수는 `문자열`을 `datetime` 객체로 파싱(변환)하는 데 사용됩니다.  
입력된 문자열과 형식 문자열을 비교하여 datetime 객체를 생성합니다.  
strftime의 포맷 코드와 반대로, 문자열에서 날짜와 시간 정보를 추출합니다.  

In [None]:
from datetime import datetime

datetime.strptime("2023-08-07 12:30:01", "%Y-%m-%d %H:%M:%S")

## timestamp

datetime 타임스탬프는 특정 날짜와 시간을 `고유한 숫자 값`으로 나타낸 것을 말합니다.  
이 숫자 값은 일반적으로 `1970년 1월 1일`부터의 경과 시간을 초단위로 표현한 것으로,  
이를 `"UNIX 시간"` 또는 "에포크 시간"이라고도 합니다.

파이썬의 datetime 모듈을 사용하여 날짜와 시간을 다루다보면,  
`datetime 객체`를 특정 시간으로부터의 경과 시간을 나타내는 `타임스탬프`로 변환하거나,  
반대로 `타임스탬프`를 `datetime 객체`로 변환하는 작업을 할 수 있습니다.

In [None]:
from datetime import datetime

# 현재 시간을 datetime 객체로 가져오기
datetime.now().timestamp()

In [None]:
# 타임스탬프를 datetime 객체로 변환
from datetime import datetime

datetime.fromtimestamp(1693407846.324211)

## Naive vs tz-awre 시간대
`"나이브(Naive)"`란 용어는 `시간대(timezone) 정보를 갖지 않는` 시간 관련 데이터를 가리킵니다.  
파이썬의 `datetime` 라이브러리에서는 시간대 정보 없이 날짜와 시간만을 다루는 객체를 "나이브"하다고 표현합니다.  
즉, "나이브"한 `datetime` 객체는 특정한 지역이나 표준 시간대를 고려하지 않습니다.

예를 들어, 2023년 8월 15일 10시를 `datetime` 객체로 나타내면 아래와 같습니다:

```python
import datetime

naive_datetime = datetime.datetime(2023, 8, 15, 10, 0)
print(naive_datetime)
```

위의 `naive_datetime` 객체는 시간대 정보를 갖지 않습니다. 이 객체는 로컬 시스템의 기본 시간대를 따르게 됩니다. 이것은 시간대 변경이나 다양한 시간대의 변환을 고려하지 않고 단순히 날짜와 시간 정보를 저장하는 객체입니다.

나이브한 `datetime` 객체를 사용할 때 주의해야 할 점은 다음과 같습니다:

1. **시간대 변환 문제**: 나이브한 객체를 다른 시간대로 변환하면 부정확한 결과를 얻을 수 있습니다.
2. **시간대 정보 손실**: 나이브한 객체는 시간대 정보가 없으므로 다른 시간대에서 언제 발생한 사건인지 파악하기 어려울 수 있습니다.

이러한 이유로 시간대를 다루는 경우에는 `datetime` 객체를 "안전하게(tz-aware)" 만드는 것이 중요합니다. "안전한" `datetime` 객체는 시간대 정보를 포함하며, 시간대 변환 등의 작업을 정확하게 수행할 수 있습니다. 이를 위해서는 `dateutil.tz` 모듈이나 `pytz` 라이브러리 등을 사용하여 `datetime` 객체를 시간대 정보와 함께 생성하고 다루는 것이 좋습니다.

## tzinfo

`tzinfo`는 파이썬의 `datetime` 모듈에서 시간대(Time Zone) 정보를 나타내는 추상 기본 클래스(Abstract Base Class)입니다. 이 클래스를 사용하여 `datetime` 객체에 시간대 정보를 추가할 수 있습니다.


## pytz 

`pytz`는 파이썬에서 시간대(Time Zone) 정보를 처리하고 다루는 라이브러리입니다. 파이썬의 내장 `datetime` 모듈은 기본적으로 시간대 정보를 다루는 기능이 제한적이기 때문에, `pytz` 라이브러리는 이를 보완하여 다양한 시간대의 변환과 처리를 지원합니다. `pytz`는 파이썬의 `datetime` 모듈과 함께 사용하여 시간대 정보를 적용한 날짜와 시간을 다루는 작업을 돕는 도구로 사용됩니다.

`pytz` 라이브러리의 주요 기능과 특징은 다음과 같습니다:

1. 다양한 시간대 지원: `pytz`는 전 세계의 다양한 시간대를 지원합니다. 오래된 시간대부터 최신 시간대까지 포함하고 있어, 다양한 국가와 지역의 시간을 정확하게 다룰 수 있습니다.

2. 오프셋과 시간대 이름: `pytz`는 시간대의 오프셋(offset)과 시간대의 이름을 다루는 클래스와 함수를 제공합니다. 이를 통해 시간대 변환 및 연산이 용이해집니다.

3. `datetime` 객체와 함께 사용: `pytz`는 `datetime` 모듈과 밀접하게 연동되어 시간대 정보를 가진 `datetime` 객체를 생성하고, 시간대 변환, 비교 등을 할 수 있도록 합니다.

4. 데이터베이스 기반 시간대 정보: `pytz`는 Olson 데이터베이스를 기반으로 시간대 정보를 제공합니다. 이 데이터베이스는 전 세계의 시간대 정보를 관리하며, `pytz`는 이 정보를 활용하여 정확한 시간대 처리를 가능케 합니다.  https://en.wikipedia.org/wiki/List_of_tz_database_time_zones

5. 유연한 인터페이스: `pytz`는 다양한 시간대 정보를 다루는 데 필요한 유연한 인터페이스를 제공합니다. 시간대 이름, 오프셋, DST(Daylight Saving Time) 등을 조작하고 변환할 수 있습니다.


In [None]:
from datetime import datetime

dt = datetime(2023, 8, 7, 15, 30, 0)
dt, dt.timestamp() # naive 시간대

In [None]:
import pytz

dt_seoul = dt.astimezone(pytz.timezone('Asia/Seoul'))
dt_seoul, dt_seoul.timestamp()

In [None]:
dt_ny = dt_seoul.astimezone(pytz.timezone('America/New_York'))
dt_ny, dt_ny.timestamp() # tz-aware 시간대

In [None]:
import pytz

# 사용 가능한 모든 시간대 출력
all_timezones = pytz.all_timezones
print("사용 가능한 모든 시간대:", len(all_timezones), all_timezones[:10])

# 일반적으로 사용되는 시간대 출력
common_timezones = pytz.common_timezones
print("일반적으로 사용되는 시간대:", len(common_timezones), common_timezones[:10])

## timedelta

`timedelta`는 파이썬의 내장 모듈인 `datetime`에서 제공하는 클래스로,  
두 날짜 또는 시간 사이의 시간 간격을 나타내는 데 사용됩니다.  
`timedelta` 객체는 일(day), 초(second), 마이크로초(microsecond) 등의 시간 단위로 간격을 표현할 수 있습니다.  
주로 날짜와 시간 연산에서 일정 기간을 더하거나 빼는 등의 작업에 활용됩니다.

`timedelta` 객체의 생성자는 다음과 같이 사용됩니다:

```python
from datetime import timedelta

# 일(day), 초(second), 마이크로초(microsecond) 단위로 간격 생성
time_gap = timedelta(days=5, seconds=3600, microseconds=5000)
```

`timedelta` 객체의 주요 속성과 메서드는 다음과 같습니다:

1. `days`: 일(day) 단위의 간격을 나타내는 속성입니다.
2. `seconds`: 초(second) 단위의 간격을 나타내는 속성입니다.
3. `microseconds`: 마이크로초(microsecond) 단위의 간격을 나타내는 속성입니다.
4. `total_seconds()`: `timedelta` 객체의 총 초(second) 수를 반환하는 메서드입니다.

`timedelta` 객체는 `datetime` 객체와 함께 사용하여 시간 연산을 수행할 때 유용합니다.

In [None]:
# 2일 후의 날짜 계산
from datetime import datetime, timedelta
datetime(2023, 9, 2, 8, 9, 38, 797337) + timedelta(days=2)

In [None]:
# 3시간 30분 후의 시간 계산
datetime(2023, 9, 2, 11, 00) + timedelta(hours=3, minutes=30)

In [None]:
# 두 날짜 사이의 일수 계산
date1 = datetime(2023, 8, 1, 9, 10, 23)
date2 = datetime(2023, 8, 10, 10, 15, 11)
date2 - date1

In [None]:
(date2-date1).seconds/60/60

# pandas 의 시계열 데이터 처리

## to_datetime()
`pandas`의 `to_datetime` 함수는 문자열이나 숫자 등의 다양한 형식의 입력을 받아  
`DatetimeIndex` 또는 `Timestamp` 객체로 변환하는 기능을 제공하는 함수입니다.  
이 함수를 사용하면 날짜와 시간 데이터를 처리하고 `pandas`에서 다양한 시간 관련 작업을 수행할 수 있습니다.

`to_datetime` 함수의 주요 기능과 사용법은 다음과 같습니다:

1. **문자열을 날짜로 변환**: `to_datetime` 함수는 문자열을 날짜 또는 시간 형식으로 변환할 수 있습니다. 이 때, 문자열의 형식을 지정할 수 있습니다.

2. **숫자나 문자열을 타임스탬프로 변환**: `to_datetime` 함수는 숫자나 문자열을 `Timestamp` 객체로 변환할 수 있습니다.

3. **시계열 데이터 변환**: `to_datetime` 함수는 데이터프레임의 열이나 시리즈를 변환할 수 있습니다. 이 때, 컬럼의 이름이나 인덱스를 지정하여 변환할 수 있습니다.

4. **옵션 설정**: `to_datetime` 함수는 다양한 옵션을 설정하여 날짜 형식을 조정하거나 누락된 데이터 처리를 할 수 있습니다.


In [None]:
# 문자열을 날짜로 변환
import pandas as pd

pd.to_datetime('2023-08-07 10:01:23')

In [None]:
# 숫자(에포크시간)를 타임스탬프로 변환
import pandas as pd

pd.to_datetime(1678873600, unit='s')

In [None]:
# 시리즈 변환
s = pd.Series(['2023-08-01', '2023-08-02', '2023-08-03'])
s


In [None]:
s2 = pd.to_datetime(s)
s2


In [None]:
# 데이터프레임 변환
data = {'Date': ['2023-08-01', '2023-08-02', '2023-08-03'],
        'Value': [10, 20, 30]}
df = pd.DataFrame(data)
df


In [None]:
df["TS"] = pd.to_datetime(df.Date)
df

In [None]:
df.info()

## pandas에서 datetime 활용

`pandas`에서 `datetime` 객체는 시계열 데이터와 날짜, 시간 정보를 표현하고 다루는 데 사용되는 중요한 데이터 유형입니다.  
`datetime` 객체는 `pandas` 라이브러리에서 시간 관련 연산과 분석을 수행하는 데 필수적인 도구로 사용됩니다.  
객체는 시계열 데이터를 생성하고 다루는 데 중요한 역할을 합니다.

`pandas`에서 활용하는 `datetime` 객체의 주요 특징과 기능은 다음과 같습니다:

1. **DatetimeIndex**: `pandas`에서 시계열 데이터를 다룰 때, `datetime` 객체는 `DatetimeIndex`의 요소로 사용됩니다. `DatetimeIndex`는 날짜와 시간을 색인으로 사용하는 데 특화된 데이터 구조입니다.

2. **날짜와 시간 표현**: `datetime` 객체는 날짜와 시간 정보를 모두 포함하며, 연도, 월, 일, 시, 분, 초, 마이크로초 등을 표현할 수 있습니다.

3. **시간 연산 및 변환**: `datetime` 객체는 시간 간격을 계산하거나 다른 시간 단위로 변환하는 기능을 제공합니다. 또한 시간대 변환과 관련된 작업도 처리할 수 있습니다.

4. **표준 연산 및 함수 지원**: `datetime` 객체는 일반적인 연산자와 함수를 사용하여 시간 관련 작업을 수행할 수 있습니다. 예를 들어, 두 날짜의 차이를 계산하거나 특정 날짜와 시간을 생성하는 등의 작업이 가능합니다.

5. **누락된 데이터 처리**: `pandas`의 `datetime` 객체는 누락된 날짜나 시간 데이터를 처리하고 채울 수 있는 기능을 제공합니다.

6. **시각화 및 시계열 분석**: `datetime` 객체를 사용하여 시계열 데이터를 시각화하고 분석하는데 활용할 수 있습니다. `pandas`와 `matplotlib`을 연동하여 시계열 데이터를 그래프로 표현할 수 있습니다.


## date_range()

`pd.date_range()`는 `pandas` 라이브러리에서 사용되는 함수로, 날짜 범위를 생성하는데 사용됩니다.  
이 함수를 사용하면 특정 기간 동안 일정한 간격으로 날짜를 생성하여 `DatetimeIndex`를 생성할 수 있습니다.  
이는 시계열 데이터를 다루거나 분석할 때 유용하게 활용됩니다.

`pd.date_range()` 함수의 주요 인자와 사용법은 다음과 같습니다:

1. `start`: 날짜 범위의 시작 날짜를 지정합니다. 날짜 형식으로 입력할 수 있습니다.
2. `end`: 날짜 범위의 종료 날짜를 지정합니다. 날짜 형식으로 입력할 수 있습니다.
3. `periods`: 생성할 날짜의 수를 지정합니다. `start`가 있을 경우 `end` 대신에 이 인자를 사용할 수 있습니다.
4. `freq`: 생성할 날짜의 간격을 지정합니다. 예를 들어, 'D'는 일간격, 'H'는 시간 간격을 나타냅니다.
5. `normalize`: 기본값은 False이며, True로 설정하면 시간을 00:00:00으로 정규화합니다.



In [None]:
# 날짜 범위 생성: 2023년 1월 1일부터 2023년 1월 10일까지
import pandas as pd
pd.date_range(start='2023-01-01', end='2023-01-10', freq='D')

In [None]:
# 날짜 범위 생성: 2023년 1월 1일 00:00부터 2023년 1월 2일 02:00까지 시간단위로
import pandas as pd
pd.date_range(start='2023-01-01 09:00', end='2023-01-02 02:00', freq='H')

## DatetimeIndex

`DatetimeIndex`는 Datetime 타입의 객체를 DataFrame의 인덱스로 활용할 경우이며  
이는 날짜와 시간 정보를 포함하는 인덱스(Index)로서, 데이터프레임이나 시리즈의 행을 식별하는 데 활용됩니다.  
`DatetimeIndex`는 시계열 데이터를 쉽게 조작하고 분석하는데 매우 유용합니다.

`DatetimeIndex`의 주요 특징과 기능은 다음과 같습니다:

1. **시계열 데이터와 연동**: `DatetimeIndex`는 시계열 데이터를 다루는 데 최적화된 구조입니다. 시계열 데이터를 데이터프레임이나 시리즈와 함께 사용할 때, 인덱스로 `DatetimeIndex`를 사용하면 데이터를 날짜와 시간에 기반하여 쉽게 필터링하거나 조작할 수 있습니다.

2. **데이터 선택 및 슬라이싱**: `DatetimeIndex`를 사용하면 날짜 범위를 기반으로 데이터를 선택하거나 슬라이싱하는 작업을 쉽게 수행할 수 있습니다. 원하는 날짜 범위 내의 데이터를 추출하거나 필터링하는데 용이합니다.

3. **데이터 리샘플링**: `DatetimeIndex`는 시계열 데이터의 리샘플링 작업을 지원합니다. 데이터를 주기적으로 묶어서 집계하거나 변환하는 작업을 할 때 유용합니다.

4. **시간 간격 연산**: `DatetimeIndex`를 사용하여 시간 간격을 계산하거나 다른 시간 단위로 변환하는 작업을 수행할 수 있습니다.

5. **데이터 정렬**: `DatetimeIndex`는 날짜와 시간에 기반하여 데이터를 정렬하는 데 사용됩니다. 데이터를 시간순으로 정렬할 수 있습니다.



In [None]:
import pandas as pd
import numpy as np

data = np.random.randint(0,12,10)

df = pd.DataFrame(
    {"Value":data},
    index = pd.date_range(start='2023-01-31 18:00', periods=len(data), freq="H")
)
df

In [None]:
# 특정 날짜 범위 선택
df['2023-01-31 23:30':'2023-02-01 02:10']

In [None]:
# 특정 날짜 범위 선택
from datetime import datetime
df[datetime(2023,1,31,23,30):datetime(2023,2,1,2,30)]


In [None]:
# 특정 날짜 선택
df.loc['2023-01-31']

In [None]:
# 특정 월 선택
df.loc['2023-02']

## resampling()

`pandas`의 리샘플링(resampling)은 시계열 데이터의 주기를 변경하는 작업을 말합니다. 이는 원본 시계열 데이터의 간격을 더 큰 주기로 변환하거나 더 작은 주기로 세분화하는 작업을 의미합니다. 리샘플링은 시계열 데이터를 분석하거나 시각화할 때 유용하며, 데이터의 집계나 변환 작업을 수행하는데 활용됩니다.

`pandas`에서 리샘플링은 `resample()` 메서드를 사용하여 수행할 수 있습니다. 이 메서드는 원하는 리샘플링 주기를 지정하고, 해당 주기로 데이터를 집계하거나 변환하는 작업을 수행합니다.

`resample()` 메서드의 주요 인자와 사용법은 다음과 같습니다:

1. `rule`: 리샘플링할 주기를 지정합니다. 예를 들어, 'D'는 일간격, 'M'은 월간격을 의미합니다.
2. `how`: 집계 방법을 지정합니다. 'mean', 'sum', 'count' 등이 가능합니다.
3. `closed`: 리샘플된 구간의 어느 쪽을 포함할지 지정합니다. 'right', 'left', 'both', 'neither' 중 선택할 수 있습니다.
4. `label`: 리샘플된 구간의 레이블을 지정합니다. 'right', 'left' 중 선택할 수 있습니다.




In [None]:
import pandas as pd
import numpy as np

df = pd.DataFrame(
    {"Value":np.random.randint(1,100,60)},
    index=pd.date_range(start="2023-01-01", periods=60, freq="D")
)

In [None]:
df.head(2)

In [None]:
df.tail(2)

In [None]:
# 월간 평균 리샘플링
df.resample('M').mean().round(2)

In [None]:
# 주간 표준편차 리샘플링
df.resample('W').std().round(2)

# DateOffset 객체

판다스에서 날짜 오프셋(Date Offset)은 시계열 데이터를 다룰 때 날짜와 시간을 조작하고 오프셋을 적용하는데 사용되는 도구로써  
파이썬의 `TimeDelta`와 유사한 기능을 제공합니다.
날짜 오프셋은 특정 주기나 간격에 따라 날짜와 시간을 조정하는 기능을 제공하여  
데이터 분석과 시계열 데이터 처리를 보다 효과적으로 수행할 수 있도록 도와줍니다.  
주요 날짜 오프셋은 다음과 같습니다:

1. **Day, BusinessDay**: 날짜를 일(day) 단위로 이동시키는 오프셋입니다. `pd.DateOffset(days=n)`와 같이 사용합니다. `BusinessDay`는 주말과 공휴일을 제외하고 이동합니다.

2. **Week**: 주(week) 단위로 날짜를 이동시키는 오프셋입니다. `pd.DateOffset(weeks=n)`와 같이 사용합니다.

3. **Month, Year**: 월(month)과 년(year) 단위로 날짜를 이동시키는 오프셋입니다. `pd.DateOffset(months=n)`와 `pd.DateOffset(years=n)`와 같이 사용합니다.

4. **Hour, Minute, Second**: 시(hour), 분(minute), 초(second) 단위로 날짜와 시간을 이동시키는 오프셋입니다.

5. **Custom Offset**: 사용자 정의 오프셋을 만들어 사용할 수도 있습니다. 이는 특정한 주기에 따라 날짜와 시간을 조정하기 위해 유용합니다.

날짜 오프셋은 주로 `pd.Timestamp`나 `pd.DatetimeIndex` 객체와 함께 사용됩니다. 


In [None]:
# 일주일 후로 이동
import pandas as pd

pd.Timestamp('2023-08-08') + pd.DateOffset(weeks=1)

In [None]:
# 10주 후로 이동
import pandas as pd

pd.Timestamp('2023-08-08') + pd.DateOffset(weeks=10)

In [None]:
# 힌딜 후로 이동
pd.Timestamp('2023-08-08') + pd.DateOffset(months=1)

In [None]:
import pandas as pd

# 샘플 데이터프레임 생성
df = pd.DataFrame(
    {
        'date': pd.date_range(start='2023-08-01', periods=10),
        'value': np.random.randint(1,100,10),
    }
)
df

In [None]:
# 3일 만큼 이동
df['shifted_date'] = df['date'] + pd.DateOffset(days=3)
df

In [None]:
# DatetimeIndex 에 DateOffset을 적용
df2 = df.set_index("date")
df2.index = df2.index + pd.DateOffset(days=2)
df2.head(2)

## MonthEnd, MonthBegin, Week

판다스(Pandas)에서 `MonthEnd`, `MonthBegin`, `Week` 클래스는  
날짜 오프셋을 표현하는데 사용되는 클래스들입니다.  
이들 클래스는 주로 시계열 데이터의 날짜와 시간을 효과적으로 조작하고 계산하는 데 활용됩니다.


In [None]:
"""
1. **`MonthEnd`** 클래스 (pd.Timestamp)
`MonthEnd` 클래스는 월(month)의 마지막 날짜로 이동하는 날짜 오프셋입니다.
"""

import pandas as pd

month_end = pd.offsets.MonthEnd()
month_end.rollforward('2023-08-15')

In [None]:
pd.Timestamp('2023-08-15') + month_end

In [None]:
# 해당일자에서 이전달의 마지막 날로 이동
month_end.rollback('2023-08-15')

In [None]:
pd.Timestamp('2023-08-15') - month_end

In [None]:
"""
2. **`MonthBegin` 클래스**:
`MonthBegin` 클래스는 월(month)의 첫 번째 날짜로 이동하는 날짜 오프셋입니다.
"""

import pandas as pd

month_begin = pd.offsets.MonthBegin()
month_begin.rollforward(pd.Timestamp('2023-08-15'))

In [None]:
pd.Timestamp('2023-08-15') + month_begin

In [None]:
month_begin.rollback(pd.Timestamp('2023-08-15'))

In [None]:
pd.Timestamp('2023-08-15') - month_begin

In [None]:
"""
3. **`Week` 클래스**:
`Week` 클래스는 주(week)의 특정 요일로 이동하는 날짜 오프셋입니다.
"""
import pandas as pd
week_sat = pd.offsets.Week(weekday=5) # Saturday

week_sat.rollforward(pd.Timestamp('2023-08-15')).strftime("%Y-%m-%d %A %H:%M:%S")

In [None]:
week_mon = pd.offsets.Week(weekday=0) # Monday
week_mon.rollforward(pd.Timestamp('2023-08-15')).strftime("%Y-%m-%d %A %H:%M:%S")

In [None]:
(pd.Timestamp('2023-08-15') + pd.offsets.Week(weekday=6)).strftime("%Y-%m-%d %A %H:%M:%S")

## .dt 접근자

판다스에서 `.dt` 접근자는 시리즈(Series)나 데이터프레임(DataFrame) 객체의   
날짜와 시간 관련 작업을 수행하는 데 사용되는 접근자(accessor)입니다.   
이 접근자를 사용하여 시계열 데이터의 날짜, 시간, 요일 등의 세부 정보를 추출하거나 조작할 수 있습니다.

In [None]:
import pandas as pd

df = pd.DataFrame(
    {'Date': ['2023-08-01', '2023-08-15', '2023-08-30']}
)
df

In [None]:
df.info()

In [None]:
df['Date'] = pd.to_datetime(df['Date'])  # 문자열을 날짜로 변환
df

In [None]:
df.info()

In [None]:
df.Date.dt.year

In [None]:
df.Date.dt.month

In [None]:
df.Date.dt.day

In [None]:
df.Date.dt.day_name()

In [None]:
df.Date.year # error - AttributeError: 'Series' object has no attribute 'year'

## dataframe 에서 timezone 변경

In [None]:
import pandas as pd

# 예제 데이터프레임 생성
data = {
    'timestamp': ['2023-08-01 10:00:00', '2023-08-15 12:30:00', '2023-08-30 15:45:00'],
    'value': [10, 20, 30]
}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])  # 문자열을 날짜로 변환
df


In [None]:
df.timestamp = df.timestamp.dt.tz_localize('Asia/Seoul')  # UTC 시간대로 설정
df

In [None]:
df.info()

In [None]:
# 시간대 변경
new_timezone = 'America/New_York'
df['timestamp'] = df['timestamp'].dt.tz_convert(new_timezone)  # 뉴욕 시간대로 변환
df

In [None]:
df.info()