## Contents
- 날짜 변환 : to_datetime, to_timestamp, to_period
- 날짜 생성 : date_range, period_range, date_range
- 날짜 인덱싱, 필터링, 집계, 속성 접근, 정렬

### python, numpy, pandas 날짜 타입 비교 및 정리

- datetime은 python 설치 시 기본적으로 내장된 라이브러리로, 날짜를 쓸 것인지, 시간을 쓸 것인지, 날짜시간을 합쳐쓸 것인지에 따라 클래스가 분화되어 있는 것이 특징. 예를들어 '2021-3-16'을 표시하고 싶으면 date 클래스를 사용하고, '2021-3-16 12:34:21'를 표시하고 싶으면 'datetime' 클래스를 사용합니다.
- 반면 datetime64나 Timestamp는 각각 numpy, pandas 라이브러리에서 새로 정의한 날짜시간 클래스입니다. 이 둘은 numpy, pandas를 설치해야만 이용할 수 있고, 한 클래스로 날짜, 시간, 날짜시간을 모두 정의할 수 있는 것이 특징
- 날짜, 시간 타입은 일반적인 정수, 실수끼리 연산할 때와 달리 단위를 가지고 있는 점 때문에 시간의 차이를 저장하는 별도의 클래스가 있다는 특징. 이를 timedelta(타임델타)라고 하는데, 날짜, 시간은 특정 시점의 시각을 표시하는 용도이고(2021년 3월 16일), 타임델타는 기간 또는 시간 차이를 표시하는 용도(5일)

### 파이썬 datetime 모듈
- 기본 개념: datetime 모듈은 날짜 및 시간을 다루는 기본적인 클래스들(date, time, datetime, timedelta, tzinfo)을 제공
- 날짜 생성 및 조작: 특정 날짜를 생성하거나 날짜 간의 차이를 계산하는 등의 기능을 수행
- 포맷팅: strftime()을 사용하여 날짜를 문자열로, strptime()을 사용하여 문자열을 날짜로 변환
- 시간대 처리: 시간대를 처리하는 기능을 포함하고 있지만, 별도의 라이브러리(pytz 등)의 도움이 필요

판다스
- 시계열 데이터 처리에 최적화: 판다스는 시계열 데이터 처리에 특화되어 있으며, 대량의 날짜 데이터를 빠르고 효율적으로 처리할 수 있다.
- DateTimeIndex: 판다스는 DateTimeIndex를 제공하여 시계열 데이터의 인덱싱과 슬라이싱을 간편하게 한다.
- 시간대 처리: 판다스는 내장된 시간대 처리 기능을 제공하며, 시간대 변환을 손쉽게 할 수 있다.
- 날짜 데이터 변환 및 조작: to_datetime() 함수로 다양한 형식의 날짜 문자열을 datetime 객체로 변환할 수 있다. 또한, resample, asfreq 등의 메서드로 시계열 데이터의 빈도를 변경하는 등 다양한 날짜 관련 조작을 지원.
- 통합된 데이터 처리: 판다스는 DataFrame이나 Series 내의 날짜 데이터를 다룰 때, 다른 데이터 유형과의 통합된 처리가 가능.

포인트
- 파이썬 datetime: 날짜 및 시간의 기본적인 처리에 적합하며, 작고 단순한 날짜 관련 작업에 이상적이다.
- 판다스: 대규모 데이터셋에서 복잡하고 고급 시계열 데이터 처리에 적합하며, 데이터 분석과 관련된 다양한 기능을 제공한다.
- 사용 사례에 따라 적절한 도구를 선택하는 것이 중요. 작은 규모의 기본적인 날짜 연산에는 datetime을, 복잡한 데이터셋과 시계열 분석에는 판다스를 사용하는 것이 일반적.

Python의 datetime 모듈을 사용한 날짜 처리 예시. 이 예제들은 datetime 모듈을 사용하여 날짜 및 시간 데이터를 다루는 기본적인 방법을 보여준다.

- 현재 날짜 및 시간 얻기: datetime.now()를 사용.
- 특정 날짜 및 시간 생성: datetime 객체를 직접 생성.
- 날짜 간 차이 계산: timedelta를 사용.
- 날짜 포맷팅: 날짜를 문자열로 변환하거나 문자열로부터 날짜를 파싱.
- 날짜와 시간 요소 접근: 날짜의 연도, 월, 일 등을 접근.

판다스를 사용한 날짜 처리의 예. 이 예제들은 판다스가 시계열 데이터를 어떻게 다룰 수 있는지 보여준다.

- 날짜 범위 생성: pd.date_range()를 사용하여 날짜 범위를 생성.
- 날짜 변환: 문자열을 pd.to_datetime()을 사용하여 날짜 객체로 변환.
- 시계열 데이터 생성: 날짜를 인덱스로 사용하는 시계열 데이터를 생성.
- 날짜 기반 필터링: 특정 날짜 조건을 만족하는 데이터를 필터링.
- 시계열 데이터 리샘플링: 월별 평균 등으로 데이터를 리샘플링.
- 이 코드를 실행하면, 판다스를 사용하여 날짜 데이터를 다양하게 처리하는 방법을 확인할 수 있다. 날짜 범위 생성, 날짜 변환, 시계열 데이터 처리 등은 데이터 분석에서 매우 유용하게 활용.

In [None]:
# 문자열 형식의 날짜를 datetime 형식으로 변환하여 처리
import pandas as pd

date_str = '2022-01-01'
date_dt = pd.to_datetime(date_str)
print(date_dt) # 출력 : 2022-01-01 00:00:00
print(date_dt.date()) # 출력 : 2022-01-01
print(date_dt.time()) # 출력 : 00:00:00

2022-01-01 00:00:00
2022-01-01
00:00:00


In [None]:
# 날짜 변환
dates = ['2020-01-01', '2020-01-05', '2020-01-10']
date_objects = pd.to_datetime(dates)
print(f"날짜 객체 : {date_objects}")
print()

date_only_list = [date.date() for date in date_objects]
print(date_only_list)

날짜 객체 : DatetimeIndex(['2020-01-01', '2020-01-05', '2020-01-10'], dtype='datetime64[ns]', freq=None)

[datetime.date(2020, 1, 1), datetime.date(2020, 1, 5), datetime.date(2020, 1, 10)]


Q. 문자열로 다시 바꾸기

In [None]:
date = pd.to_datetime(date_objects).tolist()
date

[Timestamp('2020-01-01 00:00:00'),
 Timestamp('2020-01-05 00:00:00'),
 Timestamp('2020-01-10 00:00:00')]

In [None]:
date = [date.strftime('%Y-%m-%d') for date in date_objects]
date

['2020-01-01', '2020-01-05', '2020-01-10']

In [None]:
# pd.date_range 함수는 일정한 간격으로 날짜 범위를 생성하는데 사용
# pd.date_range 함수는 pandas에서 제공하지만 내부적으로 numpy의 날짜/시간 타입인 datetime64를 사용
date_range = pd.date_range(start = '2022-01-01', end = '2022-01-10')
print(date_range)

DatetimeIndex(['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04',
               '2022-01-05', '2022-01-06', '2022-01-07', '2022-01-08',
               '2022-01-09', '2022-01-10'],
              dtype='datetime64[ns]', freq='D')


In [None]:
# 날짜를 인덱스로 설정하여 데이터프레임을 구성하면 날짜를 기준으로 데이터 조작이 용이
data = {'date':['2022-01-01', '2022-01-02', '2022-01-03'], 'value':[1, 2, 3]}
df = pd.DataFrame(data)
df.set_index('date', inplace = True)
print(df)

            value
date             
2022-01-01      1
2022-01-02      2
2022-01-03      3


In [None]:
df.index.name = None
df

Unnamed: 0,value
2022-01-01,1
2022-01-02,2
2022-01-03,3


In [None]:
# 날짜를 인덱스로 설정한 데이터프레임에서는 특정 기간의 데이터를 쉽게 인덱싱하고 슬라이싱
# 특정 날짜의 데이터 선택
print(df.loc['2022-01-02'])
print()

# 날짜 범위 슬라이싱
print(df['2022-01-01':'2022-01-02'])

value    2
Name: 2022-01-02, dtype: int64

            value
2022-01-01      1
2022-01-02      2


In [None]:
# 불라인 조건식을 사용하여 날짜 범위를 필터링
date_range = pd.date_range(start = '2020-01-01', end = '2020-01-10')
date_series = pd.Series(date_range)
fd = date_series[(date_series >= '2020-01-01') & (date_series <= '2020-01-03')]
print(fd)

0   2020-01-01
1   2020-01-02
2   2020-01-03
dtype: datetime64[ns]


In [None]:
# Pandas는 주어진 주기(일, 월, 분기 등)에 따라 데이터를 리샘플링 할 수 있는 기능을 제공
# resample 메소드를 사용하면 다양한 방법으로 데이터를 집계
date_range = pd.date_range(start = '2020-01-01', periods = 10, freq = 'D')
data = {'value':range(10)}
df = pd.DataFrame(data, index = date_range)
print(df, '\n')

# 월별 데이터 합계 계산
monthly_sum = df.resample('M').sum()
print(monthly_sum)

            value
2020-01-01      0
2020-01-02      1
2020-01-03      2
2020-01-04      3
2020-01-05      4
2020-01-06      5
2020-01-07      6
2020-01-08      7
2020-01-09      8
2020-01-10      9 

            value
2020-01-31     45


Q. 365일간 일당을 성과에 따라 50~ 100 달러를 받는다. 월별 합계를 구하세요.

In [None]:
import numpy as np

date_range = pd.date_range(start = '2020-01-01', periods = 365, freq = 'D')
data = {'value':np.random.randint(50, 100,365)}
df = pd.DataFrame(data, index = date_range)
print(df, '\n')

monthly_sum = df.resample('M').sum()
print(monthly_sum)

            value
2020-01-01     85
2020-01-02     89
2020-01-03     68
2020-01-04     73
2020-01-05     54
...           ...
2020-12-26     57
2020-12-27     55
2020-12-28     77
2020-12-29     71
2020-12-30     97

[365 rows x 1 columns] 

            value
2020-01-31   2319
2020-02-29   2208
2020-03-31   2388
2020-04-30   2276
2020-05-31   2342
2020-06-30   2312
2020-07-31   2355
2020-08-31   2416
2020-09-30   2254
2020-10-31   2394
2020-11-30   2282
2020-12-31   2253


In [None]:
# 날짜의 속성 뽑아내기
data = {'date':['2022-01-01', '2022-01-02', '2022-01-03'], 'value':[1, 2, 3]}
df = pd.DataFrame(data)
print(df, '\n')
df['date'] = pd.to_datetime(df['date'])
df.set_index('date', inplace = True)
print(df)

         date  value
0  2022-01-01      1
1  2022-01-02      2
2  2022-01-03      3 

            value
date             
2022-01-01      1
2022-01-02      2
2022-01-03      3


In [None]:
# Pandas의 datetime 형식 데이터는 다양한 속성에 접근할 수 있다.
# 예를 들어, 연도, 월, 일, 요일 등을 쉽게 추출

df['year'] = df.index.year
df['month'] = df.index.month
df['day'] = df.index.day
df['day_of_week'] = df.index.dayofweek
print(df)

            value  year  month  day  day_of_week
date                                            
2022-01-01      1  2022      1    1            5
2022-01-02      2  2022      1    2            6
2022-01-03      3  2022      1    3            0


In [5]:
import pandas as pd
from google.colab import files

In [3]:
uploaded = files.upload()

Saving stock-data.csv to stock-data.csv


In [6]:
df = pd.read_csv('stock-data.csv')
df.head()

Unnamed: 0,Date,Close,Start,High,Low,Volume
0,2018-07-02,10100,10850,10900,10000,137977
1,2018-06-29,10700,10550,10900,9990,170253
2,2018-06-28,10400,10900,10950,10150,155769
3,2018-06-27,10900,10800,11050,10500,133548
4,2018-06-26,10800,10900,11000,10700,63039


In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Date    20 non-null     object
 1   Close   20 non-null     int64 
 2   Start   20 non-null     int64 
 3   High    20 non-null     int64 
 4   Low     20 non-null     int64 
 5   Volume  20 non-null     int64 
dtypes: int64(5), object(1)
memory usage: 1.1+ KB


In [24]:
df['New_Date'] = pd.to_datetime(df['Date'])
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   Date      20 non-null     object        
 1   Close     20 non-null     int64         
 2   Start     20 non-null     int64         
 3   High      20 non-null     int64         
 4   Low       20 non-null     int64         
 5   Volume    20 non-null     int64         
 6   New_Date  20 non-null     datetime64[ns]
dtypes: datetime64[ns](1), int64(5), object(1)
memory usage: 1.2+ KB


In [None]:
# df['Year'] = pd.to_datetime(df['Date'])
# df['Month'] = pd.to_datetime(df['Date'])
# df['Day'] = pd.to_datetime(df['Date'])
# df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 10 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   Date      20 non-null     object        
 1   Close     20 non-null     int64         
 2   Start     20 non-null     int64         
 3   High      20 non-null     int64         
 4   Low       20 non-null     int64         
 5   Volume    20 non-null     int64         
 6   New_Date  20 non-null     datetime64[ns]
 7   Year      20 non-null     datetime64[ns]
 8   Month     20 non-null     datetime64[ns]
 9   Day       20 non-null     datetime64[ns]
dtypes: datetime64[ns](4), int64(5), object(1)
memory usage: 1.7+ KB


In [11]:
df1 = df.copy()
df1.head()

Unnamed: 0,Date,Close,Start,High,Low,Volume
0,2018-07-02,10100,10850,10900,10000,137977
1,2018-06-29,10700,10550,10900,9990,170253
2,2018-06-28,10400,10900,10950,10150,155769
3,2018-06-27,10900,10800,11050,10500,133548
4,2018-06-26,10800,10900,11000,10700,63039


In [12]:
df1['New_Date'] = pd.to_datetime(df1['Date'])
df1.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   Date      20 non-null     object        
 1   Close     20 non-null     int64         
 2   Start     20 non-null     int64         
 3   High      20 non-null     int64         
 4   Low       20 non-null     int64         
 5   Volume    20 non-null     int64         
 6   New_Date  20 non-null     datetime64[ns]
dtypes: datetime64[ns](1), int64(5), object(1)
memory usage: 1.2+ KB


In [20]:
df2 = df.copy()
df2.head()

Unnamed: 0,Date,Close,Start,High,Low,Volume
0,2018-07-02,10100,10850,10900,10000,137977
1,2018-06-29,10700,10550,10900,9990,170253
2,2018-06-28,10400,10900,10950,10150,155769
3,2018-06-27,10900,10800,11050,10500,133548
4,2018-06-26,10800,10900,11000,10700,63039


In [21]:
df2['New_Date'] = pd.to_datetime(df2['Date'])
df2.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   Date      20 non-null     object        
 1   Close     20 non-null     int64         
 2   Start     20 non-null     int64         
 3   High      20 non-null     int64         
 4   Low       20 non-null     int64         
 5   Volume    20 non-null     int64         
 6   New_Date  20 non-null     datetime64[ns]
dtypes: datetime64[ns](1), int64(5), object(1)
memory usage: 1.2+ KB


In [None]:
df.drop('Date', axis = 1, inplace = True)
df['Year'] = df['New_Date'].dt.year
df['Month'] = df['New_Date'].dt.month
df['Day'] = df['New_Date'].dt.day
df.head()

Unnamed: 0,Close,Start,High,Low,Volume,New_Date,Year,Month,Day
0,10100,10850,10900,10000,137977,2018-07-02,2018,7,2
1,10700,10550,10900,9990,170253,2018-06-29,2018,6,29
2,10400,10900,10950,10150,155769,2018-06-28,2018,6,28
3,10900,10800,11050,10500,133548,2018-06-27,2018,6,27
4,10800,10900,11000,10700,63039,2018-06-26,2018,6,26


In [15]:
df1.drop('Date', axis = 1, inplace = True)
df1['Year'] = df1['New_Date'].dt.year
df1['Month'] = df1['New_Date'].dt.month
df1['Day'] = df1['New_Date'].dt.day
df1.head()

Unnamed: 0,Close,Start,High,Low,Volume,New_Date,Year,Month,Day
0,10100,10850,10900,10000,137977,2018-07-02,2018,7,2
1,10700,10550,10900,9990,170253,2018-06-29,2018,6,29
2,10400,10900,10950,10150,155769,2018-06-28,2018,6,28
3,10900,10800,11050,10500,133548,2018-06-27,2018,6,27
4,10800,10900,11000,10700,63039,2018-06-26,2018,6,26


In [22]:
# 인덱스 버전

df2.drop('Date', axis = 1, inplace = True)
df2.set_index('New_Date', inplace = True)
df2['Year'] = df2.index.year
df2['Month'] = df2.index.month
df2['Day'] = df2.index.day
df2.head()

Unnamed: 0_level_0,Close,Start,High,Low,Volume,Year,Month,Day
New_Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2018-07-02,10100,10850,10900,10000,137977,2018,7,2
2018-06-29,10700,10550,10900,9990,170253,2018,6,29
2018-06-28,10400,10900,10950,10150,155769,2018,6,28
2018-06-27,10900,10800,11050,10500,133548,2018,6,27
2018-06-26,10800,10900,11000,10700,63039,2018,6,26


In [25]:
df.head()

Unnamed: 0,Date,Close,Start,High,Low,Volume,New_Date
0,2018-07-02,10100,10850,10900,10000,137977,2018-07-02
1,2018-06-29,10700,10550,10900,9990,170253,2018-06-29
2,2018-06-28,10400,10900,10950,10150,155769,2018-06-28
3,2018-06-27,10900,10800,11050,10500,133548,2018-06-27
4,2018-06-26,10800,10900,11000,10700,63039,2018-06-26


In [28]:
df.drop('Date', axis = 1, inplace = True)
df.set_index('New_Date', inplace = True)
df.head()

Unnamed: 0_level_0,Close,Start,High,Low,Volume
New_Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2018-07-02,10100,10850,10900,10000,137977
2018-06-29,10700,10550,10900,9990,170253
2018-06-28,10400,10900,10950,10150,155769
2018-06-27,10900,10800,11050,10500,133548
2018-06-26,10800,10900,11000,10700,63039


In [31]:
df.index

DatetimeIndex(['2018-07-02', '2018-06-29', '2018-06-28', '2018-06-27',
               '2018-06-26', '2018-06-25', '2018-06-22', '2018-06-21',
               '2018-06-20', '2018-06-19', '2018-06-18', '2018-06-15',
               '2018-06-14', '2018-06-12', '2018-06-11', '2018-06-08',
               '2018-06-07', '2018-06-05', '2018-06-04', '2018-06-01'],
              dtype='datetime64[ns]', name='New_Date', freq=None)

In [32]:
df.sort_index(inplace = True)
df.head()

Unnamed: 0_level_0,Close,Start,High,Low,Volume
New_Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2018-06-01,11900,11800,12100,11750,32062
2018-06-04,11900,11900,12200,11700,25171
2018-06-05,12150,11800,12250,11800,42485
2018-06-07,11950,12200,12300,11900,49088
2018-06-08,11950,11950,12200,11800,59258


In [34]:
# 데이터프레임에 대해 [] 접근자를 사용할 때,
# 날짜를 기반으로 슬라이싱 가능, 슬라이스의 양 끝을 포함
df.ymd_range = df.loc['2018-06-26':'2018-06-29']
df.ymd_range

Unnamed: 0_level_0,Close,Start,High,Low,Volume
New_Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2018-06-26,10800,10900,11000,10700,63039
2018-06-27,10900,10800,11050,10500,133548
2018-06-28,10400,10900,10950,10150,155769
2018-06-29,10700,10550,10900,9990,170253


In [40]:
df_ym = df.loc['2018-07', 'Start':'Low']
df_ym.index.name = None
df_ym

Unnamed: 0,Start,High,Low
2018-07-02,10850,10900,10000


#### Task1_0603. 주어진 df의 날짜 리스트를 datetime 형식으로 변환하고, 변환된 데이터프레임의 년도, 월, 일 열을 추가하시오.

In [None]:
import pandas as pd

# 날짜 문자열 리스트
date_list = ['2023-01-01', '2023-02-15', '2023-03-30']

# 데이터프레임 생성
df = pd.DataFrame(date_list, columns=['date'])
df

Unnamed: 0,date
0,2023-01-01
1,2023-02-15
2,2023-03-30


In [None]:
# df의 날짜 리스트를 datetime 형식으로 변환
df['New_Date'] = pd.to_datetime(df['date'])

# 변환된 데이터 프레임의 년도, 월, 일 Columns를 추가
df['Year'] = df['New_Date'].dt.year
df['Month'] = df['New_Date'].dt.month
df['Day'] = df['New_Date'].dt.day
df

Unnamed: 0,date,New_Date,Year,Month,Day
0,2023-01-01,2023-01-01,2023,1,1
1,2023-02-15,2023-02-15,2023,2,15
2,2023-03-30,2023-03-30,2023,3,30


#### Task2_0603. 주어진 월간 데이터를 타임스탬프로 변환하고, 변환된 결과에서 시간을 제외한 날짜만 출력하시오.

In [None]:
import pandas as pd

# 문자열을 Period로 변환
period_data = pd.Series(['2023-01', '2023-02', '2023-03'], name='period')
period_data

0    2023-01
1    2023-02
2    2023-03
Name: period, dtype: object

In [None]:
# 문자열을 period로 변환
period_data = period_data.astype('period[M]')

# Period를 Timestamp로 변환
timestamp_data = period_data.apply(lambda x: x.to_timestamp())

print(timestamp_data)

0   2023-01-01
1   2023-02-01
2   2023-03-01
Name: period, dtype: datetime64[ns]


In [None]:
timestamp_data = pd.to_datetime(period_data, format = '%Y-%m')
print(timestamp_data, '\n')

df1 = [date.strftime('%Y-%m-%d') for date in timestamp_data]
print(df1)

0   2023-01-01
1   2023-02-01
2   2023-03-01
Name: period, dtype: datetime64[ns] 

['2023-01-01', '2023-02-01', '2023-03-01']


#### Task3_0603. 주어진 날짜 데이터 시리즈를 분기로 변환하고, 각 분기별로 데이터의 개수를 출력하세요.

In [121]:
import pandas as pd

# 날짜 데이터 시리즈
date_series = pd.Series(pd.date_range('2023-01-01', '2023-12-31', freq='M'))
date_series

0    2023-01-31
1    2023-02-28
2    2023-03-31
3    2023-04-30
4    2023-05-31
5    2023-06-30
6    2023-07-31
7    2023-08-31
8    2023-09-30
9    2023-10-31
10   2023-11-30
11   2023-12-31
dtype: datetime64[ns]

In [None]:
# 날짜 데이터를 분기로 변환
b = date_series.dt.to_period('Q')

# 각 분기별 데이터 개수 세기
quarter_counts = b.value_counts().sort_index()

print(quarter_counts)

2023Q1    3
2023Q2    3
2023Q3    3
2023Q4    3
Freq: Q-DEC, Name: count, dtype: int64


In [41]:
import numpy as np
import pandas as pd

from datetime import datetime
# datetime 객체로 이루어진 리스트
dates = [datetime(2011,1,2),datetime(2011,1,5),
        datetime(2011,1,7),datetime(2011,1,8),
        datetime(2011,1,10),datetime(2011,1,12)]
# 표준정규분포 -1 ~ +1 사이 숫자 중 6개 랜덤
ts = pd.Series(np.random.randn(6),index=dates)
ts

2011-01-02    0.661939
2011-01-05   -0.237357
2011-01-07   -0.315070
2011-01-08    0.135106
2011-01-10   -0.318812
2011-01-12   -0.392359
dtype: float64

In [42]:
df = pd.DataFrame(ts, columns = ['Value'])
df

Unnamed: 0,Value
2011-01-02,0.661939
2011-01-05,-0.237357
2011-01-07,-0.31507
2011-01-08,0.135106
2011-01-10,-0.318812
2011-01-12,-0.392359


In [43]:
# Two Step : 1칸 건너뛴 인덱스를 가0져옴
ts[::2]

2011-01-02    0.661939
2011-01-07   -0.315070
2011-01-10   -0.318812
dtype: float64

In [44]:
ts + ts[::2]

2011-01-02    1.323878
2011-01-05         NaN
2011-01-07   -0.630139
2011-01-08         NaN
2011-01-10   -0.637623
2011-01-12         NaN
dtype: float64

In [45]:
ts

2011-01-02    0.661939
2011-01-05   -0.237357
2011-01-07   -0.315070
2011-01-08    0.135106
2011-01-10   -0.318812
2011-01-12   -0.392359
dtype: float64

In [47]:
# datetime → Timestamp

dt1 = datetime(2021, 1, 2)
ts1 = pd.Timestamp(dt1)
ts1

Timestamp('2021-01-02 00:00:00')

In [49]:
# Timestamp → datetime
ts1 = pd.Timestamp('2011-01-02')
dt1 = ts1.to_pydatetime()
dt1

datetime.datetime(2011, 1, 2, 0, 0)

In [50]:
ts

2011-01-02    0.661939
2011-01-05   -0.237357
2011-01-07   -0.315070
2011-01-08    0.135106
2011-01-10   -0.318812
2011-01-12   -0.392359
dtype: float64

In [51]:
# indexing, Selection, Subsetting
# stamp에는 인덱스가 저장
stamp = ts.index[2]
ts[stamp]

-0.3150696902246646

In [53]:
# 서로 다른 날짜 형식을 사용하지만,
# pandas는 이러한 형식들을 자동으로 인식하고 적절한 날짜로 변환
# 2011-01-10
print(ts['01/10/2011'])
ts['20110110']

-0.31881167259376975


-0.31881167259376975

In [54]:
longer_ts = pd.Series(np.random.randn(365), index = pd.date_range('11/30/2023', periods = 365))
longer_ts

2023-11-30   -2.121616
2023-12-01    0.708630
2023-12-02   -0.229475
2023-12-03    0.676949
2023-12-04    1.174737
                ...   
2024-11-24    0.599224
2024-11-25    1.173665
2024-11-26    1.079466
2024-11-27   -0.056235
2024-11-28    1.174214
Freq: D, Length: 365, dtype: float64

In [56]:
longer_ts = pd.Series(np.random.randn(1000), index = pd.date_range('01/01/2000', periods = 1000))
longer_ts

2000-01-01   -0.678440
2000-01-02   -0.583942
2000-01-03   -1.220833
2000-01-04   -1.506288
2000-01-05    0.463939
                ...   
2002-09-22    0.170589
2002-09-23   -1.292056
2002-09-24    0.314497
2002-09-25   -0.617395
2002-09-26   -0.126039
Freq: D, Length: 1000, dtype: float64

In [57]:
longer_ts['2001-05'][:5]

2001-05-01    2.904687
2001-05-02    0.270469
2001-05-03    0.117289
2001-05-04   -0.815995
2001-05-05   -1.617931
Freq: D, dtype: float64

In [58]:
ts

2011-01-02    0.661939
2011-01-05   -0.237357
2011-01-07   -0.315070
2011-01-08    0.135106
2011-01-10   -0.318812
2011-01-12   -0.392359
dtype: float64

In [60]:
ts[datetime(2011,1,7):]

2011-01-07   -0.315070
2011-01-08    0.135106
2011-01-10   -0.318812
2011-01-12   -0.392359
dtype: float64

In [61]:
# truncate
print(ts.truncate(before= '2011-01-05', after = '2011-01-10'))

2011-01-05   -0.237357
2011-01-07   -0.315070
2011-01-08    0.135106
2011-01-10   -0.318812
dtype: float64


In [64]:
print(ts.truncate(after = '1/9/2011'), '\n')
print(ts.truncate(before = '1/9/2011'))


2011-01-02    0.661939
2011-01-05   -0.237357
2011-01-07   -0.315070
2011-01-08    0.135106
dtype: float64 

2011-01-10   -0.318812
2011-01-12   -0.392359
dtype: float64


In [65]:
from datetime import datetime
from datetime import timedelta

now = datetime.now()
in_two_weeks = now + timedelta(weeks = 2)
pd.date_range(datetime.now(), in_two_weeks)

DatetimeIndex(['2024-06-04 01:26:42.191019', '2024-06-05 01:26:42.191019',
               '2024-06-06 01:26:42.191019', '2024-06-07 01:26:42.191019',
               '2024-06-08 01:26:42.191019', '2024-06-09 01:26:42.191019',
               '2024-06-10 01:26:42.191019', '2024-06-11 01:26:42.191019',
               '2024-06-12 01:26:42.191019', '2024-06-13 01:26:42.191019',
               '2024-06-14 01:26:42.191019', '2024-06-15 01:26:42.191019',
               '2024-06-16 01:26:42.191019', '2024-06-17 01:26:42.191019'],
              dtype='datetime64[ns]', freq='D')

In [70]:
# periods 매개변수는 date_range 함수에 전달된 시작날짜와 종료날짜를
# periods 매개변수에 전달된 기준의 수만큼 동일하게 나누어 출력
ts = pd.date_range(start = '2023-11-01', end = '2023-11-30', periods = 10)
ts

DatetimeIndex(['2023-11-01 00:00:00', '2023-11-04 05:20:00',
               '2023-11-07 10:40:00', '2023-11-10 16:00:00',
               '2023-11-13 21:20:00', '2023-11-17 02:40:00',
               '2023-11-20 08:00:00', '2023-11-23 13:20:00',
               '2023-11-26 18:40:00', '2023-11-30 00:00:00'],
              dtype='datetime64[ns]', freq=None)

In [71]:
# 위에 있는 periods = n 과 np.arange(n) n은 같은 숫자로 넣어야함.
df = pd.DataFrame(np.arange(10), index = ts, columns = ['value'])
df

Unnamed: 0,value
2023-11-01 00:00:00,0
2023-11-04 05:20:00,1
2023-11-07 10:40:00,2
2023-11-10 16:00:00,3
2023-11-13 21:20:00,4
2023-11-17 02:40:00,5
2023-11-20 08:00:00,6
2023-11-23 13:20:00,7
2023-11-26 18:40:00,8
2023-11-30 00:00:00,9


In [76]:
# normalize = True 옵션은 pd.date_range 함수에서 날짜와 시간을 생성할 때 시간 정보를 제거

pd.date_range('2012-01-01', periods = 5)
pd.date_range('2012-01-01 12:56:31', periods = 5, normalize = True)

DatetimeIndex(['2012-01-01', '2012-01-02', '2012-01-03', '2012-01-04',
               '2012-01-05'],
              dtype='datetime64[ns]', freq='D')

#### freq 매개변수에 사용되는 Frequncy strings
- A calendar year end frequency
- B   business day frequency
- C   custom business day frequency
- D   calendar day frequency
- W   weekly frequency
- M   month end frequency
- SM   semi-month end frequency (15th and end of month)
- BM   business month end frequency
- CBM   custom business month end frequency
- MS   month start frequency
- SMS   semi-month start frequency (1st and 15th)
- BMS   business month start frequency
- CBMS   custom business month start frequency
- Q   quarter end frequency

In [81]:
import numpy as np
dates = pd.date_range('11/30/2023', periods = 10, freq = 'W-WED')
dates

DatetimeIndex(['2023-12-06', '2023-12-13', '2023-12-20', '2023-12-27',
               '2024-01-03', '2024-01-10', '2024-01-17', '2024-01-24',
               '2024-01-31', '2024-02-07'],
              dtype='datetime64[ns]', freq='W-WED')

In [82]:
np.random.randint(3, size = 10)

array([2, 2, 0, 2, 1, 1, 2, 0, 2, 1])

In [85]:
df = pd.DataFrame(np.random.randint(3, size = 10), index = dates, columns = ['운동시간'])
df

Unnamed: 0,운동시간
2023-12-06,1
2023-12-13,2
2023-12-20,0
2023-12-27,1
2024-01-03,2
2024-01-10,0
2024-01-17,2
2024-01-24,0
2024-01-31,0
2024-02-07,1


In [86]:
np.random.seed(0)
long_df = pd.DataFrame(np.random.randn(10, 4),
                       index = dates,
                       columns = ['Colorado', 'Texas', 'New York', 'Ohio'])
print(long_df, '\n')

            Colorado     Texas  New York      Ohio
2023-12-06  1.764052  0.400157  0.978738  2.240893
2023-12-13  1.867558 -0.977278  0.950088 -0.151357
2023-12-20 -0.103219  0.410599  0.144044  1.454274
2023-12-27  0.761038  0.121675  0.443863  0.333674
2024-01-03  1.494079 -0.205158  0.313068 -0.854096
2024-01-10 -2.552990  0.653619  0.864436 -0.742165
2024-01-17  2.269755 -1.454366  0.045759 -0.187184
2024-01-24  1.532779  1.469359  0.154947  0.378163
2024-01-31 -0.887786 -1.980796 -0.347912  0.156349
2024-02-07  1.230291  1.202380 -0.387327 -0.302303 



In [89]:
# 2024년의 데이터만 출력
long_df.loc['2024']

Unnamed: 0,Colorado,Texas,New York,Ohio
2024-01-03,1.494079,-0.205158,0.313068,-0.854096
2024-01-10,-2.55299,0.653619,0.864436,-0.742165
2024-01-17,2.269755,-1.454366,0.045759,-0.187184
2024-01-24,1.532779,1.469359,0.154947,0.378163
2024-01-31,-0.887786,-1.980796,-0.347912,0.156349
2024-02-07,1.230291,1.20238,-0.387327,-0.302303


In [88]:
# 1월의 데이터만 출력
long_df.loc['2024-01']

Unnamed: 0,Colorado,Texas,New York,Ohio
2024-01-03,1.494079,-0.205158,0.313068,-0.854096
2024-01-10,-2.55299,0.653619,0.864436,-0.742165
2024-01-17,2.269755,-1.454366,0.045759,-0.187184
2024-01-24,1.532779,1.469359,0.154947,0.378163
2024-01-31,-0.887786,-1.980796,-0.347912,0.156349
2024-02-07,1.230291,1.20238,-0.387327,-0.302303


In [90]:
dates = pd.DatetimeIndex(['1/1/2000','1/2/2000','1/2/2000','1/2/2000',
                         '1/3/2000'])
dup_ts = pd.Series(np.arange(5),index=dates)
dup_ts

2000-01-01    0
2000-01-02    1
2000-01-02    2
2000-01-02    3
2000-01-03    4
dtype: int64

In [93]:
# 중복되는게 있는지 체크하는 코드
# False : 중복되는게 있음
# True : 중복되는게 없음
dup_ts.index.is_unique

False

In [91]:
dup_ts['1/3/2000'] # not_duplicated의 경우 스칼라 값

4

In [92]:
dup_ts['1/2/2000'] # duplicated의 경우 슬라이스 출력

2000-01-02    1
2000-01-02    2
2000-01-02    3
dtype: int64

In [94]:
dup_ts

2000-01-01    0
2000-01-02    1
2000-01-02    2
2000-01-02    3
2000-01-03    4
dtype: int64

In [97]:
grouped = dup_ts.groupby(level = 0)
print(grouped.mean(), '\n')
grouped.count()

2000-01-01    0.0
2000-01-02    2.0
2000-01-03    4.0
dtype: float64 



2000-01-01    1
2000-01-02    3
2000-01-03    1
dtype: int64

In [98]:
pd.date_range('2000-01-01', '2000-01-03 23:59', freq = '4h')


DatetimeIndex(['2000-01-01 00:00:00', '2000-01-01 04:00:00',
               '2000-01-01 08:00:00', '2000-01-01 12:00:00',
               '2000-01-01 16:00:00', '2000-01-01 20:00:00',
               '2000-01-02 00:00:00', '2000-01-02 04:00:00',
               '2000-01-02 08:00:00', '2000-01-02 12:00:00',
               '2000-01-02 16:00:00', '2000-01-02 20:00:00',
               '2000-01-03 00:00:00', '2000-01-03 04:00:00',
               '2000-01-03 08:00:00', '2000-01-03 12:00:00',
               '2000-01-03 16:00:00', '2000-01-03 20:00:00'],
              dtype='datetime64[ns]', freq='4H')

In [99]:
# 오프셋 객체들은 새로운 시간을 계산하거나 시계열 데이터를 조작하는 데 사용
from pandas.tseries.offsets import Hour, Minute
Hour(2) + Minute(30)

<150 * Minutes>

In [100]:
pd.date_range('2000-01-01', periods = 10, freq = '1h30min')

DatetimeIndex(['2000-01-01 00:00:00', '2000-01-01 01:30:00',
               '2000-01-01 03:00:00', '2000-01-01 04:30:00',
               '2000-01-01 06:00:00', '2000-01-01 07:30:00',
               '2000-01-01 09:00:00', '2000-01-01 10:30:00',
               '2000-01-01 12:00:00', '2000-01-01 13:30:00'],
              dtype='datetime64[ns]', freq='90T')

In [102]:
# Week of month, 매월 세 번째 금요일에 해당하는 날짜를 생성
rng = pd.date_range('2000-01-01', '2012-09-01', freq = 'WOM-3FRI')
print(rng)

DatetimeIndex(['2000-01-21', '2000-02-18', '2000-03-17', '2000-04-21',
               '2000-05-19', '2000-06-16', '2000-07-21', '2000-08-18',
               '2000-09-15', '2000-10-20',
               ...
               '2011-11-18', '2011-12-16', '2012-01-20', '2012-02-17',
               '2012-03-16', '2012-04-20', '2012-05-18', '2012-06-15',
               '2012-07-20', '2012-08-17'],
              dtype='datetime64[ns]', length=152, freq='WOM-3FRI')


In [103]:
from pandas.tseries.offsets import Day, MonthEnd
now = datetime(2011, 11, 17)
now + 3 *Day()

Timestamp('2011-11-20 00:00:00')

In [108]:
# 현재 날짜를 기준으로 가장 가까운 월말 날짜로 이동
offset = MonthEnd()
print(offset.rollforward(now), '\n')

# 현재 날짜를 기준으로 가장 가까운 이전 월말 날짜로 이동
offset.rollback(now)


2011-11-30 00:00:00 



Timestamp('2011-10-31 00:00:00')

In [109]:
# 기간을 타임스탬프로 변환
import numpy as np
rng = pd.period_range('2000-01-01', periods = 3, freq = 'M')
ts = pd.Series(np.random.randn(3), index = rng)
print(ts, '\n')

2000-01   -1.048553
2000-02   -1.420018
2000-03   -1.706270
Freq: M, dtype: float64 



In [110]:
ts.to_timestamp(how = 'end')

2000-01-31 23:59:59.999999999   -1.048553
2000-02-29 23:59:59.999999999   -1.420018
2000-03-31 23:59:59.999999999   -1.706270
dtype: float64

#### Task4_0604. 2023년 1월 1일부터 2023년 12월 31일까지의 날짜 범위를 생성하고, 이 날짜 범위에서 매월 첫 번째 날만 포함하는 데이터프레임을 작성하세요.

In [169]:
date = pd.date_range('2023-01-01', '2023-12-31', freq = 'MS')

df = pd.DataFrame(date, columns = ['date'])
print(df)

         date
0  2023-01-01
1  2023-02-01
2  2023-03-01
3  2023-04-01
4  2023-05-01
5  2023-06-01
6  2023-07-01
7  2023-08-01
8  2023-09-01
9  2023-10-01
10 2023-11-01
11 2023-12-01


#### Task5_0604. 2020년부터 2025년까지의 분기별 기간 범위를 생성하고, 각 분기의 시작과 끝 날짜를 포함하는 데이터프레임을 작성하세요.

In [170]:
period_range = pd.period_range(start = '2020Q1', end = '2025Q4', freq = 'Q')

df = pd.DataFrame({
    'quarter' : period_range,
    'start_date' : period_range.start_time.date,
    'end_date' : period_range.end_time.date
})

df

Unnamed: 0,quarter,start_date,end_date
0,2020Q1,2020-01-01,2020-03-31
1,2020Q2,2020-04-01,2020-06-30
2,2020Q3,2020-07-01,2020-09-30
3,2020Q4,2020-10-01,2020-12-31
4,2021Q1,2021-01-01,2021-03-31
5,2021Q2,2021-04-01,2021-06-30
6,2021Q3,2021-07-01,2021-09-30
7,2021Q4,2021-10-01,2021-12-31
8,2022Q1,2022-01-01,2022-03-31
9,2022Q2,2022-04-01,2022-06-30


#### Task6_0604. 0일부터 10일까지의 시간 범위를 12시간 간격으로 생성하고, 각 간격에 대해 누적 시간을 계산하여 데이터프레임을 작성하세요.

In [135]:
date = pd.date_range('2024-06-01', '2024-06-10', freq = '12H')
date

DatetimeIndex(['2024-06-01 00:00:00', '2024-06-01 12:00:00',
               '2024-06-02 00:00:00', '2024-06-02 12:00:00',
               '2024-06-03 00:00:00', '2024-06-03 12:00:00',
               '2024-06-04 00:00:00', '2024-06-04 12:00:00',
               '2024-06-05 00:00:00', '2024-06-05 12:00:00',
               '2024-06-06 00:00:00', '2024-06-06 12:00:00',
               '2024-06-07 00:00:00', '2024-06-07 12:00:00',
               '2024-06-08 00:00:00', '2024-06-08 12:00:00',
               '2024-06-09 00:00:00', '2024-06-09 12:00:00',
               '2024-06-10 00:00:00'],
              dtype='datetime64[ns]', freq='12H')

In [171]:
timedelta_range = pd.timedelta_range(start = 0, end = '10D', freq = '12H')

df = pd.DataFrame({
    'timedelta' : timedelta_range,
    'cumulative_time' :[timedelta.total_seconds() / 3600 for timedelta in timedelta_range]
    #누적 시간을 시간 단위로 계산
})

print(df)

          timedelta  cumulative_time
0   0 days 00:00:00              0.0
1   0 days 12:00:00             12.0
2   1 days 00:00:00             24.0
3   1 days 12:00:00             36.0
4   2 days 00:00:00             48.0
5   2 days 12:00:00             60.0
6   3 days 00:00:00             72.0
7   3 days 12:00:00             84.0
8   4 days 00:00:00             96.0
9   4 days 12:00:00            108.0
10  5 days 00:00:00            120.0
11  5 days 12:00:00            132.0
12  6 days 00:00:00            144.0
13  6 days 12:00:00            156.0
14  7 days 00:00:00            168.0
15  7 days 12:00:00            180.0
16  8 days 00:00:00            192.0
17  8 days 12:00:00            204.0
18  9 days 00:00:00            216.0
19  9 days 12:00:00            228.0
20 10 days 00:00:00            240.0


#### Task7_0604. 주어진 df 에서 특정 날짜 이후의 데이터를 필터링하세요.

In [173]:
import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({
    'date': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04', '2022-01-05'],
    'value': [1, 2, 3, 4, 5]
})
df['date'] = pd.to_datetime(df['date'])
df

Unnamed: 0,date,value
0,2022-01-01,1
1,2022-01-02,2
2,2022-01-03,3
3,2022-01-04,4
4,2022-01-05,5


In [137]:
df.truncate(before= '2022-01-03')

Unnamed: 0,date,value
3,2022-01-04,4
4,2022-01-05,5


In [174]:
filtered_df = df[df['date'] > '2022-01-02']
print(filtered_df)

        date  value
2 2022-01-03      3
3 2022-01-04      4
4 2022-01-05      5


#### Task8_0604. 주어진 df에서 월별로 데이터의 합계를 계산하세요.

In [177]:
import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({
    'date': ['2022-01-01', '2022-01-15', '2022-02-01', '2022-02-15', '2022-03-01'],
    'value': [1, 2, 3, 4, 5]
})
df['date'] = pd.to_datetime(df['date'])
df

Unnamed: 0,date,value
0,2022-01-01,1
1,2022-01-15,2
2,2022-02-01,3
3,2022-02-15,4
4,2022-03-01,5


In [175]:
df['month'] = df['date'].dt.to_period('M')
df

Unnamed: 0,date,value,month
0,2022-01-01,1,2022-01
1,2022-01-02,2,2022-01
2,2022-01-03,3,2022-01
3,2022-01-04,4,2022-01
4,2022-01-05,5,2022-01


In [178]:
# 월별 데이터 집계
df['month'] = df['date'].dt.to_period('M')
monthly_sum = df.groupby('month')['value'].sum().reset_index()
print(monthly_sum)

     month  value
0  2022-01      3
1  2022-02      7
2  2022-03      5


#### Task9_0604. 주어진 데이터프레임에서 주말(토요일과 일요일) 데이터를 필터링하세요.

In [180]:
import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({
    'date': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-08', '2022-01-09'],
    'value': [1, 2, 3, 4, 5]
})
df['date'] = pd.to_datetime(df['date'])
df

Unnamed: 0,date,value
0,2022-01-01,1
1,2022-01-02,2
2,2022-01-03,3
3,2022-01-08,4
4,2022-01-09,5


In [181]:
df['day_of_week'] = df['date'].dt.dayofweek
df

Unnamed: 0,date,value,day_of_week
0,2022-01-01,1,5
1,2022-01-02,2,6
2,2022-01-03,3,0
3,2022-01-08,4,5
4,2022-01-09,5,6


In [183]:
# 월, 화, 수, 목, 금, 토, 일 = [0, 1, 2, 3, 4, 5, 6]
weekend_satsun = df[df['day_of_week'] >= 5]
weekend_satsun

Unnamed: 0,date,value,day_of_week
0,2022-01-01,1,5
1,2022-01-02,2,6
3,2022-01-08,4,5
4,2022-01-09,5,6


#### Task10_0604. 주어진 df에서 분기별 데이터의 평균을 계산하세요.

In [185]:
import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({
    'date': ['2022-01-01', '2022-02-01', '2022-03-01', '2022-04-01', '2022-05-01'],
    'value': [1, 2, 3, 4, 5]
})
df['date'] = pd.to_datetime(df['date'])

df

Unnamed: 0,date,value
0,2022-01-01,1
1,2022-02-01,2
2,2022-03-01,3
3,2022-04-01,4
4,2022-05-01,5


In [186]:
# 분기별 데이터 평균 계산
df['quarter'] = df['date'].dt.to_period('Q')
quarterly_mean = df.groupby('quarter')['value'].mean().reset_index()
print(quarterly_mean)

  quarter  value
0  2022Q1    2.0
1  2022Q2    4.5


#### Task11_0604. 주어진 df에서 작업 일자(월요일부터 금요일)만 남기고 필터링하세요.

In [189]:
import pandas as pd

# 데이터프레임 생성
df = pd.DataFrame({
    'date': ['2022-01-01', '2022-01-03', '2022-01-04', '2022-01-05', '2022-01-08', '2022-01-09'],
    'value': [1, 2, 3, 4, 5, 6]
})
df['date'] = pd.to_datetime(df['date'])
df

Unnamed: 0,date,value
0,2022-01-01,1
1,2022-01-03,2
2,2022-01-04,3
3,2022-01-05,4
4,2022-01-08,5
5,2022-01-09,6


In [190]:
df['day_of_week'] = df['date'].dt.dayofweek
# 월, 화, 수, 목, 금, 토, 일 = [0, 1, 2, 3, 4, 5, 6]
weekend_not_satsun = df[df['day_of_week'] < 5]
weekend_not_satsun

Unnamed: 0,date,value,day_of_week
1,2022-01-03,2,0
2,2022-01-04,3,1
3,2022-01-05,4,2
