# 날짜를 이용하여 데이터 조회하기

## - 특정 요일에 해당하는 데이터 조회하기

In [12]:
import pandas as pd
 
df = pd.read_csv('data/temperatures.csv')
df.head()

Unnamed: 0,Date,Temp
0,1981-01-01,20.7
1,1981-01-02,17.9
2,1981-01-03,18.8
3,1981-01-04,14.6
4,1981-01-05,15.8


In [13]:
## 문자열을 Datetime으로 변환하기 # Date는 String으로 담아져있음.
df['Date'] = pd.to_datetime(df['Date'],format='%Y-%m-%d') # XXXX년도 표시는 %Y, XX년도 표시는 %y

In [3]:
## 월요일인 데이터 조회
df[df['Date'].dt.dayofweek == 0] # 0은 첫번째 주를 기준으로 '월요일' 기준만을 출력
## 또는 df.query('Date.dt.dayofweek == 0') 

Unnamed: 0,Date,Temp
4,1981-01-05,15.8
11,1981-01-12,13.3
18,1981-01-19,17.7
25,1981-01-26,18.7
32,1981-02-02,18.8
...,...,...
3621,1990-12-03,16.2
3628,1990-12-10,11.0
3635,1990-12-17,13.9
3642,1990-12-24,10.0


In [15]:
## 월, 수, 금에 해당하는 데이터 조회
dayofweek = [0,2,4]
df[df['Date'].dt.dayofweek.isin(dayofweek)] # isin()
## 또는 df.query('Date.dt.dayofweek in @dayofweek')

Unnamed: 0,Date,Temp
1,1981-01-02,17.9
4,1981-01-05,15.8
6,1981-01-07,15.8
8,1981-01-09,21.8
11,1981-01-12,13.3
...,...,...
3639,1990-12-21,13.1
3642,1990-12-24,10.0
3644,1990-12-26,14.6
3646,1990-12-28,13.6


## - 특정 날짜에 해당하는 데이터 조회하기

In [5]:
## 특정 날짜
target_date = '1981-01-02'
df[df['Date'] == target_date]
## 또는 df.query('Date == @target_date') 

Unnamed: 0,Date,Temp
1,1981-01-02,17.9


## - 특정 연도에 해당하는 데이터 조회하기

In [6]:
target_year = 1990 # 1990년
df[df['Date'].dt.year == target_year] # 1년치를 필터링해줌.
## 또는 df.query('Date.dt.year == @target_year') 

Unnamed: 0,Date,Temp
3285,1990-01-01,14.8
3286,1990-01-02,13.3
3287,1990-01-03,15.6
3288,1990-01-04,14.5
3289,1990-01-05,14.3
...,...,...
3645,1990-12-27,14.0
3646,1990-12-28,13.6
3647,1990-12-29,13.5
3648,1990-12-30,15.7


In [7]:
# 특정 월, 일에 해당하는 데이터 조회
target_month = 9 # 9월
df[df['Date'].dt.month==target_month]
## 또는 df.query('Date.dt.month == @target_month') 
 
target_day = 13 # 13일
df[df['Date'].dt.day==target_day]
## 또는 df.query('Date.dt.day == @target_day') 

Unnamed: 0,Date,Temp
12,1981-01-13,16.7
43,1981-02-13,18.3
71,1981-03-13,11.8
102,1981-04-13,13.5
132,1981-05-13,5.3
...,...,...
3509,1990-08-13,7.8
3540,1990-09-13,9.8
3570,1990-10-13,7.5
3601,1990-11-13,13.8


## -  특정 날짜 범위에 해당하는 데이터 조회하기

In [8]:
# 1981년 1월 1일부터 1981년 1월 4일까지 데이터 조회
df[(df['Date']>='1981-01-01') & (df['Date']<='1981-01-04')]
## 또는 df.query('"1981-01-01"<= Date <= "1981-01-04"') 

Unnamed: 0,Date,Temp
0,1981-01-01,20.7
1,1981-01-02,17.9
2,1981-01-03,18.8
3,1981-01-04,14.6


In [9]:
# 1987년부터 1989년까지의 데이터 조회
df[(df['Date'].dt.year >= 1987) & (df['Date'].dt.year <= 1989)]
## 또는 df.query('1987 <= Date.dt.year <= 1989') 

Unnamed: 0,Date,Temp
2190,1987-01-01,12.3
2191,1987-01-02,13.8
2192,1987-01-03,15.3
2193,1987-01-04,15.6
2194,1987-01-05,16.2
...,...,...
3280,1989-12-27,13.3
3281,1989-12-28,11.7
3282,1989-12-29,10.4
3283,1989-12-30,14.4


## - 그룹화 하기

In [10]:
## 연도별로 그룹화하기
df['Year'] = df['Date'].dt.year
df.groupby('Year')['Temp'].aggregate(['max','min','mean']).reset_index()

Unnamed: 0,Year,max,min,mean
0,1981,25.0,2.1,11.51726
1,1982,26.3,0.0,10.783562
2,1983,22.5,0.0,11.187397
3,1984,24.3,0.1,10.591781
4,1985,22.4,0.3,11.137534
5,1986,21.4,0.8,10.803288
6,1987,24.1,1.5,10.853151
7,1988,23.9,2.8,11.972055
8,1989,22.0,0.5,11.261918
9,1990,22.1,2.1,11.669589


In [11]:
## 요일별로 그룹화하기
num_to_day = {
    0 : '월요일',
    1 : '화요일',
    2 : '수요일',
    3 : '목요일',
    4 : '금요일',
    5 : '토요일',
    6 : '일요일',
}
 
df['Day'] = [num_to_day[k] for k in df['Date'].dt.dayofweek] ## 요일 칼럼
df.groupby('Day')['Temp'].aggregate(['max','min','mean']).reset_index()


Unnamed: 0,Day,max,min,mean
0,금요일,23.9,0.7,11.161877
1,목요일,25.0,0.9,11.19272
2,수요일,25.2,0.3,11.33762
3,월요일,26.3,0.7,11.156238
4,일요일,24.8,0.0,11.028544
5,토요일,23.4,0.0,11.114587
6,화요일,22.5,0.2,11.252975
