### 2023 미세먼지 농도

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [3]:
df_2023 = pd.read_csv('./finedust/일별평균대기오염도_2023.csv', encoding='cp949')
df_2023.head()
df_2023.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 8 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   측정일시          18250 non-null  int64  
 1   측정소명          18250 non-null  object 
 2   이산화질소농도(ppm)  18159 non-null  float64
 3   오존농도(ppm)     18157 non-null  float64
 4   일산화탄소농도(ppm)  17766 non-null  float64
 5   아황산가스농도(ppm)  18029 non-null  float64
 6   미세먼지농도(㎍/㎥)   18137 non-null  float64
 7   초미세먼지농도(㎍/㎥)  18132 non-null  float64
dtypes: float64(6), int64(1), object(1)
memory usage: 1.1+ MB


In [4]:
df_2023.columns

Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스농도(ppm)', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)'],
      dtype='object')

In [5]:
# 미세먼지 데이터 프레임 
fd_2023 = df_2023.loc[:, ['측정일시', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)']]
fd_2023.head()
fd_2023.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 3 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   측정일시          18250 non-null  int64  
 1   미세먼지농도(㎍/㎥)   18137 non-null  float64
 2   초미세먼지농도(㎍/㎥)  18132 non-null  float64
dtypes: float64(2), int64(1)
memory usage: 427.9 KB


In [6]:
# 측정일시를 datetime 형식으로 변환
fd_2023['측정일시'] = fd_2023['측정일시'].astype('str')
fd_2023.info() # 측정일시가 int에서 object로 바뀐것을 확인
fd_2023['측정일시'] = pd.to_datetime(fd_2023['측정일시'])
fd_2023.info() # 측정일시가 object에서 datetime으로 바뀐것을 확인
fd_2023


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 3 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   측정일시          18250 non-null  object 
 1   미세먼지농도(㎍/㎥)   18137 non-null  float64
 2   초미세먼지농도(㎍/㎥)  18132 non-null  float64
dtypes: float64(2), object(1)
memory usage: 427.9+ KB
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 3 columns):
 #   Column        Non-Null Count  Dtype         
---  ------        --------------  -----         
 0   측정일시          18250 non-null  datetime64[ns]
 1   미세먼지농도(㎍/㎥)   18137 non-null  float64       
 2   초미세먼지농도(㎍/㎥)  18132 non-null  float64       
dtypes: datetime64[ns](1), float64(2)
memory usage: 427.9 KB


Unnamed: 0,측정일시,미세먼지농도(㎍/㎥),초미세먼지농도(㎍/㎥)
0,2023-01-01,52.0,36.0
1,2023-01-01,56.0,43.0
2,2023-01-01,51.0,34.0
3,2023-01-01,62.0,38.0
4,2023-01-01,54.0,35.0
...,...,...,...
18245,2023-12-31,25.0,16.0
18246,2023-12-31,26.0,20.0
18247,2023-12-31,23.0,16.0
18248,2023-12-31,19.0,18.0


In [7]:
# 일별 평균 계산
fd_2023 = fd_2023.groupby('측정일시').agg({
    '미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2023.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2023.head(), fd_2023.tail())

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2023-01-01    51.80     43.0     62.0       4.27     36.52      29.0   
2023-01-02    24.82     18.0     34.0       3.37     11.02       5.0   
2023-01-03    29.78     21.0     37.0       3.76     16.18       9.0   
2023-01-04    35.42     22.0     48.0       4.70     22.58      15.0   
2023-01-05    49.32     31.0     66.0       6.08     35.28      24.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2023-01-01      46.0        3.55  
2023-01-02      15.0        2.40  
2023-01-03      22.0        3.13  
2023-01-04      29.0        3.24  
2023-01-05      44.0        4.73               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2023-12-27    75.62     57.0     92.0       8.27     56.66      43.0   
2023-12-28    52.18     35.0     8

### 2022 미세먼지 농도

In [8]:
df_2022 = pd.read_csv('./finedust/일별평균대기오염도_2022.csv', encoding='cp949')
print( df_2022.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스농도(ppm)', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)'],
      dtype='object')


In [9]:
# 미세먼지 데이터 프레임 
fd_2022 = df_2022.loc[:, ['측정일시', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)']]
fd_2022.head()
fd_2022.info()

# 측정일시를 datetime 형식으로 변환
fd_2022['측정일시'] = fd_2022['측정일시'].astype('str')
fd_2022.info() # 측정일시가 int에서 object로 바뀐것을 확인
fd_2022['측정일시'] = pd.to_datetime(fd_2022['측정일시'])
fd_2022.info() # 측정일시가 object에서 datetime으로 바뀐것을 확인
fd_2022


# 일별 평균 계산
fd_2022 = fd_2022.groupby('측정일시').agg({
    '미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2022.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2022.head(1), fd_2022.tail(1))

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 3 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   측정일시          18250 non-null  int64  
 1   미세먼지농도(㎍/㎥)   18115 non-null  float64
 2   초미세먼지농도(㎍/㎥)  18122 non-null  float64
dtypes: float64(2), int64(1)
memory usage: 427.9 KB
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 3 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   측정일시          18250 non-null  object 
 1   미세먼지농도(㎍/㎥)   18115 non-null  float64
 2   초미세먼지농도(㎍/㎥)  18122 non-null  float64
dtypes: float64(2), object(1)
memory usage: 427.9+ KB
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18250 entries, 0 to 18249
Data columns (total 3 columns):
 #   Column        Non-Null Count  Dtype         
---  ------        --------------  -----         
 0   측정일시          18250 non-null  datet

In [10]:
df_2021 = pd.read_csv('./finedust/일별평균대기오염도_2021.csv', encoding='cp949')
print( df_2021.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스농도(ppm)', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)'],
      dtype='object')


In [11]:
# 미세먼지 데이터 프레임 
fd_2021 = df_2021.loc[:, ['측정일시', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2021['측정일시'] = fd_2021['측정일시'].astype('str')
fd_2021['측정일시'] = pd.to_datetime(fd_2021['측정일시'])

# 일별 평균 계산
fd_2021 = fd_2021.groupby('측정일시').agg({
    '미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2021.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2021.head(1), fd_2021.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2021-01-01    25.41     13.0     33.0       4.17      15.9       6.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2021-01-01      23.0        3.01               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2021-12-31     22.9     17.0     33.0       3.48      6.22       3.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2021-12-31      10.0        1.46  


In [12]:
df_2020 = pd.read_csv('./finedust/일별평균대기오염도_2020.csv', encoding='cp949')
print( df_2020.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스농도(ppm)', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)'],
      dtype='object')


In [13]:
# 미세먼지 데이터 프레임 
fd_2020 = df_2020.loc[:, ['측정일시', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2020['측정일시'] = fd_2020['측정일시'].astype('str')
fd_2020['측정일시'] = pd.to_datetime(fd_2020['측정일시'])

# 일별 평균 계산
fd_2020 = fd_2020.groupby('측정일시').agg({
    '미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2020.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2020.head(1), fd_2020.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2020-01-01    34.22     20.0     42.0       4.51     22.68      17.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2020-01-01      30.0        3.26               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2020-12-31    25.58      5.0     35.0       4.98     11.43       3.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2020-12-31      17.0        2.39  


In [14]:
df_2019 = pd.read_csv('./finedust/일별평균대기오염도_2019.csv', encoding='cp949')
print( df_2019.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스농도(ppm)', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)'],
      dtype='object')


In [15]:
# 미세먼지 데이터 프레임 
fd_2019 = df_2019.loc[:, ['측정일시', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2019['측정일시'] = fd_2019['측정일시'].astype('str')
fd_2019['측정일시'] = pd.to_datetime(fd_2019['측정일시'])

# 일별 평균 계산
fd_2019 = fd_2019.groupby('측정일시').agg({
    '미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2019.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2019.head(1), fd_2019.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2019-01-01    37.04     28.0     47.0        4.8     23.89      16.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2019-01-01      30.0         3.7               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2019-12-31    26.62     19.0     59.0       6.06     14.82       8.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2019-12-31      19.0         2.9  


In [16]:
df_2018 = pd.read_csv('./finedust/일별평균대기오염도_2018.csv', encoding='cp949')
print( df_2018.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스농도(ppm)', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)'],
      dtype='object')


In [17]:
# 미세먼지 데이터 프레임 
fd_2018 = df_2018.loc[:, ['측정일시', '미세먼지농도(㎍/㎥)', '초미세먼지농도(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2018['측정일시'] = fd_2018['측정일시'].astype('str')
fd_2018['측정일시'] = pd.to_datetime(fd_2018['측정일시'])

# 일별 평균 계산
fd_2018 = fd_2018.groupby('측정일시').agg({
    '미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지농도(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2018.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2018.head(1), fd_2018.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2018-01-01    44.54     33.0     58.0       6.39     20.24      13.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2018-01-01      28.0        3.14               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2018-12-31     46.5     31.0     62.0       6.67     28.48      17.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2018-12-31      40.0        5.26  


In [18]:
# !pip install openpyxl
import openpyxl

In [19]:
excel = "./finedust/일별평균대기오염도_2017.xlsx"
df_2017 = pd.read_excel(excel)
print( df_2017.columns )
df_2017

Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스(ppm)', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)'],
      dtype='object')


Unnamed: 0,측정일시,측정소명,이산화질소농도(ppm),오존농도(ppm),일산화탄소농도(ppm),아황산가스(ppm),미세먼지(㎍/㎥),초미세먼지(㎍/㎥)
0,20170101,강남구,0.040,0.002,0.8,0.005,80.0,58.0
1,20170101,강남대로,0.082,0.005,1.4,0.007,83.0,58.0
2,20170101,강동구,0.039,0.003,0.8,0.004,80.0,54.0
3,20170101,강변북로,0.042,0.003,0.8,0.004,81.0,
4,20170101,강북구,0.046,0.003,1.0,0.005,78.0,65.0
...,...,...,...,...,...,...,...,...
14230,20171231,천호대로,0.035,0.014,0.5,0.005,71.0,30.0
14231,20171231,청계천로,0.021,0.020,0.4,0.006,58.0,35.0
14232,20171231,한강대로,0.031,0.017,0.5,0.005,69.0,25.0
14233,20171231,홍릉로,0.031,0.016,0.5,0.007,63.0,38.0


In [20]:
# 미세먼지 데이터 프레임 
fd_2017 = df_2017.loc[:, ['측정일시', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2017['측정일시'] = fd_2017['측정일시'].astype('str')
fd_2017['측정일시'] = pd.to_datetime(fd_2017['측정일시'])

# 일별 평균 계산
fd_2017 = fd_2017.groupby('측정일시').agg({
    '미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2017.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2017.head(1), fd_2017.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2017-01-01    80.41     64.0    111.0       9.65     60.09      44.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2017-01-01      88.0       11.03               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2017-12-31    66.08     54.0     87.0       7.59     34.75      20.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2017-12-31      48.0        6.39  


In [21]:
excel = "./finedust/일별평균대기오염도_2016.xlsx"
df_2016 = pd.read_excel(excel)
print( df_2016.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스(ppm)', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)'],
      dtype='object')


In [22]:
# 미세먼지 데이터 프레임 
fd_2016 = df_2016.loc[:, ['측정일시', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2016['측정일시'] = fd_2016['측정일시'].astype('str')
fd_2016['측정일시'] = pd.to_datetime(fd_2016['측정일시'])

# 일별 평균 계산
fd_2016 = fd_2016.groupby('측정일시').agg({
    '미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2016.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2016.head(1), fd_2016.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2016-01-01    70.74     54.0     88.0       9.06     44.18      24.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2016-01-01      65.0        7.75               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2016-12-31    60.41     51.0     83.0        7.2     42.22      30.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2016-12-31      66.0        8.15  


In [23]:
excel = "./finedust/일별평균대기오염도_2015.xlsx"
df_2015 = pd.read_excel(excel)
print( df_2015.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스(ppm)', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)'],
      dtype='object')


In [24]:
# 미세먼지 데이터 프레임 
fd_2015 = df_2015.loc[:, ['측정일시', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2015['측정일시'] = fd_2015['측정일시'].astype('str')
fd_2015['측정일시'] = pd.to_datetime(fd_2015['측정일시'])

# 일별 평균 계산
fd_2015 = fd_2015.groupby('측정일시').agg({
    '미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2015.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2015.head(1), fd_2015.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2015-01-01     65.2     44.0     80.0       7.45      13.2       7.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2015-01-01      21.0        3.78               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2015-12-31    65.95     49.0     88.0      10.21      42.9      25.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2015-12-31      63.0        8.45  


In [25]:
excel = "./finedust/일별평균대기오염도_2014.xlsx"
df_2014 = pd.read_excel(excel)
print( df_2014.columns )


Index(['측정일시', '측정소명', '이산화질소농도(ppm)', '오존농도(ppm)', '일산화탄소농도(ppm)',
       '아황산가스(ppm)', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)'],
      dtype='object')


In [26]:
# 미세먼지 데이터 프레임 
fd_2014 = df_2014.loc[:, ['측정일시', '미세먼지(㎍/㎥)', '초미세먼지(㎍/㎥)']]

# 측정일시를 datetime 형식으로 변환
fd_2014['측정일시'] = fd_2014['측정일시'].astype('str')
fd_2014['측정일시'] = pd.to_datetime(fd_2014['측정일시'])

# 일별 평균 계산
fd_2014 = fd_2014.groupby('측정일시').agg({
    '미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std'],
    '초미세먼지(㎍/㎥)': ['mean', 'min', 'max', 'std']
}).round(2)

# 인덱스 이름과 컬럼 이름을 보기 좋게 설정
fd_2014.columns = ['미세먼지_평균', '미세먼지_최소', '미세먼지_최대', '미세먼지_표준편차',
                        '초미세먼지_평균', '초미세먼지_최소', '초미세먼지_최대', '초미세먼지_표준편차']

print(fd_2014.head(1), fd_2014.tail(1))

            미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2014-01-01   116.75     96.0    142.0       8.14     26.98      21.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2014-01-01      53.0        6.28               미세먼지_평균  미세먼지_최소  미세먼지_최대  미세먼지_표준편차  초미세먼지_평균  초미세먼지_최소  \
측정일시                                                                   
2014-12-31    39.95     30.0     54.0       5.88     17.25      12.0   

            초미세먼지_최대  초미세먼지_표준편차  
측정일시                              
2014-12-31      25.0        3.37  


In [27]:
total_fd = pd.concat([fd_2014, fd_2015, fd_2016, fd_2017, fd_2018, fd_2019, fd_2020, 
                      fd_2021, fd_2022, fd_2023])
total_fd

Unnamed: 0_level_0,미세먼지_평균,미세먼지_최소,미세먼지_최대,미세먼지_표준편차,초미세먼지_평균,초미세먼지_최소,초미세먼지_최대,초미세먼지_표준편차
측정일시,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2014-01-01,116.75,96.0,142.0,8.14,26.98,21.0,53.0,6.28
2014-01-02,55.08,43.0,77.0,7.51,21.15,15.0,30.0,4.31
2014-01-03,61.85,52.0,78.0,6.42,28.15,19.0,41.0,5.47
2014-01-04,47.75,39.0,64.0,6.65,22.50,15.0,36.0,4.53
2014-01-05,45.30,36.0,68.0,6.03,23.78,18.0,34.0,4.05
...,...,...,...,...,...,...,...,...
2023-12-27,75.62,57.0,92.0,8.27,56.66,43.0,70.0,6.70
2023-12-28,52.18,35.0,87.0,7.62,40.28,27.0,67.0,6.11
2023-12-29,42.40,27.0,49.0,3.74,32.08,20.0,37.0,3.28
2023-12-30,39.18,26.0,50.0,5.89,30.90,19.0,40.0,5.09


In [42]:
total_fd.shape
# total_fd.to_csv('./wt_data/fd_14_23.csv') #- 데이터 프레임을 csv로 저장
total_fd.info()

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 3652 entries, 2014-01-01 to 2023-12-31
Data columns (total 8 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   미세먼지_평균     3652 non-null   float64
 1   미세먼지_최소     3652 non-null   float64
 2   미세먼지_최대     3652 non-null   float64
 3   미세먼지_표준편차   3652 non-null   float64
 4   초미세먼지_평균    3652 non-null   float64
 5   초미세먼지_최소    3652 non-null   float64
 6   초미세먼지_최대    3652 non-null   float64
 7   초미세먼지_표준편차  3652 non-null   float64
dtypes: float64(8)
memory usage: 256.8 KB


## 2024

In [28]:
import requests

service_key = "YgC6RL7Xuzrbvz7msHuvRG0JZ+JxR0E6iUI4qrJNk78+5FdBneHQ8wktN9kjkpfJFCUeVtCuvThmYWikuonEuA=="
# 디코딩 인증키

url = 'http://apis.data.go.kr/B552584/ArpltnStatsSvc/getMsrstnAcctoRDyrg'
params ={'serviceKey' : service_key, 'returnType' : 'JSON', 'numOfRows' : '100000', 'pageNo' : '1', 'inqBginDt' : '20240101', 'inqEndDt' : '20241031'}

response = requests.get(url, params=params)
print(response.content)

b'{"response":{"body":{"totalCount":99311,"items":[{"msurDt":"2024-06-01","so2Value":".002","coValue":".2","msrstnName":"\xec\xa7\x80\xec\xa0\x95\xeb\xa9\xb4","pm10Value":"19","no2Value":".005","o3Value":".054","pm25Value":"14"},{"msurDt":"2024-06-01","so2Value":".003","coValue":".2","msrstnName":"\xec\xb0\xbd\xeb\x85\x95\xec\x9d\x8d","pm10Value":"20","no2Value":".016","o3Value":".054","pm25Value":"14"},{"msurDt":"2024-06-01","so2Value":".002","coValue":".4","msrstnName":"\xea\xb3\xb5\xeb\x8b\xa8\xeb\x8f\x99","pm10Value":"18","no2Value":".007","o3Value":".049","pm25Value":"8"},{"msurDt":"2024-06-01","so2Value":".001","coValue":".3","msrstnName":"\xec\x96\x91\xed\x8f\x89\xec\x9d\x8d","pm10Value":"22","no2Value":".006","o3Value":".053","pm25Value":"11"},{"msurDt":"2024-06-01","so2Value":".001","coValue":".4","msrstnName":"\xeb\xb3\xb4\xeb\xa0\xb9\xed\x95\xad","pm10Value":"44","no2Value":".007","o3Value":".053","pm25Value":"23"},{"msurDt":"2024-06-01","so2Value":".001","coValue":".4","msr

In [29]:
# binary 텍스트를 text 포멧으로 변환하는 작업

dedcoded_response_content = response.content.decode('utf-8')
dedcoded_response_content

'{"response":{"body":{"totalCount":99311,"items":[{"msurDt":"2024-06-01","so2Value":".002","coValue":".2","msrstnName":"지정면","pm10Value":"19","no2Value":".005","o3Value":".054","pm25Value":"14"},{"msurDt":"2024-06-01","so2Value":".003","coValue":".2","msrstnName":"창녕읍","pm10Value":"20","no2Value":".016","o3Value":".054","pm25Value":"14"},{"msurDt":"2024-06-01","so2Value":".002","coValue":".4","msrstnName":"공단동","pm10Value":"18","no2Value":".007","o3Value":".049","pm25Value":"8"},{"msurDt":"2024-06-01","so2Value":".001","coValue":".3","msrstnName":"양평읍","pm10Value":"22","no2Value":".006","o3Value":".053","pm25Value":"11"},{"msurDt":"2024-06-01","so2Value":".001","coValue":".4","msrstnName":"보령항","pm10Value":"44","no2Value":".007","o3Value":".053","pm25Value":"23"},{"msurDt":"2024-06-01","so2Value":".001","coValue":".4","msrstnName":"신풍동","pm10Value":"27","no2Value":".007","o3Value":".051","pm25Value":"12"},{"msurDt":"2024-06-01","so2Value":".002","coValue":".3","msrstnName":"광교동","pm10V

In [30]:
import json

# json string -> dict 변환
dict_content = json.loads(dedcoded_response_content)
dict_content

{'response': {'body': {'totalCount': 99311,
   'items': [{'msurDt': '2024-06-01',
     'so2Value': '.002',
     'coValue': '.2',
     'msrstnName': '지정면',
     'pm10Value': '19',
     'no2Value': '.005',
     'o3Value': '.054',
     'pm25Value': '14'},
    {'msurDt': '2024-06-01',
     'so2Value': '.003',
     'coValue': '.2',
     'msrstnName': '창녕읍',
     'pm10Value': '20',
     'no2Value': '.016',
     'o3Value': '.054',
     'pm25Value': '14'},
    {'msurDt': '2024-06-01',
     'so2Value': '.002',
     'coValue': '.4',
     'msrstnName': '공단동',
     'pm10Value': '18',
     'no2Value': '.007',
     'o3Value': '.049',
     'pm25Value': '8'},
    {'msurDt': '2024-06-01',
     'so2Value': '.001',
     'coValue': '.3',
     'msrstnName': '양평읍',
     'pm10Value': '22',
     'no2Value': '.006',
     'o3Value': '.053',
     'pm25Value': '11'},
    {'msurDt': '2024-06-01',
     'so2Value': '.001',
     'coValue': '.4',
     'msrstnName': '보령항',
     'pm10Value': '44',
     'no2Value': '.007

In [31]:
import pandas as pd

# 판다스 데이터프레임으로 변환
df_content = pd.DataFrame(dict_content['response']['body']['items'])
print(df_content.columns)

Index(['msurDt', 'so2Value', 'coValue', 'msrstnName', 'pm10Value', 'no2Value',
       'o3Value', 'pm25Value'],
      dtype='object')


In [32]:
df_content.shape
df_content.head()

Unnamed: 0,msurDt,so2Value,coValue,msrstnName,pm10Value,no2Value,o3Value,pm25Value
0,2024-06-01,0.002,0.2,지정면,19,0.005,0.054,14
1,2024-06-01,0.003,0.2,창녕읍,20,0.016,0.054,14
2,2024-06-01,0.002,0.4,공단동,18,0.007,0.049,8
3,2024-06-01,0.001,0.3,양평읍,22,0.006,0.053,11
4,2024-06-01,0.001,0.4,보령항,44,0.007,0.053,23
