In [1]:
import pandas as pd
import os, sys, time

In [2]:
df = pd.read_excel('FZ_Data/ASOS_All.xlsx', converters={'지점':str, '지면상태(지면상태코드)':str, '현상번호(국내식)':str})

In [3]:
df.dtypes

지점                       object
지점명                      object
일시               datetime64[ns]
기온(°C)                  float64
기온 QC플래그                  int64
강수량(mm)                 float64
강수량 QC플래그               float64
풍속(m/s)                 float64
풍속 QC플래그                  int64
풍향(16방위)                  int64
풍향 QC플래그                  int64
습도(%)                   float64
습도 QC플래그                  int64
증기압(hPa)                float64
이슬점온도(°C)               float64
현지기압(hPa)               float64
현지기압 QC플래그                int64
해면기압(hPa)               float64
해면기압 QC플래그                int64
일조(hr)                  float64
일조 QC플래그                  int64
일사(MJ/m2)               float64
적설(cm)                  float64
3시간신적설(cm)              float64
전운량(10분위)               float64
중하층운량(10분위)             float64
운형(운형약어)                 object
최저운고(100m )             float64
시정(10m)                 float64
지면상태(지면상태코드)             object
현상번호(국내식)                object
지면온도(°C)

In [4]:
df.groupby(['지면상태(지면상태코드)']).size()

지면상태(지면상태코드)
0     1324
1     1066
11     347
12     178
13     619
14      26
15      62
16      52
17     170
18      15
19     213
2       35
3        3
4      734
dtype: int64

In [5]:
df.groupby(['운형(운형약어)']).size()

운형(운형약어)
Ac         133
AcCc         1
AcCi       161
AcCs        10
As         189
AsCi         6
AsCs         3
CbNs         4
CbStNs       2
Cc           1
CcCi         1
Ci        1669
Cs          80
CsCi         3
Cu           5
CuCi         2
CuCs         1
CuNs         2
CuSc         2
Sc        2979
ScAc       146
ScAcCi      30
ScAcCs       2
ScAs      1068
ScAsCs       1
ScCc         1
ScCi       380
ScCs        14
ScNs        64
St         179
StAc         5
StAcCi       1
StAs       138
StCi         5
StNs       981
StSc         3
StScAs       3
StScCi       1
StScNs       1
dtype: int64

In [8]:
interest_columns = ['지점', '지점명', '일시', '기온(°C)', '강수량(mm)', 
       '풍속(m/s)', '풍향(16방위)', '습도(%)', 
       '증기압(hPa)', '이슬점온도(°C)', '현지기압(hPa)', '해면기압(hPa)',
       '일조(hr)', '일사(MJ/m2)', '적설(cm)', '3시간신적설(cm)',
       '전운량(10분위)', '중하층운량(10분위)', '운형(운형약어)', '최저운고(100m )', '시정(10m)',
       '지면상태(지면상태코드)', '현상번호(국내식)', '지면온도(°C)', '5cm 지중온도(°C)',
       '10cm 지중온도(°C)', '20cm 지중온도(°C)', '30cm 지중온도(°C)']

df = df[interest_columns]

KeyError: "['최저운고(100m )', '습도(%)', '3시간신적설(cm)', '시정(10m)', '일사(MJ/m2)', '지점명', '지면상태(지면상태코드)', '현지기압(hPa)', '풍향(16방위)', '적설(cm)', '운형(운형약어)', '풍속(m/s)', '전운량(10분위)', '강수량(mm)', '기온(°C)', '현상번호(국내식)', '해면기압(hPa)', '증기압(hPa)', '일시', '지면온도(°C)', '이슬점온도(°C)', '지점', '중하층운량(10분위)', '일조(hr)'] not in index"

In [6]:
df.rename(columns = {'지점' : 'Office',
                      '지점명' : 'Office_Name',
                      '일시' : 'Date',
                      '기온(°C)': 'Temp', 
                      '강수량(mm)': 'Rain', 
                      '풍속(m/s)': 'WindSpeed', 
                      '풍향(16방위)': 'WindDir',  
                      '습도(%)': 'Moist',
                      '증기압(hPa)': 'hPa', 
                      '이슬점온도(°C)': 'DewTemp', 
                      '현지기압(hPa)': 'CurhPa', 
                      '해면기압(hPa)': 'SeahPa',
                      '일조(hr)': 'Daylight', 
                      '일사(MJ/m2)': 'DaylightMJ', 
                      '적설(cm)': 'SnowCm', 
                      '3시간신적설(cm)': 'Snow3hr',
                      '전운량(10분위)': 'Clouds_10', 
                      '중하층운량(10분위)': 'MClouds_10',                      
                      '운형(운형약어)' : 'CloudDesigns_Abb',                     
                      '최저운고(100m )': 'HClouds_100m', 
                      '시정(10m)': 'Visibility_10m', 
                      '지면상태(지면상태코드)': 'GroundState_Code',
                      '현상번호(국내식)': 'PhenomenaNo',
                      '지면온도(°C)': 'SurfaceTemp'
                     }, inplace=True)

In [7]:
df.columns

Index(['Office', 'Office_Name', 'Date', 'Temp', '기온 QC플래그', 'Rain',
       '강수량 QC플래그', 'WindSpeed', '풍속 QC플래그', 'WindDir', '풍향 QC플래그', 'Moist',
       '습도 QC플래그', 'hPa', 'DewTemp', 'CurhPa', '현지기압 QC플래그', 'SeahPa',
       '해면기압 QC플래그', 'Daylight', '일조 QC플래그', 'DaylightMJ', 'SnowCm', 'Snow3hr',
       'Clouds_10', 'MClouds_10', 'CloudDesigns_Abb', 'HClouds_100m',
       'Visibility_10m', 'GroundState_Code', 'PhenomenaNo', 'SurfaceTemp',
       '지면온도 QC플래그', '5cm 지중온도(°C)', '10cm 지중온도(°C)', '20cm 지중온도(°C)',
       '30cm 지중온도(°C)'],
      dtype='object')