In [2]:
import sys
sys.path.append('..')

import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.compose import ColumnTransformer
from util.preprocessing import parse_num_of_people, extract_month, extract_facility, extract_ratio, extract_population, extract_cost, calc_damage_scale, extract_middle_class, str_to_median, count_days
from util.preprocessing2 import extract_sago#, extract_date, is_noramal_temper, is_normal_humid, get_temper, get_humid
from imblearn.over_sampling import SMOTE, RandomOverSampler
from imblearn.under_sampling import OneSidedSelection, EditedNearestNeighbours
import re
from dateutil import parser

def preprocess_data():
    df = pd.read_csv('../data/output-v2.csv')
    #필요 없는 특성 제거

    allColumns = df.columns
    params = ['발생일시','공공/민간 구분', '기상상태', '시설물 종류', '사망자수(명)', '부상자수(명)', '공사비', '공사기간', '공정률', '작업자수', '설계안전성검토', '공종', '사고신고사유']

    df = df.drop(allColumns.drop(params), axis=1)

    df = df.dropna()

    #범주형 데이터를 수치형 데이터로 인코딩
    df['공종'] = df['공종'].apply(extract_middle_class)
    df['사망자수(명)'] = df['사망자수(명)'].apply(parse_num_of_people)
    df['부상자수(명)'] = df['부상자수(명)'].apply(parse_num_of_people)
    #df['사고발생월'] = df['발생일시'].apply(extract_month)
    df['시설물 종류'] = df['시설물 종류'].apply(extract_facility)
    df['공사기간'] = df['공사기간'].apply(count_days)
    df['공정률'] = df['공정률'].apply(str_to_median)
    df['작업자수'] = df['작업자수'].apply(extract_population)
    df['공사비'] = df['공사비'].apply(extract_cost)
    df['피해규모'] = df.apply(calc_damage_scale, axis=1)
    df['발생일시'] = df['발생일시'].apply(extract_month)
    
    # 기상 상태 컬럼 분리
    df[['날씨', '기온', '습도']] = df['기상상태'].str.extract('날씨 : (\S+)기온 : (\d+)℃습도 : (\d+)%')
    df = df.drop(['기상상태'], axis=1)
    '''
    # SOYEON
    # 기온, 습도 결측치 처리
    df[['기온', '습도']].fillna(-999)
    df[['기온', '습도']] = df[['기온', '습도']].astype('float64')
    df['습도'] = df['습도'].apply(lambda x: x/100)
    if df['기온'].apply(is_normal_temper) == False: 
        df['기온'] = df['발생일시'].apply(get_temper)
    if df['습도'].apply(is_normal_humid) == False:
        df['습도'] = df['발생일시'].apply(get_humid)
    '''
    # SOYEON
    # 사고신고사유 열 추가
    df['사망사고', '부상사고', '재산피해', '기타'] = df['사고신고사유'].apply(extract_sago)
    df = df.drop(['사고신고사유'], axis=1)

    
    print(df)
    
preprocess_data()

       발생일시 공공/민간 구분   시설물 종류        공종  사망자수(명)  부상자수(명)           공사비   
0         4       민간      건축   건축물 부대공사      0.0      1.0  1.500000e+09  \
1         4       민간      건축   건축물 부대공사      0.0      1.0  7.500000e+09   
2         4       공공      토목        관공사      0.0      1.0  1.750000e+10   
3         4       공공      건축   철근콘크리트공사      0.0      1.0  1.250000e+10   
4         4       공공  산업환경설비     기계설비공사      0.0      1.0           NaN   
...     ...      ...      ...       ...      ...      ...           ...   
17788     7       민간      건축     전기설비공사      0.0      1.0  1.500000e+09   
17789     7       공공      토목       가설공사      0.0      1.0  7.500000e+08   
17790     7       민간      건축       가설공사      0.0      1.0  1.750000e+10   
17791     7       민간      건축         기타      0.0      1.0  1.500000e+09   
17792     1       민간      건축       가설공사      0.0      1.0  3.500000e+09   

         공사기간    공정률  작업자수 설계안전성검토  피해규모  날씨   기온  습도 (사망사고, 부상사고, 재산피해, 기타)  
0      1171.0  0.950

In [None]:
str = "시설물 종류_건축          
시설물 종류_산업환경설비      
시설물 종류_조경          
시설물 종류_토목          
공공/민간 구분_공공        
공공/민간 구분_민간        
날씨_강설              
날씨_강우              
날씨_강풍              
날씨_맑음              
날씨_안개              
날씨_흐림              
공종_가설공사            
공종_강구조물공사          
공종_건축 토공사          
공종_건축물 부대공사        
공종_관공사             
공종_관공사 부대공사        
공종_교량공사            
공종_금속공사            
공종_기계설비공사          
공종_기타              
공종_댐 및 제방공사        
공종_도로 및 포장공사       
공종_도장공사            
공종_말뚝공사            
공종_목공사             
공종_미장공사            
공종_방수공사            
공종_산업설비공사          
공종_수장공사            
공종_전기설비공사          
공종_조경공사            
공종_조적공사            
공종_지반개량공사          
공종_지반조사            
공종_지붕 및 홈통공사       
공종_지정공사            
공종_창호 및 유리공사       
공종_철골공사            
공종_철근콘크리트공사        
공종_철도 및 궤도공사       
공종_타일 및 돌공사        
공종_터널공사            
공종_토공사             
공종_통신설비공사          
공종_특수 건축물공사        
공종_프리캐스트 콘크리트공사    
공종_하천공사            
공종_항만공사            
공종_해체 및 철거공사       
발생일시               
공사비                
공사기간               
공정률                
작업자수               
설계안전성검토            
기온                 
습도  "

In [4]:
import sys
sys.path.append('..')

import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.compose import ColumnTransformer
from util.preprocessing import parse_num_of_people, extract_month, extract_facility, extract_ratio, extract_population, extract_cost, calc_damage_scale, extract_middle_class, str_to_median, count_days
from util.preprocessing2 import extract_sago, extract_yyyymmdd, is_normal_temper, is_normal_humid, get_temper, get_humid
from imblearn.over_sampling import SMOTE, RandomOverSampler
from imblearn.under_sampling import OneSidedSelection, EditedNearestNeighbours
import re
from dateutil import parser

def preprocess_data():
    df = pd.read_csv('../data/output-v2.csv')
    
    #필요 없는 특성 제거
    allColumns = df.columns
    params = ['발생일시','공공/민간 구분', '기상상태', '시설물 종류', '사망자수(명)', '부상자수(명)', '공사비', '공사기간', '공정률', '작업자수', '설계안전성검토', '공종', '사고신고사유']
    df = df.drop(allColumns.drop(params), axis=1)

    df = df.dropna()

    #범주형 데이터를 수치형 데이터로 인코딩
    df['공종'] = df['공종'].apply(extract_middle_class)
    df['사망자수(명)'] = df['사망자수(명)'].apply(parse_num_of_people)
    df['부상자수(명)'] = df['부상자수(명)'].apply(parse_num_of_people)
    df['사고발생월'] = df['발생일시'].apply(extract_month)
    df['시설물 종류'] = df['시설물 종류'].apply(extract_facility)
    df['공사기간'] = df['공사기간'].apply(count_days)
    df['공정률'] = df['공정률'].apply(str_to_median)
    df['작업자수'] = df['작업자수'].apply(extract_population)
    df['공사비'] = df['공사비'].apply(extract_cost)
    df['피해규모'] = df.apply(calc_damage_scale, axis=1)
    df['발생일시'] = df['발생일시'].apply(extract_yyyymmdd)
    
    total = df['사망자수(명)'].count() + df['부상자수(명)'].count()
    df2 = df.groupby(['공종']).count()
    df2['사망빈도'] = df.groupby(['공종'])['사망자수(명)'].count()/total *100
    df2['부상빈도'] = df.groupby(['공종'])['부상자수(명)'].count()/total *100
    print(df.groupby(['공종']).count())
    

preprocess_data()

              발생일시  공공/민간 구분  기상상태  시설물 종류  사망자수(명)  부상자수(명)  사고신고사유   공사비   
공종                                                                           
가설공사          1938      1938  1938    1938     1938     1938    1938  1710  \
강구조물공사          34        34    34      34       34       34      34    29   
건축 토공사         444       444   444     444      444      444     444   399   
건축물 부대공사       417       417   417     417      417      417     417   332   
관공사            434       434   434     434      434      434     434   407   
관공사 부대공사       144       144   144     144      144      144     144   131   
교량공사           271       271   271     271      271      271     271   239   
금속공사           184       184   184     184      184      184     184   164   
기계설비공사         720       720   720     720      720      720     720   562   
기타            1787      1787  1787    1787     1787     1787    1787  1342   
댐 및 제방공사        13        13    13      13       13       13    

In [24]:
def extract_yyyymmdd(s):
    date = s.split()[0]
    list =  date.split('-')
    return int(list[0]+list[1]+list[2])
extract_yyyymmdd('2023-04-17 오후 02:00')

20230417

In [15]:
import sys
sys.path.append('..')

import pandas as pd
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.compose import ColumnTransformer
from util.preprocessing import extract_month
from util.preprocessing2 import get_temper, get_humid, extract_cost1, extract_yyyymmdd
import re
from dateutil import parser

def preprocess_data2():
    df = pd.read_csv('../data/baccident_data.csv', encoding = 'cp949')
    
    #필요 없는 특성 제거
    allColumns = df.columns
    #{사고데이터:비사고데이터} = {'발생일시':'일자','공공/민간 구분':'발주자구분','기상상태':일자를통해기상청에서불러오기,'공종':'공종','사망자수(명)':0,'부상자수(명)':0,'공사비':'공사비','공사기간':'총공사일수'}
    params = ['일자', '발주자구분', '공종', '공사비', '총공사일수']
    df = df.drop(allColumns.drop(params), axis=1)

    df = df.dropna()
    
    #범주형 데이터를 수치형 데이터로 인코딩
    df['사고발생월'] = df['일자'].apply(extract_month)
    df['일자'] = df['일자'].apply(extract_yyyymmdd)
    
    # 기온, 습도 기상청에서 불러오기
    df['기온'] = df['일자'].apply(get_temper)
    df['습도'] = df['일자'].apply(get_humid)
    
    print(df)
    
preprocess_data2()

ConnectionError: HTTPConnectionPool(host='apis.data.go.kr', port=80): Max retries exceeded with url: /1360000/AsosDalyInfoService/getWthrDataList?serviceKey=Fr9wFe%2FlwpNUNCFDyb4c74NiogVnhbSPOn4VixALepK1XaBViv2tOKOjrbTArthJoToqj0KuLzn4w4TVj%2FAqJQ%3D%3D&pageNo=1&numOfRows=10&dataType=JSON&dataCd=ASOS&dateCd=DAY&startDt=20200205&endDt=20200206&stnIds=108 (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7faaea6e1be0>: Failed to establish a new connection: [Errno 61] Connection refused'))

In [6]:
import requests
import json

serviceKey = "Fr9wFe/lwpNUNCFDyb4c74NiogVnhbSPOn4VixALepK1XaBViv2tOKOjrbTArthJoToqj0KuLzn4w4TVj/AqJQ=="
url = 'http://apis.data.go.kr/1360000/AsosDalyInfoService/getWthrDataList'
params ={'serviceKey' : serviceKey, 'pageNo' : '1', 'numOfRows' : '10', 'dataType' : 'JSON', 'dataCd' : 'ASOS', 'dateCd' : 'DAY', 'startDt' : '20100101', 'endDt' : '20100601', 'stnIds' : '108' }
def get_humid(yyyymmdd):
    params['startDt'] = yyyymmdd 
    params['endDt'] = yyyymmdd+1
    response = requests.get(url, params=params)
    jsondata = json.loads(response.content)

    for item in jsondata['response']['body']['items']['item']:
        return float(item['avgRhm'])  
    
get_humid(20230417)

59.0

In [14]:
import sys
sys.path.append('..')

import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.compose import ColumnTransformer
from util.preprocessing import extract_month
from util.preprocessing2 import get_temper, get_humid, extract_cost, extract_yyyymmdd
import re
from dateutil import parser

def preprocess_data2():
    df = pd.read_csv('../data/baccident_data.csv', encoding = 'cp949').head(20)
    
    #필요 없는 특성 제거
    allColumns = df.columns
    #{사고데이터:비사고데이터} = {'발생일시':'일자','공공/민간 구분':'발주자구분','기상상태':일자를통해기상청에서불러오기,'공종':'공종','사망자수(명)':0,'부상자수(명)':0,'공사비':'공사비','공사기간':'총공사일수'}
    params = ['일자', '발주자구분', '공종', '공사비', '총공사일수']
    df = df.drop(allColumns.drop(params), axis=1)

    df = df.dropna()

    #범주형 데이터를 수치형 데이터로 인코딩
    df['사고발생월'] = df['일자'].apply(extract_month)
    df['공사비'] = df['공사비'].apply(extract_cost)
    df['일자'] = df['일자'].apply(extract_yyyymmdd)
    
    # 기온, 습도 기상청에서 불러오기
    df['기온'] = df['일자'].apply(get_temper)
    df['습도'] = df['일자'].apply(get_humid)
    
    # '사망자수(명)','부상자수(명)' 추가
    df['사망자수(명)'] = 0
    df['부상자수(명)'] = 0
    
    print(df)

preprocess_data2()

ImportError: cannot import name 'extract_cost' from 'util.preprocessing2' (/Users/soyeon/Git/accident-data/cleansing/../util/preprocessing2.py)

In [8]:
## 기상청 데이터 불러오기
import requests
import json
import pandas as pd

import sys
sys.path.append('..')
from util.preprocessing2 import extract_yyyymmdd

df = pd.read_csv('../data/baccident_data.csv', encoding = 'cp949').head()
allColumns = df.columns
params = ['일자']
df = df.drop(allColumns.drop(params), axis=1)
df['일자'] = df['일자'].apply(extract_yyyymmdd)

serviceKey = "Fr9wFe/lwpNUNCFDyb4c74NiogVnhbSPOn4VixALepK1XaBViv2tOKOjrbTArthJoToqj0KuLzn4w4TVj/AqJQ=="
url = 'http://apis.data.go.kr/1360000/AsosDalyInfoService/getWthrDataList'
params ={'serviceKey' : serviceKey, 'pageNo' : '1', 'numOfRows' : '10', 'dataType' : 'JSON', 'dataCd' : 'ASOS', 'dateCd' : 'DAY', 'startDt' : '20100101', 'endDt' : '20100601', 'stnIds' : '108' }

# 해당 날짜의 평균 기온를 반환하는 함수
def get_temper(yyyymmdd):
    params['startDt'] = yyyymmdd 
    params['endDt'] = yyyymmdd+1
    try:
        response = requests.get(url, params=params)
        jsondata = json.loads(response.content)

        for item in jsondata['response']['body']['items']['item']:
            return float(item['avgTa'])
    except ValueError:
        return 0.0
    except KeyError:
        return None
    
# 해당 날짜의 평균 기온를 반환하는 함수
def get_humid(yyyymmdd):
    params['startDt'] = yyyymmdd 
    params['endDt'] = yyyymmdd+1
    try:
        response = requests.get(url, params=params)
        jsondata = json.loads(response.content)

        for item in jsondata['response']['body']['items']['item']:
            return float(item['avgRhm'])
    except ValueError:
        return 0.0
    except KeyError:
        return None
    
df['기온'] = df['일자'].apply(get_temper)
df['습도'] = df['일자'].apply(get_humid)

print(df)


         일자   기온    습도
0  20200312  6.8  49.8
1  20200205 -8.3  37.3
2  20200205 -8.3  37.3
3  20200205 -8.3  37.3
4  20200408  9.4  25.5


In [15]:
import pandas as pd
from dateutil import parser

list = ["시설물 종류_건축","시설물 종류_산업환경설비","시설물 종류_조경","시설물 종류_토목",
        "공공/민간 구분_공공","공공/민간 구분_민간",
        "날씨_강설","날씨_강우","날씨_강풍","날씨_맑음","날씨_안개","날씨_흐림",
        "공종_가설공사","공종_강구조물공사","공종_건축 토공사","공종_건축물 부대공사","공종_관공사","공종_관공사 부대공사","공종_교량공사","공종_금속공사","공종_기계설비공사","공종_기타","공종_댐 및 제방공사","공종_도로 및 포장공사","공종_도장공사","공종_말뚝공사","공종_목공사","공종_미장공사","공종_방수공사","공종_산업설비공사","공종_수장공사","공종_전기설비공사","공종_조경공사","공종_조적공사","공종_지반개량공사","공종_지반조사","공종_지붕 및 홈통공사","공종_지정공사","공종_창호 및 유리공사","공종_철골공사","공종_철근콘크리트공사","공종_철도 및 궤도공사","공종_타일 및 돌공사","공종_터널공사","공종_토공사","공종_통신설비공사","공종_특수 건축물공사","공종_프리캐스트 콘크리트공사","공종_하천공사","공종_항만공사","공종_해체 및 철거공사",
        "발생일시","공사비","공사기간","공정률","작업자수","설계안전성검토","기온","습도"]

df = pd.DataFrame({"class": list, "boolean": 0.0})
df =df.set_index("class")

#(1) 공사기간 (yy.mm.dd ~ yy.mm.dd)
start_day = '2020-06-01'
end_day = '2020-08-01'

#(2) 공사기간 계산
start_day = parser.parse(start_day)
end_day = parser.parse(end_day)
dur = (end_day - start_day).days
if (dur <= 0): st.write("공사기간 입력 오류")
df.loc['공사기간'] = dur

#(3) 시설물종류 (건축~)
string = '시설물 종류_'
selected_facility = '건축'
df.loc[string + selected_facility] = 1.0
# if (selected_facility == '건축'): 
#     df.loc['시설물 종류_건축'] = 1.0
# elif (selected_facility == '산업환경설비'):
#     df.loc['시설물 종류_산업환경설비'] = 1.0
# elif (selected_facility == '조경'):
#     df.loc['시설물 종류_조경'] = 1.0
# else: 
#     df.loc['시설물 종류_토목'] = 1.0
    
print(df)

                 boolean
class                   
시설물 종류_건축            1.0
시설물 종류_산업환경설비        0.0
시설물 종류_조경            0.0
시설물 종류_토목            0.0
공공/민간 구분_공공          0.0
공공/민간 구분_민간          0.0
날씨_강설                0.0
날씨_강우                0.0
날씨_강풍                0.0
날씨_맑음                0.0
날씨_안개                0.0
날씨_흐림                0.0
공종_가설공사              0.0
공종_강구조물공사            0.0
공종_건축 토공사            0.0
공종_건축물 부대공사          0.0
공종_관공사               0.0
공종_관공사 부대공사          0.0
공종_교량공사              0.0
공종_금속공사              0.0
공종_기계설비공사            0.0
공종_기타                0.0
공종_댐 및 제방공사          0.0
공종_도로 및 포장공사         0.0
공종_도장공사              0.0
공종_말뚝공사              0.0
공종_목공사               0.0
공종_미장공사              0.0
공종_방수공사              0.0
공종_산업설비공사            0.0
공종_수장공사              0.0
공종_전기설비공사            0.0
공종_조경공사              0.0
공종_조적공사              0.0
공종_지반개량공사            0.0
공종_지반조사              0.0
공종_지붕 및 홈통공사         0.0
공종_지정공사              0.0


In [10]:
import pandas as pd
from dateutil import parser

list = ["시설물 종류_건축","시설물 종류_산업환경설비","시설물 종류_조경","시설물 종류_토목",
        "공공/민간 구분_공공","공공/민간 구분_민간",
        "날씨_강설","날씨_강우","날씨_강풍","날씨_맑음","날씨_안개","날씨_흐림",
        "공종_가설공사","공종_강구조물공사","공종_건축 토공사","공종_건축물 부대공사","공종_관공사","공종_관공사 부대공사","공종_교량공사","공종_금속공사","공종_기계설비공사","공종_기타","공종_댐 및 제방공사","공종_도로 및 포장공사","공종_도장공사","공종_말뚝공사","공종_목공사","공종_미장공사","공종_방수공사","공종_산업설비공사","공종_수장공사","공종_전기설비공사","공종_조경공사","공종_조적공사","공종_지반개량공사","공종_지반조사","공종_지붕 및 홈통공사","공종_지정공사","공종_창호 및 유리공사","공종_철골공사","공종_철근콘크리트공사","공종_철도 및 궤도공사","공종_타일 및 돌공사","공종_터널공사","공종_토공사","공종_통신설비공사","공종_특수 건축물공사","공종_프리캐스트 콘크리트공사","공종_하천공사","공종_항만공사","공종_해체 및 철거공사",
        "발생일시","공사비","공사기간","공정률","작업자수","설계안전성검토","기온","습도"]

df = pd.DataFrame({"class": list, "boolean": 0.0})
df =df.set_index("class")

#(1) 공사기간 (yy.mm.dd ~ yy.mm.dd)
start_day = '2020-06-01'
end_day = '2020-08-01'

#(2) 공사기간 계산
start_day = parser.parse(start_day)
end_day = parser.parse(end_day)
dur = (end_day - start_day).days
df.loc['공사기간'] = dur

#(3) 시설물종류 (건축~)
string = '시설물 종류_'
selected_facility = '건축'
df.loc[string + selected_facility] = 1.0
    
#(4) 공정률 (~%)
percent = 65
if percent:
    df.loc['공정률'] = float(percent)
else:
    df.loc['공정률'] = None 
    
#(6),(5) 공종 (철근콘크리트~)
selected_category = '가설공사'
string = '공종_'
df.loc[string + selected_category] = 1.0

#(7) 설계안전성검토 (대상,비대상)
selected_safety = "대상"
if (selected_safety == "대상"):
    df.loc['설계안전성검토'] = 1.0

#(8) 시설관리공사 (공공,민간)
selected_company = "공공"
if (selected_company == "공공"):
    df.loc['시설관리공사'] = 1.0

#(9) 공사비 (~원)
cost = 10
df.loc['공사비'] = float(cost)

#(10) 작업자수 (~명)
person = 1000
df.loc['작업자수'] = float(person)

print(df)

                 boolean
class                   
시설물 종류_건축            1.0
시설물 종류_산업환경설비        0.0
시설물 종류_조경            0.0
시설물 종류_토목            0.0
공공/민간 구분_공공          0.0
공공/민간 구분_민간          0.0
날씨_강설                0.0
날씨_강우                0.0
날씨_강풍                0.0
날씨_맑음                0.0
날씨_안개                0.0
날씨_흐림                0.0
공종_가설공사              1.0
공종_강구조물공사            0.0
공종_건축 토공사            0.0
공종_건축물 부대공사          0.0
공종_관공사               0.0
공종_관공사 부대공사          0.0
공종_교량공사              0.0
공종_금속공사              0.0
공종_기계설비공사            0.0
공종_기타                0.0
공종_댐 및 제방공사          0.0
공종_도로 및 포장공사         0.0
공종_도장공사              0.0
공종_말뚝공사              0.0
공종_목공사               0.0
공종_미장공사              0.0
공종_방수공사              0.0
공종_산업설비공사            0.0
공종_수장공사              0.0
공종_전기설비공사            0.0
공종_조경공사              0.0
공종_조적공사              0.0
공종_지반개량공사            0.0
공종_지반조사              0.0
공종_지붕 및 홈통공사         0.0
공종_지정공사              0.0


In [7]:
def extract_yyyymmdd(s):
    date = str(s.split()[0])
    list =  date.split('-')
    return int(list[0]+list[1]+list[2])
import datetime

dt_now = datetime.datetime.now()
date = dt_now.date().strftime('%Y-%m-%d') #2020-09-02 
date = int(extract_yyyymmdd(date))
print(date)

# 기상청 데이터 연결
import requests
import json
serviceKey = "NminqLTNuSX5OFbyRamiOBFhuUBormib7/IeKYFKpWn1iXnxa1PEQ5IZAfJWebf8nOOb2FplMo5tdutaV6kUxQ=="
url = 'http://apis.data.go.kr/1360000/VilageFcstInfoService_2.0'
params ={'serviceKey' : serviceKey, 'pageNo' : '1', 'numOfRows' : '10', 'dataType' : 'JSON', 'dataCd' : 'ASOS', 'dateCd' : 'DAY', 'startDt' : '20100101', 'endDt' : '20100601', 'stnIds' : '108' }
# 해당 날짜의 평균 기온를 반환하는 함수
def get_temper(yyyymmdd):
    params['startDt'] = yyyymmdd
    params['endDt'] = yyyymmdd+1
    try:
        response = requests.get(url, params=params)
        jsondata = json.loads(response.content)

        for item in jsondata['response']['body']['items']['item']:
            return float(item['avgTa'])
    except ValueError:
        return 0.0
    except KeyError:
        return None
    
# 해당 날짜의 평균 기온를 반환하는 함수
def get_humid(yyyymmdd):
    params['startDt'] = yyyymmdd 
    params['endDt'] = yyyymmdd+1
    try:
        response = requests.get(url, params=params)
        jsondata = json.loads(response.content)

        for item in jsondata['response']['body']['items']['item']:
            return float(item['avgRhm'])
    except ValueError:
        return 0.0
    except KeyError:
        return None 
    
df.loc['기온'] = get_temper(date)
df.loc['습도'] = get_humid(date)

print(df)

20230608
                 boolean
class                   
시설물 종류_건축            1.0
시설물 종류_산업환경설비        0.0
시설물 종류_조경            0.0
시설물 종류_토목            0.0
공공/민간 구분_공공          0.0
공공/민간 구분_민간          0.0
날씨_강설                0.0
날씨_강우                0.0
날씨_강풍                0.0
날씨_맑음                0.0
날씨_안개                0.0
날씨_흐림                0.0
공종_가설공사              1.0
공종_강구조물공사            0.0
공종_건축 토공사            0.0
공종_건축물 부대공사          0.0
공종_관공사               0.0
공종_관공사 부대공사          0.0
공종_교량공사              0.0
공종_금속공사              0.0
공종_기계설비공사            0.0
공종_기타                0.0
공종_댐 및 제방공사          0.0
공종_도로 및 포장공사         0.0
공종_도장공사              0.0
공종_말뚝공사              0.0
공종_목공사               0.0
공종_미장공사              0.0
공종_방수공사              0.0
공종_산업설비공사            0.0
공종_수장공사              0.0
공종_전기설비공사            0.0
공종_조경공사              0.0
공종_조적공사              0.0
공종_지반개량공사            0.0
공종_지반조사              0.0
공종_지붕 및 홈통공사         0.0
공종_지정공사         

In [4]:
date = '20230607'
time = '0700' #0700

# 기상청 데이터 연결 "기상청_단기예보 ((구)_동네예보) 조회서비스"
import requests
import json
serviceKey = "NminqLTNuSX5OFbyRamiOBFhuUBormib7/IeKYFKpWn1iXnxa1PEQ5IZAfJWebf8nOOb2FplMo5tdutaV6kUxQ=="
url = 'http://apis.data.go.kr/1360000/VilageFcstInfoService_2.0'
params ={'serviceKey' : serviceKey, 'pageNo' : '1', 'numOfRows' : '1000', 'dataType' : 'JSON', 'base_date' : '20210628', 'base_time' : '0600', 'nx' : '55', 'ny' : '127'}
# 기온 불러오기
def get_temper(date, time):
    params['base_date'] = str(date)
    params['base_time'] = str(time)
    try:
        response = requests.get(url, params=params)
        jsondata = json.loads(response.content)

        for item in jsondata['response']['body']['items']['item']:
            return float(item['T1H'])
    except ValueError:
        return 0.0
    except KeyError: 
        return None
    
    
# 습도 불러오기
def get_humid(date, time):
    params['base_date'] = str(date)
    params['base_time'] = str(time)
    try:
        response = requests.get(url, params=params)
        jsondata = json.loads(response.content)

        for item in jsondata['response']['body']['items']['item']:
            return float(item['REH'])
    except ValueError:
        return 0.0
    except KeyError:
        return None
    
    
# df.loc['기온'] = get_temper(date, time)
# df.loc['습도'] = get_humid(date, time)
print(get_temper(date, time))
print(get_humid(date, time))

0.0
0.0


In [85]:
import requests
import json

serviceKey = "NminqLTNuSX5OFbyRamiOBFhuUBormib7/IeKYFKpWn1iXnxa1PEQ5IZAfJWebf8nOOb2FplMo5tdutaV6kUxQ=="
url = 'http://apis.data.go.kr/1360000/VilageFcstInfoService_2.0'
params = {'serviceKey' : serviceKey, 'pageNo' : '1', 'numOfRows' : '10', 'dataType' : 'JSON', 'base_date' : '20230608', 'base_time' : '0630', 'nx' : '55', 'ny' : '127' }

response = requests.get(url, params=params)
jsondata = json.loads(response.content)

for item in jsondata['response']['body']['items']['item']:
    print(item['REH']) 

JSONDecodeError: Expecting value: line 1 column 1 (char 0)

In [84]:
import requests
import json
from datetime import date, timedelta

# 기상청_동네 예보 조회 서비스 api 데이터 url 주소, 초단기이기때문에 getUltraSrtFcst 사용
url = "https://apis.data.go.kr/1360000/VilageFcstInfoService_2.0/getUltraSrtFcst"
serviceKey = "NminqLTNuSX5OFbyRamiOBFhuUBormib7/IeKYFKpWn1iXnxa1PEQ5IZAfJWebf8nOOb2FplMo5tdutaV6kUxQ==" # 공공데이터 포털에서 생성된 본인의 서비스 키를 복사 / 붙여넣기

now = datetime.now()
today = datetime.today().strftime("%Y%m%d")
y = date.today() - timedelta(days=1)
yesterday = y.strftime("%Y%m%d")
nx = 60 # 위도와 경도를 x,y좌표로 변경
ny = 127
    
if now.minute<45: # base_time와 base_date 구하는 함수
    if now.hour==0:
        base_time = "2330"
        base_date = yesterday
    else:
        pre_hour = now.hour-1
        if pre_hour<10:
            base_time = "0" + str(pre_hour) + "30"
        else:
            base_time = str(pre_hour) + "30"
        base_date = today
else:
    if now.hour < 10:
        base_time = "0" + str(now.hour) + "30"
    else:
        base_time = str(now.hour) + "30"
    base_date = today

queryParams = '?' + urlencode({ quote_plus('serviceKey') : serviceKeyDecoded, quote_plus('base_date') : base_date,
                                    quote_plus('base_time') : base_time, quote_plus('nx') : nx, quote_plus('ny') : ny,
                                    quote_plus('dataType') : 'json', quote_plus('numOfRows') : '60'}) #페이지로 안나누고 한번에 받아오기 위해 numOfRows=60으로 설정해주었다
                                   

# 값 요청 (웹 브라우저 서버에서 요청 - url주소와 파라미터)
res = requests.get(url + queryParams, verify=False) # verify=False이거 안 넣으면 에러남ㅜㅜ
items = res.json().get('response').get('body').get('items') #데이터들 아이템에 저장
#print(items)# 테스트

weather_data = dict()

for item in items['item']:
    # 기온
    if item['category'] == 'T1H':
        weather_data['tmp'] = item['fcstValue']
    # 습도
    if item['category'] == 'REH':
        weather_data['hum'] = item['fcstValue']
    # 하늘상태: 맑음(1) 구름많은(3) 흐림(4)
    if item['category'] == 'SKY':
        weather_data['sky'] = item['fcstValue']
    # 1시간 동안 강수량
    if item['category'] == 'RN1':
        weather_data['rain'] = item['fcstValue']

print("response: ", weather_data)

AttributeError: module 'datetime' has no attribute 'now'