In [1]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
import plotly.express as px
import platform
from datetime import datetime,timedelta


# 운영체제별 한글 폰트 설정
if platform.system() == 'Windows': # Windows 환경 폰트 설정
    plt.rc('font', family='Malgun Gothic')

plt.rc('axes', unicode_minus=False) # 마이너스 폰트 설정


# 글씨 선명하게 출력하는 설정
%config InlineBackend.figure_format = 'retina'




# dataset

In [2]:
df_1 = pd.read_csv('data/국립자연휴양림 예약 정보(200101~200824).csv')
df_2 = pd.read_csv('data/국립자연휴양림 예약 정보(201014~210322).csv')
df_3 = pd.read_csv('data/국립자연휴양림 예약 정보(210329~210923).csv')
df_4 = pd.read_csv('data/국립자연휴양림 예약 정보(210924~220314).csv')



# pre-processing

In [3]:
df_1 = df_1[['기관ID','기관이름','숙박일자']]
df_1 = df_1.rename(columns={'기관ID':'id','기관이름':'name','숙박일자':'date'})
df_1['id'] = df_1['id'].str.replace("'","")
df_1['name'] = df_1['name'].str.replace("'","")
df_1['date'] = df_1['date'].str.replace("'","")
df_1 = df_1[df_1['date'] != '2(24.7㎡×2실)']  
df_1['date'] = df_1['date'].astype('datetime64')

df_1 = df_1[['date','id','name']]

In [4]:
df_2 = df_2[['기관ID','기관이름','숙박일자']]
df_2 = df_2.rename(columns={'기관ID':'id','기관이름':'name','숙박일자':'date'})
df_2['date'] = df_2['date'].astype('str').astype('datetime64')

df_2 = df_2[['date','id','name']]

In [5]:
df_3 = df_3[['INSTT_ID','INSTT_NM','STNG_DT']]
df_3 = df_3.rename(columns={'INSTT_ID':'id','INSTT_NM':'name','STNG_DT':'date'})
df_3['date'] = df_3['date'].astype('str').astype('datetime64')

df_3 = df_3[['date','id','name']]

In [6]:
df_4 = df_4[['기관아이디','기관이름','숙박일자']]
df_4 = df_4.rename(columns={'기관아이디':'id','기관이름':'name','숙박일자':'date'})
df_4['date'] = df_4['date'].astype('str').astype('datetime64')

df_4 = df_4[['date','id','name']]

In [7]:
df = pd.concat([df_1,df_2,df_3,df_4,])

In [19]:
df.isnull().sum()

date       0
id         0
name       0
month      0
weekday    0
dtype: int64

In [18]:
df.id.unique()

array(['0101', '0182', '0202', '0111', '0189', '0105', '0300', '0195',
       '0109', '0107', '0187', '0201', '0112', '0220', '0106', '0141',
       '0183', '0243', '0222', '0110', '0224', '0200', '0194', '0190',
       '0103', '0184', '0108', '0102', '0193', '0192', '0115', '0188',
       '0191', '0245', '0116', '0196', '0242', '0181', '0113', '0244',
       '0223', '0104', 106, 196, 242, 115, 190, 191, 182, 141, 102, 104,
       103, 194, 220, 187, 101, 181, 110, 107, 105, 300, 202, 200, 195,
       113, 192, 188, 244, 222, 245, 201, 224, 189, 116, 223, 108, 111,
       301, 183, 109, 184, 243, 193, 112], dtype=object)

In [23]:
df.id = df.id.apply(lambda x : x[-3])

TypeError: 'int' object is not subscriptable

In [9]:
df['month'] = df['date'].dt.month
df['weekday'] = df['date'].dt.weekday

In [10]:
fig = px.line(df.groupby(['date'],as_index=False).agg(count = ('id','count')), x="date", y="count" )
fig.show()

In [11]:
#2021년 통계만 이용용
fig = px.bar(df[('2021-01-01'<=df.date) & (df.date<='2021-12-31')].groupby(['month'],as_index=False).agg(count = ('id','count')), x="month", y="count" , text_auto=True)
fig.show()

In [12]:
fig = px.bar(df.groupby(['weekday'],as_index=False).agg(count = ('id','count')), x="weekday", y="count" , text_auto=True)
fig.show()

In [15]:
import plotly.graph_objects as go
df_name = df.groupby(['id','name'],as_index=False).agg(count = ('id','count'))
ratio_total   = list(df_name.loc[:,'count'])
labels_total  = list(df_name.loc[:,'name'])

# pull is given as a fraction of the pie radius
fig = go.Figure(data=[go.Pie(labels=labels_total, values=ratio_total)])
fig.update_layout(margin=dict(t=20, b=20, l=10, r=20))
fig.update_traces(textposition='inside', textinfo='percent+label')
fig.show()

In [16]:
df_name

Unnamed: 0,id,name,count
0,101,유명산 자연휴양림,28510
1,102,용대 자연휴양림,8050
2,103,산음 자연휴양림,17858
3,104,아세안 자연휴양림,8828
4,105,신불산 자연휴양림,9325
...,...,...,...
80,0242,황정산 자연휴양림,2018
81,0243,두타산 자연휴양림,2116
82,0244,검봉산 자연휴양림,1825
83,0245,대야산 자연휴양림,2288


In [22]:
loc[loc.소재지도로명주소.str.contains('검마')]

Unnamed: 0,name,휴양림구분,입장료,숙박가능여부,주요시설명,소재지도로명주소,위도,경도


In [23]:
loc[loc.name.str.contains('검마')]

Unnamed: 0,name,휴양림구분,입장료,숙박가능여부,주요시설명,소재지도로명주소,위도,경도


In [16]:
loc

Unnamed: 0,name,휴양림구분,입장료,숙박가능여부,주요시설명,소재지도로명주소,위도,경도
0,태학산자연휴양림,공유림,없음,N,숲속의집+잔디광장+숲속공연장 등,충청남도 천안시 동남구 풍세면 휴양림길 127,36.727348,127.090327
1,비슬산자연휴양림,공유림,없음,Y,숲속의집+통나무집+야영장+반딧불이전기차등,대구광역시 달성군 유가읍 일연선사길 99,35.690011,128.512902
2,화원자연휴양림,공유림,없음,Y,숲속의집+산림문화휴양관+산림욕장+전망데크등,대구광역시 달성군 화원읍 화원휴양림길 126,35.771792,128.536739
3,옥화자연휴양림,공유림,어른(개인 1000원+단체 500원)+청소년(개인 500원+단체 300원)+어린이(...,Y,숲속의집+산림휴양관+국민여가오토캠핑장+물놀이장 등,충청북도 청주시 상당구 미원면 운암옥화길 140,36.598950,127.694372
4,가리산휴양림,공유림,개인 2000원+청소년 1500원+어린이 1000원,Y,산림문화휴양관+숲속의 집+야영데크 등,강원도 홍천군 두촌면 모르골길 179-22,37.865900,127.998812
...,...,...,...,...,...,...,...,...
182,여수봉황산자연휴양림,공유림,1000,Y,"숲속의집,야영장 등",전라남도 여수시 돌산읍 대복길160,34.614702,127.761800
183,독용산성자연휴양림,공유림,입장료 무료,Y,"숲속휴양관, 휴양관, 숲속의집, 관리사무소, 야외화장실 등",경상북도 성주군 금수면 사더래길 144,35.906368,128.134411
184,미숭산자연휴양림,공유림,없음,Y,"숲속의집, 산림문화휴양관",경상북도 고령군 대가야읍 낫질로 672-99,35.750775,128.202839
185,송정자연휴양림,공유림,"개인(성인 1,000원, 청소년·군인 700원, 어린이 500원), 단체(성인 80...",Y,"숲속의집, 산림휴양관, 야영장, 바비큐장, 숲만남의광장 등",경상북도 칠곡군 석적읍 반계3길 88,36.023332,128.441641


In [17]:
pd.merge(df_name,loc,on='name')

Unnamed: 0,name,count,휴양림구분,입장료,숙박가능여부,주요시설명,소재지도로명주소,위도,경도
0,남해편백자연휴양림,20462,국유림,개인 어른1000원+개인 청소년 600원+개인 어린이 300원+단체 어른800원+단...,Y,숲속의집+휴양관,경상남도 남해군 삼동면 금암로 658,34.752164,128.020132
1,남해편백자연휴양림,20462,국유림,성인 1000원,Y,"생태숲,숲속의집 등",경상남도 남해군 삼동면 금암로 658,34.752164,128.020132
2,대야산자연휴양림,10295,국유림,어른 1000원+청소년 600원+어린이 300원,Y,산림문화휴양관+연립동+야영시설,경상북도 문경시 가은읍 용추길 31-35,36.670904,127.961977
3,방장산자연휴양림,6724,국유림,일반 1000원+단체 800원,Y,"숲속의 집, 산림문화휴양관, 세미나실, 숲속공예마을(체험) 등",전라남도 장성군 북이면 방장로 353,35.444052,126.751405
4,백운산자연휴양림,5269,공유림,0,Y,숙박동+목재문화체험장+황토길+산책로+야영장+운동장,전라남도 광양시 옥룡면 백계로 337,35.051643,127.598531
5,변산자연휴양림,18369,국유림,숙박비 52000원+154000원,Y,숲속의집+휴양관+체험교실+물놀이장(현재 미운영),전라북도 부안군 변산면 변산로 3768,35.582878,126.523728
6,아세안자연휴양림,10632,공유림,일반(개인 1000원+단체 800원)+청소년(개인 600원+단체 500원)+어린이(...,Y,숲속의집14동+안내센터+다목적광장 등,경기도 양주시 백석읍 기산로 472,37.773823,126.942176
7,운문산자연휴양림,16230,국유림,0,Y,숲속의집+산림문화휴양관+숲속수련장+야영시설,경상북도 청도군 운문면 운문로 763,35.648347,129.026208
8,운장산자연휴양림,9658,국유림,일반인(개인 1000+단체 800)+청소년(개인 600+단체 500)+어린이(개인 ...,Y,"숲속의집,연립동, 산림문화휴양관, 숲속수련관",전라북도 진안군 정천면 휴양림길 77,35.899246,127.42111
9,회문산자연휴양림,6001,국유림,어른 1000원 청소년 600원 어린이 300원,Y,숲속의 집+산림문화 휴양관+야영시설,전라북도 순창군 구림면 안심길 295,35.501959,127.114825


In [27]:
datalab = pd.read_csv('data/datalab.csv')
data = pd.read_csv('data/전국 캠핑장 위치 및 부가정보.csv')

In [26]:
datalab

Unnamed: 0.1,Unnamed: 0,관광지명,광역시/도,시/군/구,도로명주소,중분류 카테고리,소분류 카테고리,검색건수,date
0,0,가산수피아,경상북도,칠곡군,경북 칠곡군 학하4길 57-105,숙박,캠핑,1383,202001
1,1,임진각평화누리캠핑장,경기도,파주시,경기 파주시 임진각로 148-40,숙박,캠핑,1325,202001
2,2,연곡해변솔향기캠핑장,강원도,강릉시,강원 강릉시 해안로 1282-0,숙박,캠핑,1073,202001
3,3,임진각평화누리캠핑장,경기도,파주시,경기 파주시 임진각로 148-40,숙박,캠핑,1504,202002
4,4,연곡해변솔향기캠핑장,강원도,강릉시,강원 강릉시 해안로 1282-0,숙박,캠핑,942,202002
...,...,...,...,...,...,...,...,...,...
987,987,피노키오캠핑장,강원도,원주시,강원 원주시 소야1길 72-0,숙박,캠핑,1590,202210
988,988,노을캠핑장,서울특별시,마포구,서울 마포구 하늘공원로 84-0,숙박,캠핑,1578,202210
989,989,더드림핑,경기도,남양주시,경기 남양주시 북한강로 1630-18,숙박,캠핑,1524,202210
990,990,유식물원오토캠핑장,경기도,포천시,경기 포천시 간자동길 138-100,숙박,캠핑,1473,202210


In [36]:
data[data.CMPSI_NM.str.contains('평화')]

Unnamed: 0,CMPSI_ID,CMPSI_NM,CMPSI_SCTIN_NM,CMPSI_LTTD_VAL,CMPSI_LNGTD_VAL,CMPSI_ADDR,CMPSI_GNRL_CMPGR_CNT,CMPSI_CAR_CMPGR_CNT,CMPSI_GLPG_CNT,CMPSI_CARBN_CNT,...,CMPSI_ETC_SBFCL_NM2,CMPSI_INFO_DATA_STNDD_DTM,CMPSI_CNPRM_DTM,DATA_CONNO,OPERT_TPCD,OCCRR_DTM,CNTCT_BGN_DTM,CNTCT_PRCES_DTM,CNTCT_PRCES_STCD,TRNSA_ID
1220,CAP301221,철원 평화마을 서울캠핑장,자동차야영장,38.301224,127.39899,강원도 철원군 근북면 유곡리 512,0,0,0,0,...,,2020-11-20,2015-12-07,1220,I,20201125000000,,,N,
1767,CAP301768,평화강변수목 캠핑장,자동차야영장,38.018972,126.977948,경기도 연천군 미산면 삼화리 어삼로 419,100,0,0,0,...,탁구장,2020-11-20,2016-05-17,1767,I,20201125000000,,,N,
1920,CAP301921,평화누리캠핑장,"일반야영장,자동차야영장",37.892043,126.744793,경기 파주시 문산읍 임진각로 148-40,62,52,0,15,...,,2020-11-20,2018-09-10,1920,I,20201125000000,,,N,
2134,CAP302135,평화의댐 오토캠핑장,자동차야영장,38.206529,127.850107,강원 화천군 화천읍 비수구미길 145-145,0,50,0,0,...,,2020-11-20,2019-04-01,2134,I,20201125000000,,,N,
