# 한국관광공사 Tour API 3.0 - Answer
* [관광데이터](https://api.visitkorea.or.kr/search/galleryList.do)

## 1. 데이터분석 환경 셋팅

### 필요한 패키지 불러오기

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns

In [None]:
# Plotly 설치방법: Anaconda Prompt 창에서 아래 커맨드를 실행 
# pip install plotly 

In [None]:
import plotly.express as px

### 엑셀 파일 불러오기

In [None]:
df = pd.read_excel('data/06_tour_data.xlsx')
df

## 2. 전체 데이터 살펴보기

### 전국 관광시설수 - 지역별

In [None]:
df_reg = df.groupby('지역').size().reset_index()
df_reg.rename(columns={0:'관광시설수'}, inplace=True)
df_reg

In [None]:
fig = px.bar(df_reg, x='지역', y='관광시설수', color='지역', title='전국 관광시설수 - 지역별')
fig.show()

### 전국 관광시설수 - 관광타입별

In [None]:
df_cat = df.groupby('관광타입').size().reset_index()
df_cat.rename(columns={0:'관광시설수'}, inplace=True)
df_cat

In [None]:
fig = px.bar(df_cat, x='관광타입', y='관광시설수', color='관광타입', title='전국 관광시설수 - 관광타입별')
fig.show()

### 전국 관광시설수 - 지역별, 관광타입별

In [None]:
df_rc = df.groupby(['지역','관광타입']).size().reset_index()
df_rc.rename(columns={0:'관광시설수'}, inplace=True)
df_rc

In [None]:
fig = px.bar(df_rc, x='지역', y='관광시설수', color='관광타입', barmode='group', title ='전국 관광시설수 - 지역별, 관광타입별')
fig.show()

### 전국 관광시설수 - 지도

In [None]:
fig = px.scatter_mapbox(df, lat='위도', lon='경도', color='관광타입', hover_name='명칭', size_max=15, zoom=6)
fig.update_layout(mapbox_style = 'open-street-map')
fig.show()

## 3. 원하는 데이터만 추출 & 분석 해보기

### 관광타입에서 '숙박' 만 추출

#### 관광타입 = '레포츠',  '관광지',  '음식점',  '문화시설',  '축제공연행사',  '여행코스',  '숙박',  '쇼핑'

In [None]:
df_acc = df[(df['관광타입'] == '숙박')].copy()

#### 결측치 확인

In [None]:
df_acc.isnull().sum()

#### 결측치 있는 컬럼 삭제

In [None]:
df_acc = df_acc.dropna(axis=1, how='any')
df_acc

#### 시설 유/무 컬럼 선택

In [None]:
col_list = ['세미나','스포츠시설','사우나실','뷰티 시설','노래방','바베큐장',
            '캠프화이어','자전거대여','휘트니스센터','공용 PC실','공용 샤워실']

In [None]:
df_acc_part = df_acc[col_list]

#### 시설 유/무 데이터 리스트 저장

In [None]:
df_acc_ynlist = df_acc_part.apply(pd.value_counts).reset_index()
df_acc_ynlist

In [None]:
df_tmp = df_acc_ynlist.melt(id_vars='index')
df_tmp

In [None]:
fig = px.bar(df_tmp, x='variable', y='value', color='index', barmode='group', title ='시설 유/무')
fig.show()

#### 시설 유/무 데이터 선택

In [None]:
df_acc_yn = df_acc_ynlist[['index','바베큐장']]
df_acc_yn

In [None]:
fig = px.pie(df_acc_yn, values='바베큐장', names='index', title='바베큐장 유/무 - 숙박')
fig.show()

#### 바베큐와 자전거 대여가 가능한 숙박시설만 보기 

In [None]:
df_acc_ylist = df_acc.loc[(df_acc['바베큐장'] == '있음')&(df_acc['자전거대여'] == '있음'), ['지역','명칭','주소','바베큐장','자전거대여']]
df_acc_ylist

---

## [실습] 직접 해보기
**HOW TO**: 각각의 셀 마다 ANSWER 에 들어갈 코드를 입력한 후, 셀을 실행 해보세요.

#### 관광타입에서 '관광지' 데이터만 추출하세요.

In [None]:
#df_ts = df[(df['관광타입'] == '관광지')].copy()
df_ts = df[(df['관광타입'] == 'ANSWER')].copy()
df_ts

#### 결측치를 확인하세요.

In [None]:
df_ts.isnull().sum()

#### 1) '유모차 대여 여부'와 2) '애완동물 동반 가능 여부' 컬럼을 포함하여 데이터를 추출하세요.

In [None]:
#df_ts = df_ts[['지역','관광타입','명칭','주소','위도','경도','개요','유모차 대여 여부','애완동물 동반 가능 여부']]
df_ts = df_ts[['지역','관광타입','명칭','주소','위도','경도','개요','ANSWER','ANSWER']]
df_ts

#### '유모차 대여 여부' 컬럼의 value과 개수를 확인하세요.

In [None]:
#df_ts['유모차 대여 여부'].value_counts()
df_ts['ANSWER'].value_counts()

#### '애완동물 동반 가능 여부' 컬럼의 value과 개수를 확인하세요.

In [None]:
#df_ts['애완동물 동반 가능 여부'].value_counts()
df_ts['ANSWER'].value_counts()

#### 유모차 대여가 가능하고 애완동물 동반이 가능한 관광지를 추출하세요.

In [None]:
#df_ts_ylist = df_ts[(df_ts['유모차 대여 여부'] == '가능')& (df_ts['애완동물 동반 가능 여부'] == '가능')]
df_ts_ylist = df_ts[(df_ts['ANSWER'] == 'ANSWER')& (df_ts['ANSWER'] == 'ANSWER')]
df_ts_ylist

#### 지도 차트 그리기

In [None]:
#fig = px.scatter_mapbox(df_ts_ylist, lat='위도', lon='경도', hover_name='명칭', hover_data=['주소'], size_max=15, zoom=6)
fig = px.scatter_mapbox(ANSWER, lat='ANSWER', lon='ANSWER',  hover_name='명칭', hover_data=['주소'], size_max=15, zoom=6)
fig.update_layout(mapbox_style = 'open-street-map')
fig.show()

---

In [None]:
 # End of file