In [55]:
import pandas as pd
import numpy as np

pd.options.plotting.backend = 'plotly' # 시각화

import plotly.express as px # 지도에 표시
import plotly.io as pio

from pyproj import Proj, transform # 좌표계 변환


pio.renderers.default = 'notebook_connected' # 제출

# =============================================
# 데이터 로드
# =============================================

In [46]:
data_5 = pd.read_csv('./data/KRI-DAC_Jeju_data5.txt')
data_6 = pd.read_csv('./data/KRI-DAC_Jeju_data6.txt')
data_7 = pd.read_csv('./data/KRI-DAC_Jeju_data7.txt').drop(['X', 'Y'], axis=1)
data_8 = pd.read_csv('./data/KRI-DAC_Jeju_data8.txt')

In [48]:
data = pd.concat([data_5, data_6, data_7, data_8])

In [49]:
data

Unnamed: 0,OBJECTID,Field1,YM,SIDO,SIGUNGU,FranClass,Type,Time,TotalSpent,DisSpent,NumofSpent,NumofDisSpent,POINT_X,POINT_Y
0,1,1,202005,제주특별자치도,제주시,영세,일반한식,00시,363000,66500,10,2,877005.9834,1.479766e+06
1,2,2,202005,제주특별자치도,제주시,영세,단란주점,00시,1180000,0,3,0,877005.7447,1.479816e+06
2,3,3,202005,제주특별자치도,제주시,중소1,편의점,00시,157670,6850,20,2,877056.6756,1.479616e+06
3,4,4,202005,제주특별자치도,제주시,영세,편의점,00시,46600,0,2,0,877055.9593,1.479766e+06
4,5,5,202005,제주특별자치도,제주시,영세,주점,00시,66000,0,2,0,877055.4817,1.479866e+06
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
280080,280081,280081,202008,제주특별자치도,제주시,영세,편의점,x시,13700,0,2,0,950266.5976,1.502458e+06
280081,280082,280082,202008,제주특별자치도,제주시,영세,일반한식,x시,56000,0,1,0,950317.5379,1.502258e+06
280082,280083,280083,202008,제주특별자치도,제주시,영세,일반한식,x시,28000,0,1,0,950469.1585,1.501909e+06
280083,280084,280084,202008,제주특별자치도,제주시,중소1,중국음식,x시,46000,0,3,0,950574.6388,1.500760e+06


# =============================================
# 데이터 확인
# =============================================

## 데이터 정의
    - YM : 기준년월
    - SIDO : 지역대분류명
    - SIGUNGU : 지역중분류명
    - FranClass : 소상공인구분
    - Type : 업종명
    - Time : 시간대(x는 무승인거래, 2~6 새벽, 6~11 오전, 11~15 점심, 15~18 오후, 18~22 저녁, 22~02 심야)
    - TotalSpent : 총사용금액(재난지원금 사용금액을 포함한 금액)
    - DisSpent : 재난지원금 사용금액
    - NumOfSpent : 총 이용건수
    - NumOfDisSpent : 총 재난지원금 이용건수
    - POINT_X, POINT_Y : X,Y 좌표

In [7]:
data['SIDO'].unique()

array(['제주특별자치도'], dtype=object)

In [8]:
data['SIGUNGU'].unique()

array(['제주시', '서귀포시'], dtype=object)

In [9]:
data['FranClass'].unique()

array(['영세', '중소1', '중소', '중소2', '일반'], dtype=object)

In [10]:
data['Type'].unique()

array(['일반한식', '단란주점', '편의점', '주점', '스넥', '서양음식', '일식회집', '기타음료식품', '노래방',
       '중국음식', '슈퍼마켓', '유흥주점', '기타숙박업', '기타레져업', '당구장', '농축수산품', '유아원',
       '골프경기장', '세탁소', '가방', '콘도', '주차장', '문화취미기타', '주유소', '사무서비스',
       '자동차정비', '특급호텔', '볼링장', '화장품', '기타회원제형태업소', '주류판매점', '제과점',
       '피부미용실', '약국', '칵테일바', '정육점', '독서실', '스포츠레져용품', '골프용품', 'LPG',
       '종합병원', '사우나', '화원', '의원', '안마스포츠마사지', '골프연습장', '2급호텔', '기타대인서비스',
       '보습학원', '부동산분양', '화물운송', '애완동물', '동물병원', '대형할인점', '인터넷Mall', '항공사',
       '헬스크럽', '기타유통업', '레져용품수리', '정장', '레져업소(회원제형태)', '관광여행', '1급호텔',
       '침구수예점', '사진관', '악세사리', '보관창고업', '기념품점', '미용원', '영화관', '의료용품',
       '세차장', '인터넷종합Mall', '기타잡화', '성인용품점', '상품권', '종합용역', '기계공구',
       '조세서비스', '택시', '기타의료기관및기기', '가례서비스', '구내매점', '수영장', '목재석재철물',
       '건축요업품', '기타업종', '렌트카', '종합레져타운', '유류판매', '농축협직영매장', '기타건축자재',
       '비료농약사료종자', '농기계', '보일러펌프', '가전제품', '스포츠의류', '페인트', '미곡상',
       '기타농업관련', '기타가구', '공공요금', '기능학원', '면세점', '기타교육', '위탁급식업', '이용원',
       '조명기구',

In [11]:
data['Time'].unique()

array(['00시', '01시', '02시', '03시', '04시', '05시', '06시', '07시', '08시',
       '09시', '10시', '11시', '12시', '13시', '14시', '15시', '16시', '17시',
       '18시', '19시', '20시', '21시', '22시', '23시', 'x시'], dtype=object)

In [12]:
print(data['TotalSpent'].max())
print(data['TotalSpent'].min())

872468620
1


In [13]:
print(data['DisSpent'].max())
print(data['DisSpent'].min())

68372220
-650000


In [14]:
print(data['NumofSpent'].max())
print(data['NumofSpent'].min())

10359
1


In [15]:
print(data['NumofDisSpent'].max())
print(data['NumofDisSpent'].min())

1025
-1


In [16]:
print(data_5['NumofDisSpent'].sum())
print(data_6['NumofDisSpent'].sum())
print(data_7['NumofDisSpent'].sum())
print(data_8['NumofDisSpent'].sum())

# 재난지원금의 경우 사용 기한이 8월까지였다는 점을 확인해볼만함

# 먼저, 5월부텉 8월까지 재난 지원금 사용 건수가 줄어드는데,
# 이는 지원금이 들어오고나서 얼마 지나지 않아 모두 사용해버리는 가구가 많다는 뜻

# 반대로 사용 기한이 다가오는데 금액이 남아있는 사람들도 분석해볼만함
# 왜냐하면 어차피 사용해야 한다면 남은 돈 다 털어내기 위해서 상대적으로 '큰' 금액을 지출할 것으로 예상 됨
# 이를 증명하기 위해서는 총 4개월의 재난지원금 건당 금액을 비교해보면 될 듯 함

782769
384342
56363
18660


# =============================================
# 지도에 표시 using plotly
# =============================================

In [52]:
# Scatter Plots on Mapbox 링크
# https://plotly.com/python/scattermapbox/


# fig = px.scatter_mapbox(data, # data frame 지정
#                         lat="POINT_Y", lon="POINT_X", # 위도 경도 지정
#                         hover_name="Type",
#                         hover_data=["SIGUNGU", "FranClass", "Time", "TotalSpent", "DisSpent"], # 추가로 보여줄 데이터 지정
#                         color=["TotalSpent"], # 컬러 지정
#                         size="NumofSpent",
#                         size_max=15, # 크기 지정
#                         zoom = 10, height = 400
#                        )

# fig.update_layout(mapbox_style="white-bg")
# fig.update_layout(margin={"r":0, "t":0, "l":0, "b":0})

# fig.show()


# 아무리 해도 출력이 안됨...
# 에러는 없이 코드가 실행 되니까 출력 단계에서 문제인가 고민했다
# 왜그런지 생각해보니, 좌표계의 문제이지 않나 싶다.
# 참고한 예제나 블로그 코드에서는 위도경도를 쓰는데, 데이터는 ITRF2000 좌표계 값을 쓴다.
# 따라서 이 값을 변환해서 그래프를 그려야 한다

In [None]:
# 좌표계 변환 : ITRF2000 -> WGS84
# ref. URL : https://m.blog.naver.com/wideeyed/221243506770

xy_ITFR2000 = Proj(init="epsg:5178") # ITRF2000 좌표계
xy_WGS84 = Proj(init="epsg:4326") # GPS 경도 위도

# sample 예제
x1, y1 = 877005.9834, 1.479766e+06
x2, y2 = transform(xy_ITFR2000, xy_WGS84, x1, y1)
print(x2, y2)

# 변환
def transform_ITRF2WGS(data) : 
    return pd.Series(transform(xy_ITFR2000, xy_WGS84, data['POINT_X'], data['POINT_Y']), index=['POINT_X', 'POINT_Y'])

data[['POINT_X', 'POINT_Y']] = data.apply(transform_ITRF2WGS, axis=1)

data


'+init=<authority>:<code>' syntax is deprecated. '<authority>:<code>' is the preferred initialization method. When making the change, be mindful of axis order changes: https://pyproj4.github.io/pyproj/stable/gotchas.html#axis-order-changes-in-proj-6


'+init=<authority>:<code>' syntax is deprecated. '<authority>:<code>' is the preferred initialization method. When making the change, be mindful of axis order changes: https://pyproj4.github.io/pyproj/stable/gotchas.html#axis-order-changes-in-proj-6


'+init=<authority>:<code>' syntax is deprecated. '<authority>:<code>' is the preferred initialization method. When making the change, be mindful of axis order changes: https://pyproj4.github.io/pyproj/stable/gotchas.html#axis-order-changes-in-proj-6


'+init=<authority>:<code>' syntax is deprecated. '<authority>:<code>' is the preferred initialization method. When making the change, be mindful of axis order changes: https://pyproj4.github.io/pyproj/stable/gotchas.html#axis-order-changes-in-

126.17674598466576 33.30508901176835



This function is deprecated. See: https://pyproj4.github.io/pyproj/stable/gotchas.html#upgrading-to-pyproj-2-from-pyproj-1



In [None]:
fig = px.scatter_mapbox(data, # data frame 지정
                        lat="POINT_Y", lon="POINT_X", # 위도 경도 지정
                        hover_name="Type",
                        hover_data=["SIGUNGU", "FranClass", "Time", "TotalSpent", "DisSpent"], # 추가로 보여줄 데이터 지정
                        color="TotalSpent", # 컬러 지정
                        size="NumofSpent",
                        size_max=15, # 크기 지정
                        zoom = 10, height = 400
                       )

fig.update_layout(mapbox_style="white-bg")
fig.update_layout(margin={"r":0, "t":0, "l":0, "b":0})

# =============================================
# 
# =============================================

# =============================================
# 
# =============================================