# 도전! 데이터 분석
## 기초 통계량과 데이터 시각화를 통한 인사이트 도출 실습 과정입니다.

* 먼저, 데이터를 불러와서 구조와 변수를 확인하겠습니다.
    * 제주도 내 상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터
    * 음면동, 업종명, 이용금액, 거주인구 등 정보 제공
    * 2019년 : raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_19.csv
    * 2020년 : raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_20(수정).csv
    * 2021년(1월_5월): raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_(2101~2105).csv

#### 지리정보 시각화를 위해 필요한 folium과 geopandas를 설치해보겠습니다.

__사내 PC 실습 안내__ 
- 본 실습은 외부 라이브러리를 설치하는 내용이 포함되어 있습니다.
- 사내 PC에서 외부 라이브러리 설치 시, SSL 인증 오류가 발생할 수 있습니다.
- 아래 코드와 같이, pypi 서버 신뢰 옵션을 추가하여 SSL 인증을 생략합니다.
- 따라서, 내용은 영상 강의와 다를 수 있습니다.
```cmd
pip install --trusted-host pypi.python.org --trusted-host files.pythonhosted.org --trusted-host pypi.org -U [설치할 패키지 명]
```


In [17]:
# !pip install folium
!pip install --trusted-host pypi.python.org --trusted-host files.pythonhosted.org --trusted-host pypi.org -U folium



In [18]:
# !pip install geopandas
!pip install --trusted-host pypi.python.org --trusted-host files.pythonhosted.org --trusted-host pypi.org -U geopandas



#### 1. 2019년 데이터 불러오기 및 지리정보 시각화
* 지도 위에 동별로 이용금액 표시하기

In [19]:
# 필요한 라이브러리 Import
import pandas as pd

# 데이터 불러오기
df_2019 = pd.read_csv('raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_19.csv', encoding = 'cp949')

In [13]:
# 데이터 확인
df_2019

Unnamed: 0,년월,시도명,읍면동명,업종명,성별,이용자수,이용금액,거주인구,근무인구,방문인구,데이터기준일자
0,2019-01-01,제주시,화북동,과실 및 채소 소매업,여성,155,11202300,9078626.288,539749.963,2866049.927,2020-12-15
1,2019-01-01,제주시,화북동,비알콜 음료점업,여성,1184,9674400,9078626.288,539749.963,2866049.927,2020-12-15
2,2019-01-01,제주시,화북동,기타 외국식 음식점업,여성,412,14592800,9078626.288,539749.963,2866049.927,2020-12-15
3,2019-01-01,제주시,화북동,기타 대형 종합 소매업,여성,4176,168038410,9078626.288,539749.963,2866049.927,2020-12-15
4,2019-01-01,제주시,화북동,관광 민예품 및 선물용품 소매업,여성,99,7165200,9078626.288,539749.963,2866049.927,2020-12-15
...,...,...,...,...,...,...,...,...,...,...,...
27411,2019-12-01,제주시,화북동,한식 음식점업,여성,5163,170629710,7706780.511,895520.731,3674034.647,2020-12-15
27412,2019-12-01,제주시,화북동,화장품 및 방향제 소매업,여성,187,14738370,7706780.511,895520.731,3674034.647,2020-12-15
27413,2019-12-01,제주시,봉개동,한식 음식점업,남성,2046,62019240,1461151.063,489270.669,1861857.723,2020-12-15
27414,2019-12-01,제주시,화북동,차량용 가스 충전업,여성,367,14734053,7706780.511,895520.731,3674034.647,2020-12-15


In [14]:
# 읍면동 기준 연간 총 합계 계산

# 읍면동별로 그룹화하여 월간 총 합계 계산
result = df_2019.groupby(['읍면동명']).sum(numeric_only = True).reset_index()

# 결과 출력
result

Unnamed: 0,읍면동명,이용자수,이용금액,거주인구,근무인구,방문인구
0,건입동,651604,22336106067,1435528000.0,194449200.0,1506264000.0
1,구좌읍,842666,25295161055,2793967000.0,320364900.0,1915840000.0
2,남원읍,660351,27531663612,2854531000.0,243026500.0,1751912000.0
3,노형동,3983308,119715132765,14169510000.0,1701194000.0,6121115000.0
4,대륜동,939393,33052856446,3014950000.0,327893800.0,2005594000.0
5,대정읍,952010,30300086965,3652055000.0,261310600.0,1471549000.0
6,대천동,637924,16598676820,1216198000.0,124595200.0,1154180000.0
7,도두동,371450,13985467474,186942200.0,33817610.0,673193200.0
8,동홍동,1024687,31958145282,3631532000.0,352957300.0,1577157000.0
9,봉개동,298983,10011683321,537631200.0,134324800.0,669495000.0


In [20]:
import folium
import geopandas as gpd

# Shapefile 로드
shapefile_path = 'raw_data/geoshapefile/Z_SOP_BND_ADM_DONG_PG.shp'
gdf = gpd.read_file(shapefile_path, encoding='cp949')

# 데이터 프레임의 열 이름 변경
result.rename(columns={'읍면동명': 'ADM_NM'}, inplace=True)

# 동에 맞춰서 이용금액을 매핑하는 딕셔너리 생성
dong_to_usage = dict(zip(result['ADM_NM'], result['이용금액']))

# 읍면동 폴리곤 데이터에 이용금액 열 추가
gdf['이용금액'] = gdf['ADM_NM'].map(dong_to_usage)
gdf = gdf.dropna()

# 지도의 중심 좌표 설정
center_lat, center_lon = 33.380675, 126.551296

# folium 지도 객체 생성
m = folium.Map(location=[center_lat, center_lon], zoom_start=10)

# 읍면동 폴리곤을 지도에 추가
folium.GeoJson(gdf).add_to(m)

# 단계구분도(Choropleth Map) 생성
folium.Choropleth(
    geo_data=gdf,
    data=gdf,
    columns=['ADM_NM', '이용금액'],
    key_on='feature.properties.ADM_NM',
    fill_color='YlGn',
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name='이용금액'
).add_to(m)

# 금액 폴리곤을 지도에 추가
folium.GeoJson(
    gdf,
    tooltip=folium.GeoJsonTooltip(fields=['ADM_NM','이용금액'], labels=True, sticky=False),
).add_to(m)

# 지도 출력
m

ImportError: The 'read_file' function requires the 'pyogrio' or 'fiona' package, but neither is installed or imports correctly.
Importing fiona resulted in: dlopen(/opt/anaconda3/lib/python3.11/site-packages/fiona/_env.cpython-311-darwin.so, 0x0002): Library not loaded: /usr/lib/libpcre2-8.0.dylib
  Referenced from: <87E09CDB-FEB5-3363-881E-532F9203505C> /opt/anaconda3/lib/python3.11/site-packages/fiona/.dylibs/libgdal.32.3.6.4.dylib
  Reason: tried: '/usr/lib/libpcre2-8.0.dylib' (no such file), '/System/Volumes/Preboot/Cryptexes/OS/usr/lib/libpcre2-8.0.dylib' (no such file), '/usr/lib/libpcre2-8.0.dylib' (no such file, not in dyld cache)
Importing pyogrio resulted in: No module named 'pyogrio'

#### 2. 2020년 데이터 불러오기 및 지리정보 시각화(실습)
* 2020년 : raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_20(수정).csv
* 지도 위에 동별로 이용금액 표시하기

In [7]:
# 필요한 라이브러리 Import
import pandas as pd

# 데이터 불러오기
df_2020 = pd.read_csv('raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_20(수정).csv', encoding = 'cp949')

In [9]:
# 데이터 확인
df_2020

Unnamed: 0,년월,시도명,읍면동명,업종명,성별,이용자수,이용금액,거주인구,근무인구,방문인구,데이터기준일자
0,2020-01-01,서귀포시,남원읍,골프장 운영업,남성,1980,297727940,4.869067e+06,444319.725,3304302.997,2020-12-15
1,2020-01-01,제주시,외도동,수산물 소매업,남성,75,4657000,3.651449e+06,197093.412,1837113.079,2020-12-15
2,2020-01-01,제주시,오라동,중식 음식점업,남성,283,9340000,4.759442e+06,595571.433,4993516.699,2020-12-15
3,2020-01-01,제주시,오라동,자동차 임대업,남성,293,16523986,4.759442e+06,595571.433,4993516.699,2020-12-15
4,2020-01-01,제주시,오라동,스포츠 및 레크레이션 용품 임대업,남성,407,37918500,4.759442e+06,595571.433,4993516.699,2020-12-15
...,...,...,...,...,...,...,...,...,...,...,...
26933,2020-12-01,서귀포시,천지동,건강보조식품 소매업,남성,31,4654100,3.266401e+05,36434.368,629487.114,2021-07-26
26934,2020-12-01,서귀포시,천지동,건강보조식품 소매업,여성,25,3073660,2.702654e+05,28777.808,551171.003,2021-07-26
26935,2020-12-01,서귀포시,천지동,과실 및 채소 소매업,남성,2561,93739250,3.266401e+05,36434.368,629487.114,2021-07-26
26936,2020-12-01,서귀포시,천지동,과실 및 채소 소매업,여성,2342,77394645,2.702654e+05,28777.808,551171.003,2021-07-26


In [11]:
# 읍면동 기준 연간 총 합계 계산

# 읍면동별로 그룹화하여 총 합계 계산
result = df_2020.groupby(['읍면동명']).sum(numeric_only = True).reset_index()

# 결과 출력
result

Unnamed: 0,읍면동명,이용자수,이용금액,거주인구,근무인구,방문인구
0,건입동,599348,19498811275,1467661000.0,185622000.0,1383834000.0
1,구좌읍,849438,25138309104,2920109000.0,275208000.0,1712957000.0
2,남원읍,657991,25394237586,3186602000.0,250910900.0,1567432000.0
3,노형동,3736458,110602948230,14745760000.0,1459356000.0,5679354000.0
4,대륜동,864994,29471933074,2985945000.0,298881600.0,1612490000.0
5,대정읍,994174,31222291258,4197527000.0,258562400.0,1459702000.0
6,대천동,609136,14994084735,1427389000.0,121452700.0,1043475000.0
7,도두동,383334,12529184511,215873200.0,33221130.0,554168500.0
8,동홍동,965544,29919711991,4201807000.0,328230900.0,1578549000.0
9,봉개동,272778,8291405863,632601000.0,99922490.0,637766700.0


In [None]:
# 지도 출력


# AX 디그리 Step1 라이브 강의 마치겠습니다.
# 감사합니다.