# 도전! 데이터 분석
## 기초 통계량과 데이터 시각화를 통한 인사이트 도출 실습 과정입니다.

* 먼저, 데이터를 불러와서 구조와 변수를 확인하겠습니다.
    * 제주도 내 상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터
    * 음면동, 업종명, 이용금액, 거주인구 등 정보 제공
    * 2019년 : raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_19.csv
    * 2020년 : raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_20(수정).csv
    * 2021년(1월~5월): raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_(2101~2105).csv

#### 지리정보 시각화를 위해 필요한 folium과 geopandas를 설치해보겠습니다.

In [None]:
!pip install folium

In [None]:
!pip install geopandas

#### 1. 2019년 데이터 불러오기 및 지리정보 시각화
* 지도 위에 동별로 이용금액 표시하기

In [None]:
# 필요한 라이브러리 Import
import pandas as pd

# 데이터 불러오기
df_2019 = pd.read_csv('raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_19.csv', encoding = 'cp949')

In [None]:
# 데이터 확인
df_2019

In [None]:
# 읍면동 기준 월간 총 합계 계산
# 날짜 데이터 타입으로 변환
df_2019['년월'] = pd.to_datetime(df_2019['년월'])

# 연도와 월 추출
df_2019['연도'] = df_2019['년월'].dt.year
df_2019['월'] = df_2019['년월'].dt.month

# 읍면동별로 그룹화하여 월간 총 합계 계산
result = df_2019.groupby(['읍면동명', '월']).sum().reset_index()

# 결과 출력
result

In [None]:
# 읍면동별로 그룹화하여 월간 총 합계 계산
result_M = result.groupby(['읍면동명']).sum().reset_index()
result_M

In [None]:
import folium
import geopandas as gpd

# Shapefile 로드
shapefile_path = 'raw_data/geoshapefile/Z_SOP_BND_ADM_DONG_PG.shp'
gdf = gpd.read_file(shapefile_path, encoding='cp949')

# 데이터 프레임의 열 이름 변경
result_M.rename(columns={'읍면동명': 'ADM_NM'}, inplace=True)

# 동에 맞춰서 이용금액을 매핑하는 딕셔너리 생성
dong_to_usage = dict(zip(result_M['ADM_NM'], result_M['이용금액']))

# 읍면동 폴리곤 데이터에 이용금액 열 추가
gdf['이용금액'] = gdf['ADM_NM'].map(dong_to_usage)
gdf = gdf.dropna()

# 지도의 중심 좌표 설정
center_lat, center_lon = 33.380675, 126.551296

# folium 지도 객체 생성
m = folium.Map(location=[center_lat, center_lon], zoom_start=10)

# 읍면동 폴리곤을 지도에 추가
folium.GeoJson(gdf).add_to(m)

# 단계구분도(Choropleth Map) 생성
folium.Choropleth(
    geo_data=gdf,
    data=gdf,
    columns=['ADM_NM', '이용금액'],
    key_on='feature.properties.ADM_NM',
    fill_color='YlGn',
    fill_opacity=0.7,
    line_opacity=0.2,
    legend_name='이용금액'
).add_to(m)

# 금액 폴리곤을 지도에 추가
folium.GeoJson(
    gdf,
    tooltip=folium.GeoJsonTooltip(fields=['ADM_NM','이용금액'], labels=True, sticky=False),
).add_to(m)

# 지도 출력
m

#### 2. 2020년 데이터 불러오기 및 지리정보 시각화(실습)
* 2020년 : raw_data/제주특별자치도_주제3_상권분석을 위한 유동인구에 따른 카드 매출액 변화 데이터 활용_매쉬업결과_20(수정).csv
* 지도 위에 동별로 이용금액 표시하기

In [None]:
# 필요한 라이브러리 Import


# 데이터 불러오기(df_2020)


In [None]:
# 데이터 확인


In [None]:
# 읍면동 기준 월간 총 합계 계산
# 날짜 데이터 타입으로 변환

# 읍면동별로 그룹화하여 월간 총 합계 계산

# 결과 출력


In [None]:
# 읍면동별로 그룹화하여 월간 총 합계 계산


In [None]:
# 지리정보시각화


# 디지코 디그리 Step1 라이브 강의 마치겠습니다.
# 감사합니다.