도트맵은 지리적 위치에 동일한 크기의 작은 점을 찍어서 해당 지역의 데이터 분포나 패턴을 표현하는 기법

점 하나는 실제 하나를 뜻할 수도 있고 다른 단위의 크기를 나타낼 수도 있다

도트맵은 시각적으로 데이터의 개요를 파악하는 데 유리하지만, 정확한 값을 전달하는 데에는 적합하지 않다

이러한 단점을 보완하기 위해 축소해서 보면 숫자로 정확한 수치를 표현하고 확대하면 점으로 표시하는 기법을
사용하기도 한다

버블맵은 버블차트를 지도에 그대로 옮겨둔 것이라고 생각하면 된다

데이터 값이 원의 크기로 표현되기 때문에 코로플레스맵보다 비율을 비교하는 것이 효과적이다

다만 버블맵은 지나치게 큰 버블이 다른 지역의 버블과 영역이 겹칠 수 있기 때문에 이를 잘 조절해야 한다

코로플레스맵은 단계 구분도라고도 하는데, 데이터 값의 크기에 따라 색상의 음영을 달리하여 해당 지역에 대한 값을 시각화하는 기법이다

경우에 따라서 여러 색상을 혼합할 수 있으며, 투명도, 채도, 명도 등 다양하게 표현할 수 있다

이 방법 역시 정확한 수치를 인지하고 비교하는 것이 어렵다

코로플레스맵은 작은 지역들에 비해 큰 지역들이 강조되는 인상을 줄 수 있기 때문에 이 점을 유의해서 지도를

해석해야 한다


커넥션맵은 지도에 찍힌 점들을 곡선 또는 직선으로 연결하여 지리적 관계를 표현한다

뿐만 아니라, 연속적 연결을 통해 지도에 경로를 표현할 수도 있다

일반적으로는 연결선의 분포와 집중도르 통해 지리적 관계의 패턴을 파악하기 위해 사용한다

지역 간의 무역 관계나 항공 경로나 통신 정보 흐름 등을 표현할 때 사용한다

그 밖에 커넥션맵과 유사하게 선을 표시하지만 시작점과 도착점이 함께 표현되는 플로우맵,

각 지역의 면적을 데이터 값에 비례하도록 변형시켜 시각화하는 카토그램 등의 공간 시각화 방법이 있으며,

지도 위에 바 차트나 파이차트 등을 표현하는 방법도 적용할 수 있다

1. 필요한 패키지 설치

In [9]:
!pip install folium



2. 패키지 임포트

In [10]:
import folium
from folium import Marker
from folium import plugins
from folium import GeoJson
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from IPython.display import display

3. 데이터 불러오기 및 확인

In [11]:
df = pd.read_csv('/content/Starbucks_Seoul.csv', encoding='utf-8')

geo = ('/content/Seoul_Gu.json')

df.head()

Unnamed: 0,name,address,gu_name,latitude,longitude
0,GS타워,서울특별시 강남구 논현로 508 (역삼동),강남구,37.501859,127.037278
1,SSG마켓도곡R,"서울특별시 강남구 언주로30길 57, 타워팰리스Ⅱ F 지하1층 (도곡동)",강남구,37.490298,127.054895
2,W-Mall,서울특별시 금천구 디지털로 188 (가산동),금천구,37.477305,126.887691
3,가든파이브,서울특별시 송파구 충민로 10 (문정동) 가든파이브툴,송파구,37.478232,127.11937
4,가락본동,서울특별시 송파구 송파대로30길 13 (가락동),송파구,37.494895,127.118785


4. 기본 지도 시각화

In [12]:
# 서울의 위도와 경도를 통해 지도를 시각화하고 줌을 12배로 소환
m= folium.Map(location=[37.541, 126.986], zoom_start = 12)

m

5. 기본 지도에 다양한 옵션 적용

In [13]:
# 지도 형태 변경
m= folium.Map(location=[37.541, 126.986], zoom_start = 12)

# 원하는 좌표에 반경 표시
folium.CircleMarker([37.5538, 126.9810], radius = 50,
                    popup = 'Laurelhurst Park', color='#3246cc',
                    fill_color='#3246cc').add_to(m)

# 원하는 좌표에 포인트 표시
folium.Marker([37.5538, 126.9810], popup='The Waterfront').add_to(m)

m

6. 군집 마커 시각화

In [14]:
m = folium.Map([37.541, 126.986], zoom_start= 12, width='%100', height='%100')
locations = list(zip(df.latitude, df.longitude))
cluster = plugins.MarkerCluster(locations=locations, #MarkerCluster() 함수는 각 구역에 존재하는 지점의 수를 숫자로 표현해준다 지도를 축소하면 뭉쳐진다 반대로 지도를 확대하면 원이 쪼개지다가 결국 하나의 핀으로 표시된다
                                popups= df['name'].tolist())
m.add_child(cluster)
m

7. 도트맵 시각화

In [15]:
m = folium.Map([37.541, 126.986], zoom_start= 12, width='%100', height='%100')
locations = list(zip(df.latitude, df.longitude))
for i in range(len(locations)):
    folium.CircleMarker(location=locations[i], radius=1).add_to(m)

m

버블맵 시각화

1. 버블맵 시각화를 위한 데이터 가공


In [16]:
df_m = df.groupby('gu_name').agg({'latitude': 'mean',
                                  'longitude' : 'mean',
                                  'name' : 'count'}).reset_index()

df_m.head()

Unnamed: 0,gu_name,latitude,longitude,name
0,강남구,37.507603,127.044611,80
1,강동구,37.539914,127.137106,14
2,강북구,37.626866,127.026372,5
3,강서구,37.555716,126.841528,16
4,관악구,37.481759,126.944286,11


2. 버블맵 시각화

In [33]:
m = folium.Map(location=[37.541, 126.986], tiles="CartoDB Positron",
               zoom_start= 11, width="%100",
               height = "%100")

# 구별 구분선, 색상 설정
folium.Choropleth(
    geo_data = geo,   # 앞에서 불러온 json파일 적용
    fill_color = 'gray'
    ).add_to(m)

# 버블맵 삽입
locations = list(zip(df_m.latitude, df_m.longitude))
for i in range(len(locations)):
    row = df_m.iloc[i]
    folium.CircleMarker(location = locations[i],
                        radius = float(row.name/2),   # 버블 크기 설정
                        fill_color='blue'
                        ).add_to(m)

m

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 1974: invalid start byte

코로플레스맵

1. 코로플레스맵 시각화를 위한 데이터 불러오기 및 확인

In [19]:
df2 = pd.read_csv('/content/us_states_unemployment.csv')

us_geo = '/content/folium_us-states.json'

df2.head()

Unnamed: 0,State,Unemployment
0,AL,7.1
1,AK,6.8
2,AZ,8.1
3,AR,7.2
4,CA,10.1


2. 코로플레스맵 시각화

In [24]:
# 미국 지도 시각화
m = folium.Map(location=[40,-98], zoom_start=3, tiles="CartoDB Positron")

# 지도에 주 경계선, 실업률 데이터 연동
m.choropleth(geo_data = us_geo,
             data = df2,
             columns = ['State', 'Unemployment'],
             key_on = 'feature.id',
             fill_colot = 'YlGn',
             legend_name = '실업률')

m



커넥션맵

1. 커넥션맵 시각화

In [30]:
# 서울과 도쿄, 워싱턴, 마닐라, 파리, 모스크바 위경도 입력
source_to_dest = zip([37.541, 37.541, 37.541, 37.541, 37.541],
                     [35.6804, 35.6804, 35.6804, 35.6804, 35.6804],
                     [126.986, 126.986, 126.986, 126.986, 126.986],
                     [139.7690, -77.0369, 120.9842, 2.3522, 37.6173])

fig = go.Figure()

# for 문을 활용하여 위경도 입력
for a,b,c,d in source_to_dest:
    fig.add_trace(go.Scattergeo(
                        lat =[a,b],
                        lon =[c,d],
                        mode ='lines',
                        line = dict(width=1, color ='red'),
                        opacity = 0.5 # 선 투명도
                        ))

fig.update_layout(
                margin= {'t':0, 'b':0, 'l':0, 'r':0, 'pad':0},
                showlegend=False,
                geo = dict(
                showcountries=True)     # 국가 경계선
)

fig.show()

시작점과 도착점의 위도, 경도를 입력하고 반복문으로 입력했던 모든 경로를 시각화한다