In [None]:
### Folium ###
# : Open Street Map과 같은 지도 데이터에 Leaflet.js를 이용하여 위치정보를 시각화하기 위한 라이브러리
# > Leaflet.js : 모바일 친화적인 인터랙티브 지도용 오픈 소스 JavaScript 라이브러리
# > 지도상의 위치 표시를 위해 위도, 경도 사용

# 좌표 값 얻디
# > 구글 지도 사용 (http://www.google.com/maps)
# 1) 좌표 값을 얻고자 하는 곳을 구글 지도에서 검색
# 2) 지도상의 빨간색 마커에 마우스 우클릭, '이곳이 궁금한가요?' 선택
# 3) 하단에 주소 및 위도, 경도 좌표 값 표시

## Folium 관련 함수 ###
# Map() - 지도 정보 불러오기, map_osm = folium.Map(location=[위도, 경도], zoom_start=값, tiles=배경 지도 선택)
# Marker() - 지도 정보에 특정 위치를 표시하는 표식 출력, folium.Marker([위도, 경도], popup='표시이름').add_to(map_osm)
# Icon() - 특정아이콘 표시, folium.Marker([위도, 경도], popup='표시이름', icon=folium.Icon(color=색상, icon=아이콘형태).add_to(map_osm))
# CircleMarker() - 서클 마커를 만들기 위함, folium.CircleMarker([위도, 경도], radius=반지름, color=외관선색, fill_color=채우기투명도).add_to(map_osm)
# save() - 불러온 지도 정보를 HTML형식으로 저장, map_osm.save('저장위치/파일명.html')

import folium
map_osm = folium.Map(location=[37.566345, 126.977893], zoom_start = 18)
folium.Marker([37.566345, 126.977893], popup = '서울특별시청', icon = folium.Icon(color = 'red', icon = 'info-sign')).add_to(map_osm) # 빨간아이콘 누르면 Marker가 뜸

map_osm # 출력

In [None]:
### 서클마커 만들기 ###

import folium

map_osm = folium.Map(location=[37.566345, 126.977893], zoom_start = 18) # 지도 시작 표시 지점
folium.CircleMarker([37.566043, 126.975135], popup = '덕수궁', radius = 100, color = 'blue', fill_color = 1).add_to(map_osm) # 빨간아이콘 누르면 Marker가 뜸

map_osm.save('/content/map.html') # 출력, 저장, 다운로드해서 html파일을 열 수 있음

In [None]:
### tiles 속성 
# - Stamen Terrain : 지도 시각화 할 때 산림 위주로 보여주는 스타일 형식
# - Staman Toner : 지도 시각화 할 때 하천과 길 위주로 보여주는 스타일 형식

## 서울N타워 위치에 Marker하기 ##
import folium

x = 37.551391 # 위도값
y = 126.988248  # 경도값

n_tower = folium.Map([x, y], zoom_start = 16, width = 500, height = 400)

folium.Marker([x, y], popup = "서울N타워", tooltip = "클릭!").add_to(n_tower) # tooltip은 마우스 올렸을 때 문자열, popup-클릭하면 나오는 문자열
n_tower

In [None]:
## 위 서울N타워 Marker icon 변경 ##

import folium

x = 37.551391 # 위도값
y = 126.988248  # 경도값

n_tower = folium.Map([x, y], zoom_start = 16, width = 500, height = 400)

folium.Marker([x, y], popup = "서울N타워", tooltip = "클릭!", icon = folium.Icon(icon = "flash", color = "red")).add_to(n_tower) # tooltip은 마우스 올렸을 때 문자열, popup-클릭하면 나오는 문자열
n_tower

In [None]:
## 남산공원에 CircleMarker 하기 ##

import folium

x = 37.551391 # 위도값
y = 126.988248  # 경도값

n_tower = folium.Map([x, y], zoom_start = 16, width = 500, height = 400)

folium.CircleMarker([x, y], radius = 200, color = "red", fill_color = "blue", popup = "남산공원 면적", tooltip = "여기는 남산공원!!!").add_to(n_tower) # tooltip은 마우스 올렸을 때 문자열, popup-클릭하면 나오는 문자열
n_tower

In [None]:
### 자연어 처리 (NLP) ###
# 자연어의 의믜를 분석하여 컴퓨터가 처리할 수 있도록 하는 일

## KoNLPy ##
# - 자연언어 처리를 위해서 텍스트를 컴퓨터가 연산할 수 있는 형태로 변경 -> 형태소 단위 분리 -> KoNLPY를 이용! (한국어 정보처리를 위한 Python package)
# - from konlpy.tag import Hannanum
!pip install konlpy  # 먼저 설치!

## KoNLPy 함수 ##
# analyze() - 텍스트를 분석한 결과를 반환, H
# morphs() - 텍스트를 형태소 단위로 나눔, H, Kk, Ko, M, O
# nouns() - 텍스트에서 명사만 추출, H, Kk, Ko, M, O
# phrases() - 텍스트에서 어절을 추출, O
# pos() - 텍스트를 형태소 단위로 나누고, 각 형태소에 해당되는 품사를 알려줌

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [None]:
### 함수 사용 ###

from konlpy.tag import Hannanum
engine = Hannanum()

text = '나는 대학생이다. 내가 듣는 수업은 4차산업혁명과데이터사이언스다.'

print(engine.analyze(text))
print(engine.morphs(text))
print(engine.nouns(text))
print(engine.pos(text))

[[[('나', 'ncn'), ('는', 'jxc')], [('나', 'npp'), ('는', 'jxc')], [('나', 'pvg'), ('는', 'etm')], [('나', 'px'), ('는', 'etm')], [('나', 'pvg'), ('아', 'ecs'), ('는', 'jxc')], [('나', 'pvg'), ('아', 'ef'), ('는', 'etm')], [('나', 'px'), ('아', 'ecs'), ('는', 'jxc')], [('나', 'px'), ('아', 'ef'), ('는', 'etm')], [('날', 'pvg'), ('는', 'etm')]], [[('대학생', 'ncn'), ('이', 'jp'), ('다', 'ef')], [('대학생', 'ncn'), ('이', 'ncn'), ('이', 'jp'), ('다', 'ef')], [('대학', 'ncn'), ('생', 'ncn'), ('이', 'jp'), ('다', 'ef')]], [[('.', 'sf')], [('.', 'sy')]], [], [[('나', 'npp'), ('가', 'jcs')], [('나', 'npp'), ('가', 'jcc')], [('내', 'pvg'), ('어', 'ecx'), ('가', 'px'), ('아', 'ecs')]], [[('듣', 'pvg'), ('는', 'etm')]], [[('수업', 'ncpa'), ('은', 'jxc')], [('수업', 'ncpa'), ('은', 'ncn')]], [[('4차산업혁명과데이터사이언스', 'ncn'), ('이', 'jp'), ('다', 'ef')], [('4차산업혁명과데이터사이언스다', 'ncn')], [('4차산업혁명과데이터사이언스', 'nqq'), ('이', 'jp'), ('다', 'ef')], [('4차산업혁명과데이터사이언스다', 'nqq')]], [[('.', 'sf')], [('.', 'sy')]]]
['나', '는', '대학생', '이', '다', '.', '나', '가', '듣', '는', '수업',

In [None]:
### koNLPy의 Kkma 사용 ###

from konlpy.tag import Kkma
engine = Kkma()

text = '나는 대학생이다. 내가 듣는 수업은 4차산업혁명과데이터사이언스다.'

print(engine.morphs(text))  # Kkma는 이 3가지만 제공
print(engine.nouns(text))
print(engine.pos(text))
### 형태소 분석기 엔진에 따라 결과값이 조금씩 다르다. 보통 Hannanum 사용

['나', '는', '대학생', '이', '다', '.', '내', '가', '듣', '는', '수업', '은', '4', '차', '산업', '혁명', '과', '데이터', '사이언스', '이', '다', '.']
['나', '대학생', '내', '수업', '4', '4차산업혁명', '차', '산업', '혁명', '데이터', '데이터사이언스', '사이언스']
[('나', 'NP'), ('는', 'JX'), ('대학생', 'NNG'), ('이', 'VCP'), ('다', 'EFN'), ('.', 'SF'), ('내', 'NP'), ('가', 'JKS'), ('듣', 'VV'), ('는', 'ETD'), ('수업', 'NNG'), ('은', 'JX'), ('4', 'NR'), ('차', 'NNM'), ('산업', 'NNG'), ('혁명', 'NNG'), ('과', 'JC'), ('데이터', 'NNG'), ('사이언스', 'NNG'), ('이', 'VCP'), ('다', 'EFN'), ('.', 'SF')]


In [None]:
### 워드 클라우드 만들기 ###
# - 문서의 키워드, 개념 등을 직관적으로 파악할 수 있도록 핵심 단어를 시각적으로 돋보이게 하는 기법
# - 큰 단어: 많이 언급된 키워드
# - 작은 단어: 적게 언급된 키워드

## 워드 클라우드 함수 ##
# from wordcloud import WordCloud
# font_path - 출력될 폰트 사용할 폰트의 주소
# relative_scale - 단어들 간의 간격 (0.0 ~ 1.0)
# mask - 사용할 이미지이ㅢ 정보가 있는 배열
# Background_color - 워드 클라우드의 배경 색
# min_font_size, max_font_size - 워드 클라우드 글자의 최소(min), 최대(max) 크기
# max_words - 적용할 최대 단어수
# width, height - 이미지의 가로(width), 세로(height) 크기

# generate_from_frequencies() : 단어 빈도수의 정보를 입력 받는 함수
# Matplotlib 이용해서 plt.imshow(): 데이터로 이루어진 배열을 이미지로 출력

In [8]:
### WordCloud 만들어보기

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

from konlpy.tag import Hannanum
from collections import Counter
import matplotlib.pyplot as plt
from wordcloud import WordCloud

text = open("2018_president_message.txt","r",encoding = 'cp949').read() # 'r'은 read, 'cp949'는 한글을 읽어올 때 반드시 포함!

engine = Hannanum # KoNLpy의 Hannanum 형태소분석기 사용
nouns_list=engine.nouns(text)  # text에서 명사만 추출

nouns = [ n for n in nouns_list if len(n) > 1] # 두 단어 이상인 단어들만 nouns 리스트에 저장

count = Counter(nouns)  # 명사 counter
tags = count.most_common(50)  # 빈도수가 높은(most_common) 상위 50개인 명사들을 tags로 지정

wordcloud = WordCloud(font_path = 'usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf', background_color = 'white', width = 1200, height = 800).generate_from_frequencies(dict(tags))
# colab 사용하면 txt파일 업로드
fig = plt.figure(figsize = (12, 12))  # size는 12*12
plt.axis('off')
plt.imshow(wordcloud)
plt.show()

Reading package lists... Done
Building dependency tree       
Reading state information... Done
fonts-nanum is already the newest version (20170925-1).
The following package was automatically installed and is no longer required:
  libnvidia-common-460
Use 'sudo apt autoremove' to remove it.
0 upgraded, 0 newly installed, 0 to remove and 19 not upgraded.
/usr/share/fonts: caching, new cache contents: 0 fonts, 1 dirs
/usr/share/fonts/truetype: caching, new cache contents: 0 fonts, 3 dirs
/usr/share/fonts/truetype/humor-sans: caching, new cache contents: 1 fonts, 0 dirs
/usr/share/fonts/truetype/liberation: caching, new cache contents: 16 fonts, 0 dirs
/usr/share/fonts/truetype/nanum: caching, new cache contents: 10 fonts, 0 dirs
/usr/local/share/fonts: caching, new cache contents: 0 fonts, 0 dirs
/root/.local/share/fonts: skipping, no such directory
/root/.fonts: skipping, no such directory
/var/cache/fontconfig: cleaning cache directory
/root/.cache/fontconfig: not cleaning non-existent

TypeError: ignored

In [11]:
!apt-get -qq install -y libarchive-dev && pip install -U libarchive
import libarchive

!apt-get -qq install -y graphviz && pip install pydot
import pydot

!pip install cartopy
import cartopy

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting cartopy
  Downloading Cartopy-0.20.3.tar.gz (10.8 MB)
[K     |████████████████████████████████| 10.8 MB 2.7 MB/s 
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25herror
  Downloading Cartopy-0.20.2.tar.gz (10.8 MB)
[K     |████████████████████████████████| 10.8 MB 28.3 MB/s 
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25herror
  Downloading Cartopy-0.20.1.tar.gz (10.8 MB)
[K     |████████████████████████████████| 10.8 MB 19.3 MB/s 
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25herror
  Do

In [9]:
### WordCloud 또 다른 예제

from konlpy.tag import Hannanum
from collections import Counter
import matplotlib.pyplot as plt
from wordcloud import WordCloud, ImageColorGenerator
from PIL import image
import numpy as np

mask = np.array(Image.open("korea_map.jpg"))
image_colors = ImageColorGenerator(mask)

text = open("2018_president_message.txt", "r", encoding = 'cp949').read() 

engine = Hannanum 
nouns_list = engine.nouns(text)  
nouns = [ n for n in nouns_list if len(n) > 1] 
count = Counter(nouns)  
tags = count.most_common(50)  

wordcloud = WordCloud(font_path = 'usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf',
                      relative_scaling= 0.1, mask = mask, background_color = 'white',
                      min_font_size = 5, max_font_size = 100, max_words = 6000).generate_from_frequencies(dict(tags))

fig = plt.figure(figsize = (12, 12))  
plt.axis('off')
plt.imshow(wordcloud.recolor(color_func = image_colors), interpolation= "bilinear")
plt.show()

ImportError: ignored