### 한국에서 코로나 바이러스와 관련하여 네어버에 검색된 단어들에 대한 데이터셋 처리
 
 - 코로나 바이러스에 감염된 사람들에 대한 분석을 진행해 봄
 
 - 이제는 한국에서 네이버 검색 포털에 검색된 단어를 기반으로 분석을 진행해보자
 
 - csv 파일 형식
 
 - 단어 : the search volume of 'XXX' in Korean in NAVER
 
 - column 항목
 
 > 0. 날짜
 > 
 > 1. cold 라는 단어의 검색 수치
 > 
 > 2. flu 라는 단어의 검색 수치
 > 
 > 3. pneumonia 라는 단어의 검색 수치
 > 
 > 4. coronavirus 라는 단어의 검색 수치

###### 사용할 모듈에 대한 정의 및 ipython notebook setup

In [None]:
# draw charts
%matplotlib notebook

from matplotlib import pyplot as plt
import numpy as np

###### 검색된 단어에 대한 csv 파일 읽기

In [None]:
# CSV 파일 읽어들이기

import csv  # csv 모듈 임포트
import pprint

# 파일 위치, 경로 정의
file_path = '01_South_Korea/trend.csv'

# trend.csv 파일 열기
with open(file_path) as file:
    reader = csv.reader(file)  # CSV 파일을 읽어들이는 읽기 객체
    raw = list(reader)      #  CSV 파일 내용을 리스트로 읽어들인다

pprint.pprint(raw[:10])  # 읽어들인 내용을 화면에 출력

###### 읽어드린 데이터를 list 처리하기

In [None]:
# 안내를 위한 row를 삭제
raw_ = raw[1:]

In [None]:
date_list = []
cold_trend = []
flu_trend = []
pneumonia_trend = []
coronavirus_trend = []

for i in range(len(raw_)):
    date = raw_[i][0]
    cold_value = float(raw_[i][1])
    flu_value = float(raw_[i][2])
    pneumonia_value = float(raw_[i][3])
    coronavirus_value = float(raw_[i][4])
    
    date_list.append(date)
    cold_trend.append(cold_value)
    flu_trend.append(flu_value)
    pneumonia_trend.append(pneumonia_value)
    coronavirus_trend.append(coronavirus_value)

###### draw 'cold' word trend

In [None]:
# draw line graph
dates = date_list
counts = cold_trend

x_pos = [i for i, _ in enumerate(dates)]

plt.plot(x_pos, counts, color='black')
plt.xlabel("date")
plt.ylabel("volume of word")
plt.title("search 'cold' in NAVER after infection COVID 19")

plt.xticks(x_pos, dates, rotation=90)

plt.show()

 - 위의 그래프가 가지는 문제는 무엇일까? 해결 방법은?
 
 - 이를 아래와 같이 해결해보자

In [None]:
# draw line graph
dates = date_list
counts = cold_trend

x_pos = [i for i, _ in enumerate(dates)]

dates_sorting = []
for i in range(len(dates)):
    if i % 5 == 0:
        dates_sorting.append(dates[i])
    else:
        dates_sorting.append("")

plt.plot(x_pos, counts, color='black')
plt.xlabel("date")
plt.ylabel("volume of word")
plt.title("search 'cold' in NAVER after infection COVID 19")

plt.xticks(x_pos, dates_sorting, rotation=90)

plt.show()

###### draw 'flu' word trend

In [None]:
# draw line graph


###### draw 'pneumonia' word trend

In [None]:
# draw line graph


###### draw 'corona virus' word trend

In [None]:
# draw line graph


### data를 균일화하여 같이 확인해보기

 - 이전에 그렸던 그래프들을 한번에 그려서 확인해보자

In [None]:
# x axis dates data
dates_sorting
x_pos

# labels for legend
labels_word = ['cold', 'coronavirus'] # add code!

# each word data
cold_trend
flu_trend
pneumonia_trend
coronavirus_trend

# plot each value in word data 
plt.plot(x_pos, cold_trend, color='red')
plt.plot(x_pos, coronavirus_trend, color='magenta') # add code!

# plot legend
plt.legend(labels_word)

# plot each axis info.
plt.xlabel("date")
plt.ylabel("volume of word")
plt.title("search 'word' in NAVER after infection COVID 19")
plt.xticks(x_pos, dates_sorting, rotation=90)

plt.show()

 - 이 그래프에서 불편한 점이 있다면 무엇일까?
 
 - 보완해서 그래프를 그려보자

In [None]:
# x axis dates data
dates_sorting
x_pos

# labels for legend
labels_word = ['cold', 'flu', 'pneumonia', 'coronavirus']

# each word data with normalization
cold_trend_normalized = [float(i)/max(cold_trend) for i in cold_trend]
flu_trend_normalized = [float(i)/max(flu_trend) for i in flu_trend]
pneumonia_trend_normalized = [float(i)/max(pneumonia_trend) for i in pneumonia_trend]
coronavirus_trend_normalized = [float(i)/max(coronavirus_trend) for i in coronavirus_trend]

# plot each value in word data
plt.plot(x_pos, cold_trend_normalized, color='red')
plt.plot(x_pos, flu_trend_normalized, color='green')
plt.plot(x_pos, pneumonia_trend_normalized, color='blue')
plt.plot(x_pos, coronavirus_trend_normalized, color='magenta')

# plot legend
plt.legend(labels_word)

# plot each axis info.
plt.xlabel("date")
plt.ylabel("volume of word")
plt.title("search 'word' in NAVER after infection COVID 19")
plt.xticks(x_pos, dates_sorting, rotation=90)

plt.show()