In [1]:
import pandas as pd
import numpy as np

# 1. 종합데이터로 기업 순위 매기기

## 1) 키워드 파일 가공하기

In [None]:
#키워드 빈도수 파일 불러오기
keyword_category_df = pd.read_csv('c:/pywork/keyword_category.csv', encoding = 'euc-kr')

In [None]:
#빈도수 세기
temp_df = keyword_category_df.groupby(['카테고리']).count()

In [None]:
#키워드 빈도수 데이터프레임 순위화
category_count_result_temp = temp_df.sort_values('counts', ascending = False)
category_count_result = category_count_result_temp.reset_index()
category_count_result_df = category_count_result['카테고리']

## 2) 종합순위 데이터프레임 만들기

In [None]:
#기업 순위 정보 파일 불러오기
event_rank_df = pd.read_csv('c:/pywork/event_rank_df.csv', encoding = 'euc-kr')

In [None]:
#원하는 상위 키워드 개수 고르기
category_count_result_10 = category_count_result_df.head(10)

In [None]:
#데이터프레임 합치고 정리하기
total_rank_temp = pd.merge(event_rank_df, category_count_result_10, how='inner')
total_rank_temp = total_rank_temp[['카테고리', '기업명', '기업코드', '순이익률', 'ROE', '부채비율', 'PER', '종합순위']]
total_rank = total_rank_temp.sort_values('종합순위', ascending = True)

In [None]:
#원하는 개수의 기업랭킹 가져오기
total_rank_result = total_rank.head(30)
total_rank_result

In [None]:
#파일 저장하기
total_rank_result.to_csv('c:/pywork/total_rank_result.csv', encoding = 'euc-kr')

# 2. 시세 그래프 그리기

## 1) 시세 데이터 가져오기

In [None]:
import requests

import matplotlib.pyplot as plt
import matplotlib.ticker as ticker

from matplotlib import font_manager, rc
from matplotlib.gridspec import GridSpec
from urllib import parse
from ast import literal_eval

In [None]:
#데이터 불러오기
rank = pd.read_csv('c:/pywork/total_rank_result.csv', encoding = 'euc-kr')

#상위 5개 데이터로 가공하기
rank_code = list(rank['기업코드'].head(5))

In [None]:
#원하는 기업의 기업코드 가져오기
#상위 1위 기업 선택
company_num = rank_code[0]

In [None]:
def get_price(code, start_time, end_time, time_from='week') :
    get_price_data = { 'symbol':code, 'requestType':1, 'startTime':start_time,
                 'endTime':end_time, 'timeframe':time_from
    }
    get_price_data = parse.urlencode(get_price_data)
    url="https://api.finance.naver.com/siseJson.naver?%s"%(get_price_data)
    response = requests.get(url)
    return literal_eval(response.text.strip())

In [None]:
#일간시세표 만들기
#'기업코드', '시작날짜', '종료날짜', 'day' 입력
price = get_price(company_num, '20190716', '20210726', 'day')
price_day_df = pd.DataFrame(data = price[1:], columns = price[0])

In [None]:
#주간시세표 만들기
#'기업코드', '시작날짜', '종료날짜', 'week' 입력
price = get_price(company_num, '20190716', '20210724', 'week')
price_week_df = pd.DataFrame(data = price[1:], columns = price[0])

In [None]:
#월간시세표 만들기
#'기업코드', '시작날짜', '종료날짜', 'month' 입력
price = get_price(company_num, '20190716', '20210724', 'month')
price_month_df = pd.DataFrame(data = price[1:], columns = price[0])

## 2) 그래프 그리기

In [None]:
price_week_df2 = price_week_df.reset_index()

In [None]:
fig, [ax1, ax2] = plt.subplots(2, 2, figsize=(15, 15))

gs = GridSpec(nrows=2, ncols=2)

ax1 = fig.add_subplot(gs[0,0])
ax1.plot(price_day_df['날짜'], price_day_df['종가'], label="종가",color='y')
ax1.set_xlabel("날짜(일)", size=20)
ax1.set_ylabel("주가(원)", size=20)
ax1.xaxis.set_major_locator(ticker.MaxNLocator(10))
plt.xticks(rotation = 15)

ax1 = fig.add_subplot(gs[0,1])
ax1.plot(price_week_df['날짜'], price_week_df['종가'], label="종가", color='b')
ax1.set_xlabel("날짜(주)", size=20)
ax1.set_ylabel("주가(원)", size=20)
ax1.xaxis.set_major_locator(ticker.MaxNLocator(10))
plt.xticks(rotation = 15)

ax2 = fig.add_subplot(gs[1,0])
ax2.plot(price_month_df['날짜'], price_month_df['종가'], label="종가", color='g')
ax2.set_xlabel("날짜(월)", size=20)
ax2.set_ylabel("주가(원)", size=20)
ax2.xaxis.set_major_locator(ticker.MaxNLocator(10))
plt.xticks(rotation = 15)

#추세선 그리기
ax3 = fig.add_subplot(gs[1,1])
ax3.plot(price_week_df2['index'], price_week_df2['종가'], label="종가", color='purple')
ax3.set_ylabel("주가(원)", size=20)
ax3.xaxis.set_major_locator(ticker.MaxNLocator(10))
z = np.polyfit((price_week_df2['index']), (price_week_df2['종가']), 1)
p = np.poly1d(z)
plt.plot(price_week_df2['index'],p(price_week_df2['index']),"r--")

plt.xticks(rotation = 15)

font_path = "C:/Windows/Fonts/H2GTRE.TTF"
font = font_manager.FontProperties(fname=font_path).get_name()
rc('font', family=font)

plt.show()