### 환경 설정

In [None]:
import warnings
warnings.filterwarnings("ignore")

In [None]:
import seaborn as sns
from matplotlib import pyplot as plt
from matplotlib import rcParams
sns.set()
%matplotlib inline
rcParams['font.family'] = 'Malgun Gothic'
rcParams['axes.unicode_minus'] = False 

### 데이터 준비

In [None]:
import pandas as pd
data = pd.read_csv("../../데이터/재무제표_분석용데이터.csv",
                   encoding = "euc-kr",
                   usecols = ['기업', '연도', '현재_주가', '미래_주가', '배당금'])

In [None]:
import numpy as np
# 미래_배당금 및 배당유무 컬럼 추가
data.rename({"배당금":"현재_배당금"}, axis = 1, inplace = True)
data['미래_배당금'] = np.nan
data['미래_배당금'].iloc[:-1] = data['현재_배당금'].iloc[1:]
data.loc[data['연도'] == 2020, '미래_배당금'] = np.nan
data['배당유무'] = (data['현재_배당금'] > 0)
data.dropna(inplace = True)

### 데이터 탐색 및 시각화

#### 배당 비율 시각화

In [None]:
num_div = data.groupby('연도')['배당유무'].sum() 
num_corp = data['연도'].value_counts()
div_ratio = num_div / num_corp
div_ratio.plot(kind = "bar", figsize = (8, 5), title = "배당한 기업 비율")

#### 배당 유무에 따른 수익률 비교

In [None]:
data['수익률'] = (data['미래_주가'] - data['현재_주가']) / data['현재_주가'] * 100

In [None]:
display(data.groupby(['연도', '배당유무'])['수익률'].describe().round(2))

#### 주가 대비 배당 비율에 따른 수익률 비교

In [None]:
data['배당금/주가'] = data['현재_배당금'] / data['현재_주가']

In [None]:
data["배당금/주가 그룹"] = 0
for year in range(2013, 2020):
    idx = data.loc[(data["연도"] == year) & (data["배당유무"])].index
    data.loc[idx, "배당금/주가 그룹"] = pd.qcut(
        data.loc[idx, "배당금/주가"], 4, labels=[1, 2, 3, 4]
    ).astype(int)

In [None]:
graph_data = data.groupby(['연도', '배당금/주가 그룹'])['수익률'].mean().unstack()
plt.figure(figsize = (6, 6))
sns.heatmap(graph_data, annot = True, fmt = ".2f", linewidth = 1)
plt.show()

### 동일 가중 교체 매매에 따른 수익 비교

In [None]:
result = []
for year in range(2013, 2020):
    y_data = data.loc[data['연도'] == year]
    record = []
    for group in range(5):
        group_data = y_data.loc[data['배당금/주가 그룹'] == group]
        inve_per_stock = 10**8 / len(group_data)
        num_stock_list = inve_per_stock / group_data['현재_주가']
        ror_list = (group_data['미래_주가'] - group_data['현재_주가'] + group_data['미래_배당금']) / group_data['현재_주가'] * 100
        profit = (inve_per_stock * ror_list / 100).sum()
        profit_ratio = profit / 10 ** 8 * 100
        result.append([year, group, profit_ratio])
result = pd.DataFrame(result, columns = ["연도", "그룹", "수익률"])

In [None]:
plt.figure(figsize = (12, 6))
for group in range(5):
    graph_data = result.loc[(result['그룹'] == group), '수익률'].values    
    plt.plot(graph_data, marker = "o", label = group)
plt.xticks(range(7), range(2013, 2020))
plt.legend()
plt.ylabel("수익률")
plt.xlabel("연도")

In [None]:
display(result.groupby('그룹')['수익률'].describe().round(2))