### 데이터 준비

In [None]:
import pandas as pd
cols = ["기업", "연도", "현재_주가", "미래_주가", "영업이익_상태", "당기순이익_상태"]
data = pd.read_csv("../../데이터/재무제표_분석용데이터.csv",
                   usecols = cols,
                   encoding="euc-kr")

In [None]:
data.dropna(inplace = True)

### 환경 설정

In [None]:
import warnings
warnings.filterwarnings("ignore")

In [None]:
import seaborn as sns
from matplotlib import pyplot as plt
from matplotlib import rcParams
sns.set()
%matplotlib inline
rcParams['font.family'] = 'Malgun Gothic'
rcParams['axes.unicode_minus'] = False

### 데이터 탐색 및 시각화

#### 상태 변수 분포 확인

In [None]:
display(data['영업이익_상태'].value_counts(normalize = True))

In [None]:
display(data['당기순이익_상태'].value_counts(normalize = True))

#### 상태에 따른 수익률 시각화

In [None]:
data['수익률'] = (data['미래_주가'] - data['현재_주가']) / data['현재_주가'] * 100

In [None]:
# 영업이익 상태에 따른 수익률 시각화
plt.figure(figsize = (10, 6))
graph_data = []
for state in ["흑자지속", "적자지속", "흑자전환", "적자전환"]:
    value = data.loc[data["영업이익_상태"] == state, "수익률"]
    graph_data.append(value)
plt.boxplot(graph_data)
plt.ylim(-100, 100)
plt.xticks([1, 2, 3, 4], ["흑자지속", "적자지속", "흑자전환", "적자전환"])
plt.ylabel("수익률")

In [None]:
# 당기순이익 상태에 따른 수익률 시각화
plt.figure(figsize = (10, 6))
graph_data = []
for state in ["흑자지속", "적자지속", "흑자전환", "적자전환"]:
    value = data.loc[data["당기순이익_상태"] == state, "수익률"]
    graph_data.append(value)
plt.boxplot(graph_data)
plt.ylim(-100, 100)
plt.xticks([1, 2, 3, 4], ["흑자지속", "적자지속", "흑자전환", "적자전환"])
plt.ylabel("수익률")

#### 상태에 따른 수익률 통계량 확인

In [None]:
display(data.groupby(['영업이익_상태'])['수익률'].describe().round(2))

In [None]:
display(data.groupby(['당기순이익_상태'])['수익률'].describe().round(2))

### 동일 가중 교체 매매 방법에 따른 수익 비교

#### 영업이익 상태 기준

In [None]:
result = []
for year in range(2014, 2020):
    y_data = data.loc[data['연도'] == year]
    for state in ["흑자지속", "적자지속", "흑자전환", "적자전환"]:
        # 영업이익 상태와 연도에 따른 수익률 정의 
        ror_list = y_data.loc[data["영업이익_상태"] == state, "수익률"]
        inve_per_stock = 10 ** 8 / len(ror_list) # 종목별 투자금 계산
        profit = (inve_per_stock * ror_list / 100).sum()
        profit_ratio = profit / 10 ** 8 * 100
        result.append([year, state, profit_ratio])
result = pd.DataFrame(result, columns = ["연도", "상태", "수익률"]) 

In [None]:
plt.figure(figsize = (10, 4))
for state in ["흑자지속", "적자지속", "흑자전환", "적자전환"]:
    graph_data = result.loc[(result['상태'] ==  state), '수익률'].values    
    plt.plot(graph_data, marker = "o", label = state)
plt.xticks(range(6), range(2014, 2020))
plt.legend()
plt.ylabel("수익률(%)")
plt.xlabel("연도")

In [None]:
display(result.groupby('상태')['수익률'].describe().round(2))

#### 당기순이익 상태 기준

In [None]:
result = []
for year in range(2014, 2020):
    y_data = data.loc[data['연도'] == year]
    for state in ["흑자지속", "적자지속", "흑자전환", "적자전환"]:
        # 당기순이익 상태와 연도에 따른 수익률 정의 
        ror_list = y_data.loc[data["당기순이익_상태"] == state, "수익률"]
        inve_per_stock = 10 ** 8 / len(ror_list) # 종목별 투자금 계산
        profit = (inve_per_stock * ror_list / 100).sum()
        profit_ratio = profit / 10 ** 8 * 100
        result.append([year, state, profit_ratio])
result = pd.DataFrame(result, columns = ["연도", "상태", "수익률"]) 

In [None]:
plt.figure(figsize = (10, 4))
for state in ["흑자지속", "적자지속", "흑자전환", "적자전환"]:
    graph_data = result.loc[(result['상태'] ==  state), '수익률'].values    
    plt.plot(graph_data, marker = "o", label = state)
plt.xticks(range(6), range(2014, 2020))
plt.legend()
plt.ylabel("수익률")
plt.xlabel("연도")

In [None]:
display(result.groupby('상태')['수익률'].describe().round(2))