# TASK #1: PROJECT OVERVIEW AND ASSET TYPES
- 주식, 채권, ETF 또는 상장 펀드와 같은 자산 그룹인 포트폴리오 분석
- Study 내용 
    - 무작위 할당 
    - 샤프 비비율 계산
    - 수익률, 위험률 계산 
    - 개인 증권과 포트폴리오에 대한 누적 수익율에 관한 내용

![alt text](https://drive.google.com/uc?id=1TEVVCFWQD8F5mlC7FzD-JM2y54ivYZHT)

- 여기서 말하는 포트폴리오는 간단히 말해 채권(고정소득증권)과 같은 금융 투자 집합체 이다.
- 포트폴리오에서는 현금이나 현금성 자산의 뮤추얼 펀드, 상장 지수펀드가 포함될 수도 있다. 
- 주요 쟁점은 고객의 자산으로 어디에 투자를 할지 할당하는 것이다. 
- 그래서 모든 것은 고객의 데이터를 들여다 봐야 분석이 가능하다.

#### 자산 유형 소개
- 주식
- 고정수익증권(채권)
- 상장지수펀드(ETF)

![alt text](https://drive.google.com/uc?id=1Z253Wmij7HCEHqPsMdEI56qYqASRrsjn)


- 주식은 간다힌 말해 회사의 특정 비율에 대한 소유권을 나타낸다.
- 주식은 단순히 소유주가 얼마나 많은 주식을 보유하고 있는지에 따라 주어진 회사의 일부 주식에 대한 권리를 소유자에게 부여한다.
- 주식은 유동성 자산이다.
- 주식들은 미국을 기준으로 뉴욕 증권 거래소와 같은 증권 거래소에서 거래된다.(개인은 온라인 중개 회사(투자사)를 통해 구매할 수 있음)

![alt text](https://drive.google.com/uc?id=10XxwtKY2qEiNAdTkqNXKhNFZrWvwwKbN)

- 고정수익증권(채권)은 일반적으로 정부나 기업에서 발행하고 투자자가 차용인(빌려주는 사람)에게 헌 대출을 나타내는 고정 수입 증권 이다. 
- 따라서 채권은 투자자에게 정해진 고정 이자율을 지불한다. 
    - 예를 들어 미국 국채는 연 2퍼센트를 지불하는데, 이 투자는 대체적으로 안전하기 떄문에 수익이 보장된다.
- 그래서 채권은 기본적으로 회사와 정부에서 자본을 조달하고 투자자에게 증서를 준다. 
- 일반적으로 채권은 주식에 비해 덜 위험하다.(비교적 안전 자산에 속한다.)

![alt text](https://drive.google.com/uc?id=1SfBtfOoDigo4ofEvPAwIojqGHpMojL5S)

- 상장지수펀드(ETF)는 유가 증권 그룹을 포함하며 미국을 기준으로 S&P500과 같은 추적 및 지수를 포함하는 증권 유형이다.
- ETF는 기본적으로 무퓨얼 펀드(주식 발행을 통해 투자자를 모집하여 형성된 투자자금을 전분 투자사가 운영햐도록 맡김)와 비슷하다. 하지만 ETF는 시장성이 있는 증권이기 때문에 다른 주식들과 유사하게 거래소에서 거래가 가능하다. 
- ETF는 일반적으로 관리 수수료가 매우 낮고 리스크 분산을 위한 좋은 장치로도 쓰인다.

Links:
- https://www.bankofcanada.ca/rates/interest-rates/canadian-bonds/
- https://ca.finance.yahoo.com/quote/AAPL?p=AAPL&.tsrc=fin-tre-srch
- https://investor.vanguard.com/etf/profile/performance/voo
- https://grow.acorns.com/warren-buffett-index-funds/



# TASK #2: IMPORT LIBRARIES & DATASETS AND PERFORM DATA VISUALIZATION

In [1]:
import pandas as pd
import plotly.express as px
from copy import copy
from scipy import stats
import matplotlib.pyplot as plt
import numpy as np
import plotly.figure_factory as ff
import plotly.graph_objects as go

import warnings
warnings.filterwarnings("ignore")

In [2]:
# Read the stock data file
stocks_df = pd.read_csv("data/stock.csv")
stocks_df

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500
0,2012-01-12,60.198570,75.510002,30.120001,12.130000,175.929993,180.550003,28.250000,313.644379,1295.500000
1,2012-01-13,59.972858,74.599998,30.070000,12.350000,178.419998,179.160004,22.790001,311.328064,1289.089966
2,2012-01-17,60.671429,75.239998,30.250000,12.250000,181.660004,180.000000,26.600000,313.116364,1293.670044
3,2012-01-18,61.301430,75.059998,30.330000,12.730000,189.440002,181.070007,26.809999,315.273285,1308.040039
4,2012-01-19,61.107143,75.559998,30.420000,12.800000,194.449997,180.520004,26.760000,318.590851,1314.500000
...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,440.250000,174.279999,29.850000,16.719999,3205.030029,125.449997,1485.020020,1473.609985,3327.770020
2155,2020-08-06,455.609985,172.199997,29.840000,18.459999,3225.000000,126.120003,1489.579956,1500.099976,3349.159912
2156,2020-08-07,444.450012,170.020004,30.020000,19.030001,3167.459961,124.959999,1452.709961,1494.489990,3351.280029
2157,2020-08-10,450.910004,179.410004,30.200001,21.650000,3148.159912,127.110001,1418.569946,1496.099976,3360.469971


In [3]:
# Sort the data based on Date
stocks_df = stocks_df.sort_values(by=["Date"])
stocks_df

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500
0,2012-01-12,60.198570,75.510002,30.120001,12.130000,175.929993,180.550003,28.250000,313.644379,1295.500000
1,2012-01-13,59.972858,74.599998,30.070000,12.350000,178.419998,179.160004,22.790001,311.328064,1289.089966
2,2012-01-17,60.671429,75.239998,30.250000,12.250000,181.660004,180.000000,26.600000,313.116364,1293.670044
3,2012-01-18,61.301430,75.059998,30.330000,12.730000,189.440002,181.070007,26.809999,315.273285,1308.040039
4,2012-01-19,61.107143,75.559998,30.420000,12.800000,194.449997,180.520004,26.760000,318.590851,1314.500000
...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,440.250000,174.279999,29.850000,16.719999,3205.030029,125.449997,1485.020020,1473.609985,3327.770020
2155,2020-08-06,455.609985,172.199997,29.840000,18.459999,3225.000000,126.120003,1489.579956,1500.099976,3349.159912
2156,2020-08-07,444.450012,170.020004,30.020000,19.030001,3167.459961,124.959999,1452.709961,1494.489990,3351.280029
2157,2020-08-10,450.910004,179.410004,30.200001,21.650000,3148.159912,127.110001,1418.569946,1496.099976,3360.469971


**MINI CHALLENGE #1:** 
- **Use Plotly express to visualize raw stock data and normalized ones (PX를 사용하여 가공되지 않은 주식 데이터를 시각화하고 데이터도 정규화 하라)** 

In [4]:
# answer - 동적 그래프 시각화를 위한 함수
# 함수 선언 
def interactive_plot(df, title):
    fig = px.line(title=title)      # 객체 생성

    for i in df.columns[1:]:
        fig.add_scatter(x=df["Date"], y=df[i], name=i)  # 실제 그래픽 요소 설정
    
    fig.show()

In [5]:
# answer - 정규화 구하기 - 함수 설정
def normalize(df):
    x = df.copy()             # 데이터프레임 복사 
    for i in x.columns[1:]:   # 첫 번째 컬럼을 제외한 나머지 컬럼 기준 데이터프레임을 기준으로 반복문 작성
        x[i] = x[i]/x[i][0]   # 정규화 계산 - 전체값 / 초기값
    return x

In [6]:
# 일반 데이터로 그린 그래프 
interactive_plot(df=stocks_df, title="Prices")

In [7]:
# answer - 정규화 구하기
normalize(stocks_df)

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500
0,2012-01-12,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000
1,2012-01-13,0.996251,0.987949,0.998340,1.018137,1.014153,0.992301,0.806726,0.992615,0.995052
2,2012-01-17,1.007855,0.996424,1.004316,1.009893,1.032570,0.996954,0.941593,0.998317,0.998587
3,2012-01-18,1.018320,0.994040,1.006972,1.049464,1.076792,1.002880,0.949027,1.005193,1.009680
4,2012-01-19,1.015093,1.000662,1.009960,1.055235,1.105269,0.999834,0.947257,1.015771,1.014666
...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,7.313297,2.308039,0.991036,1.378401,18.217644,0.694821,52.567080,4.698347,2.568715
2155,2020-08-06,7.568452,2.280493,0.990704,1.521847,18.331155,0.698532,52.728494,4.782805,2.585226
2156,2020-08-07,7.383066,2.251622,0.996680,1.568838,18.004093,0.692107,51.423361,4.764919,2.586862
2157,2020-08-10,7.490377,2.375977,1.002656,1.784831,17.894390,0.704016,50.214865,4.770052,2.593956


In [8]:
# 정규화한 데이터로 그린 그래프
interactive_plot(df=normalize(stocks_df), title="NORMALIZED STOCK PRICES")

# TASK #3: UNERSTAND THE CONCEPT OF ASSET ALLOCATION

![alt text](https://drive.google.com/uc?id=17SLLaxLeP6vlXH6MltEQMFNbt5u-J6iK)

- 자산 할당이란 투자위험감수 즉 목표 수익율과 투자 기간을 기준으로 고객의 자산을 할당하는데 사용되는 투자 전략이다.
- 포트폴리오 매니저의 목표는 많은 수익과 리스크를 줄이는 것이다. 
- 어떻게 자산을 할당할 수 있을까? 여러가지 방법이 있지만 대표적으로 아래의 방법으로 많이 분류한다.
    - 주식
    - 채권
    - 현금 등가물
    - ETF 
    - 부동산
    - REIT

![alt text](https://drive.google.com/uc?id=1qLML-ejBIKR8Bv8aeItfNaJuhq5GzvJ5)

- 예시를 들어보자, 만약에 우리가 백만 달러를 투자할 수 있다고 가정해보자. 
- 간단히 하기 위해 위의 열거한 모든 주요 주식에 대한 무작위 비중으로 부터 시작한다. 
- 가지고 있는 백만달러로 9개의 주식들에 대해 백만달러를 나눈다. (이것들이 우리가 할당하려는 비중이 될 것이다.)
- 그럼 WEIGHTS에서 보듯 가중치는 위와 같이 구성되어 있다. (그리고 해당 비중들은 완전 무작위로 뽑힌 것들이다. 이 무작위 비중을 생성하기 위해 넘파이를 사용한댜)
    - 예를 들어 S&P500의 자산 할당을 보고 하면 S&P500의 가중치에서 백단 달러를 곱하면 152,599 달러를 S&P500에 할당한 것을 알 수 있다. 
    - 그리고 예시 표에 나와있는 값을 모두 합산하면 백만달러가 된다.
    - 마지막으로 포트폴리오 일일 가치(portfolio daily worth)를 갖고 있으면 시간에 지남에 따라 포트폴리오의 전체 가치를 추적할 수 있다. 
    - 그리고 일일 수익율을 게산해서도 볼 수있다.(마지막 열 참조)

![alt text](https://drive.google.com/uc?id=1iR3WYvU9SYVRqhKwR91x0AsE5sGQtFhz)

- 그리고 포트폴리 가치를 추적하는 작업도 진행한다. 

**MINI CHALLENGE #2:**
- **What is the common advice that financial advisors generally give to retired seniors when it comes to asset allocations? (금융 설계사가 자산 할당, 특히 주식과 관련하여 은퇴하신 몇몇 어르신들께 일반적으로 하는 조언이 무엇일까?)**

- 일반적으로 주식에 할당될 포트폴리오의 비율을 계산하기 위해 100에서 고객의 나이를 뺀다. 
- 예를들어 당신이 30살이라고 가정한다면, 100에서 30을 뺸다. 그럼 주식에 70%를 할당하게 된다. 여기서 중요한 점은 30살인 당신은 아직 시간이 많이 남아있기에 복리를 활용할 수 있고, 위험을 더 감수할 수 있다.(Hight Risk, Hight Return)
- 만약 당신이 70세 혹은 75세의 은퇴 연장자라고 가정한다면, 100에서 나이를 뺀 금액을 다시 투자해야한다. 여기서는 25% 주식에 이르게 된다. 다시 말해 은퇴한 모든 연장자들은 일반적으로 더 안정적이고 위험이 낮은 포트폴리오를 추천한다.

# TASK #4: PERFORM RANDOM ASSET ALLOCATION AND CALCULATE PORTFOLIO DAILY RETURN

In [28]:
# step 1 무작위 비중 만들기 
# np.random.seed(101)
np.random.seed()

# step 2 만든 무작위 비중 계산(비중 생성)
my_weight = np.array(np.random.random(9))   # 9개의 난수를 행성

# step 3 모든 비중의 합이 1이 되도록 하기 - 지정한 난수들 / 난수들의 합
my_weight = my_weight / np.sum(my_weight)
print(my_weight)

[0.05245343 0.17241652 0.18952423 0.11340316 0.05706149 0.16930714
 0.09578945 0.11286864 0.03717595]


In [29]:
# step 4 정규화 시키기
df_portfolio = normalize(stocks_df)
df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500
0,2012-01-12,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000,1.000000
1,2012-01-13,0.996251,0.987949,0.998340,1.018137,1.014153,0.992301,0.806726,0.992615,0.995052
2,2012-01-17,1.007855,0.996424,1.004316,1.009893,1.032570,0.996954,0.941593,0.998317,0.998587
3,2012-01-18,1.018320,0.994040,1.006972,1.049464,1.076792,1.002880,0.949027,1.005193,1.009680
4,2012-01-19,1.015093,1.000662,1.009960,1.055235,1.105269,0.999834,0.947257,1.015771,1.014666
...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,7.313297,2.308039,0.991036,1.378401,18.217644,0.694821,52.567080,4.698347,2.568715
2155,2020-08-06,7.568452,2.280493,0.990704,1.521847,18.331155,0.698532,52.728494,4.782805,2.585226
2156,2020-08-07,7.383066,2.251622,0.996680,1.568838,18.004093,0.692107,51.423361,4.764919,2.586862
2157,2020-08-10,7.490377,2.375977,1.002656,1.784831,17.894390,0.704016,50.214865,4.770052,2.593956


In [30]:
# step 5 모든 열의 이름들의 목록 얻어내기 
df_portfolio.columns[1:]

Index(['AAPL', 'BA', 'T', 'MGM', 'AMZN', 'IBM', 'TSLA', 'GOOG', 'sp500'], dtype='object')

In [31]:
# step 6 테이블 만들기 - enumerate함수 활용
for counter, stock in enumerate(df_portfolio.columns[1:]):
    # 보유한 주식의 값(정규화된) * 가중치 
    df_portfolio[stock] = df_portfolio[stock] * my_weight[counter]
    # 위에 계산한 가중치 * 100만 달러 
    df_portfolio[stock] = df_portfolio[stock] * 1000000

# 초기 할당 테이블 결과 확인
df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500
0,2012-01-12,52453.425001,172416.523933,189524.227639,113403.163550,5.706149e+04,169307.135579,9.578945e+04,112868.641307,37175.946743
1,2012-01-13,52256.753096,170338.657130,189209.606106,115459.939806,5.786910e+04,168003.691961,7.727581e+04,112035.087944,36992.003028
2,2012-01-17,52865.445986,171800.007579,190342.220974,114525.041507,5.891997e+04,168791.381323,9.019467e+04,112678.628861,37123.433932
3,2012-01-18,53414.391089,171389.002766,190845.605360,119012.553338,6.144335e+04,169794.758876,9.090673e+04,113454.822407,37535.798400
4,2012-01-19,53245.101044,172530.682804,191411.912795,119666.982147,6.306830e+04,169279.004620,9.073719e+04,114648.687791,37721.174831
...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,383607.457065,397943.991826,187825.299044,156314.986080,1.039526e+06,117638.212670,5.035372e+06,530295.991128,95494.404506
2155,2020-08-06,396991.227165,393194.598301,187762.375996,172582.216466,1.046003e+06,118266.497327,5.050833e+06,539828.727860,96108.213449
2156,2020-08-07,387267.095732,388216.889318,188894.990864,177911.155462,1.027340e+06,117178.726896,4.925816e+06,537809.908012,96169.052782
2157,2020-08-10,392895.945485,409657.640435,190027.612025,202405.481521,1.021080e+06,119194.848049,4.810054e+06,538389.280526,96432.769335


In [32]:
# step 7 추가열 만들기 - step 6에서 계산한 모든 달러 값의 총합
df_portfolio["portfolio daily worth in $"] = df_portfolio[df_portfolio!="Date"].sum(axis=1)    # x축은 1과 같음(한마디로 더하는 기준을 가로열 지정)
df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500,portfolio daily worth in $
0,2012-01-12,52453.425001,172416.523933,189524.227639,113403.163550,5.706149e+04,169307.135579,9.578945e+04,112868.641307,37175.946743,1.000000e+06
1,2012-01-13,52256.753096,170338.657130,189209.606106,115459.939806,5.786910e+04,168003.691961,7.727581e+04,112035.087944,36992.003028,9.794406e+05
2,2012-01-17,52865.445986,171800.007579,190342.220974,114525.041507,5.891997e+04,168791.381323,9.019467e+04,112678.628861,37123.433932,9.972408e+05
3,2012-01-18,53414.391089,171389.002766,190845.605360,119012.553338,6.144335e+04,169794.758876,9.090673e+04,113454.822407,37535.798400,1.007797e+06
4,2012-01-19,53245.101044,172530.682804,191411.912795,119666.982147,6.306830e+04,169279.004620,9.073719e+04,114648.687791,37721.174831,1.012309e+06
...,...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,383607.457065,397943.991826,187825.299044,156314.986080,1.039526e+06,117638.212670,5.035372e+06,530295.991128,95494.404506,7.944018e+06
2155,2020-08-06,396991.227165,393194.598301,187762.375996,172582.216466,1.046003e+06,118266.497327,5.050833e+06,539828.727860,96108.213449,8.001570e+06
2156,2020-08-07,387267.095732,388216.889318,188894.990864,177911.155462,1.027340e+06,117178.726896,4.925816e+06,537809.908012,96169.052782,7.846604e+06
2157,2020-08-10,392895.945485,409657.640435,190027.612025,202405.481521,1.021080e+06,119194.848049,4.810054e+06,538389.280526,96432.769335,7.780138e+06


In [33]:
# step 8 포트폴리오 일일 수익율 계산 컬럼 추가 

# 최초값 0 설정
df_portfolio["portfolio daily % return"] = 0.0000

# 일일 수익율 계산
for i in range(1, len(stocks_df)):
    # ((오늘 수익 - 어제자 수익) / 어제자 수익) * 100
    df_portfolio["portfolio daily % return"][i] = ((df_portfolio["portfolio daily worth in $"][i] - df_portfolio["portfolio daily worth in $"][i-1]) / df_portfolio["portfolio daily worth in $"][i-1]) * 100
    
df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500,portfolio daily worth in $,portfolio daily % return
0,2012-01-12,52453.425001,172416.523933,189524.227639,113403.163550,5.706149e+04,169307.135579,9.578945e+04,112868.641307,37175.946743,1.000000e+06,0.000000
1,2012-01-13,52256.753096,170338.657130,189209.606106,115459.939806,5.786910e+04,168003.691961,7.727581e+04,112035.087944,36992.003028,9.794406e+05,-2.055935
2,2012-01-17,52865.445986,171800.007579,190342.220974,114525.041507,5.891997e+04,168791.381323,9.019467e+04,112678.628861,37123.433932,9.972408e+05,1.817379
3,2012-01-18,53414.391089,171389.002766,190845.605360,119012.553338,6.144335e+04,169794.758876,9.090673e+04,113454.822407,37535.798400,1.007797e+06,1.058542
4,2012-01-19,53245.101044,172530.682804,191411.912795,119666.982147,6.306830e+04,169279.004620,9.073719e+04,114648.687791,37721.174831,1.012309e+06,0.447712
...,...,...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,383607.457065,397943.991826,187825.299044,156314.986080,1.039526e+06,117638.212670,5.035372e+06,530295.991128,95494.404506,7.944018e+06,0.499965
2155,2020-08-06,396991.227165,393194.598301,187762.375996,172582.216466,1.046003e+06,118266.497327,5.050833e+06,539828.727860,96108.213449,8.001570e+06,0.724474
2156,2020-08-07,387267.095732,388216.889318,188894.990864,177911.155462,1.027340e+06,117178.726896,4.925816e+06,537809.908012,96169.052782,7.846604e+06,-1.936703
2157,2020-08-10,392895.945485,409657.640435,190027.612025,202405.481521,1.021080e+06,119194.848049,4.810054e+06,538389.280526,96432.769335,7.780138e+06,-0.847057


**MINI CHALLENGE #3:** 
- **Try at least 3 another random weights allocation and rerun the code. (최소 세 개의 무작위 비중할당 지정)** 
- **Compare the final portfolio value on Aug 11th, 2020 to its initial value ($1M) on January 12th, 2012. Do you notice a big difference? Comment on your answer. (2020년 8월 11일의 최종 포트폴리오 가치를 2012년 1월 12일의 초기 가치(1백만 달러)와 비교하기**

In [40]:
# answer - 랜덤시드를 통해 세번 정도 무작위로 비중할 당을 지정한다.
np.random.seed()                         # 무작위 비중 - 지정 X 

my_weight = np.array(np.random.random(9))   # 3개의 난수를 행성

my_weight = my_weight / np.sum(my_weight)   # 모든 비중의 합이 1이 되도록 하기 - 지정한 난수들 / 난수들의 합

# 정규화 진행 
df_portfolio = normalize(stocks_df)

#  모든 열의 이름들의 목록 얻어내기 
df_portfolio.columns[1:]

# 테이블 만들기 - enumerate함수 활용
for counter, stock in enumerate(df_portfolio.columns[1:]):
    # 보유한 주식의 값(정규화된) * 가중치 
    df_portfolio[stock] = df_portfolio[stock] * my_weight[counter]
    # 위에 계산한 가중치 * 100만 달러 
    df_portfolio[stock] = df_portfolio[stock] * 1000000

# 모든 달러 값의 총합 계산 및 컬럼 생성
df_portfolio["portfolio daily worth in $"] = df_portfolio[df_portfolio!="Date"].sum(axis=1)    # x축은 1과 같음(한마디로 더하는 기준을 가로열 지정)

# 포트폴리오 일일 수익율 계산
# 최초값 0 설정
df_portfolio["portfolio daily % return"] = 0.0000

# 일일 수익율 계산
for i in range(1, len(stocks_df)):
    # ((오늘 수익 - 어제자 수익) / 어제자 수익) * 100
    df_portfolio["portfolio daily % return"][i] = ((df_portfolio["portfolio daily worth in $"][i] - df_portfolio["portfolio daily worth in $"][i-1]) / df_portfolio["portfolio daily worth in $"][i-1]) * 100

df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500,portfolio daily worth in $,portfolio daily % return
0,2012-01-12,1.726751e+05,144020.301424,186337.330936,20460.029955,7.941364e+04,136008.583827,6.192917e+04,151407.341237,47748.456033,1.000000e+06,0.000000
1,2012-01-13,1.720277e+05,142284.649896,186027.999841,20831.110465,8.053761e+04,134961.495528,4.995986e+04,150289.173276,47512.200358,9.844318e+05,-1.556820
2,2012-01-17,1.740315e+05,143505.322528,187141.569511,20662.437506,8.200012e+04,135594.265755,5.831207e+04,151152.449542,47681.009045,1.000081e+06,1.589644
3,2012-01-18,1.758386e+05,143162.008350,187636.489364,21472.067710,8.551196e+04,136400.303608,5.877243e+04,152193.672327,48210.646308,1.009198e+06,0.911670
4,2012-01-19,1.752813e+05,144115.658844,188193.274199,21590.138782,8.777344e+04,135985.985536,5.866282e+04,153795.179898,48448.742150,1.013847e+06,0.460600
...,...,...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,1.262825e+06,332404.414294,184666.970245,28202.117097,1.446729e+06,94501.667957,3.255436e+06,711364.158860,122652.165564,7.438781e+06,0.694957
2155,2020-08-06,1.306884e+06,328437.224424,184605.105263,31137.026588,1.455744e+06,95006.384466,3.265432e+06,724151.823410,123440.536323,7.514837e+06,1.022427
2156,2020-08-07,1.274872e+06,324279.321621,185718.674933,32098.465829,1.429770e+06,94132.551740,3.184606e+06,721443.682849,123518.677823,7.370440e+06,-1.921495
2157,2020-08-10,1.293402e+06,342188.877899,186832.250789,36517.695674,1.421059e+06,95752.151421,3.109765e+06,722220.880580,123857.393023,7.331595e+06,-0.527040


In [20]:
# 가중치 확인 
my_weight

array([0.04327252, 0.16661559, 0.13099263, 0.08194828, 0.14186944,
       0.13089397, 0.06962302, 0.10687679, 0.12790776])

- 2020-08-11 맨 끝에 수익 달러가 가장 높게 나오는 것을 지정하기 위해 우선 가중치를 얼마나 하면 좋을지 확인, 총 3번 난수 생성
    - 포트폴리오 value run 1 - `$7,295,231`, [0.15952835, 0.04967618, 0.23382265, 0.22653663, 0.09201566, 0.05169675, 0.06796329, 0.05670886, 0.06205163] - 100만 달러로 시작해 729만 달러를 갖게 됨
    - 포트폴리오 value run 2 - `$13,561,220`, [0.15253008, 0.18257552, 0.03509856, 0.00871194, 0.06676844, 0.04527681, 0.19427722, 0.23472342, 0.080038] - 100만 달러로 시작해 1,356만 달러를 갖게 됨 
    - 포트폴리오 value run 3 - `$7,785,478`, [0.04327252, 0.16661559, 0.13099263, 0.08194828, 0.14186944, 0.13089397, 0.06962302, 0.10687679, 0.12790776] - 100만 달러로 시작해 778만 달러를 갖게 됨 

# TASK #5: PORTFOLIO ALLOCATION - DAILY RETURN/WORTH CALCULATION (FUNCTION)

In [15]:
# Lets assume we have $1,000,000 to be invested and we will allocate this fund based on the weights of the stocks
# We will create a function that takes in the stock prices along with the weights and return:
# (1) Daily value of each individual securuty in $ over the specified time period(달러 가치로된 개별 증권에 대한 일일 값 반환))
# (2) Overall daily worth of the entire portfolio(포트폴리오 전체의 일일 가치 반환)
# (3) Daily return(일일 수익율 반환))

# 포트폴리오 배분 - 일일 수익률/가치 계산 기능
def portfolio_allocation(df, weights):
    df_portfolio = df.copy()                # 데이터프레임 카피
    df_portfolio = normalize(df_portfolio)  # 정규화 계산
    
    # 테이블 만들기 - enumerate함수 활용
    for counter, stock in enumerate(df_portfolio.columns[1:]):
        # 보유한 주식의 값(정규화된) * 가중치 
        df_portfolio[stock] = df_portfolio[stock] * weights[counter]
        # 위에 계산한 가중치 * 100만 달러 
        df_portfolio[stock] = df_portfolio[stock] * 1000000
    
    # 모든 달러 값의 총합 계산 및 컬럼 생성
    df_portfolio["portfolio daily worth in $"] = df_portfolio[df_portfolio!="Date"].sum(axis=1)
    
    # 최초값 0 설정
    df_portfolio["portfolio daily % return"] = 0.0000
    
    # 일일 수익율 계산
    for i in range(1, len(stocks_df)):
        # ((오늘 수익 - 어제자 수익) / 어제자 수익) * 100
        df_portfolio["portfolio daily % return"][i] = ((df_portfolio["portfolio daily worth in $"][i] - df_portfolio["portfolio daily worth in $"][i-1]) / df_portfolio["portfolio daily worth in $"][i-1]) * 100
    
    # 첫 번째 raw에 0추가 
    df_portfolio["portfolio daily % return"][0] = 0

    return df_portfolio
    

**MINI CHALLENGE #4:**
- **Call the function and ensure that the results make sense**

In [16]:
# 무작위 비중 만들기 
np.random.seed(101)

# 만든 무작위 비중 계산(비중 생성)
weights = np.array(np.random.random(9))   # 9개의 난수를 행성

# 모든 비중의 합이 1이 되도록 하기 - 지정한 난수들 / 난수들의 합
weights = weights / np.sum(weights)

# 위에 설정한 함수를 사용 
result = portfolio_allocation(stocks_df, weights)
result

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500,portfolio daily worth in $,portfolio daily % return
0,2012-01-12,109213.072967,120690.407490,6022.010143,36275.090893,1.449291e+05,176360.729910,6.492024e+04,188990.104235,152599.209597,1.000000e+06,0.000000
1,2012-01-13,108803.583155,119235.914699,6012.013247,36933.006803,1.469804e+05,175002.982837,5.237283e+04,187594.381427,151844.160487,9.847792e+05,-1.522076
2,2012-01-17,110070.940263,120258.850187,6048.001354,36633.954117,1.496495e+05,175823.488543,6.112844e+04,188671.942595,152383.655881,1.000669e+06,1.613507
3,2012-01-18,111213.896735,119971.149581,6063.996069,38069.407013,1.560585e+05,176868.668340,6.161103e+04,189971.620676,154076.322712,1.013905e+06,1.322705
4,2012-01-19,110861.418590,120770.317932,6081.990122,38278.743893,1.601857e+05,176331.426972,6.149613e+04,191970.659033,154837.252810,1.020814e+06,0.681427
...,...,...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,798707.600095,278558.118654,5968.027783,50001.606220,2.640267e+06,122539.200612,3.412668e+06,887941.003611,391983.847760,8.588634e+06,0.879605
2155,2020-08-06,826573.895966,275233.575119,5966.028443,55205.122968,2.656718e+06,123193.660569,3.423147e+06,903902.858806,394503.400529,8.664444e+06,0.882669
2156,2020-08-07,806327.319584,271749.212299,6002.016551,56909.729263,2.609318e+06,122060.571958,3.338417e+06,900522.495854,394753.132817,8.506059e+06,-1.827981
2157,2020-08-10,818047.125846,286757.593922,6038.004858,64744.906663,2.593418e+06,124160.687803,3.259961e+06,901492.611827,395835.632149,8.450456e+06,-0.653686


# TASK #6: PERFORM PORTFOLIO DATA VISUALIZATION

In [15]:
# Plot the portfolio daily return
fig = px.line(x=df_portfolio["Date"], y=df_portfolio["portfolio daily % return"], title="Portfolio Daily % Return")
fig.show()

In [16]:
# Plot all stocks (normalized)
interactive_plot(df_portfolio.drop(["portfolio daily worth in $", "portfolio daily % return"], axis=1), "Portfolio Individual stocks in $ overtime")

In [17]:
# Print out a histogram of daily returns
fig = px.histogram(df_portfolio, x="portfolio daily % return")
fig.show()

**MINI CHALLENGE #5:** 
- **Plot the portfolio overall daily worth vs. time. (포트폴리오 전체의 일일 가치를 시간에 대조해서 그리기)**
- **Rerun the code with various weights and visualize the final value. (다양한 비중을 사용해서 코드를 다시 실행하고 최종값을 시각화)** 

In [18]:
# answer - 포트폴리오 전체의 일일 가치를 시간데 대조해 그리기
fig = px.line(x=df_portfolio["Date"], y=df_portfolio["portfolio daily worth in $"], title="Portfolio Overal value in $")
fig.show()

In [58]:
# answer - 위의 전체 코드를 두번 다시 실행하고 최종값 시각화
fig = px.line(x=df_portfolio["Date"], y=df_portfolio["portfolio daily worth in $"], title="Portfolio Overal value in $")
fig.show()

# TASK #7: UNDERSTAND PORTFOLIO STATISTICAL METRICS (CUMMULATIVE RETURN, AVERAGE DAILY RETURN, AND SHARPE RATIO)

![alt text](https://drive.google.com/uc?id=1W_MNP2Qldn3ulrvXivOnjQg3NTf3hNCo)

- 주가 일일 수익률 - 오늘의 종가(t) - 어제자 종가(t-1) / 어제자 종가(t-1) -> 목적은 우리가 돈을 벌었는지 아니면 돈일 잃었는지 확인, 백분율로 계산하고 싶으면 위의 식에서 100을 곱하면 된다.
- 주가 누적 수익률 - 주식이 일정 기간 동안 얻거나 잃은 총 금액의 척도이다. 누적 수익율의 식은 다음과 같다 
    - 주식의 현재 가격 - 주식의 원가(초기에 구매한 원가) / 주식의 원가(초기에 구매한 원가)

![alt text](https://drive.google.com/uc?id=12e4Zgxv1FNviJYML88G6cTnlte0bts-4)

- 표준편차(위험과 변동성의 척도) 
    - 위험성과 변동성은 단순히 말해 표준편차를 말한다.  
    - 표준편차는 평균으로부터의 분산의 척도이다.
    - 변동성이란 내일은 20%를 잃고, 다음날 25%를 얻는 등의 편차를 변동성이라고 하고 이러한 종목은 위험하다 라고 칭한다.
    - 하지만 꽤 긍정적인 상황이 된다면 엄청난 수익을 얻을 수 있다. 
    - 늘 말하지만 Hight Risk, Hight Return이다.
    - 따라서 데이터가 많이 확산될 수록 표준편가차 높아진다.
    - 변동성이 높은 주식은 표준편차가 높으므로 표준편차는 모든 주식과 관련된 위험을 나타낸다. 
- 표준편차의 계산 
    - 모든 데이이터의 표인트를 가져가서 (지수(xi) - 평균값(x bar))의 제곱 / 모든 데이터의 포인트 합(n-1)의 제곱근
        - 여기서 n은 데이터 세트의 총 데이터 포인트 개수이다.
    - 이렇게 하면 개별 주식이나 전체 포트폴리오의 위험이나 변동성을 예측할 수 있다.

![alt text](https://drive.google.com/uc?id=1QQLWpIJ8uXopJrV40YFKb5H-SxnmsRaj)

- 샤프 비율
    - 모든 투자자가 고려하고 있는 두 가지인 "투자 수익"과 "위험"을 단순히 결합한 것이다.
    - 샤프 비율은 투자자가 위험 대비 투자 수익을 계산하기 위해 사용한다. 즉 나의 이득이 얼마인가를 나태는 것이다.
- 샤프 비율 계산
    - 수익율(Rp) - 무위험수익률(Rf) / 위험(포트폴리오의 포준편차)
        - 여기서 무위험수익률 즉 위험 부담이 없다고 한 것은 아마 우리의 돈을 미국 국채나 단기재정증권에 투자한다는 이야기이다.
    - 만약 샤프 비율이 증가한다면, 이는 위험 조정 수익률이 증가하고 투자자들이 해당 주식을 더 원하다라는 것을 의미한다.

# TASK #8: CALCULATE PORTFOLIO STATISTICAL METRICS (CUMMULATIVE RETURN, AVERAGE DAILY RETURN, AND SHARPE RATIO)

In [35]:
df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500,portfolio daily worth in $,portfolio daily % return
0,2012-01-12,52453.425001,172416.523933,189524.227639,113403.163550,5.706149e+04,169307.135579,9.578945e+04,112868.641307,37175.946743,1.000000e+06,0.000000
1,2012-01-13,52256.753096,170338.657130,189209.606106,115459.939806,5.786910e+04,168003.691961,7.727581e+04,112035.087944,36992.003028,9.794406e+05,-2.055935
2,2012-01-17,52865.445986,171800.007579,190342.220974,114525.041507,5.891997e+04,168791.381323,9.019467e+04,112678.628861,37123.433932,9.972408e+05,1.817379
3,2012-01-18,53414.391089,171389.002766,190845.605360,119012.553338,6.144335e+04,169794.758876,9.090673e+04,113454.822407,37535.798400,1.007797e+06,1.058542
4,2012-01-19,53245.101044,172530.682804,191411.912795,119666.982147,6.306830e+04,169279.004620,9.073719e+04,114648.687791,37721.174831,1.012309e+06,0.447712
...,...,...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,383607.457065,397943.991826,187825.299044,156314.986080,1.039526e+06,117638.212670,5.035372e+06,530295.991128,95494.404506,7.944018e+06,0.499965
2155,2020-08-06,396991.227165,393194.598301,187762.375996,172582.216466,1.046003e+06,118266.497327,5.050833e+06,539828.727860,96108.213449,8.001570e+06,0.724474
2156,2020-08-07,387267.095732,388216.889318,188894.990864,177911.155462,1.027340e+06,117178.726896,4.925816e+06,537809.908012,96169.052782,7.846604e+06,-1.936703
2157,2020-08-10,392895.945485,409657.640435,190027.612025,202405.481521,1.021080e+06,119194.848049,4.810054e+06,538389.280526,96432.769335,7.780138e+06,-0.847057


In [20]:
df_portfolio["portfolio daily worth in $"][-1:]

2158    1.521325e+07
Name: portfolio daily worth in $, dtype: float64

In [27]:
# 누적 수익율 계산 (주식의 현재 가격 - 주식의 원가(초기에 구매한 원가) / 주식의 원가(초기에 구매한 원가))
cummulitive_return = ((df_portfolio["portfolio daily worth in $"][-1:] - df_portfolio["portfolio daily worth in $"][0]) / df_portfolio["portfolio daily worth in $"][0]) * 100
print(f"cummulitive return of the portfolio in {cummulitive_return.values[0]}%")

cummulitive return of the portfolio in 1421.325324960399%


In [34]:
# 누적 수익율 계산 (주식의 현재 가격 - 주식의 원가(초기에 구매한 원가) / 주식의 원가(초기에 구매한 원가)) 두 번째
cummulitive_return = ((df_portfolio["portfolio daily worth in $"][-1:] - df_portfolio["portfolio daily worth in $"][0]) / df_portfolio["portfolio daily worth in $"][0]) * 100
print(f"cummulitive return of the portfolio in {cummulitive_return.values[0]}%")

cummulitive return of the portfolio in 659.0216584762319%


In [43]:
# 표준편차 계산(위혐성 변동성)
print(f"Standard deviation of the Portfolio is {df_portfolio['portfolio daily % return'].std()}")

Standard deviation of the Portfolio is 1.6404297239000365


In [44]:
# 일평균 수익율 계산
print(f"My average daily return of the portfolio is {df_portfolio['portfolio daily % return'].mean()}%")

My average daily return of the portfolio is 0.10744014448661675%


In [45]:
# 샤프 비율 계산 - 모든 데이이터의 표인트를 가져가서 (지수(xi) - 평균값(x bar))의 제곱 / 모든 데이터의 포인트 합(n-1)의 제곱근
# 여기서 계산하는 방식 - (일일 수익율의 평균 / 일일 수익율의 표준편차) * 거래 날수 (평균 252일로 추정)의 제곱근
sharps_ratio = df_portfolio["portfolio daily % return"].mean() / df_portfolio["portfolio daily % return"].std() * np.sqrt(252)
print(f"Sharps ratio of the portfolio is {sharps_ratio}")

Sharps ratio of the portfolio is 1.0397028254058536


- 좋은 샤프 비율은 얼마일까? 
- 딱 정의할 수 없지만 만약 값을 극대화 하고 싶다면 대체적으로 1.5 혹은 2정도가 좋겠다.

**MINI CHALLENGE #6:** 
- **Try at least 3 different random weights allocation, rerun the code and compare sharpe ratios, daily return and cummulative returns. (세 번의 무작위 할당을 한 뒤 세 가지 샤프 비율의 값을 구하시오)**

In [60]:
# answer - 랜덤시드를 통해 세번 정도 무작위로 비중할 당을 지정한다.
np.random.seed()                         # 무작위 비중 - 지정 X 

my_weight = np.array(np.random.random(9))   # 3개의 난수를 행성

my_weight = my_weight / np.sum(my_weight)   # 모든 비중의 합이 1이 되도록 하기 - 지정한 난수들 / 난수들의 합

# 정규화 진행 
df_portfolio = normalize(stocks_df)

#  모든 열의 이름들의 목록 얻어내기 
df_portfolio.columns[1:]

# 테이블 만들기 - enumerate함수 활용
for counter, stock in enumerate(df_portfolio.columns[1:]):
    # 보유한 주식의 값(정규화된) * 가중치 
    df_portfolio[stock] = df_portfolio[stock] * my_weight[counter]
    # 위에 계산한 가중치 * 100만 달러 
    df_portfolio[stock] = df_portfolio[stock] * 1000000

# 모든 달러 값의 총합 계산 및 컬럼 생성
df_portfolio["portfolio daily worth in $"] = df_portfolio[df_portfolio!="Date"].sum(axis=1)    # x축은 1과 같음(한마디로 더하는 기준을 가로열 지정)

# 포트폴리오 일일 수익율 계산
# 최초값 0 설정
df_portfolio["portfolio daily % return"] = 0.0000

# 일일 수익율 계산
for i in range(1, len(stocks_df)):
    # ((오늘 수익 - 어제자 수익) / 어제자 수익) * 100
    df_portfolio["portfolio daily % return"][i] = ((df_portfolio["portfolio daily worth in $"][i] - df_portfolio["portfolio daily worth in $"][i-1]) / df_portfolio["portfolio daily worth in $"][i-1]) * 100

df_portfolio

Unnamed: 0,Date,AAPL,BA,T,MGM,AMZN,IBM,TSLA,GOOG,sp500,portfolio daily worth in $,portfolio daily % return
0,2012-01-12,1.347663e+05,150219.417312,155621.990568,87789.584912,8.265242e+04,64734.327125,5.298916e+04,144789.319752,126437.499598,1.000000e+06,0.000000
1,2012-01-13,1.342610e+05,148409.057532,155363.648772,89381.811514,8.382223e+04,64235.957430,4.274772e+04,143720.026961,125811.896610,9.877533e+05,-1.224667
2,2012-01-17,1.358249e+05,149682.272001,156293.660637,88658.072149,8.534440e+04,64537.129266,4.989422e+04,144545.569384,126258.900554,1.001039e+06,1.345048
3,2012-01-18,1.372352e+05,149324.180431,156706.999244,92132.021099,8.899946e+04,64920.769155,5.028812e+04,145541.280276,127661.375457,1.012809e+06,1.175815
4,2012-01-19,1.368003e+05,150318.879235,157172.005176,92638.638654,9.135317e+04,64723.571296,5.019433e+04,147072.785881,128291.851194,1.018566e+06,0.568328
...,...,...,...,...,...,...,...,...,...,...,...,...
2154,2020-08-05,9.855858e+05,346712.213025,154226.967604,121009.214504,1.505732e+06,44978.792627,2.785485e+06,680270.400469,324781.876160,6.948783e+06,0.788549
2155,2020-08-06,1.019972e+06,342574.262023,154175.300278,133602.279446,1.515114e+06,45219.016315,2.794039e+06,692499.115644,326869.475127,7.024065e+06,1.083376
2156,2020-08-07,9.949883e+05,338237.389165,155105.312143,137727.608299,1.488082e+06,44803.108936,2.724881e+06,689909.348025,327076.393145,6.900810e+06,-1.754745
2157,2020-08-10,1.009450e+06,356917.832698,156035.329175,156689.572411,1.479015e+06,45573.969808,2.660844e+06,690652.574409,327973.308072,6.883151e+06,-0.255898


In [56]:
# answer - 첫 번째 
# 누적 수익율 계산 (주식의 현재 가격 - 주식의 원가(초기에 구매한 원가) / 주식의 원가(초기에 구매한 원가))
cummulitive_return = ((df_portfolio["portfolio daily worth in $"][-1:] - df_portfolio["portfolio daily worth in $"][0]) / df_portfolio["portfolio daily worth in $"][0]) * 100
print(f"cummulitive return of the portfolio in {cummulitive_return.values[0]}%")

# 표준편차 계산(위혐성 변동성)
print(f"Standard deviation of the Portfolio is {df_portfolio['portfolio daily % return'].std()}")

sharps_ratio = df_portfolio["portfolio daily % return"].mean() / df_portfolio["portfolio daily % return"].std() * np.sqrt(252)
print(f"Sharps ratio of the portfolio is {sharps_ratio}")

cummulitive return of the portfolio in 462.5899301432516%
Standard deviation of the Portfolio is 1.4415138326257757
Sharps ratio of the portfolio is 0.996691903741257


In [59]:
# answer - 두 번째
# 누적 수익율 계산 (주식의 현재 가격 - 주식의 원가(초기에 구매한 원가) / 주식의 원가(초기에 구매한 원가))
cummulitive_return = ((df_portfolio["portfolio daily worth in $"][-1:] - df_portfolio["portfolio daily worth in $"][0]) / df_portfolio["portfolio daily worth in $"][0]) * 100
print(f"cummulitive return of the portfolio in {cummulitive_return.values[0]}%")

# 표준편차 계산(위혐성 변동성)
print(f"Standard deviation of the Portfolio is {df_portfolio['portfolio daily % return'].std()}")

sharps_ratio = df_portfolio["portfolio daily % return"].mean() / df_portfolio["portfolio daily % return"].std() * np.sqrt(252)
print(f"Sharps ratio of the portfolio is {sharps_ratio}")

cummulitive return of the portfolio in 662.6392862332581%
Standard deviation of the Portfolio is 1.367095479033988
Sharps ratio of the portfolio is 1.202156178928014


In [61]:
# answer - 세 번째
# 누적 수익율 계산 (주식의 현재 가격 - 주식의 원가(초기에 구매한 원가) / 주식의 원가(초기에 구매한 원가))
cummulitive_return = ((df_portfolio["portfolio daily worth in $"][-1:] - df_portfolio["portfolio daily worth in $"][0]) / df_portfolio["portfolio daily worth in $"][0]) * 100
print(f"cummulitive return of the portfolio in {cummulitive_return.values[0]}%")

# 표준편차 계산(위혐성 변동성)
print(f"Standard deviation of the Portfolio is {df_portfolio['portfolio daily % return'].std()}")

sharps_ratio = df_portfolio["portfolio daily % return"].mean() / df_portfolio["portfolio daily % return"].std() * np.sqrt(252)
print(f"Sharps ratio of the portfolio is {sharps_ratio}")

cummulitive return of the portfolio in 572.8873259610519%
Standard deviation of the Portfolio is 1.3997211765996664
Sharps ratio of the portfolio is 1.11362375531837


# **WELL DONE!**