# Анализ статистических данных портфеля
В этом проекте мы будем использовать Python для проведения портфельного анализа, например, для расчета доходности портфеля, риска и коэффициента Шарпа. Портфель - это набор финансовых инвестиций, таких как акции, ценные бумаги с фиксированным доходом (облигации), наличные деньги, взаимные фонды и биржевые фонды (ETF). В этом практическом проекте мы выполним следующие задания:
* Импорт библиотек и датасета
* Произвольное распределение активов и рассчет ежедневной доходности портфеля
* Распределение портфеля - Ежедневный расчет доходности/стоимости
* Визулизация данных портфеля
* Рассчитываем статистические показатели портфеля (кумулятивную доходность, среднедневную доходность и коэффициент Шарпа)

### Импорт библиотек и датасета

In [6]:
import pandas as pd
import plotly.express as px
from copy import copy
from scipy import stats
import matplotlib.pyplot as plt
import numpy as np
import plotly.figure_factory as ff
import plotly.graph_objects as go
from numpy import random

In [7]:
# Чтение файла данных акций.
stocks_df = pd.read_csv("stock_data.csv")
stocks_df.head()

Unnamed: 0,Date,FB,TWTR,NFLX
0,2013-11-07,47.560001,44.900002,46.694286
1,2013-11-08,47.529999,41.650002,47.842857
2,2013-11-11,46.200001,42.900002,48.272858
3,2013-11-12,46.610001,41.900002,47.675713
4,2013-11-13,48.709999,42.599998,47.897144


In [10]:
# Функция для построения интерактивного графика
def interactive_plot(stocks_df, title, columns):
    fig = px.line(title=title)
    for i in columns:
        fig.add_scatter(x = stocks_df["Date"], y = stocks_df[i], name = i)
    fig.show()
    
# Построение интерактивной диаграммы 
interactive_plot(stocks_df, "Prices", stocks_df.columns[1:])

In [12]:
# Функция для нормализации цен на основе начальной цены

def normalize(df, columns):
    x = df.copy()
    for i in columns:
        x[i] = x[i]/x[i][0]
    return x
    
# Построение нормализованной интерактивной диаграммы
interactive_plot(normalize(stocks_df, ["FB", "TWTR", "NFLX"]), "Prices", stocks_df.columns[1:])

### Произвольное распределение активов и рассчет ежедневной доходности портфеля

In [21]:
# Создайте случайные веса для акций и нормализуйте их.
weights = np.random.random(3)
weights /= weights.sum()

In [22]:
# Нормализовать значения акций. 
df_portfolio = normalize(stocks_df, ["FB", "TWTR", "NFLX"])

In [23]:
# Задаем наш первоначальный вклад
deposit = 1000000

In [24]:
# Расчитываем вклад для каждой акции
for counter, stock in enumerate(df_portfolio.columns[1:]):
  df_portfolio[stock] = df_portfolio[stock] * weights[counter]
  df_portfolio[stock] = df_portfolio[stock] * deposit

In [25]:
# Создадим дополнительный столбец, который будет содержать размер портфеля
df_portfolio['portfolio daily worth in $'] = df_portfolio[df_portfolio != 'Date'].sum(axis = 1)

In [26]:
# Давайте рассчитаем дневную доходность портфеля 
# Определите новый столбец в датафрейме и установите в нем нули
df_portfolio['portfolio daily % return'] = 0.0000

for i in range(1, len(stocks_df)):
  # Вычислите процент изменения по сравнению с предыдущим днем
  df_portfolio['portfolio daily % return'][i] = ( (df_portfolio['portfolio daily worth in $'][i] - df_portfolio['portfolio daily worth in $'][i-1]) / df_portfolio['portfolio daily worth in $'][i-1]) * 100 

# Округляем значения
df_portfolio.round(decimals = 0)

Unnamed: 0,Date,FB,TWTR,NFLX,portfolio daily worth in $,portfolio daily % return
0,2013-11-07,229383.0,282930.0,487687.0,1000000.0,0.0
1,2013-11-08,229239.0,262450.0,499683.0,991372.0,-1.0
2,2013-11-11,222824.0,270327.0,504174.0,997325.0,1.0
3,2013-11-12,224801.0,264026.0,497937.0,986764.0,-1.0
4,2013-11-13,234930.0,268437.0,500250.0,1003616.0,2.0
...,...,...,...,...,...,...
1707,2020-08-20,1297443.0,245500.0,5200194.0,6743137.0,3.0
1708,2020-08-21,1287797.0,247390.0,5141811.0,6676998.0,-1.0
1709,2020-08-24,1308922.0,255141.0,5105256.0,6669318.0,-0.0
1710,2020-08-25,1354403.0,255519.0,5123742.0,6733664.0,1.0


### Распределение портфеля - Ежедневный расчет доходности/стоимости

In [27]:
# Мы создадим функцию, которая принимает цены на акций вместе с весами и выдает:
# (1) Ежедневная стоимость каждой отдельной ценной бумаги в $ за указанный период времени.
# (2) Общая дневная стоимость всего портфеля 
# (3) Ежедневная доходность 

def portfolio_allocation(df, weights):

  df_portfolio = df.copy()
  
  # нормализация значений акций 
  df_portfolio = normalize(df_portfolio, ["FB", "TWTR", "NFLX"])
  
  for counter, stock in enumerate(df_portfolio.columns[1:]):
    df_portfolio[stock] = df_portfolio[stock] * weights[counter]
    df_portfolio[stock] = df_portfolio[stock] * deposit

  df_portfolio['portfolio daily worth in $'] = df_portfolio[df_portfolio != 'Date'].sum(axis = 1)
  
  df_portfolio['portfolio daily % return'] = 0.0000

  for i in range(1, len(stocks_df)):
    
    # Вычисляем процент изменения по сравнению с предыдущим днем
    df_portfolio['portfolio daily % return'][i] = ( (df_portfolio['portfolio daily worth in $'][i] - df_portfolio['portfolio daily worth in $'][i-1]) / df_portfolio['portfolio daily worth in $'][i-1]) * 100 
  
  # Устанавливаем значение первой строки в ноль, так как предыдущее значение недоступно
  df_portfolio['portfolio daily % return'][0] = 0
  return df_portfolio

In [None]:
# Вызываем функцию
df_portfolio = portfolio_allocation(stocks_df, weights)

### Визулизация данных портфеля

In [28]:
# Построение графика дневной доходности портфеля
interactive_plot(df_portfolio, "Daily return", ["portfolio daily % return"])

In [None]:
# Построение графика всех акций (нормализованных)
normalized = normalize(df_portfolio, ["FB", "TWTR", "NFLX", "portfolio daily worth in $"])
interactive_plot(normalized,"Stocks (normalized)", ["FB", "TWTR", "NFLX"])

In [None]:
# Вывод гистограммы дневной доходности
def interactive_histogram (df, title, column):
    hist = px.histogram(df, x = column, title=title)
    hist.show()
interactive_histogram(df_portfolio, "Histogram of daily returns", "portfolio daily % return")

### Рассчитываем статистические показатели портфеля (кумулятивную доходность, среднедневную доходность и коэффициент Шарпа)

In [37]:
# Кумулятивная доходность портфеля (Обратите внимание, что теперь мы ищем последнюю чистую стоимость портфеля по сравнению с его начальной стоимостью)
cummulative_return = ((df_portfolio['portfolio daily worth in $'][-1:] - df_portfolio['portfolio daily worth in $'][0])/ df_portfolio['portfolio daily worth in $'][0]) * 100
print('Кумулятивная доходность портфеля составляет {} %'.format(cummulative_return.values[0]))

Кумулятивная доходность портфеля составляет 644.3167792128088 %


In [38]:
# Рассчитываем стандартное отклонение портфеля
std = df_portfolio["portfolio daily % return"].std()
print('Cтандартное отклонение портфеля составляет {} %'.format(std))

Cтандартное отклонение портфеля составляет 2.15582064371933 %


In [39]:
# Рассчитываем среднюю дневную доходность 
mean = df_portfolio["portfolio daily % return"].mean()
print('Средняя дневная доходность портфеля {} %'.format(mean))

Средняя дневная доходность портфеля 0.14055476798636907 %


In [40]:
# Коэффициент доходности портфеля
sharpe_ratio = df_portfolio['portfolio daily % return'].mean() / df_portfolio['portfolio daily % return'].std() * np.sqrt(252)
print('Коэффициент Шарпа портфеля составляет {}'.format(sharpe_ratio))

Коэффициент Шарпа портфеля составляет 1.0349830244729676
