In [1]:
import yfinance as yf 
import datetime 
import pandas as pd 
import numpy as np 
pd.core.common.is_list_like = pd.api.types.is_list_like #
import pandas_datareader as pdr 
yf.pdr_override()
import matplotlib.pyplot as plt

# Task1

Нашей задачей был анализ рынка акций на Российской бирже за 2017 год

Первым делом была сделана попытка получить доступ к ациям с МосБиржи, но она закончилась провалом, так как доступ к архивным даннным платный (https://www.moex.com/ru/marketdata/archive/#/engine=stock&market=shares&data_type=trades&data_interval=archive&data_format=csv&year=2017)

После была найдена биржа Санкт-Петербурга, но на ней отствовали данные за 2017 год(https://spbexchange.ru/ru/market-data/archive.aspx)

В итоге использовался вариант, предложенный Дмитрием Семеновым(он был указан как констультант по вопросам о добыче данных):

    1) С сайта питерской биржи были получены тикеры акций, которые использовались за 2017 год
    2) С помощью средств языка Python были собраны данные за 2017 год с сайта https://finance.yahoo.com/ на основе имеющихся тикеров

Очевидный минус данного способа состоит в том, что данные в конечном итоге берутся не с одной конкретной биржи, а с разных, что может приводить к небычным результатам. Также это делает бесполезным включение индекса рынка в общее исследование, так как  данные акций принадлежат разным рынкам.

Таким образом, наши данные могут отражать не ситуацию на конретной Санкт-Петербургской бирже, а некую ситуацию с этими акциями вцелом, что все равно подходит анализа. Использование данного метода было согласовано с преподавателем.


In [2]:
start = datetime.datetime(2017, 1, 1) 
end = datetime.datetime(2018, 1, 1)

In [3]:
def get_tickers():
    f = open('Stocks.txt')
    tickers = []
    for line in f:
        tickers.append(line[0:len(line)-1])
    f.close()
    return tickers

def data_for_ticker(ticker):
    return yf.download([ticker], start=start, end=end)

In [4]:
def generate_frames():
    f = open('Stocks.txt')
    frames = dict()
    for line in f:
        ticker = line[0:len(line)-1]
        frames[ticker] = data_for_ticker(ticker)
    f.close()
    return frames

def get_frame(ticker, frames):
    return frames[ticker]

In [5]:
allTickers = get_tickers()

In [None]:
allFrames = generate_frames()

[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*******************

[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*******************

[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*********************100%***********************]  1 of 1 downloaded
[*******************

# Task2

Данные 'Adj Close' использовались для нахождение логарифмической доходности следующим образом:
Доходность Ri в день i  = ln(Ri - Ri-1)
Доходность для первого дня торгов обозначена за NaN

In [None]:
def compute_return(frames):
    for ticker in frames:
        frame = frames[ticker]
        pt = frame["Adj Close"][1:].values
        pt_1 = frame["Adj Close"][:-1].values
        ret = np.log(pt / pt_1)
        frames[ticker]["Return"] = [np.NaN, *ret]
        
        #####################
        Ticker = yf.Ticker(ticker)
        #frames[ticker]["Exchange"] = Ticker.info['fullExchangeName']
        
compute_return(allFrames)

Годовая доходность акции это математическое ожидание ежедневных доходностей за отчетный период, а риск актива это стандартное отклоенение от этих величин.

In [None]:
def get_return_info(ticker):
    E = np.mean(allFrames[ticker]["Return"])
    sigma = np.std(allFrames[ticker]["Return"])
    return E, sigma

Карта активов представлена ниже:

In [None]:
allReturns = []
allRisks = []
for tick in allTickers:
    ret,risk = get_return_info(tick)
    allReturns.append(ret)
    allRisks.append(risk)

plt.figure(figsize=(10,6))
plt.xlabel("Risk")
plt.ylabel("Return")
plt.plot(allRisks, allReturns,"*")
plt.show()

Из данной карты активов видно, что большинство из них обладают невысокой доходностью и риском. 
Следовательно, при увеличении риска и доходности уменьшается плотность точек. 
При увеличении риска, абсолютное значение доходностей растет, то есть очень мало активов с высоким риском и близкой к 0 доходностью.
Есть активы с отрицательной доходностью, но нет тех, что обладают постоянной доходностью, то есть нулевым риском. 
Активы расположены почти симметрично относительно оси ОХ (линии нулевой доходности).

# Task 3

In [None]:
import scipy.stats as st
import math as m

In [None]:
def transform(ticker):
    A = []
    #A= list
    for i in range(1,len(allFrames[ticker]["Return"])):
        A.append(allFrames[ticker]["Return"][i])
    return A

In [None]:
def test_invertion(stock, alpha):
    n = len(stock)
    inv = 0
    for i in range(n-1):
        for j in range(i+1,n):
            if(stock[i]>stock[j]):
                inv = inv+1
    ei = (n*(n-1))/4
    di = (2*n**3+3*n**2-5*n)/72
    iinv = (inv - ei)/(di**(1/2))

    if(m.fabs(iinv) >= st.norm.ppf(1 - alpha/2)):
        print("      Критерий инверсий: гипотеза отвергается")
    else:
        print("      Критерий инверсий: гипотеза принимается")

In [None]:
def autocorrelation_criterion(stock, alpha):
    n = len(stock)
    xixi = 0
    xi = 0
    xi2 = 0
    for i in range(n-1):
        xixi = xixi + stock[i]*stock[i+1]
    for i in range(n):            
        xi = xi + stock[i]
        xi2 = xi2 + stock[i]**2
    r = (n*xixi-xi**2+n*stock[0]*stock[n-1])/(n*xi2-xi**2)
    er = -1/(n-1)
    dr = (n*(n-3))/((n+1)*(n-1)**2)
    rr = (r - er)/(dr**0.5)
    
    if(m.fabs(rr) >= st.norm.ppf(1 - alpha/2)):
        print("Критерий автокорреляции: гипотеза отвергается")
    else:
        print("Критерий автокорреляции: гипотеза принимается")
        
    rm = (n-1)**0.5*(n*r+1)/(n-2)
    
    if(m.fabs(rm) >= st.norm.ppf(1 - alpha/2)):
        print("        Критерий Морана: гипотеза отвергается")
    else:
        print("        Критерий Морана: гипотеза принимается")
    
    rlb = (n*(n+2)/(n-1))**0.5*r
    
    if(m.fabs(rlb) >= st.norm.ppf(1 - alpha/2)):
        print("   Критерий Люнга-Бокса: гипотеза отвергается")
    else:
        print("   Критерий Люнга-Бокса: гипотеза принимается")
        
    rdr = ((n-1)/n*(n-2))**0.5*(n*r+1)
    
    if(m.fabs(rdr) >= st.norm.ppf(1 - alpha/2)):
        print("     Критерий Дюффа-Роя: гипотеза отвергается")
    else:
        print("     Критерий Дюффа-Роя: гипотеза принимается")
    

In [None]:
Tickers = find_good_actives(allRisks,allReturns,8)#функция из 4 задания
for t in Tickers:
    A = transform(t)
    print('Для ' + t)
    autocorrelation_criterion(A,0.05)
    test_invertion(A,0.05)

Как показывают результаты, для акций Micro Focus International гипотеза о случайности не отвергается ни одним критерием на заданном уровне 0.05, откуда можно сделать вывод что докодности акции данной компании действительно является случайной выборкой. Однако то же самое нельзя однозначно сказать о Ecolab Inc, где гипотеза о случайности доходностей акции данной компании была отвергнута всеми критериями, кроме критерий инверсий. Это может быть связано с тем, что мощность остальных критериев гораздо ниже, чем у критерия инверсий. Отсюда следует что выборку данной компании можно считать случайной. Для всех остальных акции можно сказать что гипотеза об отсутствии тренда не откланяется при заданном уровне значимости alpha = 0.05

# Task 4 

In [None]:
import copy


def find_good_actives(risks,returns,count):
    #return -> max
    return_count = count // 3
    ret = copy.deepcopy(returns)
    return_indices = find_max_ret(return_count,ret,[])
    #risk -> min
    risk = copy.deepcopy(risks)
    risk_indices = find_min_risk(count - return_count, risk,[])
    return [allTickers[index] for index in return_indices + risk_indices]

def find_max_ret(count,returns,accum):
    if count != 0:
        max_ret = allReturns.index(max(returns))
        returns.remove(allReturns[max_ret])
        accum.append(max_ret)
        find_max_ret(count - 1, returns, accum)
    return accum
    
def find_min_risk(count,risks,accum):
    if count != 0:
        min_risk = allRisks.index(min(risks))
        risks.remove(allRisks[min_risk])
        accum.append(min_risk)
        find_min_risk(count - 1, risks, accum)
    return accum

Значимые активы выбирались следующим образом:
треть нужного количества активов составляли самые доходные активы, остальное - наименее рискованные

In [None]:
def plot_for_tickers(Tickers):
    rets=[]
    risks=[]
    for tick in Tickers:
        ret,risk = get_return_info(tick)
        rets.append(ret)
        risks.append(risk)
    
    plt.figure(figsize=(10,6))
    plt.xlabel("Risk")
    plt.ylabel("Return")
    plt.plot(risks, rets,"*")
    plt.show()

15 активов отобранных таким образом и их производственные сектора представлены ниже:

    MFGP - Technology        
    BHF - Financial Services
    YY - Technology 
    SQ - Technology           
    WB - Technology
    KO - Consumer Defensive 
    PEP - Consumer Defensive 
    HON - Industrials        
    ECL - Basic Materials
    PG - Consumer Defensive
    XEL - Utilities   
    CMS - Financial Services
    WM - Industrials    
    PFE - Healthcare  
    LMT - Industrials
    
Их расположение в плоскости (E,sigma):

In [None]:
Tickers = find_good_actives(allRisks,allReturns,15)
plot_for_tickers(Tickers)


In [None]:
def plot_smth(Tickers,Column):
    plt.figure(figsize=(10,6))
    plt.xlabel("Time")
    plt.ylabel(Column)
    for Ticker in Tickers:
        returns = allFrames[Ticker][Column]
        array = returns.values
        time = returns.index.values
        plt.plot(time, array)
    plt.show()

Были рассмотрены 3 пары активов из разных прлизводственных секторов:
KO and PEP - Customer Defensive

Активы компаний Кока-кола и Пепcи соответственно
График зависимости доходностей:

In [None]:
plot_smth(['KO','PEP'],"Return")

Леко заметить, что общий тренд у обеих компаний совпадает. Скорее всего это обуславливается похожестью основной продукции компаний.

График зависимости объемов продаж:

In [None]:
plot_smth(['KO','PEP'],"Volume")

Видно, что здесь тренд также сохраняестя - в одно и тоже время происходя взлеты и падения в графиках функций. Кроме октября 2017, когда объемы продаж акций Кока-Колы сильно упали в то время как акций Пепси стали покупать значительно больше. Вместе с тем фактом, что в общем за 2017 с акцими Кока-Колы произведено значительно больше операций, можно предположить, что этот спад мог быть вызван деятельностью компании, не связанной с дистрибьюцией газировки - компания намного больше своего конкурента и работает и в других областях(https://www.coca-colacompany.com/sustainability).


Следующая пара это технологические комапнии YY и SQ
Первая является стриминговым сервисом в Китае, вторая работает с платежными системами в США

График зависимости доходностей:

In [None]:
plot_smth(['YY','SQ'], "Return")

Заметно, что в отличии от предыдущего случая здесь данные обратно пропорциональны - рост акций одной компании сопроваждается падением акций другой. Особенно это заметно в конце ноября- начале декабря 2017. Данное поведение могло бы быть обусловлено тем, что эти компании конкурируют друг с другом, но разный род деятельности внутри одного сектора опровергает это. Скорее всего это следствие того, что используемые данные по итогу собраны с разных бирж - Nasdaq и  NYSE соотвественно

График зависимости объемов продаж:

In [None]:
plot_smth(['YY','SQ'], "Volume")

Здесь можно увидеть, что YY имеет почти неменяющееся количевто транзакций, в то время как прямая SQ постоянно колеблется. Заметно, что все подъемы в количестве акций у YY приходятся на падения количества продаж SQ, но это тоже результат разного  источника данных. При сопоставлении графиков доходностей и объемов продаж заметно интересное поведение участников рынка - падение цены актива привело к резкому увеличению количества операций с ним.

HON и WM:

In [None]:
plot_smth(['HON','WM'], "Return")

Несмотря на то, что в какте-то моменты времени движение графиков кажется оратнопропорционалным (май 2017) оно скорее всего является незвисимым, тк в какие-то моменты времени графики движутся в одинаковых направлениях.
График  зависимости объемов продаж лишь подтвержадет это:

In [None]:
plot_smth(['HON','WM'], "Volume")

Есть одновременные рост и падение, видны и противоположные направления движения.

# Task 5

In [None]:
returns = []
for tick in allTickers:
    ret,risk = get_return_info(tick)
    returns.append([ret, tick, allFrames[tick].shape[0]])
returns.sort()
returns[:7], returns[-7:]

## Зависимость между доходностями
### Разные производственные сектора

In [None]:
import numpy as np 

def get_correlation_return(tic1, tic2):
    ret1 = allFrames[tic1]["Return"][1:]
    ret2 = allFrames[tic2]["Return"][1:]
    print("Correlation between {} and {} returns is {:.2f}".format(tic1, tic2, np.corrcoef(ret1,ret2)[0,1]))
    plt.scatter(ret1,ret2, c = 'green')
    plt.xlabel("Ticker 1")
    plt.ylabel("Ticker 2")
    plt.show()

In [None]:
get_correlation_return("SWN","ALGN") # energy and healthcare, wide gap between returns


Разница между доходностями SWN и ALGN (производственные сектора энергия и здоровье) очень большая. 
Скорее всего, из-за этого и разных производственных сфер коэффициент корреляции -0.02 близок к 0. 
Это позволяет говорить о независимости доходностей этих активов.

In [None]:
get_correlation_return("ALGN","NRG") # healthcare and utilities(energy), narrow gap between returns

Если же взять близкие по значению средней доходности акции, то корреляция возрастает. 
Однако ее маленькое значение (0.1) все равно не позволяет говорить о зависимости признаков.

### Один производственный сектор

In [None]:
get_correlation_return("MNK", "ALGN") # healthcare, wide gap between returns

При анализе активов из одного сектора (здоровье), но с большим различием в средних 
доходностях обнаружена линейная независимость их доходностей (коэффициент корреляции = 0).
График зависимости доходностей активов MNK и ALGN показывает, что основная масса наблюдений 
формирует шарообразную область вокруг нулевой доходности.

In [None]:
get_correlation_return("SQ", "YY") # technology, narrow gap between returns

У активов SQ и YY (технологии) с маленьким расстоянием между доходностями коэффициент корреляции возрастает до 0.21.
Это позволяет говорить о небольшом влиянии на доходность друг друга или же зависимость от внешних обстоятельств.

In [None]:
get_correlation_return("FB", "GOOGL") #Facebook and google, technology

Коэффициент корреляции 0.7 между доходностями акций Facebook и Google говорит о сильной, 
линейной зависимости, что так же заметно на графике.

Таким образом, за наличие зависимости между доходностями компаний отвечает:
разница между средними доходностями, 
отношение к одному производственному сектору
взаимотношение компаний на рынке (конкуренция или сотрудничество)

## Зависимость между доходностями и объемами продаж

In [None]:
def get_cor_return_volume(tic):
    ret = allFrames[tic]["Return"][1:]
    volume = allFrames[tic]["Volume"][1:]
    print("Correlation between return and volume of {} is {:.2f}".format(tic, np.corrcoef(ret,volume)[0,1]))
    plt.scatter(ret,volume, c = 'green')
    plt.xlabel("Return")
    plt.ylabel("Volume")
    plt.show()

In [None]:
#technology
get_cor_return_volume("INTC") 

In [None]:
#energy
get_cor_return_volume("XOM") 

In [None]:
# Communication Services
get_cor_return_volume("VZ") 

In [None]:
# Healthcare
get_cor_return_volume("JNJ") 

In [None]:
# Financial Services
get_cor_return_volume("V") #Visa

In [None]:
# Real Estate - недвижимость
get_cor_return_volume("CCI")

Доходности и объемы продаж компаний из разных секторов линейно независимы. 
Об этом говорит незначительный коэффициент корреляции (не более 0.2 по модулю).
Но на графике точки расположены в виде "галочки" и симметричны относительно оси нулевой доходности 
с максимальной плотностью в этой области.
Это значит, что покупка и продажа в больших объемах приходилась на сильные изменения в доходностях. 
То есть акции массово покупались, когда их доходность росла и продавались в противном случае. 
Такой вывод соотносится с наблюдаемым маленьким значением коэффициента корреляции.

# Task 6

Акции выбирались тем же способом, что и в задании 4

Их расположение на плоскости предствавлено ниже:

In [None]:
Tickers = find_good_actives(allRisks,allReturns,50)
plot_for_tickers(Tickers)

In [None]:
allReturns = []
allRisks = []
for tick in allTickers:
    ret,risk = get_return_info(tick)
    allReturns.append(ret)
    allRisks.append(risk)

plt.figure(figsize=(10,6))
plt.xlabel("Risk")
plt.ylabel("Return")
plt.plot(allRisks, allReturns,"*")
plt.show()

In [None]:
def covar_coefs(tic1,tic2):
    ret1 = allFrames[tic1]["Return"][1:]
    ret2 = allFrames[tic2]["Return"][1:]
    Rets = np.stack((ret1,ret2))
    Mat = np.cov(Rets)
    return np.cov(Rets)[0][1] #cov btw 1 and 2

In [None]:
from cvxopt import matrix, solvers

def get_optimal_pack(Tickers):
    C = [[covar_coefs(T2,T1) for T1 in Tickers] for T2 in Tickers] #sigma covar matrix
    
    lambdas=[]
    n = len(Tickers)
    for i in range(0,100,5):
        E0 = i / 1000
        print("E0 {}\n\n".format(E0))

        Q = 2*matrix(C)
        G = []
        for ticker in Tickers:
            E,_ = get_return_info(ticker)
            G.append(-1 * E)

        p = matrix([0.0 for i in range(n)])


        G = np.array(G).reshape(-1,1).T
        G = matrix(G)
        h = matrix(-1 * E0)

        A = np.array([1.0 for i in range(n)]).reshape(-1,1).T
        A = matrix(A)
        b = matrix(1.0)

        sol=solvers.qp(Q, p, G, h, A, b)
        X = []
        for i in sol['x']:
            X.append(i)

        Es = []
        for ticker in Tickers:
            E,_ = get_return_info(ticker)
            Es.append(E)
        #Доходность портфеля
        Rp = sum([X[i]*Es[i] for i in range(n)])
        #Риск
        sigma2 = []
        for i in range(n):
            for j in range(n):
                sigma2.append(X[i]*X[j]* C[i][j])
        sigma2 = sum(sigma2)

        print(Rp,sigma2**0.5)
        lambdas.append([Rp,sigma2**0.5])
    return lambdas

def get_optimal_pack_long_only(Tickers):
    C = [[covar_coefs(T2,T1) for T1 in Tickers] for T2 in Tickers] #sigma covar matrix
    
    lambdas=[]
    n = len(Tickers)
    for i in range(0,43,1):
        E0 = i / 10000
        print("E0 {}\n\n".format(E0))

        Q = 2*matrix(C)
        p = matrix([0.0 for i in range(n)])
        G = []
        for ticker in Tickers:
            E,_ = get_return_info(ticker)
            G.append(-1 * E)

        G = [G] + np.diag([-1.0 for i in range(n)]).tolist()
        G = np.array(G).reshape(n+1,n)
        G = matrix(G)
        h = matrix([-1 * E0] + [0.0 for i in range(n)])

        A = np.array([1.0 for i in range(n)]).reshape(-1,1).T
        A = matrix(A)
        b = matrix(1.0)

        sol=solvers.qp(Q, p, G, h, A, b)
        X = []
        for i in sol['x']:
            X.append(i)

        Es = []
        for ticker in Tickers:
            E,_ = get_return_info(ticker)
            Es.append(E)
        #Доходность портфеля
        Rp = sum([X[i]*Es[i] for i in range(n)])
        #Риск
        sigma2 = []
        for i in range(n):
            for j in range(n):
                sigma2.append(X[i]*X[j]* C[i][j])
        sigma2 = sum(sigma2)

        print(Rp,sigma2**0.5)
        lambdas.append([Rp,sigma2**0.5])
    return lambdas

In [None]:
def plot_optimal_pack(lambdas, Portfolio, ):
    rets=[]
    risks=[]
    Xes = [X for [Y,X] in lambdas]
    Yes = [Y for [Y,X] in lambdas]
    for tick in Tickers:
        ret,risk = get_return_info(tick)
        rets.append(ret)
        risks.append(risk)
    

    plt.figure(figsize=(10,6))
    plt.xlabel("Risk")
    plt.ylabel("Return")
    plt.plot(risks, rets,"*")
    plt.scatter(Portfolio[0], Portfolio[1], c='red')
    plt.plot(Xes,Yes)
    plt.show()

In [None]:
lambdas = get_optimal_pack(Tickers)

Воспользовввавшись средствами решения оптимизационнных задач найдем доли вкладов для разных фиксированных E0.
График без запрета коротких продаж: 

In [None]:
plot_optimal_pack(lambdas,Portfolio)
print(Portfolio)

In [None]:
lambdas_long_only = get_optimal_pack_long_only(Tickers)

После мы проделали тоже самое с дополнителным ограничением на неотрицательные доли
График с запретом коротких продаж:

In [None]:
plot_optimal_pack(lambdas_long_only,Portfolio)

Как видно, подтвердились основной факт о фронте без запрета - он неограничен, тк занимать и вкладывать в  активы можно бесконечно.

График при ограничении продаж ограничен максимальной доходностью 0.004215 в нашем случае и растет намного медленнее.

Фронты имеют схожую форму, но 2й более приближен к точкам активов.

Портфель с равными долями отмечен на карте активов красной точкой. Как видно - на всех графиках она лежит на эффективном фронте, то есть является оптимальным. Доходность для этого портфеля 0.00143, а риск - 2.015e-05 

# Task 7 #

In [None]:
best_tickers = sorted([[get_return_info(tic), tic] for tic in Tickers])[-15:]
best_tickers = [tic for _,tic in best_tickers]
print(best_tickers)

In [None]:
C = [[covar_coefs(T2,T1) for T1 in best_tickers] for T2 in best_tickers] #sigma covar matrix
X = [1/15 for i in range(15)]
Es = []
for ticker in best_tickers:
    E,_ = get_return_info(ticker)
    Es.append(E)
Rp = sum([X[i]*Es[i] for i in range(15)])
sigma2 = []
for i in range(15):
    for j in range(15):
        sigma2.append(X[i]*X[j]* C[i][j])
sigma2 = sum(sigma2)
Portfolio = [sigma2,Rp]

In [None]:
# формируем портфель из 15 самых доходных акций из списка лучших, сформированного ранее, полностью пренебрегая риском

In [None]:
lambdas = get_optimal_pack(best_tickers)

In [None]:
plot_optimal_pack(lambdas,Portfolio)

Оптимальный портфель на 15 выбранных активах при разрешении коротких позиций выглядит следующим образом. 
Из выбранных активов можно получить портфель той же доходности, что при испрользовании всего набора активов (0.095)
Однако при данном наборе, высшая доходность достигается при почти 100% вероятности провала (sigma=0.97),
В то время как на полном наборе риск достигает только 40%
Это связано с тем, что все 15 акций обладают очень высоким риском относительно не отобранных 35 акций 
(0.021 в среднем)
Однако, как и в случае с полным набором, можно собрать портфель с минимальным риском (0.0007) 
и маленькой доходностью 0.005 благодаря разрешению коротких продаж

In [None]:
sigmas = [sig for (e,sig),tic in sorted([[get_return_info(tic), tic] for tic in Tickers])[-15:]]
print("Mean risk value is ", np.mean(sigmas))

In [None]:
lambdas_long_only = get_optimal_pack_long_only(best_tickers)

In [None]:
plot_optimal_pack(lambdas_long_only,Portfolio)

При запрете коротких позиций оптимальный фронт оригинального и сокращенного набора активов выглядят аналогично 
и достигают маленькой, стабильной доходности в 0.0042 при риске в 0.0008.
Это значит, что набор активов, в который вкладываются максимально, остался тем же и в том, и в другом наборе
Капитал для максимальной доходности в обоих случаях распределяется следующим образом: 97% идет в YY (China Technology, return = 0.0042, risk = 0.03),
2% в SQ, а 1% распределяется между оставшимися акциями.
При убирании актива компании YY из набора, лучший доход падает до 0.0035 при риске в 0.0002, 
а доли капитала распределяются равномернее между активами: по 20% на ALGN, NRG, WB и 30% на SQ.
    
Таким образом, при запрете коротких позиций, портфель получается более "стабильным", 
то есть предлагает стабильный, но маленький доход при отсутствующем риске.