In [1]:
import pandas as pd
import numpy as np
import plotly
import plotly.graph_objects as go
import plotly.express as px

from scipy import optimize
from scipy.optimize import LinearConstraint, Bounds
%config InlineBackend.figure_format='retina'

def carregar_dados():
    precos = pd.read_csv("../dados/cotacoes-2021-jan-dez.csv", index_col=0, parse_dates=True)
    return precos

def formatar_resultado(simbolos, pesos):
    pesos_carteira = pesos * 100
    carteira = pd.DataFrame(index=simbolos, columns=['peso'], data=pesos_carteira)
    carteira = carteira[ carteira['peso'] > 0.1 ].sort_values(by='peso', ascending=False)
    carteira['peso'] = carteira['peso'].round(2) 
    
    return carteira

def formatar_legenda(simbolos, pesos):
    df = formatar_resultado(simbolos, pesos)
    simb = df.index.tolist()
    pesos_carteira = df['peso'].tolist()
    carteira_str = ''
    for i in range(len(simb)):
        carteira_str = carteira_str + simb[i] + ': ' + "%.2f" % pesos_carteira[i]
        carteira_str = (carteira_str + ' ') if i != len(simb) - 1 else carteira_str

    return carteira_str

def retorno_esperado(pesos):
    retorno = np.sum(variacao_precos_log * pesos, axis=1) 
    return retorno.mean() # retorno diário médio da carteira (log)

# função objetivo da otimização
def volatilidade_carteira(pesos):
    variacao_carteira = np.sum(variacao_precos_log * pesos, axis=1) # variação diária do valor da carteira
    return variacao_carteira.std()
    
def volatilidade_negativa_carteira(pesos): # volatilidade dos dias de queda
    variacao_carteira = np.sum(variacao_precos_log * pesos, axis=1) # variação diária do valor da carteira
    variacao_carteira = variacao_carteira[variacao_carteira < 0] # pega apenas as variações negativas
    return variacao_carteira.std()

def calcular_variacao_precos_log(precos):
    variacao = np.log(precos/precos.shift(1))
    return variacao[1:]
    
def calcular_variacao_precos(precos):
    variacao = precos/precos.shift(1) - 1
    return variacao[1:]

# def gerar_carteiras_aleatorias(qtd):
#     for x in range(qtd):
#         pesos_rdm = np.random.random(qtd_ativos)
#         pesos_rdm = pesos_rdm / sum(pesos_rdm)
#         retorno = retorno_carteira(pesos_rdm)
#         volatilidade = volatilidade_carteira(pesos_rdm)
#         frontier_x.append(volatilidade)
#         frontier_y.append(retorno)
#         sharpe_ratio.append(retorno / volatilidade)

In [2]:
precos = carregar_dados()
simbolos = precos.columns.tolist()
variacao_precos = calcular_variacao_precos(precos)
variacao_precos_log = calcular_variacao_precos_log(precos)
variacao_periodo = (precos.iloc[-1] - precos.iloc[0]) / precos.iloc[0]
variacao_media = variacao_precos.mean() # variação média por ativo
qtd_dias = variacao_precos.count()[0]
qtd_ativos = len(simbolos)

In [3]:
precos

Unnamed: 0_level_0,BTC,ETH,BNB,ADA,LINK,SOL,DOT,UNI,LUNA,AVAX,ALGO,ATOM,EGLD,LTC,CAKE
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1
2021-01-01,29374.152344,730.367554,37.905010,0.175350,11.872555,1.842084,8.306819,4.736249,0.649443,3.664823,0.398129,5.868556,26.065042,126.230347,0.662068
2021-01-02,32127.267578,774.534973,38.241592,0.177423,12.220137,1.799275,9.208837,4.845214,0.631426,3.494940,0.408091,5.414613,25.891308,136.944885,0.616939
2021-01-03,32782.023438,975.507690,41.148979,0.204995,13.650172,2.161752,10.033283,5.447031,0.661895,3.472944,0.422767,5.813898,27.156723,160.190582,0.633083
2021-01-04,31971.914062,1040.233032,40.926353,0.224762,13.571063,2.485097,9.469611,5.406566,0.670244,3.590243,0.438666,5.996770,30.629923,154.807327,0.642997
2021-01-05,33992.429688,1100.006104,41.734600,0.258314,14.539868,2.157217,9.701656,6.279291,0.716674,4.237412,0.479429,6.216816,33.953747,158.594772,0.679435
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2021-12-12,50098.335938,4134.453125,570.823975,1.347282,20.456585,173.431671,29.608980,16.017937,61.919449,88.109116,1.542000,24.574207,263.071075,159.203964,11.615931
2021-12-13,46737.480469,3784.226807,521.011597,1.225348,17.775459,155.213058,25.971106,14.148139,52.745789,79.149628,1.321398,21.760569,234.254059,144.535904,10.932409
2021-12-14,46612.632812,3745.440430,511.229370,1.222835,17.587616,153.341446,26.168419,14.979408,57.277336,87.311905,1.323860,21.213074,254.483795,146.078003,12.519122
2021-12-15,48896.722656,4018.388672,541.026978,1.311847,19.714485,178.340790,27.145760,15.180298,61.527020,101.181450,1.426744,22.295862,295.935181,153.515411,13.163462


# Markowitz Efficient Frontier

In [4]:
ativo_maior_retorno = variacao_periodo[variacao_periodo == variacao_periodo.max()].index[0]
ativo_menor_retorno = variacao_periodo[variacao_periodo == variacao_periodo.min()].index[0]
retorno_max = variacao_precos_log[ativo_maior_retorno].mean() * 1.5
retorno_min = variacao_precos_log[ativo_menor_retorno].mean() * 0.5

In [5]:
bounds = [(0,1)] * qtd_ativos
initial_guess = [1 / qtd_ativos] * qtd_ativos # pesos iniciais
possiveis_retornos = np.linspace(retorno_max, retorno_min, 100) # range entre 0 e variação máxima média diária
frontier_x = [] # volatilidade
frontier_y = [] # retorno diário médio anualizado das carteiras
sharpe_ratio = []
pesos = []
vol_min = -1;

for possivel_retorno in possiveis_retornos:
    cons = ({'type': 'eq', 'fun': lambda x: np.sum(x) - 1},
            {'type':'eq', 'fun': lambda w: retorno_esperado(w) - possivel_retorno})
    resultado = optimize.minimize(volatilidade_carteira, initial_guess, method='SLSQP', bounds=bounds, constraints=cons)
    if vol_min == -1 or resultado.fun <= vol_min:
        vol_min = resultado.fun
        retorno = retorno_esperado(resultado.x)
        sharpe_ratio.append( retorno / resultado.fun )
        frontier_x.append(resultado.fun)
        frontier_y.append(retorno)
        pesos.append(resultado.x)

In [6]:
sr_max_index = sharpe_ratio.index(max(sharpe_ratio))
retorno_max_index = frontier_y.index(max(frontier_y))
volatilidade_min_index = frontier_x.index(min(frontier_x))

In [7]:
legendas = []
for x in pesos:
    legendas.append( formatar_legenda(simbolos, x) )
    
carteiras_plot = pd.DataFrame()
carteiras_plot['retorno'] = frontier_y
carteiras_plot['volatilidade'] = frontier_x
carteiras_plot['sharpe_ratio'] = sharpe_ratio
carteiras_plot['carteira'] = legendas

In [10]:
fig = px.scatter(carteiras_plot,
                 x='volatilidade',
                 y='retorno',
                 color='sharpe_ratio',
                 title='Carteiras com melhor relação risco/retorno',
                 width=800,
                 height=550,
                 template='plotly_white',
                 labels={"sharpe_ratio": "Retorno / volatilidade", 
                         'volatilidade': 'Volatilidade',
                         'retorno': 'Retorno diário médio (log)'},
                 color_continuous_scale=px.colors.sequential.Inferno,
                 hover_data=['carteira'])

fig.add_trace(go.Scatter(x=[frontier_x[sr_max_index]], y=[frontier_y[sr_max_index]], 
                         customdata=[legendas[sr_max_index]],
                         marker_symbol = 'star', marker_color='green', marker_size=10,
                         showlegend=False,
                         name='Carteira com melhor relação retorno/volatilidade'))

fig.add_trace(go.Scatter(x=[frontier_x[retorno_max_index]], y=[frontier_y[retorno_max_index]], 
                         customdata=[legendas[retorno_max_index]],
                         marker_symbol = 'star', marker_size=10, marker_color='red', 
                         showlegend=False,
                         name='Carteira com maior retorno'))

fig.add_trace(go.Scatter(x=[frontier_x[volatilidade_min_index]], y=[frontier_y[volatilidade_min_index]], 
                         customdata=[legendas[volatilidade_min_index]],
                         marker_symbol = 'star', marker_size=10, marker_color='blue', 
                         showlegend=False,
                         name='Carteira com menor volatilidade'))

fig.update_traces(marker=dict(line=dict(width=1)),
                  hovertemplate ='<i>Retorno</i>: %{y:.2f}<br>'+ 
                                 '<i>Volatilidade</i>: %{x:.2f}<br>' +
                                 '<i>Carteira</i>: %{customdata}')

fig.update_layout(coloraxis_colorbar=dict(titleside="right"), font=dict(size=11))

fig.show()

In [None]:
# variacao_periodo.sort_values(ascending=False)

### Carteira com menor volatilidade

In [None]:
display( formatar_resultado(simbolos, pesos[volatilidade_min_index]) )

lucro = sum(variacao_periodo * pesos[volatilidade_min_index]) * 100
print("\nRentabilidade do BTC no período: " + "%.2f" % (variacao_periodo['BTC'] * 100) + "%")
print("Rentabilidade da carteira no período: " + "%.2f" % lucro + "%")
print("Volatilidade da carteira no período: " + "%.3f" % frontier_x[volatilidade_min_index])

### Carteira com maior retorno

In [None]:
display( formatar_resultado(simbolos, pesos[retorno_max_index]) )

lucro = sum(variacao_periodo * pesos[retorno_max_index]) * 100
print("\nRentabilidade do BTC no período: " + "%.2f" % (variacao_periodo['BTC'] * 100) + "%")
print("Rentabilidade da carteira no período: " + "%.2f" % lucro + "%")
print("Volatilidade da carteira no período: " + "%.3f" % frontier_x[retorno_max_index])

### Carteira com maior sharpe ratio (retorno / volatilidade)

In [None]:
display( formatar_resultado(simbolos, pesos[sr_max_index]) )

lucro = sum(variacao_periodo * pesos[sr_max_index]) * 100
print("\nRentabilidade do BTC no período: " + "%.2f" % (variacao_periodo['BTC'] * 100) + "%")
print("Rentabilidade da carteira no período: " + "%.2f" % lucro + "%")
print("Volatilidade da carteira no período: " + "%.3f" % frontier_x[sr_max_index])

### Frequência dos ativos nas carteiras

In [None]:
carteiras = pd.DataFrame(columns=simbolos, data=pesos)
carteiras['sharpe_ratio'] = sharpe_ratio
carteiras['volatilidade'] = frontier_x
carteiras['retorno'] = frontier_y

In [None]:
soma_pesos = pd.DataFrame(columns=["pesos"], data=carteiras.sum())
soma_pesos = soma_pesos[0:-3]
soma_pesos = soma_pesos.sort_values(by='pesos', ascending=False)
soma_pesos = soma_pesos.applymap(lambda x: "%.2f" % x)
soma_pesos

### Moedas com maiores retornos

In [None]:
retornos_ativos = variacao_periodo * 100
retornos_ativos = retornos_ativos.sort_values(ascending=False)
retornos_ativos = retornos_ativos.apply(lambda x: "%.2f" % x + "%")

retornos_ativos

### Moedas com menor volatilidade

In [None]:
volatilidade_ativos = variacao_precos.std()
volatilidade_ativos = volatilidade_ativos.sort_values(ascending=True)
volatilidade_ativos