# Solver de Markowitz

**Responsable:**
César Zamora Martínez

**Infraestructura usada:** Google Colab, para pruebas
0. Importamos librerias necesarias

**Fuente:*** código desarrollada en etapas previas

# Objetivo:

Implementar un solver que permite dar solución al problema de minimización de riesgo en el áreas de finanzas del siguiente tenor: 

* 1. Para un retorno $r$ esperado por un inversionista sobre un portafolio de activos, con un vector $mu$ de rendimiento promedio de cada uno de tales activos en cierto periodo histórico
2. Encontrar los pesos $w$ asociados a los activos del portafolio, que permitan obtener el portafolio con el retorno $r$ y a su vez con mínima varianza.

En términos matemáticos ello equivale a resolver 

$$\min_{w}  \frac{1}{2} w^t \Sigma w$$

tal que 

$$ w^t \mu= r$$

$$ w^t 1_{m}= 1$$

En donde $\Sigma$ es la matriz de covarianzas asociadas a los rendimientos de los activos en el periodo de interés.

Cabe destacar que el procedimiento descrito se basa en las siguientes premisas:

* Se hace uso de la herramienta *Cupy* de Python para aprovechar el hardware GPU de los equipos disponibles,
* Aprovechar que el problema planteado tiene una solución cerrada empleando la expresión de los puntos críticos del Lagrangiano asociado a este problema (para mayor detalle, por favor véase el *Readme.md* del proyecto
* Los datos de portafolios se tomarán del framework de Python existente para *Yahoo Finance*


# 0. Importamos librerias necesarias

In [2]:
import cupy as cp
import numpy as np
import pandas as pd
import yfinance as yf
import datetime
import matplotlib.pyplot as plt
import seaborn as sns
import time

  import pandas.util.testing as tm


# 1. Portafolios a emplear

A continuación creamos un arreglo con abreviaturas de los portafolios a probar en esta implementación, las abreviaturas corresponden a los nombres con que en el framework de Python para Yahoo Finance se identifican a los activos de nuestro interés:

In [0]:
stocks = ['COP','AMT','LIN','LMT','AMZN','WMT','JNJ','VTI','MSFT','GOOG','XOM','CCI','BHP.AX','UNP',
'BABA','NSRGY','RHHBY','VOO','AAPL','FB','CVX','PLD','RIO.L','HON','HD','PG','UNH','BRK-A','V','0700.HK',
'RDSA.AS','0688.HK','AI.PA','RTX','MC.PA','KO','PFE','JPM','005930.KS','VZ','RELIANCE.NS','DLR','2010.SR',
'UPS','7203.T','PEP','MRK','1398.HK','MA','T']

In [0]:
def extraer_datos_yahoo(stocks, start='2015-01-01', end='2020-04-30'):
    '''
    Descarga la información de precios de acciones al cierre para un periodo determinado
    Inputs:
        stocks - lista de acciones a descargar, las 50 especificadas previamente
        'COP','AMT','LIN','LMT','AMZN','WMT','JNJ','VTI','MSFT','GOOG','XOM','CCI','BHP.AX','UNP',
        'BABA','NSRGY','RHHBY','VOO','AAPL','FB','CVX','PLD','RIO.L','HON','HD','PG','UNH','BRK-A','V','0700.HK',
        'RDSA.AS','0688.HK','AI.PA','RTX','MC.PA','KO','PFE','JPM','005930.KS','VZ','RELIANCE.NS','DLR','2010.SR',
        'UPS','7203.T','PEP','MRK','1398.HK','MA','T'
        start - fecha inicio a partir de la cual se requieren los precios de las acciones, formato 'YYYY-MM-DD'
        end - fecha final hasta donde se requieren los precios de las acciones, formato 'YYYY-MM-DD'
    Output:
        datos - dataframe con 50 columnas, una por acción, tantos renglones como días hábiles del periodo
        solicitado (1340 en el caso de las fechas default), cada celda es el precio de una acción al cierre, 
        de un día específico
    '''
    df_c = yf.download(stocks, start, end).Close
    base = df_c['AAPL'].dropna().to_frame()
    for i in range(0,50):
        base = base.join(df_c.iloc[:,i].to_frame(), lsuffix='_caller', rsuffix='_other')
    base = base.drop(columns=['AAPL_caller'])
    base = base.rename(columns={"AAPL_other": "AAPL"})
    base = base.fillna(method='ffill')
    base = base.fillna(method='bfill')
    return base

In [6]:
datos = extraer_datos_yahoo(stocks)

[*********************100%***********************]  50 of 50 downloaded


Ahora examinamos los datos recién descargados:

In [7]:
datos

Unnamed: 0_level_0,005930.KS,0688.HK,0700.HK,1398.HK,2010.SR,7203.T,AAPL,AI.PA,AMT,AMZN,BABA,BHP.AX,BRK-A,CCI,COP,CVX,DLR,FB,GOOG,HD,HON,JNJ,JPM,KO,LIN,LMT,MA,MC.PA,MRK,MSFT,NSRGY,PEP,PFE,PG,PLD,RDSA.AS,RELIANCE.NS,RHHBY,RIO.L,RTX,T,UNH,UNP,UPS,V,VOO,VTI,VZ,WMT,XOM
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1
2015-01-02,26600.0,24.704800,112.800003,5.77,79.500000,7507.0,109.330002,89.786400,99.669998,308.519989,103.599998,27.603399,223600.0,79.510002,68.919998,112.580002,66.410004,78.449997,523.373108,103.430000,95.556229,104.519997,62.490002,42.139999,129.949997,193.309998,85.680000,130.850006,57.189999,46.759998,72.650002,94.440002,31.330000,90.440002,43.430000,27.750000,442.774994,33.910000,2970.0,72.397736,33.869999,100.779999,118.610001,110.379997,66.254997,188.399994,105.919998,46.959999,85.900002,92.830002
2015-01-05,26660.0,24.951799,113.500000,5.80,79.500000,7507.0,106.250000,87.005997,98.230003,302.190002,101.000000,27.547300,220980.0,79.000000,65.639999,108.080002,67.690002,77.190002,512.463013,101.260002,93.735291,103.790001,60.549999,42.139999,126.519997,189.289993,83.269997,127.050003,58.040001,46.330002,70.959999,93.730003,31.160000,90.010002,43.400002,26.615000,437.924988,34.029999,2883.5,71.189430,33.549999,99.120003,114.599998,108.169998,64.792503,185.089996,104.099998,46.570000,85.650002,90.290001
2015-01-06,25900.0,24.605900,120.000000,5.71,77.000000,7300.0,106.260002,86.279999,97.970001,295.290009,103.320000,26.267099,220450.0,78.849998,62.930000,108.029999,67.480003,76.150002,500.585632,100.949997,93.516014,103.279999,58.980000,42.459999,124.900002,188.399994,83.089996,125.599998,60.320000,45.650002,70.610001,93.019997,31.420000,89.599998,43.549999,26.514999,418.049988,33.900002,2944.5,70.182503,33.599998,98.919998,112.230003,107.459999,64.375000,183.270004,103.080002,47.040001,86.309998,89.809998
2015-01-07,26140.0,24.507099,124.400002,5.75,78.250000,7407.0,107.750000,86.669601,99.000000,298.420013,102.129997,26.267099,223480.0,80.500000,63.349998,107.940002,68.019997,76.150002,499.727997,104.410004,94.192909,105.559998,59.070000,42.990002,126.300003,190.830002,84.220001,125.699997,61.610001,46.230000,70.750000,95.739998,31.850000,90.070000,44.209999,26.870001,427.149994,33.990002,2962.5,70.943993,33.169998,99.930000,112.849998,108.459999,65.237503,185.559998,104.309998,46.189999,88.599998,90.720001
2015-01-08,26280.0,23.864799,127.300003,5.72,79.250000,7554.0,111.889999,90.317703,99.919998,300.459991,105.029999,26.519400,226680.0,81.769997,64.930000,110.410004,68.910004,78.180000,501.303680,106.720001,95.908974,106.389999,60.389999,43.509998,128.380005,195.130005,85.529999,129.649994,62.849998,47.590000,71.459999,97.480003,32.500000,91.099998,44.220001,27.495001,421.024994,34.279999,3027.5,72.152298,33.500000,104.699997,117.080002,110.410004,66.112503,188.820007,106.150002,47.180000,90.470001,92.230003
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2020-04-23,52100.0,26.200001,411.600006,5.06,70.300003,6570.0,275.029999,117.599998,248.600006,2399.449951,205.240005,29.750000,278750.0,160.550003,36.180000,86.800003,148.529999,185.130005,1276.310059,202.320007,134.679993,155.509995,89.389999,45.070000,181.300003,376.730011,255.860001,348.649994,80.879997,171.419998,106.000000,130.259995,36.689999,119.400002,86.750000,16.521999,1370.900024,44.180000,3783.0,63.290001,29.500000,285.329987,152.289993,99.449997,166.380005,256.420013,139.550003,57.590000,128.529999,43.450001
2020-04-24,52100.0,26.100000,406.399994,5.06,70.300003,6543.0,282.970001,115.300003,244.610001,2410.219971,204.360001,30.540001,279460.0,161.610001,36.090000,87.010002,150.029999,190.070007,1279.310059,212.179993,135.520004,154.860001,90.709999,45.430000,181.470001,381.769989,258.760010,340.850006,81.430000,174.550003,109.220001,134.360001,37.380001,118.779999,89.040001,15.978000,1417.000000,45.060001,3750.0,63.430000,29.709999,291.290009,156.089996,100.180000,167.320007,260.140015,141.630005,57.930000,129.440002,43.730000
2020-04-27,52100.0,26.950001,413.000000,5.18,71.400002,6659.0,283.170013,117.699997,250.220001,2376.000000,203.690002,30.500000,281264.0,163.800003,37.150002,89.709999,154.229996,187.500000,1275.880005,217.759995,139.880005,154.289993,94.620003,46.779999,184.580002,378.570007,265.119995,350.950012,83.980003,174.050003,107.040001,134.460007,38.330002,117.449997,91.839996,16.250000,1429.750000,44.889999,3760.5,65.070000,30.540001,293.980011,158.960007,102.550003,171.759995,263.899994,144.139999,57.810001,128.300003,43.939999
2020-04-28,52100.0,27.900000,417.200012,5.25,71.300003,6685.0,278.579987,119.599998,243.529999,2314.080078,201.149994,30.490000,280600.0,161.259995,38.480000,89.910004,154.149994,182.910004,1233.670044,217.630005,142.759995,151.389999,95.290001,46.740002,186.880005,384.730011,264.600006,357.000000,81.180000,169.809998,106.459999,136.320007,37.910000,116.889999,89.589996,16.672001,1428.150024,45.279999,3772.0,65.389999,30.650000,288.359985,161.360001,96.430000,171.250000,262.679993,143.690002,57.830002,128.000000,44.970001


# 2. Funciones auxiliares

Ahora definimos funcionas auxiliares para el cálculo de los rendimientos de los activos, así como de la matriz de covarianza de ellos:

In [0]:
def calcular_rendimiento_vector(x):
  """
  Función para calcular el rendimiento esperado

  params:
      x     vector de precios
  
  return:
      r_est rendimiento esperado diario
  """

  # Definimos precios iniciales y finales como arreglo alojado en la gpu
  x_o = cp.asarray(x)
  x_f = x_o[1:]

  # Calculamos los rendimientos diarios
  r = cp.log(x_f/x_o[:-1])

  return r

In [0]:
def calcular_rendimiento(X):
  """
  Función para calcular el rendimiento esperado para un conjunto de acciones

  params:
      X      matriz mxn de precios, donde:
             m es el número de observaciones y
             n el número de acciones
  
  return:
      r_est rvector de rendimientos esperados
  """
  m,n = X.shape
  r_est = cp.zeros(n)
  X = cp.asarray(X)

  for i in range(n):
    r_est[i] = calcular_rendimiento_vector(X[:,i]).mean()

  return 264*r_est

In [0]:
def calcular_varianza(X):

  """
  Función para calcular el la matriz de varianzas y covarianzas para un conjunto de acciones

  params:
      X      matriz mxn de precios, donde:
             m es el número de observaciones y
               n el número de acciones
  
  return:
      S  matriz de varianzas y covarianzas
  """
  m,n=X.shape
  X = cp.asarray(X)

  X_m = cp.zeros((m-1,n))

  for i in range(n):
    X_m[:,i] = calcular_rendimiento_vector(X[:,i]) - calcular_rendimiento_vector(X[:,i]).mean()

  S = (cp.transpose(X_m)@X_m)/(m-2)

  return S

# 3. Matriz de covarianza, vector de rendimiento promedio y rendimiento (con base al máximo observado)

Con los datos recién conseguidos y las funciones previamente presentadas, ahora estamos en condiciones de construir las matrices y vectores que se usarán en el problema en comento.

**Matriz de covarianza**

In [0]:
Sigma = calcular_varianza(datos)

**Vector de rendimientos promedio**

In [0]:
mu = calcular_rendimiento(datos)

In [0]:
mu = cp.array(mu)

**Rendimiento**

Solo con fines ilustrativos, calcularemos cual fue el rendimiento máximo obtenido (de entre las medias de los datos históricos):

In [0]:
r=max(mu)

# 4. Solución del modelo de Markowitz

Ahora definimos las funciones que nos permitirán resolver el problema de encontrar el portafolio de interés:

In [0]:
def formar_vectores(mu, Sigma):
  '''
  Calcula las cantidades u = \Sigma^{-1}  \mu y v := \Sigma^{-1} \cdot 1 del problema de Markowitz

  Args:
    mu (cupy array, vector): valores medios esperados de activos (dimension n)
    Sigma (cupy array, matriz): matriz de covarianzas asociada a activos (dimension n x n)

  Return:
    u (cupy array, escalar): vector dado por \cdot Sigma^-1 \cdot mu (dimension n)
    v (cupy array, escalar): vector dado por Sigma^-1 \cdot 1 (dimension n)
  '''

  # Vector auxiliar con entradas igual a 1
  n = Sigma.shape[0]
  ones_vector = cp.ones(n)

  # Formamos vector \cdot Sigma^-1 mu y Sigm^-1 1
  # Nota: 
  #   1) u= Sigma^-1 \cdot mu se obtiene resolviendo  Sigma u = mu
  #   2) v= Sigma^-1 \cdot 1 se obtiene resolviendo  Sigma v = 1

  # Obtiene vectores de interes
  u = cp.linalg.solve(Sigma, mu)
  u = u.transpose() # correcion de expresion de array
  v = cp.linalg.solve(Sigma, ones_vector)

  return u , v

In [0]:
def formar_abc(mu, Sigma):
  '''
  Calcula las cantidades A, B y C del diagrama de flujo del problema de Markowitz

  Args:
    mu (cupy array, vector): valores medios esperados de activos (dimension n)
    Sigma (cupy array, matriz): matriz de covarianzas asociada a activos (dimension n x n)

  Return:
    A (cupy array, escalar): escalar dado por mu^t \cdot Sigma^-1 \cdot mu
    B (cupy array, escalar): escalar dado por 1^t \cdot Sigma^-1 \cdot 1
    C (cupy array, escalar): escalar dado por 1^t \cdot Sigma^-1 \cdot mu
  '''

  # Vector auxiliar con entradas igual a 1
  n = Sigma.shape[0]
  ones_vector = cp.ones(n)

  # Formamos vector \cdot Sigma^-1 mu y Sigm^-1 1
  # Nota: 
  #   1) u= Sigma^-1 \cdot mu se obtiene resolviendo  Sigma u = mu
  #   2) v= Sigma^-1 \cdot 1 se obtiene resolviendo  Sigma v = 1

  u, v = formar_vectores(mu, Sigma)

  # Obtiene escalares de interes
  A = mu.transpose()@u
  B = ones_vector.transpose()@v
  C = ones_vector.transpose()@u

  return A, B, C

In [0]:
def delta(A,B,C):
  '''
  Calcula las cantidad Delta = AB-C^2 del diagrama de flujo del problema de Markowitz

  Args:
    A (cupy array, escalar): escalar dado por mu^t \cdot Sigma^-1 \cdot mu
    B (cupy array, escalar): escalar dado por 1^t \cdot Sigma^-1 \cdot 1
    C (cupy array, escalar): escalar dado por 1^t \cdot Sigma^-1 \cdot mu

  Return:
    Delta (cupy array, escalar): escalar dado \mu^t \cdot \Sigma^{-1} \cdot \mu
  '''
  Delta = A*B-C**2

  return Delta

In [0]:
def formar_omegas(r, mu, Sigma):
  '''
  Calcula las cantidades w_o y w_ del problema de Markowitz

  Args:
    mu (cupy array, vector): valores medios esperados de activos (dimension n)
    Sigma (cupy array, matriz): matriz de covarianzas asociada a activos (dimension n x n)

  Return:
    w_0 (cupy array, matriz): matriz dada por 
          w_0 = \frac{1}{\Delta} (B \Sigma^{-1} \hat{\mu}- C\Sigma^{-1} 1) 
    w_1 (cupy array, vector): vector dado por 
         w_1 = \frac{1}{\Delta} (C \Sigma^{-1} \hat{\mu}- A\Sigma^{-1} 1)
  '''
  # Obtenemos u = Sigma^{-1} \hat{\mu}, v = \Sigma^{-1} 1
  u, v = formar_vectores(mu, Sigma)
  # Escalares relevantes
  A, B, C = formar_abc(mu, Sigma)
  Delta = delta(A,B,C)
  # Formamos w_0 y w_1
  w_0 = (1/Delta)*(r*B-C)
  w_1 = (1/Delta)*(A-C*r)

  return w_0, w_1

In [0]:
def markowitz(r, mu, Sigma):
  '''
  Calcula las cantidades w_o y w_ del problema de Markowitz

  Args:
    mu (cupy array, vector): valores medios esperados de activos (dimension n)
    Sigma (cupy array, matriz): matriz de covarianzas asociada a activos (dimension n x n)

  Return:
    w_0 (cupy array, matriz): matriz dada por 
          w_0 = \frac{1}{\Delta} (B \Sigma^{-1} \hat{\mu}- C\Sigma^{-1} 1) 
    w_1 (cupy array, vector): vector dado por 
         w_1 = \frac{1}{\Delta} (C \Sigma^{-1} \hat{\mu}- A\Sigma^{-1} 1)
  '''
  # Obtenemos u = Sigma^{-1} \hat{\mu}, v = \Sigma^{-1} 1
  u, v = formar_vectores(mu, Sigma)

  # Formamos w_0 y w_1
  w_0, w_1 = formar_omegas(r, mu, Sigma)

  return w_0*u+w_1*v

# 6. Solver

Con todo lo anterior, podemos probar el solver recien implementados. En concreto el vector de pesos se obtiene en este caso como:

In [0]:
w=markowitz(r,mu,Sigma)

In [23]:
w

array([ 1.58450459e-01, -2.08710279e-02,  1.58051613e-01, -9.28970852e-02,
        3.17093838e-02,  5.10824537e-02,  8.71800626e-02,  1.26389547e-02,
        3.72861469e-02,  2.86000507e-01, -5.98810147e-03,  2.24206232e-03,
        2.03075836e-01,  9.46030741e-02,  2.28766788e-02,  1.49919976e-02,
        7.60706433e-03,  2.96676402e-02,  5.76521006e-02,  1.98109863e-01,
        1.19928144e-01,  1.27869501e-01,  1.41300419e-01,  1.36285005e-02,
        8.83904753e-02,  1.50479914e-01,  1.69293512e-01,  7.72037012e-02,
        8.09121352e-02,  8.24658724e-02,  1.92197879e-01, -2.40095431e-02,
        2.64375219e-02,  7.69647088e-02,  2.20741648e-02, -1.08207562e-01,
        1.64032748e-01,  1.77020932e-02,  6.16398087e-02, -1.08210745e-01,
       -5.03462807e-02,  1.38834320e-01,  1.03567400e-01, -4.28198353e-02,
        1.06872745e-02, -2.33314798e+00,  1.89811544e-01,  2.63296457e-01,
        1.20089773e-01, -1.05535600e-01])

**Verificamos w^t 1 = 1**

In [24]:
sum(w)

array(1.)

**Verificamos que $w^t \mu = r$**

In [25]:
r

array(0.40221088)

In [26]:
w@mu

array(0.40221088)

**Calculamos la varianza del portafolio**

In [27]:
w.transpose()@Sigma@w

array(9.45979246e-05)