# Algoritmos de optimización de portafolios

https://machinelearningmastery.com/bfgs-optimization-in-python/

Vemos cómo usar el método optimize.minimize de la librería scipy. Una ves que estamos satisfechos con el método (test unitario), creamos una optimización numérica de la cobertura de portafolios que teníamos antes:: esto nos permite comparar la solución numérica con la solución exacta. Terminamos agregando una penalización (siguiendo los argumentos de regularización de funciones de costo) para no tener coberturas "muy grandes" respecto al delta original.

Por separado vamos a entener cómo funcinoa el método `optimize&minimize` de la librería scipy.
* Luego voy a construírme la misma `cobertura de portafolios (beta-neutal, delta-neutral)` que tenían dos activos; como tiene dos ecuaciones, una para hacer beta-neutral y otra para hacer delta-neutral y tienen dos incognitas para hacer los dos activos de cobertura la solución existe y es única con algebra lineal siempre y cuando os betas no sena iguales.
> Lo que haremos es tratar de buscar la misma solución numéricamente, esto me va a permitir tener confianza en el método **minimize** para haber cosas después.  
>
> Esto es lo que se lama un test unitario en programación, que lo que hace es tratar de ver de manera independiente para probar que ese pedazo de código hace lo que ha de hacer. En nuestro caso es satisfacer que la librería debe de funcionar como debe de funcionear.


In [186]:
import importlib
import stream_classes
import stream_functions
importlib.reload(stream_functions)
importlib.reload(stream_classes)

ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['SAN.MC', 'REP.MC']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
hedge.compute(bool_print=True)
optimal_hedge = hedge.dataframe

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = SAN.MC vs ^STOXX50E is 1.3739
Beta for hedge[ 1] = REP.MC vs ^STOXX50E is 1.1593
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.874000000000002
--------------------
Betas for the hedge:
--------------------
[[1.3739]
 [1.1593]]
--------------
Optimal hedge:
--------------
[[-5.96924511]
 [-4.03075489]]


Ahora lo que quiero es entrar en en el método `hedge.compute(bool_print=True)` de la clase `hedge.maneger()`

In [2]:
def compute(self, bool_print=False):
    size = len(self.hedge_rics)      
    if not size != 2:                          # para asegurarme que me dan 2 rics de cobert
        print('-------')
        print('Warning: cannot compute exact solution, size ' + str(size) + ' =/= 2')
        return
    deltas = np.ones([size, 1])                 # matriz de unos
    targets = - np.array([[self.delta],[self.beta_usd]])
    mtx = np.transpose(                         # traspuesta
            np.column_stack(                    # acomodo como columnas
                (deltas, self.betas)))          # relleno mis columnas
    self.optimal_hedge = np.linalg.inv(mtx).dot(targets)
    self.dataframe['delta'] = self.optimal_hedge
    self.dataframe['beta_usd'] = self.betas * self.optimal_hedge # dot of matrix
    self.hedge_delta = np.sum(self.dataframe['delta'])
    self.hedge_beta_usd = np.sum(self.dataframe['beta_usd'])
    if bool_print:
        self.print_output('Exact solution from linear algebra')

En este método respecto al del notebook anterior he realizado pequeños cambios, simplemente he separado el `print` del método antiguo y lo he puesto como método independiente porque voy a crearme otro método **`compute_numerical`**  y así reciclaré el print, luego ajusté el código un poco, pero básicamente es lo mismo que teníamos.

Para crear este nuevo método usaré una nueva librería llamada `minimize`, que minimiza y optimiza la función de costes:

In [None]:
from scipy.optimize import minimize

"""
Docstring:
Minimization of scalar function of one or more variables.
"""

#minimize?                    # veamos cómo trabaja esta function

Signature:
minimize(
    fun,                      # tengo que darle una función
    x0,                       # 
    args=(),                  #
    method=None,              # el método que usaremos es - 'BFGS'
    jac=None,
    hess=None,
    hessp=None,
    bounds=None,
    constraints=(),
    tol=None,
    callback=None,
    options=None,
)

Parameters
----------
fun : callable
    The objective function to be minimized.

        ``fun(x, *args) -> float``

    where ``x`` is an 1-D array with shape (n,) and ``args``
    is a tuple of the fixed parameters needed to completely
    specify the function.
x0 : ndarray, shape (n,)
    Initial guess. Array of real elements of size (n,),
    where 'n' is the number of independent variables.
args : tuple, optional
    Extra arguments passed to the objective function and its
    derivatives (`fun`, `jac` and `hess` functions).
method : str or callable, optional
    Type of solver.  Should be one of

        - 'Nelder-Mead' :ref:`(see here) <optimize.minimize-neldermead>`
        - 'Powell'      :ref:`(see here) <optimize.minimize-powell>`
        - 'CG'          :ref:`(see here) <optimize.minimize-cg>`
        - 'BFGS'        :ref:`(see here) <optimize.minimize-bfgs>`
        - 'Newton-CG'   :ref:`(see here) <optimize.minimize-newtoncg>`
        - 'L-BFGS-B'    :ref:`(see here) <optimize.minimize-lbfgsb>`
        - 'TNC'         :ref:`(see here) <optimize.minimize-tnc>`
        - 'COBYLA'      :ref:`(see here) <optimize.minimize-cobyla>`
        - 'SLSQP'       :ref:`(see here) <optimize.minimize-slsqp>`
        - 'trust-constr':ref:`(see here) <optimize.minimize-trustconstr>`
        - 'dogleg'      :ref:`(see here) <optimize.minimize-dogleg>`
        - 'trust-ncg'   :ref:`(see here) <optimize.minimize-trustncg>`
        - 'trust-exact' :ref:`(see here) <optimize.minimize-trustexact>`
        - 'trust-krylov' :ref:`(see here) <optimize.minimize-trustkrylov>`
        - custom - a callable object (added in version 0.14.0),
          see below for description.

---

Usamos el método - 'BFGS' porque calcula el Jacobiano y Heisseano directo y es ideal para optimizar cuadráticas:

> Comments on the metohd for minimize:  
The BFGS method does not require to provide explicity the Jacobian or Hessian. There are other mothods, but I use this one for my optmisers in trading. It computes numerically the Jacobian and Hessian: ideal for quadratic optimisations.  

---


Voy a crear la función tonta de prueba (la que tenemos que pasar), esta función la usaré de test para ver su funciona bien el método `minimize` la nueva librería. Realizaré test con vectores unitarios y ceros para que me dé como resultado las mismas raices de entada.

* $x = [0, 1]$
* roots = $[2, -1]$
* coeff = $\begin{bmatrix}
              1, \\
              1
            \end{bmatrix}$

for n in range(len(x)):
>$f $+=$ \text{coeff}[n]*( x[n] - \text{roots}[n])^2$
>* $1* (0 - 2)^2$ +
>* $1* (1 - (-1))^2$

In [188]:
# reset all variables
%reset -f

import importlib
import stream_classes
import stream_functions
importlib.reload(stream_functions)
importlib.reload(stream_classes)
import scipy
import importlib
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
from scipy.stats import skew, kurtosis, chi2, linregress
from scipy.optimize import minimize

In [189]:
# define the function to minimize
def cost_function(x, roots, coeffs):
    """
    Parameters:
        - x :
        - roots :
        - coeff : 
    """
    f = 0
    for n in range(len(x)):
        f += coeffs[n] * (x[n] - roots[n])**2
    return f

In [190]:
# pongo los puntos para que los lea como enteros vector [2, 1]
roots = np.array([2., -1.])
print(roots)
print("longitud array :" + str(len(roots)))

[ 2. -1.]
longitud array :2


In [191]:
# Devuelve matriz de unos dado el tamaño [matrix 2*1]
coeffs = np.ones([len(roots), 1])  
coeffs

array([[1.],
       [1.]])

In [192]:
# inicializa optimización matriz 2*1
x = np.zeros([len(roots), 1]) 
x

array([[0.],
       [0.]])

In [193]:
optimal_result = minimize(fun=cost_function, 
                          x0=x, 
                          args=(roots, coeffs), 
                          method='BFGS')
# objetos de resultados
print(optimal_result)
print('----------------')
print('originals roots:')
print(roots)

      fun: 9.029827044970221e-16
 hess_inv: array([[0.59999999, 0.2       ],
       [0.2       , 0.90000001]])
      jac: array([-2.16583089e-08, -3.27993206e-08])
  message: 'Optimization terminated successfully.'
     nfev: 9
      nit: 2
     njev: 3
   status: 0
  success: True
        x: array([ 1.99999998, -1.00000002])
----------------
originals roots:
[ 2. -1.]


---
* `la función` es 0 : fun: 9.029827044970221e-16
* tuvo `2 iteraciones` : nit: 2
* la primera es 2 : 1.99999998
* la segunda es -1 : -1.00000002

La salida x es igual a las raíces por construcción de la función al multiplicar por uno y ceros. Así yo se que funciona.

Parece que funciona, ahora en lugar de estar cambiando cosas a mano voy a generar raíces random

In [160]:
# vector de 5 del (-20 al 19)
roots = np.random.randint(low=-20,
                          high=20,
                          size=5)
coeffs = np.ones([len(roots), 1]) 
x = np.zeros([len(roots), 1]) 

roots 

array([-13,  17,  -6,  17,  -2])

In [161]:
optimal_result = minimize(fun=cost_function, 
                          x0=x, 
                          args=(roots, coeffs), 
                          method='BFGS')
# objetos de resultados
print(optimal_result)
print('----------------')
print('originals roots:')
print(roots)

      fun: 1.5726891209054103e-12
 hess_inv: array([[ 0.89262774,  0.1404077 , -0.04955606,  0.1404077 , -0.0165192 ],
       [ 0.1404077 ,  0.81639279,  0.06480307, -0.18360721,  0.02160169],
       [-0.04955606,  0.06480307,  0.97712814,  0.06480307, -0.00762419],
       [ 0.1404077 , -0.18360721,  0.06480307,  0.81639279,  0.02160169],
       [-0.0165192 ,  0.02160169, -0.00762419,  0.02160169,  0.99745852]])
      jac: array([ 1.20219847e-06, -1.49665103e-06,  5.42018856e-07, -1.49665103e-06,
        1.98336363e-07])
  message: 'Optimization terminated successfully.'
     nfev: 42
      nit: 4
     njev: 7
   status: 0
  success: True
        x: array([-12.99999941,  16.99999924,  -5.99999974,  16.99999924,
        -1.99999991])
----------------
originals roots:
[-13  17  -6  17  -2]


In [162]:
# puedo acceder al resultado de forma independiente
optimal_result.x

array([-12.99999941,  16.99999924,  -5.99999974,  16.99999924,
        -1.99999991])

In [163]:
# puedo acceder a la jacobiana
optimal_result.jac

array([ 1.20219847e-06, -1.49665103e-06,  5.42018856e-07, -1.49665103e-06,
        1.98336363e-07])

Lo que estoy haciendo es un test unitario, estoy tomando una unidad del código, es este caso el algortimo minimize y conociendo el resultado original, porque así me estoy construyendo mis raíces, conociendo el resultado de cuál es la fórmula que necesitamos cuál es la función que es cuadrática que tiene 


entonces yo sé que estas son las `soluciones ([  8   7 -16  16 -20])`  
y estas son las soluciones numércias  `x: array([8.00000001, 7., -16.00000001,  16.00000001, -20.00000002])`,  
entonces por el momento estoy satisfechode cómo funciona el minimize.

---

**Método nuevo para computar numéricamente:** 

**compute_numerical()**

In [111]:
# método para clase hedge_maneger()

def compute_numerical(self, bool_print=False):
    x = np.zeros([len(self.betas), 1])           # núm de betas equivalente al num de raíces
    args = (self.delta,                          # el delta del portafolios
            self.beta_usd,                       # beta en dólares del portfolio
            self.betas)                          # vector con betas de los activos de cobertura
    optimal_result = minimize(fum=stream_functions.cost_function_beta_delta,  # la crearé después
                              x0=x,
                              args=args,
                              method='BFGS')
    self.optimal_hedge = optimal_result.x.reshape([len(self.betas), 1]) # lo deja como una matriz sin cambiar datos.
    self.dataframe['delta'] = self.optimal_hedge                        # 
    self.dataframe['beta_usd'] = self.betas * self.optimal_hedge        # estoy multiplicando matrices (vectores columna) 
    self.hedge_delta = np.sum(self.dataframe['delta'])
    self.hedge_delta_usd = np.sum(self.dataframe['beta_usd'])
    if bool_print:
        self.print_output('Numerical solution with optimize.minimize')

La función que me cree para la clase es **`cost_function_beta_delta()`**

Yo quiero algo que sea beta neutral y delta neutral. Entonces yo quiero esto de aquí 
* delta-neutral $S_0+\sum S_n=0$:
> Este es el delta del portafolios $S_O$  
> Este es mi vector x --> $S_1, ..., S_N$ que es la sumatoria $\sum S_n$
* beta-neutral $\beta_0 S_0+\sum \beta_n S_n=0$
> Este es el beta en dólares del postafolio  $\beta_0 S_0$.  
> El producto punto del `vector de betas` traspuesto por el `vector x` $\beta_n S_n$

![](img/09.png)

Cómo traducimos esto es python?

In [125]:
def cost_function_beta_delta(x, delta, beta_usd, betas):
    """ Tomo las dos funciones  [f_delta, f_beta] al cuadrado porque yo lo que 
    quiero es que las dos sean igual a cero en mi función de coste y quiero 
    minimizar dicho coste, el mímino será cuando  el primer cuadrado sea 
    cero y el segundo cuadrado sea cero.
    """
    f_delta = (sum(x).items() +                          # sumatoria del vector x .items() es para que tome el escalar
               delta)**2                                 # delta del portafolios
    f_beta = (np.transpose(betas).dot(x).items() +       # traspuesta v. betas por vector x. Me da matriz 1*
              beta_usd)**2                    
    f = f_delta + f_beta
    return f

Añado la función a **`stream_functions.py`**

In [226]:
import importlib
import stream_classes
import stream_functions
importlib.reload(stream_functions)
importlib.reload(stream_classes)

ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['SAN.MC', 'REP.MC']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
print('\nCOMPUTE EXACT:')
hedge.compute(bool_print=True)
print('\nCOMPUTE NUMERICAL:')
hedge.compute_numerical(bool_print=True)
optimal_hedge = hedge.dataframe

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = SAN.MC vs ^STOXX50E is 1.3739
Beta for hedge[ 1] = REP.MC vs ^STOXX50E is 1.1593

COMPUTE EXACT:
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.874000000000002
--------------------
Betas for the hedge:
--------------------
[[1.3739]
 [1.1593]]
--------------
Optimal hedge:
--------------
[[-5.96924511]
 [-4.03075489]]

COMPUTE NUMERICAL:
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.000000116987717
Hedge beta:-12.874000040613176
--------------------
Betas for the hedge:
--------------------
[[1.3739]
 [1.1593]]
--------------
Optimal hedge:
-------------

---

**RESULTADOS**

El resultado es exáctamente el mismo, osea que estoy satisfecho con el nuevo método.  
La diferencia es que antes sóLo podía añadir dos valores para cubrirme, ahora puedo con infinidad de valores:

In [227]:
ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['SAN.MC', '^FCHI', '^GDAXI']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = SAN.MC vs ^STOXX50E is 1.3739
Beta for hedge[ 1] = ^FCHI vs ^STOXX50E is 0.9747
Beta for hedge[ 2] = ^GDAXI vs ^STOXX50E is 0.9868


**CALCULAMOS CON TRES VALORES PARA CUBRIR BBVA**

In [228]:
print('\n########################## COMPUTE EXACT:')
hedge.compute(bool_print=True)
print('\n########################## COMPUTE NUMERICAL:')
hedge.compute_numerical(bool_print=True)
optimal_hedge = hedge.dataframe


########################## COMPUTE EXACT:
-------

########################## COMPUTE NUMERICAL:
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-9.99999999638392
Hedge beta:-12.874000018665479
--------------------
Betas for the hedge:
--------------------
[[1.3739]
 [0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[-7.79665114]
 [-0.9986475 ]
 [-1.20470135]]


---

**CUANDO TENGO 3 ACTIVOS ESTOY EN $R^3$**

![](img/10.png)

* El hiperplano $L_{delta}$ es un plano de dimensión 2
* El hiperplano $L_{beta}$ es un plano de dimensión 2

Por lo tanto la solución en una recta $P_{ideal}$ es N-2 = 1 .  
Esto nos dice que tengo una infinidad de soluciones. Si a mi algoritmo le cambio la inicialización y en lugar de comenzar en 0 como habíamos hecho en el **test**, le hago inicializar en otros valores, el algoritmo va a encontrar otra solución porque tenemos infinitas soluciones que están en una recta.

En el ejemplo anterior voy a cubrir con 
* Santander : -7MM
* Futuros cac-40 : -1MM
* Futuros Dax : -1.2MM
> este solución me gusta porque los futuros son muy liquidos y son venta inmediata mientras espero colocar el santander.

In [229]:
ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['SAN.MC']
delta = 10


# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
print('\n################################ COMPUTE NUMERICAL:')
hedge.compute_numerical(bool_print=True)
optimal_hedge = hedge.dataframe

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = SAN.MC vs ^STOXX50E is 1.3739

################################ COMPUTE NUMERICAL:
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-9.58843920611317
Hedge beta:-13.173556625278884
--------------------
Betas for the hedge:
--------------------
[[1.3739]]
--------------
Optimal hedge:
--------------
[[-9.58843921]]


---
Si fuera **delta-neutral** tendría que ser 10MM.
Si fuera **beta-neutral** tendría que ser 12.874MM

Esta calculando algo diferente. 
* El `Beta for BBVA.MC vs ^STOXX50E` es 1.2874
* El beta de la cobertura `Beta SAN.MC vs ^STOXX50E`es más grande : 1.3739

Entonces necesito menos de 10MM para cubrir, y es lo que me está diciendo el resultado. Con `-9.58843921` tengo suficiente para cubrir.

**PORQUÉ ESTOY CONTENTO**  
1. Reproduce bien la parte exacta. Este es mi test unitario.
2. Tal como lo tengo construído ya no me estoy limitando nada más a dos activos, puedo poner tres o más, o uno.

**Preguntas**  
¿Puede ocurrir que tengamos una función de coste con multiples mínimos locales?  
¿Qué podríamos hacer en ese caso?
> Depende de mi inicialización. 
> En el método `compute_numerical` mi inicialización es alrededor de 0. Si yo pusiera puros unos, o un millon, voy a encontrar una solución diferente. Cómo lo podemos hacer, hay muchas maneras. Ahora vamos a ver una de ellas que se llama `regularización`.

¿La inicialización te permitiría, ya que tienes tu portafolio de inversión y buscando con un activo determinado, la cobertura óptima utilizando lo que ya tienes en tu portafolios?
> Es diferente. Lo que tu dices estás suponiendo que tengo una inicialización con el activo Bbva, en tu caso estás suponiendo que no tienes dos activos del bbva, tienes tres activos de inversión y que bbva es 10MM. Pero eso es una pregunta financiera en el sentido de ¿quieres modificar tu exposición en Bbva o no?
>
> Mi pregunta es diferente, tengo 10MM del Bbva, no me los toques, cúbrelo con otra cosa.
>
> Tu pregunta está sugiriendo, tengo 10MM, te lanzo el DAX y el CAC-40 pero se vale modificar un poco el BBVA de tal menera que el riesgo se minimice. Y esto `es más desde el punto de vista de optimización de portafolio y no desde cobertura`.

---
Cuando yo calculaba esto no me gustaba:

In [230]:
ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['^FCHI', '^GDAXI']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(bool_print=True)
optimal_hedge = hedge.dataframe

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = ^FCHI vs ^STOXX50E is 0.9747
Beta for hedge[ 1] = ^GDAXI vs ^STOXX50E is 0.9868

>>>>>COMPUTE EXACT:<<<<<<<
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.873999999999995
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[ 248.42975207]
 [-258.42975207]]

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.000001360260256
Hedge beta:-12.874001441685465
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Opt

---

Vemos que tenemos:
* Delta: 10
* Beta USD: 12.874

Con soluciones:
* 248.42976028
* -258.42976164

Y como no me gusta esta respuesta, me gustaría sacrificar un poco la preción del delta y el beta, pero con tal de que estas soluciones esén del mismo lado. En otras palabras, si lo vemos desde el punto de vista deun fit numérico de algoritmo, lo que estamos haciendo aquí es un [overfiting](https://www.ibm.com/cloud/learn/overfitting) porque estoy siendo tan preciso que estoy siendo demasiado brutal con los pesos; me gustaría tener pesos pequeños. 

---

Entonces vamos a enfocarnos en:   
DATA SCIENCE AND MACHINE LEARNING. En concreto es regrersión logística y overfitting

Tengo una función $C$ que dependen de unos parámetros $\theta$ que es la variable : $C(\theta)$  
Voy a calcular en gradiente en $x_0$:
>* el gradiente me va a decir cuál es la dirección por la cual el vector varía lo más rápido posible.
>* por lo tanto si me muevo en la dirección "- gradiente" $- \Delta C(\theta)$; significa que me muevo en la dirección como un mínimo, en lo que crece más rápido.

Voy a moverme en el espacio del parámetro (**learning rate $\alpha$**) y voy bajando
> $\theta(k+1)=\theta(k) - \alpha \Delta C(\theta(K))$  
> depende de donde inicie la convergencia será más rápida o más lenta. Pero dependiendo de cómo inicializo puedo ir a un mínimo local diferente.
> Este es uno de los problemas d elas redes neuronales, por eso hay que correrlas varias veces, pra que si caigo en un minimo local buscar un mínimo local que sea menor que los mínimos locales anteriores.

![](img/12.png)

![](img/11.png)

Entonces, **¿qué hacen las redes neuronales?**  
> Tienen una función de costo $Cost(\theta)$ que es posotiva

$$
Cost(\theta) = - \frac{1}{M} \sum_{m=1}^{M} [y^m log h(x^{(m)} \theta) - (1-y^m)log(1-h(x^{(m)}) \theta)]
$$

![](img/16.png)

Y lo que queremos es acercarnos lo más posible a la función dada.
> * si tenemos demasiados parámetros tenemos un overfitting, que es perfecta cuando estamos entrenando al algorithmo pero a la mejor no funciona.
> 
> ![](img/13.png)
> 
> porque estamo clasificando un 100% de precisión.  
Pero quizás la siguiente clasifica mejor:
>
> ![](img/14.png)

Entonces lo que haremos es que si esto es muy grande:
* 248.42976028
* -258.42976164

Haremos lo que se llama una **$\color{blue}{regularización}$**:

$$
Cost(\theta) = - \frac{1}{M} \sum_{m=1}^{M} [y^m log h(x^{(m)} \theta) - (1-y^m)log(1-h(x^{(m)}) \theta)] \color{blue}{ + \frac{\lambda}{2M} \sum_{n=1}^{N} \theta_{n}^{2}}
$$

Al poner la penalización cuadrática lo que hacemos es, en lugar de tener un fitting perfecto, lo sacrificamos pero los pesos (los thetas $\theta$) en lugar de ser tan grandes, vamos a sacrificar eso.

Como es cuadrático, la deribada es lineal:  
$$
\Delta_{\theta}Cost= \frac{1}{M}(h(X \theta) - Y)^TX \color{blue}{+ \frac{\lambda}{M}J\theta}
$$

![](img/15.png)

**¿Cómo voy a penalizar?**

Voy a tomar la suma de los cuadrados.

In [174]:
# solución optima
hedge.optimal_hedge

array([[ 248.42976028],
       [-258.42976164]])

In [175]:
# solución optima al cuadrado
(hedge.optimal_hedge)**2

array([[61717.34579248],
       [66785.94170113]])

In [177]:
# suma de soluciones optimas al cuadrado
sum((hedge.optimal_hedge)**2).item()

128503.28749360351

Este ejemplo sirve para definir a f_penalty:

In [183]:
# stream_function.py 

def cost_function_beta_delta(x, delta, beta_usd, betas):
    """ Tomo las dos funciones  [f_delta, f_beta] al cuadrado porque yo lo que 
    quiero es que las dos sean igual a cero en mi función de coste y quiero 
    minimizar dicho coste, el mímino será cuando  el primer cuadrado sea 
    cero y el segundo cuadrado sea cero.
    """
    f_delta = (sum(x).items() +                     # sumatoria del vector x .items() es para que tome el escalar
               delta)**2                            # delta del portafolios
    f_beta = (np.transpose(betas).dot(x).items() +  # traspuesta v. betas por vector x. Me da matriz 1*
              beta_usd)**2
    # pruebas con incremento "epsilon" 10^-4, 10^-3, 10^-2
    # hasta dar con los Optimal hedge: que yo quiero
    f_penalty = 10**-2 * sum(x**2).item()
    
    # incremento mi 
    f = f_delta + f_beta + f_penalty
    return f

In [244]:
# reset all variables
%reset -f

import importlib
import stream_classes
import stream_functions
importlib.reload(stream_functions)
importlib.reload(stream_classes)


ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['^FCHI', '^GDAXI']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(bool_print=True)

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = ^FCHI vs ^STOXX50E is 0.9747
Beta for hedge[ 1] = ^GDAXI vs ^STOXX50E is 0.9868

>>>>>COMPUTE EXACT:<<<<<<<
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.873999999999995
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[ 248.42975207]
 [-258.42975207]]

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-11.497853480295074
Hedge beta:-11.288129269664594
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Opt

---

`Optimal hedge: [[-4.7894665 ][-6.70838698]]` se ha reducido mucho

Podemos ver como el epsilon ya no es perfecto. Paso a tener un delta [10 - 11.49] = -1.49.
* Antes teníamos delta`Hedge delta: -10.000001360260256` 
* Ahora tenemos delta `Hedge delta: -11.497853480295074`

De beta paso a tener [12.874 - 11.288129269664594]=1.58:
* Beta USD: 12.874
* Hedge beta: -11.288129269664594

No es la mejor solución pero es una mejor solución de lo que teníamos.



Como el beta está por encima del casco convexo, osea del intervalo 
* Beta for BBVA.MC vs ^STOXX50E is 1.2874
* mínimo  Beta for hedge[ 0] = ^FCHI vs ^STOXX50E is 0.9747
* máximo  Beta for hedge[ 1] = ^GDAXI vs ^STOXX50E is 0.9868

Como el beta es más fuerte, necesito poner más delta para poder reducir el beta, pero está funcionando.

---
Voy agregar "epsilon" como argumento de entrada a mi función:

In [None]:
# stream_function.py 

def cost_function_beta_delta(x, delta, beta_usd, betas, epsilon=0):
    """ Tomo las dos funciones  [f_delta, f_beta] al cuadrado porque yo lo que 
    quiero es que las dos sean igual a cero en mi función de coste y quiero 
    minimizar dicho coste, el mímino será cuando  el primer cuadrado sea 
    cero y el segundo cuadrado sea cero.
    """
    f_delta = (sum(x).items() +                     # sumatoria del vector x .items() es para que tome el escalar
               delta)**2                            # delta del portafolios
    f_beta = (np.transpose(betas).dot(x).items() +  # traspuesta v. betas por vector x. Me da matriz 1*
              beta_usd)**2
    # pruebas con incremento "epsilon" 10^-4, 10^-3, 10^-2
    # hasta dar con los Optimal hedge: que yo quiero
    f_penalty = epsilon * sum(x**2).item()
    
    # incremento mi 
    f = f_delta + f_beta + f_penalty
    return f

Modifico el método de mi clase:

In [None]:
def compute_numerical(self, epsilon=0, bool_print=False):
    x = np.zeros([len(self.betas), 1])           # núm de betas equivalente al num de raíces
    args = (self.delta,                          # el delta del portafolios
            self.beta_usd,                       # beta del portfolio en dólares
            self.betas,                          # vector con betas de los activos de cobertura
            epsilon)                             # agrego argumento epsilon
    optimal_result = minimize(fun=stream_functions.cost_function_beta_delta,
                              x0=x, args=args, method='BFGS')
    self.optimal_hedge = optimal_result.x.reshape([len(self.betas), 1])
    self.dataframe['delta'] = self.optimal_hedge
    self.dataframe['beta_usd'] = self.betas * self.optimal_hedge
    self.hedge_delta = np.sum(self.dataframe['delta'])
    self.hedge_beta_usd = np.sum(self.dataframe['beta_usd'])
    if bool_print:
        self.print_output('Numerical solution with optimize.minimize')

In [249]:
# reset all variables
%reset -f

import importlib
import stream_classes
import stream_functions
importlib.reload(stream_functions)
importlib.reload(stream_classes)


ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['^FCHI', '^GDAXI']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(epsilon=0, bool_print=True)

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = ^FCHI vs ^STOXX50E is 0.9747
Beta for hedge[ 1] = ^GDAXI vs ^STOXX50E is 0.9868

>>>>>COMPUTE EXACT:<<<<<<<
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.873999999999995
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[ 248.42975207]
 [-258.42975207]]

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.000001360260256
Hedge beta:-12.874001441685465
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Opt

In [250]:
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(epsilon=10**-2, bool_print=True)


>>>>>COMPUTE EXACT:<<<<<<<
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.873999999999995
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[ 248.42975207]
 [-258.42975207]]

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-11.497853480295074
Hedge beta:-11.288129269664594
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[-4.7894665 ]
 [-6.70838698]]


In [251]:
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(epsilon=0.01, bool_print=True)


>>>>>COMPUTE EXACT:<<<<<<<
-------------------
Optimisation result Exact solution from linear algebra:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.0
Hedge beta:-12.873999999999995
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[ 248.42975207]
 [-258.42975207]]

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-11.497853480295074
Hedge beta:-11.288129269664594
--------------------
Betas for the hedge:
--------------------
[[0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[-4.7894665 ]
 [-6.70838698]]


In [252]:
ric = "BBVA.MC"
benchmark = "^STOXX50E"
hedge_rics = ['SAN.MC', '^FCHI', '^GDAXI']
delta = 10

# compute optimal hedge
hedge = stream_classes.hedge_maneger(ric, benchmark, hedge_rics, delta)
hedge.load_inputs(bool_print=True)
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(epsilon=0, bool_print=True)

---------------
Imput portfolio
---------------
Delta mnUSD for BBVA.MC is 10
Beta for BBVA.MC vs ^STOXX50E is 1.2874
Beta mnUSD for BBVA.MC vs ^STOXX50E is 12.874
---------------
Input hedges:
-------------
Beta for hedge[ 0] = SAN.MC vs ^STOXX50E is 1.3739
Beta for hedge[ 1] = ^FCHI vs ^STOXX50E is 0.9747
Beta for hedge[ 2] = ^GDAXI vs ^STOXX50E is 0.9868

>>>>>COMPUTE EXACT:<<<<<<<
-------

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-9.99999999638392
Hedge beta:-12.874000018665479
--------------------
Betas for the hedge:
--------------------
[[1.3739]
 [0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[-7.79665114]
 [-0.9986475 ]
 [-1.20470135]]


In [262]:
print('\n>>>>>COMPUTE EXACT:<<<<<<<')
hedge.compute(bool_print=True)
print('\n>>>>COMPUTE NUMERICAL:<<<<<<')
hedge.compute_numerical(epsilon=0.01, bool_print=True)


>>>>>COMPUTE EXACT:<<<<<<<
-------

>>>>COMPUTE NUMERICAL:<<<<<<
-------------------
Optimisation result Numerical solution with optimize.minimize:
-------------------
Delta: 10
Beta USD: 12.874

Hedge delta:-10.125163918325054
Hedge beta:-12.731065713963945
--------------------
Betas for the hedge:
--------------------
[[1.3739]
 [0.9747]
 [0.9868]]
--------------
Optimal hedge:
--------------
[[-7.12136545]
 [-1.41542217]
 [-1.58837629]]


---
Esta solución no es mala porque los futuros son más líquidos y los vendo rápido mientras coloco los 7.2MM