# Indice:

[0.- Introduccion](#0--introduccion)

[1.- Importar librerias necesarias](#1--importar-librerias-necesarias)

   - [1.1.- Importar datasets de archivos del repositorio](#11--importar-datasets-de-archivos-del-repositorio)

[2.- Principios del EDA (Exploratory Data Analysis)](#2--principios-del-eda-exploratory-data-analysis)

   - [2.1.- Contexto](#21--contexto)

   - [2.2.- Hipotesis](#22--hipotesis)

[3.- Cotizacion y rentabilidad de conjunto de 35 empresas y 10 indices](#3--cotizacion-y-rentabilidad-de-conjunto-de-35-empresas-y-10-indices)

   - [3.1.- Cotizaciones](#31--cotizaciones)

     - [3.1.1.- Cotizaciones de las 35 empresas](#311--cotizaciones-de-las-35-empresas)

     - [3.1.2.- Cotizaciones de los 10 indices bursatiles](#312--cotizaciones-de-los-10-indices-bursatiles)

   - [3.2.- Rentabilidades](#32--rentabilidades)

     - [3.2.1.- Rentabilidad de 35 empresas](#321--rentabilidad-de-35-empresas)

     - [3.2.2.- Rentabilidad de 10 indices](#322--rentabilidad-de-10-indices)

[4.- Seleccion de muestra de empresas e indices para una cartera de 10 valores](#4--seleccion-de-muestra-de-empresas-e-indices-para-una-cartera-de-10-valores)

[5.- Cartera optimizada con Sharpe](#5--cartera-optimizada-con-sharpe)

   - [5.1.- Portfolio con cartera optimizada sin modelos de machine learning (Modelo 1)](#51--portfolio-con-cartera-optimizada-sin-modelos-de-machine-learning-modelo-1)
      - [Resultados finales modelo 1](#resultados-finales-modelo-1)

   - [5.2.- Portfolio con cartera optimizada con simulacion de Monte Carlo (Modelo 2)](#52--portfolio-con-cartera-optimizada-con-simulacion-de-monte-carlo-modelo-2)
      - [Resultados finales modelo 2](#resultados-finales-modelo-2)

   - [5.3.- Modelo Supervisado ML con Gradient Boosting (Modelo 3)](#53--modelo-supervisado-ml-con-gradient-boosting-modelo-3)
      - [Resultados finales modelo 3](#resultados-finales-modelo-3)
   
   - [5.4.- Modelo Supervisado ML con XGBoost (Modelo 4)](#54--modelo-supervisado-ml-con-xgboost-modelo-4)
      - [Resultados finales modelo 4](#resultados-finales-modelo-4)

   - [5.5.- Modelo No Supervisado PCA (Principal Component Analysis) (Modelo 5)](#55--modelo-no-supervisado-pca-principal-component-analysis-modelo-5)
      - [Resultados finales modelo 5](#resultados-finales-modelo-5)

[6.- Comparacion de resultados finales de los 5 modelos](#6--comparacion-de-resultados-finales-de-los-5-modelos)

   - [6.1.- Comparación de 4 indicadores (MSE, RMSE, MAE y R2) en modelos 3, 4 y 5](#61--comparacion-de-4-indicadores-mse-rmse-mae-y-r2-en-modelos-3-4-y-5)

   - [6.2.- Comparacion de retorno, volatilidad y sharpe de las 5 carteras](#62--comparacion-de-retorno-volatilidad-y-sharpe-de-las-5-carteras)

   - [6.3.- Comparacion de peso de carteras](#63--comparacion-de-peso-de-carteras)

# 0.- Introduccion

El análisis de datos financieros es una herramienta crucial en el mundo de las inversiones. Proporciona información valiosa sobre el comportamiento del mercado y ayuda a los inversores a tomar decisiones informadas. 

Este Análisis Exploratorio de Datos (EDA) se centra en las 35 empresas que conforman el IBEX 35 y 10 índices bursátiles globales. El objetivo principal es optimizar carteras de inversión mediante diversas técnicas y modelos, evaluando su rendimiento en términos de retorno, volatilidad y ratio Sharpe.

De entre las 35 empresas y 10 indices, se tomará 5 empresas y 5 indices para desarrollar carteras optimizadas.

# 1.- Importar librerias necesarias

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import yfinance as yf

import plotly as pl
from plotly.offline import iplot
import plotly.graph_objs as go
import plotly.express as px

from scipy import stats
from scipy.stats import skew, kurtosis

import warnings
warnings.filterwarnings('ignore')

## 1.1.- Importar datasets de archivos del repositorio

Aquí vamos a realizar la lectura (pd.read_csv) de los datasets de las 35 empresas.

In [2]:
#1 Acciona
ANA_dataset = pd.read_csv('../data/ANA_dataset.csv')
#2 Acciona Energías
ANE_dataset = pd.read_csv('../data/ANE_dataset.csv')
#3 ACS
ACS_dataset = pd.read_csv('../data/ACS_dataset.csv')
#4 Acerinox
ACX_dataset = pd.read_csv('../data/ACX_dataset.csv')
#5 Aena
AENA_dataset = pd.read_csv('../data/AENA_dataset.csv')
#6 Amadeus
AMS_dataset = pd.read_csv('../data/AMS_dataset.csv')
#7 ArcelorMittal
MTS_dataset = pd.read_csv('../data/MTS_dataset.csv')
#8 Banco Sabadell
SAB_dataset = pd.read_csv('../data/SAB_dataset.csv')
#9 Banco Santander
SAN_dataset = pd.read_csv('../data/SAN_dataset.csv')
#10 Bankinter
BKT_dataset = pd.read_csv('../data/BKT_dataset.csv')
#11 BBVA
BBVA_dataset = pd.read_csv('../data/BBVA_dataset.csv')
#12 CaixaBank
CABK_dataset = pd.read_csv('../data/CABK_dataset.csv')
#13 Cellnex
CLNX_dataset = pd.read_csv('../data/CLNX_dataset.csv')
#14 Colonial
COL_dataset = pd.read_csv('../data/COL_dataset.csv')
#15 Enagás
ENG_dataset = pd.read_csv('../data/ENG_dataset.csv')
#16 Endesa	
ELE_dataset = pd.read_csv('../data/ELE_dataset.csv')
#17 Ferrovial
FER_dataset = pd.read_csv('../data/FER_dataset.csv')
#18 Fluidra
FDR_dataset = pd.read_csv('../data/FDR_dataset.csv')
#19 Grifols
GRF_dataset = pd.read_csv('../data/GRF_dataset.csv')
#20 IAG	
IAG_dataset = pd.read_csv('../data/IAG_dataset.csv')
#21 Iberdrola
IBE_dataset = pd.read_csv('../data/IBE_dataset.csv')
#22 Indra
IDR_dataset = pd.read_csv('../data/IDR_dataset.csv')
#23 Inditex
ITX_dataset = pd.read_csv('../data/ITX_dataset.csv')
#24 Logista
LOG_dataset = pd.read_csv('../data/LOG_dataset.csv')
#25 Mapfre
MAP_dataset = pd.read_csv('../data/MAP_dataset.csv')
#26 Meliá
MEL_dataset = pd.read_csv('../data/MEL_dataset.csv')
#27 Merlin Properties
MRL_dataset = pd.read_csv('../data/MRL_dataset.csv')
#28 Naturgy
NTGY_dataset = pd.read_csv('../data/NTGY_dataset.csv')
#29 Redeia
RED_dataset = pd.read_csv('../data/RED_dataset.csv')
#30 Repsol
REP_dataset = pd.read_csv('../data/REP_dataset.csv')
#31 Rovi
ROVI_dataset = pd.read_csv('../data/ROVI_dataset.csv')
#32 Sacyr
SCYR_dataset = pd.read_csv('../data/SCYR_dataset.csv')
#33 Solaria
SLR_dataset = pd.read_csv('../data/SLR_dataset.csv')
#34 Telefónica
TEF_dataset = pd.read_csv('../data/TEF_dataset.csv')
#35 Unicaja
UNI_dataset = pd.read_csv('../data/UNI_dataset.csv')

In [3]:
#1 NIFTY50
NIFTY50_dataset = pd.read_csv('../data/NIFTY50_dataset.csv')
#2 ASX200
ASX200_dataset = pd.read_csv('../data/ASX200_dataset.csv')
#3 S&P 500
SP500_dataset = pd.read_csv('../data/SP500_dataset.csv')
#4 Dow Jones
DowJones_dataset = pd.read_csv('../data/DowJones_dataset.csv')
#5 Nasdaq
Nasdaq_dataset = pd.read_csv('../data/Nasdaq_dataset.csv')
#6 S&P/TSX Composite
SPCanada_dataset = pd.read_csv('../data/SPCanada_dataset.csv')
#7 DAX 40
DAX40_dataset = pd.read_csv('../data/DAX40_dataset.csv')
#8 FTSE 100
FTSE100_dataset = pd.read_csv('../data/FTSE100_dataset.csv')
#9 Eurostoxx 50
Euro50_dataset = pd.read_csv('../data/Euro50_dataset.csv')
#10 IBEX 35
IBEX35_dataset = pd.read_csv('../data/IBEX35_dataset.csv')

De entre el listado de las 35 empresas, vamos a ver las columnas de ACS como ejemplo:

In [4]:
ACS_dataset = pd.read_csv('../data/ACS_dataset.csv')
ACS_dataset

Unnamed: 0,Date,Open,High,Low,Close,Volume,Dividends,Stock Splits
0,2018-01-02,21.370347,21.370347,20.997152,21.118277,1416627,0.0,0.0
1,2018-01-03,21.213212,21.383439,21.173927,21.259043,454050,0.0,0.0
2,2018-01-04,21.396540,21.946512,21.376898,21.926870,1385247,0.0,0.0
3,2018-01-05,21.959604,22.254232,21.874489,22.221495,584567,0.0,0.0
4,2018-01-08,22.260779,22.326252,22.031624,22.031624,509748,0.0,0.0
...,...,...,...,...,...,...,...,...
1626,2024-05-13,38.860001,39.419998,38.740002,39.360001,403195,0.0,0.0
1627,2024-05-14,39.200001,39.580002,39.060001,39.439999,485238,0.0,0.0
1628,2024-05-15,39.419998,39.599998,38.740002,39.480000,736659,0.0,0.0
1629,2024-05-16,39.540001,39.820000,39.320000,39.759998,552398,0.0,0.0


De los 10 indices bursátiles, vamos a ver las columnas del indice del NIFTY50 como ejemplo:

In [5]:
NIFTY50_dataset = pd.read_csv('../data/NIFTY50_dataset.csv')
NIFTY50_dataset

Unnamed: 0,Date,Open,High,Low,Close,Volume,Dividends,Stock Splits
0,2018-01-02,10477.549805,10495.200195,10404.650391,10442.200195,153400,0.0,0.0
1,2018-01-03,10482.650391,10503.599609,10429.549805,10443.200195,167300,0.0,0.0
2,2018-01-04,10469.400391,10513.000000,10441.450195,10504.799805,174900,0.0,0.0
3,2018-01-05,10534.250000,10566.099609,10520.099609,10558.849609,180900,0.0,0.0
4,2018-01-08,10591.700195,10631.200195,10588.549805,10623.599609,169000,0.0,0.0
...,...,...,...,...,...,...,...,...
1564,2024-05-13,22027.949219,22131.650391,21821.050781,22104.050781,278200,0.0,0.0
1565,2024-05-14,22112.900391,22270.050781,22081.250000,22217.849609,230200,0.0,0.0
1566,2024-05-15,22255.599609,22297.550781,22151.750000,22200.550781,231900,0.0,0.0
1567,2024-05-16,22319.199219,22432.250000,22054.550781,22403.849609,368900,0.0,0.0


# 2.- Principios del EDA (Exploratory Data Analysis)

## 2.1.- Contexto

El IBEX 35 es el principal índice bursátil de la Bolsa de Madrid, que agrupa a las 35 empresas más líquidas y de mayor capitalización de mercado de España. Además, los índices bursátiles seleccionados para este análisis, como el S&P 500, NASDAQ, y NIFTY 50, representan los principales mercados financieros a nivel mundial. 

El análisis de estos datos permite una visión amplia del comportamiento del mercado tanto a nivel local como global.

## 2.2.- Hipotesis

1- **Diversificación**: ¿Puede una cartera diversificada reducir la volatilidad general y mejorar el ratio Sharpe?

2- **Eficiencia de Mercado**: ¿Cómo impacta la inclusión de valores de distintos mercados globales en la estabilidad y el rendimiento de la cartera?

3- **Modelos Supervisados**: ¿Pueden los modelos de machine learning supervisados (Gradient Boosting y XGBoost) identificar patrones complejos en los datos históricos de precios y mejorar la optimización de la cartera?

4- **Simulación de Monte Carlo**: ¿Generar múltiples combinaciones de pesos aleatorios puede proporcionar configuraciones óptimas sin necesidad de un modelo supervisado?

5- **Reducción de Dimensionalidad con PCA**: ¿La utilización de PCA para reducir la dimensionalidad del problema puede simplificar la optimización de la cartera sin perder información crucial?

# 3.- Cotizacion y rentabilidad de conjunto de 35 empresas y 10 indices

## 3.1.- Cotizaciones

En el apartado de cotizaciones, se va a proceder a separar los gráficos de cotizaciones de las 35 empresas y el de los 10 índices bursátiles. Esto es debido a que las empresas del IBEX 35 cotizan en euros y tienen a tener una valoración alrededor de máximo 100 euros. Mientras que la cotización de los índices bursátiles se muestra en puntos, y su cotización puede ser de miles de puntos.

En otras palabras, se realiza una separación de gráficos para diferenciar un gráfico por divisa en EUR, y diferenciar otro gráfico basado en puntos.

### 3.1.1.- Cotizaciones de las 35 empresas

In [6]:
files = [
    'ANA_dataset.csv', 'ANE_dataset.csv', 'ACS_dataset.csv', 'ACX_dataset.csv', 'AENA_dataset.csv',
    'AMS_dataset.csv', 'MTS_dataset.csv', 'SAB_dataset.csv', 'SAN_dataset.csv', 'BKT_dataset.csv',
    'BBVA_dataset.csv', 'CABK_dataset.csv', 'CLNX_dataset.csv', 'COL_dataset.csv', 'ENG_dataset.csv',
    'ELE_dataset.csv', 'FER_dataset.csv', 'FDR_dataset.csv', 'GRF_dataset.csv', 'IAG_dataset.csv',
    'IBE_dataset.csv', 'IDR_dataset.csv', 'ITX_dataset.csv', 'LOG_dataset.csv', 'MAP_dataset.csv',
    'MEL_dataset.csv', 'MRL_dataset.csv', 'NTGY_dataset.csv', 'RED_dataset.csv', 'REP_dataset.csv',
    'ROVI_dataset.csv', 'SCYR_dataset.csv', 'SLR_dataset.csv', 'TEF_dataset.csv', 'UNI_dataset.csv'
]

In [7]:
company_names = [
    'ANA', 'ANE', 'ACS', 'ACX', 'AENA', 'AMS', 'MTS', 'SAB', 'SAN', 'BKT', 
    'BBVA', 'CABK', 'CLNX', 'COL', 'ENG', 'ELE', 'FER', 'FDR', 'GRF', 'IAG', 
    'IBE', 'IDR', 'ITX', 'LOG', 'MAP', 'MEL', 'MRL', 'NTGY', 'RED', 'REP', 
    'ROVI', 'SCYR', 'SLR', 'TEF', 'UNI'
]

In [8]:
dataframes = []
for file, name in zip(files, company_names):
    df = pd.read_csv(f'../data/{file}')
    df['Company'] = name
    dataframes.append(df)

In [9]:
all_data = pd.concat(dataframes, ignore_index=True)

In [10]:
all_data['Date'] = pd.to_datetime(all_data['Date'])

In [11]:
fig = px.line(
    all_data,
    x='Date',
    y='Close',
    color='Company',
    title='Precio de cierre (Close) en el período 01/01/2018 - 20/05/2024',
    labels={'Close': 'Precio de cierre (EUR)', 'Date': 'Fecha'}
)

fig.show()

### 3.1.2.- Cotizaciones de los 10 indices bursatiles

In [12]:
index_files = [
    'NIFTY50_dataset.csv', 'ASX200_dataset.csv', 'SP500_dataset.csv', 'DowJones_dataset.csv',
    'Nasdaq_dataset.csv', 'SPCanada_dataset.csv', 'DAX40_dataset.csv', 'FTSE100_dataset.csv',
    'Euro50_dataset.csv', 'IBEX35_dataset.csv'
]

In [13]:
index_names = [
    'NIFTY50', 'ASX200', 'SP500', 'DowJones', 'Nasdaq',
    'SPCanada', 'DAX40', 'FTSE100', 'Euro50', 'IBEX35'
]

In [14]:
index_dataframes = []
for file, name in zip(index_files, index_names):
    df = pd.read_csv(f'../data/{file}')
    df['Index'] = name
    index_dataframes.append(df)

In [15]:
all_index_data = pd.concat(index_dataframes, ignore_index=True)

In [16]:
all_index_data['Date'] = pd.to_datetime(all_index_data['Date'])

In [17]:
fig = px.line(
    all_index_data,
    x='Date',
    y='Close',
    color='Index',
    title='Valor de cierre de los 10 índices entre 01/01/2018 y 20/05/2024',
    labels={'Close': 'Valor de cierre (puntos)', 'Date': 'Fechas'}
)

fig.show()

## 3.2.- Rentabilidades

### 3.2.1.- Rentabilidad de 35 empresas

In [18]:

returns = []

In [19]:
# Calcular la rentabilidad para cada empresa
for file, name in zip(files, company_names):
    df = pd.read_csv(f'../data/{file}')
    initial_close = df['Close'].iloc[0]
    final_close = df['Close'].iloc[-1]
    return_percentage = ((final_close - initial_close) / initial_close) * 100
    returns.append({'Company': name, 'Return': return_percentage})

In [20]:
returns_df = pd.DataFrame(returns)

In [21]:
returns_df = returns_df.sort_values(by='Return', ascending=False)

In [22]:
fig = px.bar(
    returns_df,
    x='Company',
    y='Return',
    color='Return',
    title='Rentabilidad de 35 empresas del IBEX 35 entre 01/01/2018 y 20/05/2024',
    labels={'Return': 'Rentabilidad (%)', 'Company': 'Empresas'},
    hover_data=['Return'],
    color_continuous_scale='Viridis'  
)

fig.update_layout(xaxis_tickangle=-45)

fig.show()

### 3.2.2.- Rentabilidad de 10 indices

In [23]:
returns = []

In [24]:
for file, name in zip(index_files, index_names):
    df = pd.read_csv(f'../data/{file}')
    initial_close = df['Close'].iloc[0]
    final_close = df['Close'].iloc[-1]
    return_percentage = ((final_close - initial_close) / initial_close) * 100
    returns.append({'Index': name, 'Return': return_percentage})

In [25]:
returns_df = pd.DataFrame(returns)

In [26]:
returns_df = returns_df.sort_values(by='Return', ascending=False)

In [27]:
fig = px.bar(
    returns_df,
    x='Index',
    y='Return',
    color='Return',
    title='Rentabilidad de 10 índices bursátiles entre 01/01/2018 y 20/05/2024',
    labels={'Return': 'Rentabilidad (%)', 'Index': 'Indices Bursátiles'},
    hover_data=['Return'],
    color_continuous_scale='Viridis'  
)

fig.update_layout(xaxis_tickangle=-45)

fig.show()

# 4.- Seleccion de muestra de empresas e indices para una cartera de 10 valores

Es aquí cuando vamos a escoger una empresa con el fin de analizarla de forma individual.

Para ello, vamos a crear una variable llamada dataset_empresa, la cual va a contener el dataset de la empresa que elijamos de entre las 35.

Como ejemplo, vamos a escoger el dataset de ACS. Generando una variable paralela mediante:

dataset_empresa = ACS_dataset

No obstante, podríamos cambiar el dataset al de otra empresa para realizar el analisis, cambiando en la siguiente celda las siglas de ACS por las de otra empresa. Como por ejemplo: ITX, quedando así como resultado: 

dataset_empresa = ITX_dataset

En definitiva, la cartera que se va a generar está compuesta por los siguientes valores:

In [28]:
#Empresas dentro de la cartera

#1 ACS
ACS_dataset
#2 Banco Santander
SAN_dataset
#3 BBVA
BBVA_dataset
#4 Repsol
REP_dataset
#5 Iberdrola
IBE_dataset

#Indices dentro de la cartera

#6 NIFTY50 (India)
NIFTY50_dataset
#7 ASX200 (Australia)
ASX200_dataset
#8 S&P 500 (EEUU)
SP500_dataset
#9 Nasdaq (EEUU)
Nasdaq_dataset
#10 S&P/TSX Composite (Canada)
SPCanada_dataset


Unnamed: 0,Date,Open,High,Low,Close,Volume,Dividends,Stock Splits
0,2018-01-02,16213.400391,16310.000000,16181.000000,16310.000000,157073400,0.0,0.0
1,2018-01-03,16336.700195,16386.300781,16322.599609,16371.599609,196865400,0.0,0.0
2,2018-01-04,16385.400391,16421.400391,16344.900391,16412.900391,195975200,0.0,0.0
3,2018-01-05,16362.599609,16370.299805,16309.900391,16349.400391,160313100,0.0,0.0
4,2018-01-08,16355.400391,16373.500000,16297.900391,16317.700195,166095400,0.0,0.0
...,...,...,...,...,...,...,...,...
1597,2024-05-13,22323.199219,22370.699219,22238.300781,22259.199219,207788000,0.0,0.0
1598,2024-05-14,22271.000000,22309.000000,22182.900391,22243.300781,224376000,0.0,0.0
1599,2024-05-15,22277.000000,22334.699219,22214.599609,22284.800781,221116900,0.0,0.0
1600,2024-05-16,22288.800781,22330.000000,22260.699219,22299.800781,191357800,0.0,0.0


# 5.- 5 modelos de optimizacion de carteras

## 5.1.- Portfolio con cartera optimizada sin modelos de machine learning (Modelo 1)

El Modelo 1 emplea métodos tradicionales de optimización de carteras sin utilizar machine learning. Se calculan los retornos y las volatilidades anualizadas de diez valores seleccionados y se construye una matriz de covarianza para analizar cómo se mueven conjuntamente los retornos de estos valores. 

Se define una función objetivo para minimizar la volatilidad de la cartera, respetando la restricción de que la suma de los pesos de los valores sea igual a 1.

Utilizando el método de optimización SLSQP (Sequential Least Squares Programming), se encuentran los pesos óptimos que minimizan la volatilidad y maximizan el ratio Sharpe de la cartera. Además, se calcula la frontera eficiente de Markowitz para identificar las carteras que ofrecen el máximo retorno para un nivel dado de riesgo. 

Los resultados incluyen la visualización de la cartera óptima, sus pesos, el retorno esperado, la volatilidad y el ratio Sharpe. 

Este enfoque se basa en la teoría moderna de carteras para optimizar la inversión sin la ayuda de técnicas de aprendizaje automático.

In [29]:
from scipy.optimize import minimize

Paso 1: Calcular retorno y volatilidad para cada valor

Calculamos el retorno anualizado y la volatilidad anualizada para cada valor. Utilizamos la media y la desviación estándar de los cambios porcentuales diarios (retornos diarios) multiplicados por 252 (el número aproximado de días de trading en un año).

In [30]:
def calcular_retorno_volatilidad(datos):
    retorno = datos['Close'].pct_change().mean() * 252
    volatilidad = datos['Close'].pct_change().std() * np.sqrt(252)
    return retorno, volatilidad

In [31]:
valores = {
    'ACS': ACS_dataset,
    'SAN': SAN_dataset,
    'BBVA': BBVA_dataset,
    'REP': REP_dataset,
    'IBE': IBE_dataset,
    'NIFTY50': NIFTY50_dataset,
    'ASX200': ASX200_dataset,
    'SP500': SP500_dataset,
    'Nasdaq': Nasdaq_dataset,
    'SPCanada': SPCanada_dataset
}

In [32]:
retorno_volatilidad = {}
for nombre, datos in valores.items():
    retorno_volatilidad[nombre] = calcular_retorno_volatilidad(datos)

Paso 2: Mostrar retorno y volatilidad de cada valor

Mostramos los retornos y las volatilidades calculadas para cada valor.

In [33]:
for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    print(f'{nombre}: Retorno={retorno}, Volatilidad={volatilidad}')

ACS: Retorno=0.1523721024945055, Volatilidad=0.33027813359082275
SAN: Retorno=0.08291557771568378, Volatilidad=0.3453637063280006
BBVA: Retorno=0.17127798798180807, Volatilidad=0.35552148147840634
REP: Retorno=0.11094421970794896, Volatilidad=0.3300932573774622
IBE: Retorno=0.16669281698517, Volatilidad=0.2132397213062408
NIFTY50: Retorno=0.13932316527144406, Volatilidad=0.1789617173764289
ASX200: Retorno=0.05304050788008818, Volatilidad=0.16250254349303883
SP500: Retorno=0.12690088320284273, Volatilidad=0.20239974483891737
Nasdaq: Retorno=0.16547900809319033, Volatilidad=0.24087009429471273
SPCanada: Retorno=0.06460765390358833, Volatilidad=0.1677521778699786


Paso 3: Crear matriz de covarianza

La matriz de covarianza mide cómo los retornos de los diferentes valores se mueven juntos. Esta matriz es crucial para calcular la volatilidad de la cartera.

In [34]:
matriz_covarianza = np.zeros((len(valores), len(valores)))
for i, (_, datos_i) in enumerate(valores.items()):
    for j, (_, datos_j) in enumerate(valores.items()):
        matriz_covarianza[i][j] = datos_i['Close'].pct_change().cov(datos_j['Close'].pct_change()) * 252

Paso 4: Función objetivo para minimizar la volatilidad de la cartera

Definimos una función objetivo que calcula la volatilidad de la cartera en función de los pesos asignados a cada valor. Esta función se utilizará en la optimización.

In [35]:
def objetivo(pesos):
    return np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos)))

Paso 5: Restricciones para los pesos de la cartera

Definimos una restricción que asegura que la suma de los pesos sea igual a 1, es decir, que se invierta el 100% del capital.

In [36]:
restricciones = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1})

Paso 6: Optimizar la cartera para maximizar el ratio Sharpe

Utilizamos el método de optimización SLSQP para encontrar los pesos que minimizan la volatilidad, respetando la restricción definida.

In [37]:
pesos_iniciales = np.ones(len(valores)) / len(valores)
resultados = minimize(objetivo, pesos_iniciales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones)

Paso 7: Calcular retorno, volatilidad y ratio Sharpe de la cartera óptima

Calculamos el retorno esperado, la volatilidad y el ratio Sharpe de la cartera utilizando los pesos óptimos encontrados.

In [38]:
retorno_cartera = np.dot([retorno for _, retorno in retorno_volatilidad.values()], resultados.x)
volatilidad_cartera = np.sqrt(np.dot(resultados.x.T, np.dot(matriz_covarianza, resultados.x)))
sharpe_cartera = retorno_cartera / volatilidad_cartera

Paso 8: Mostrar resultado

Mostramos el retorno, la volatilidad y el ratio Sharpe de la cartera óptima.

In [39]:
print(f'Retorno de la cartera: {retorno_cartera}')
print(f'Volatilidad de la cartera: {volatilidad_cartera}')
print(f'Ratio Sharpe de la cartera: {sharpe_cartera}')

Retorno de la cartera: 0.1873583102889755
Volatilidad de la cartera: 0.08647892092699173
Ratio Sharpe de la cartera: 2.1665199829117823


Paso 9: Mostrar pesos de la cartera óptima

Mostramos los pesos asignados a cada valor en la cartera óptima.

In [40]:
pesos_cartera_optima = resultados.x * 100
print('Pesos de la cartera óptima:')
for nombre, peso in zip(valores.keys(), pesos_cartera_optima):
    print(f'{nombre}: {peso:.2f}%')

Pesos de la cartera óptima:
ACS: 3.07%
SAN: 0.00%
BBVA: 0.00%
REP: 2.33%
IBE: 11.94%
NIFTY50: 26.41%
ASX200: 27.02%
SP500: 11.13%
Nasdaq: 0.00%
SPCanada: 18.10%


Paso 10: Calcular y mostrar la frontera eficiente de Markowitz

Calculamos la frontera eficiente, que representa las carteras que ofrecen el máximo retorno para un nivel dado de riesgo.

In [41]:
frontera_volatilidad = np.linspace(0, 0.3, 100)
frontera_retorno = []
for volatilidad in frontera_volatilidad:
    restricciones_frontera = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1},
                              {'type': 'eq', 'fun': lambda pesos: np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos))) - volatilidad})
    resultados_frontera = minimize(lambda pesos: -np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos), pesos_iniciales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones_frontera)
    retorno = np.dot([retorno for _, retorno in retorno_volatilidad.values()], resultados_frontera.x)
    frontera_retorno.append(retorno)

Paso 11: Graficar la frontera eficiente de Markowitz

Creamos un gráfico para mostrar la frontera eficiente y los puntos de los valores individuales

In [42]:
fig = go.Figure()

for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    fig.add_trace(go.Scatter(x=[volatilidad], y=[retorno], mode='markers', name=nombre))

fig.add_trace(go.Scatter(x=frontera_volatilidad, y=frontera_retorno, mode='lines', name='Frontera eficiente de Markowitz', line=dict(color='red', dash='dash')))

fig.update_layout(title='Frontera eficiente de Markowitz',
                  xaxis_title='Volatilidad',
                  yaxis_title='Retorno esperado')

fig.show()

Paso 12: Crear gráfico interactivo circular con los pesos de la cartera óptima

Creamos un gráfico circular para visualizar los pesos de la cartera óptima.

In [43]:
pesos_cartera_optima_pct = resultados.x * 100
pesos_labels = [f'{nombre}: {peso:.2f}%' for nombre, peso in zip(valores.keys(), pesos_cartera_optima_pct)]
fig_pie = go.Figure(data=[go.Pie(labels=pesos_labels, values=pesos_cartera_optima_pct, textinfo='label+percent', texttemplate='%{label}', marker=dict(colors=px.colors.qualitative.Bold))])
fig_pie.update_traces(hoverinfo='label+percent', textinfo='percent', textfont_size=20)
fig_pie.update_layout(title='Pesos de la cartera óptima', showlegend=False)
fig_pie.show()

### Resultados finales modelo 1:

In [44]:
print(f'Retorno de la cartera: {retorno_cartera}')
print(f'Volatilidad de la cartera: {volatilidad_cartera}')
print(f'Ratio Sharpe de la cartera: {sharpe_cartera}')


Retorno de la cartera: 0.1873583102889755
Volatilidad de la cartera: 0.08647892092699173
Ratio Sharpe de la cartera: 2.1665199829117823


In [45]:
retorno_cartera_modelo_1 = retorno_cartera
volatilidad_cartera_modelo_1 = volatilidad_cartera
sharpe_cartera_modelo_1 = sharpe_cartera

In [46]:
retorno_cartera_modelo_1

0.1873583102889755

In [47]:
volatilidad_cartera_modelo_1

0.08647892092699173

In [48]:
sharpe_cartera_modelo_1

2.1665199829117823

In [49]:
pesos_cartera_optima_modelo_1 = {nombre: peso for nombre, peso in zip(valores.keys(), pesos_cartera_optima)}
pesos_cartera_optima_modelo_1

{'ACS': 3.070834918591959,
 'SAN': 0.0,
 'BBVA': 0.0,
 'REP': 2.3312749621522952,
 'IBE': 11.93730150804186,
 'NIFTY50': 26.41374889570113,
 'ASX200': 27.015081482312446,
 'SP500': 11.134865143131869,
 'Nasdaq': 8.751544411031431e-16,
 'SPCanada': 18.09689309006845}

## 5.2.- Portfolio con cartera optimizada con simulacion de Monte Carlo (Modelo 2)

El Modelo 2 utiliza la simulación de Monte Carlo para optimizar una cartera de inversión. 

Primero, se calculan los retornos y las volatilidades anualizadas de diez valores seleccionados, junto con su matriz de covarianza. 

Luego, se generan 10,000 carteras aleatorias mediante combinaciones aleatorias de pesos para estos valores. Para cada cartera simulada, se calcula el retorno esperado, la volatilidad y el ratio Sharpe. Estas simulaciones permiten identificar las carteras con el mejor y peor ratio Sharpe. 

Posteriormente, se utiliza optimización numérica para calcular la frontera eficiente de Markowitz, que representa las carteras que maximizan el retorno para un nivel dado de riesgo. 

Finalmente, se visualizan los resultados, mostrando las carteras simuladas, la frontera eficiente, y destacando la cartera con el ratio Sharpe máximo. 

Este enfoque proporciona una visión amplia de las posibles combinaciones de carteras y ayuda a identificar la mejor estructura de inversión.



In [51]:
ACS_dataset = pd.read_csv('../data/ACS_dataset.csv')
SAN_dataset = pd.read_csv('../data/SAN_dataset.csv')
BBVA_dataset = pd.read_csv('../data/BBVA_dataset.csv')
REP_dataset = pd.read_csv('../data/REP_dataset.csv')
IBE_dataset = pd.read_csv('../data/IBE_dataset.csv')
NIFTY50_dataset = pd.read_csv('../data/NIFTY50_dataset.csv')
ASX200_dataset = pd.read_csv('../data/ASX200_dataset.csv')
SP500_dataset = pd.read_csv('../data/SP500_dataset.csv')
Nasdaq_dataset = pd.read_csv('../data/Nasdaq_dataset.csv')
SPCanada_dataset = pd.read_csv('../data/SPCanada_dataset.csv')

Paso 1: Calcular Retorno y Volatilidad para Cada Valor

En este paso, calculamos el retorno anualizado y la volatilidad anualizada para cada uno de los valores. Utilizamos la media y la desviación estándar de los cambios porcentuales diarios (retornos diarios) multiplicados por 252 (el número aproximado de días de trading en un año).

In [52]:
def calcular_retorno_volatilidad(datos):
    retorno = datos['Close'].pct_change().mean() * 252
    volatilidad = datos['Close'].pct_change().std() * np.sqrt(252)
    return retorno, volatilidad

In [53]:
# Datasets de los valores seleccionados
valores = {
    'ACS': ACS_dataset,
    'SAN': SAN_dataset,
    'BBVA': BBVA_dataset,
    'REP': REP_dataset,
    'IBE': IBE_dataset,
    'NIFTY50': NIFTY50_dataset,
    'ASX200': ASX200_dataset,
    'SP500': SP500_dataset,
    'Nasdaq': Nasdaq_dataset,
    'SPCanada': SPCanada_dataset
}

In [54]:
# Calcular retorno y volatilidad
retorno_volatilidad = {nombre: calcular_retorno_volatilidad(datos) for nombre, datos in valores.items()}

In [55]:
for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    print(f'{nombre}: Retorno={retorno}, Volatilidad={volatilidad}')

ACS: Retorno=0.1523721024945055, Volatilidad=0.33027813359082275
SAN: Retorno=0.08291557771568378, Volatilidad=0.3453637063280006
BBVA: Retorno=0.17127798798180807, Volatilidad=0.35552148147840634
REP: Retorno=0.11094421970794896, Volatilidad=0.3300932573774622
IBE: Retorno=0.16669281698517, Volatilidad=0.2132397213062408
NIFTY50: Retorno=0.13932316527144406, Volatilidad=0.1789617173764289
ASX200: Retorno=0.05304050788008818, Volatilidad=0.16250254349303883
SP500: Retorno=0.12690088320284273, Volatilidad=0.20239974483891737
Nasdaq: Retorno=0.16547900809319033, Volatilidad=0.24087009429471273
SPCanada: Retorno=0.06460765390358833, Volatilidad=0.1677521778699786


Paso 2: Crear la Matriz de Covarianza

La matriz de covarianza mide cómo se mueven juntos los retornos de los diferentes valores. Es crucial para calcular la volatilidad de la cartera.

In [56]:
matriz_covarianza = np.zeros((len(valores), len(valores)))
for i, (_, datos_i) in enumerate(valores.items()):
    for j, (_, datos_j) in enumerate(valores.items()):
        matriz_covarianza[i][j] = datos_i['Close'].pct_change().cov(datos_j['Close'].pct_change()) * 252

Paso 3: Simulación de Montecarlo (Podemos cambiar el número de 10000 simulaciones)

En este paso, generamos 10,000 carteras aleatorias (podemos cambiar este número). Para cada cartera, calculamos el retorno esperado, la volatilidad esperada y el ratio Sharpe.

In [57]:
num_simulaciones = 10000
resultados = np.zeros((num_simulaciones, len(valores) + 3))

In [58]:
for i in range(num_simulaciones):
    pesos = np.random.random(len(valores))
    pesos /= np.sum(pesos)
    
    retorno_esperado = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos)
    volatilidad_esperada = np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos)))
    ratio_sharpe = retorno_esperado / volatilidad_esperada
    
    resultados[i, :len(valores)] = pesos
    resultados[i, len(valores)] = retorno_esperado
    resultados[i, len(valores) + 1] = volatilidad_esperada
    resultados[i, len(valores) + 2] = ratio_sharpe

Paso 4: Encontrar la Cartera con el Ratio Sharpe Máximo y Mínimo

Aquí identificamos las carteras con el ratio Sharpe máximo y mínimo entre las simuladas. El ratio Sharpe mide el rendimiento ajustado por el riesgo.

In [59]:
# Encontrar la cartera con el ratio Sharpe máximo
indice_sharpe_max = np.argmax(resultados[:, len(valores) + 2])
pesos_sharpe_max = resultados[indice_sharpe_max, :len(valores)]
retorno_sharpe_max = resultados[indice_sharpe_max, len(valores)]
volatilidad_sharpe_max = resultados[indice_sharpe_max, len(valores) + 1]
sharpe_max = resultados[indice_sharpe_max, len(valores) + 2]

In [60]:
# Encontrar la cartera con el ratio Sharpe mínimo
indice_sharpe_min = np.argmin(resultados[:, len(valores) + 2])
pesos_sharpe_min = resultados[indice_sharpe_min, :len(valores)]
retorno_sharpe_min = resultados[indice_sharpe_min, len(valores)]
volatilidad_sharpe_min = resultados[indice_sharpe_min, len(valores) + 1]
sharpe_min = resultados[indice_sharpe_min, len(valores) + 2]

Paso 5: Mostrar Resultados

Se presentan los resultados, incluyendo los pesos de cada valor en las carteras óptimas (tanto la de Sharpe máximo como la de Sharpe mínimo), así como los respectivos retornos y volatilidades.

In [61]:
print(f'Ratio Sharpe Máximo: {sharpe_max}')
print(f'Retorno de la Cartera (Sharpe Máximo): {retorno_sharpe_max}')
print(f'Volatilidad de la Cartera (Sharpe Máximo): {volatilidad_sharpe_max}')
print('Pesos de la Cartera (Sharpe Máximo):')
for nombre, peso in zip(valores.keys(), pesos_sharpe_max):
    print(f'{nombre}: {peso:.2f}%')

Ratio Sharpe Máximo: 2.2009912122084856
Retorno de la Cartera (Sharpe Máximo): 0.2056690927175107
Volatilidad de la Cartera (Sharpe Máximo): 0.0934438500148037
Pesos de la Cartera (Sharpe Máximo):
ACS: 0.02%
SAN: 0.04%
BBVA: 0.00%
REP: 0.10%
IBE: 0.05%
NIFTY50: 0.28%
ASX200: 0.24%
SP500: 0.15%
Nasdaq: 0.02%
SPCanada: 0.09%


In [62]:
print(f'Ratio Sharpe Mínimo: {sharpe_min}')
print(f'Retorno de la Cartera (Sharpe Mínimo): {retorno_sharpe_min}')
print(f'Volatilidad de la Cartera (Sharpe Mínimo): {volatilidad_sharpe_min}')
print('Pesos de la Cartera (Sharpe Mínimo):')
for nombre, peso in zip(valores.keys(), pesos_sharpe_min):
    print(f'{nombre}: {peso:.2f}%')

Ratio Sharpe Mínimo: 1.339202596705762
Retorno de la Cartera (Sharpe Mínimo): 0.3141087438262102
Volatilidad de la Cartera (Sharpe Mínimo): 0.23454908510397957
Pesos de la Cartera (Sharpe Mínimo):
ACS: 0.21%
SAN: 0.19%
BBVA: 0.22%
REP: 0.20%
IBE: 0.03%
NIFTY50: 0.09%
ASX200: 0.01%
SP500: 0.03%
Nasdaq: 0.02%
SPCanada: 0.00%


Paso 6: Frontera Eficiente de Markowitz

Calculamos la frontera eficiente de Markowitz, que representa las carteras que ofrecen el máximo retorno para un nivel dado de riesgo.

In [63]:
frontera_volatilidad = np.linspace(0, 0.3, 100)
frontera_retorno = []
for volatilidad in frontera_volatilidad:
    restricciones_frontera = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1},
                              {'type': 'eq', 'fun': lambda pesos: np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos))) - volatilidad})
    resultados_frontera = minimize(lambda pesos: -np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos), pesos_iniciales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones_frontera)
    retorno = np.dot([retorno for _, retorno in retorno_volatilidad.values()], resultados_frontera.x)
    frontera_retorno.append(retorno)

Paso 7: Graficar la Frontera Eficiente y los Resultados

Graficamos los 10,000 portafolios generados, los puntos de los valores individuales y la frontera eficiente de Markowitz.

In [64]:
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=resultados[:, len(valores) + 1],
    y=resultados[:, len(valores)],
    mode='markers',
    marker=dict(color=resultados[:, len(valores) + 2], colorscale='Viridis', showscale=True, colorbar=dict(title='Ratio Sharpe')),
    name='Portafolios',
    legendgroup='Portafolios',
    showlegend=False  
))

for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    fig.add_trace(go.Scatter(
        x=[volatilidad], y=[retorno], mode='markers', name=nombre,
        legendgroup='Valores Individuales', marker=dict(size=10)
    ))

fig.add_trace(go.Scatter(
    x=frontera_volatilidad, y=frontera_retorno, mode='lines', name='Frontera eficiente de Markowitz',
    line=dict(color='red', dash='dash'), legendgroup='Frontera'
))

fig.add_trace(go.Scatter(
    x=[volatilidad_sharpe_max], y=[retorno_sharpe_max], mode='markers+text', name='Sharpe Máximo',
    marker=dict(color='red', size=15, symbol='star'),
    text=['Sharpe Máximo'], textposition='top center',
    textfont=dict(size=16, color='black')
))

fig.update_layout(
    title={
        'text': '10.000 Portafolios Simulados y Frontera Eficiente de Markowitz',
        'y': 0.98,
        'x': 0.0,
        'xanchor': 'left',
        'yanchor': 'top'
    },
    xaxis_title='Volatilidad',
    yaxis_title='Retorno esperado',
    showlegend=True,
    width=1200,  
    height=800,  
    legend=dict(
        orientation="h",  
        yanchor="bottom", 
        y=1.02,
        xanchor="right",
        x=1,
        itemsizing='constant',
        traceorder='normal'
    )
)

fig.show()

In [65]:
fig = go.Figure()

for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    fig.add_trace(go.Scatter(x=[volatilidad], y=[retorno], mode='markers', name=nombre))

fig.add_trace(go.Scatter(x=frontera_volatilidad, y=frontera_retorno, mode='lines', name='Frontera eficiente de Markowitz', line=dict(color='red', dash='dash')))

fig.update_layout(title='Frontera eficiente de Markowitz',
                  xaxis_title='Volatilidad',
                  yaxis_title='Retorno esperado')

fig.show()

Paso 8: Crear Gráfico Interactivo Circular con los Pesos de la Cartera Óptima

Finalmente, creamos un gráfico circular para visualizar los pesos de la cartera óptima (con el ratio Sharpe máximo).

In [66]:
pesos_labels_max = [f'{nombre}: {peso:.2f}%' for nombre, peso in zip(valores.keys(), pesos_sharpe_max * 100)]
fig_pie_max = go.Figure(data=[go.Pie(labels=pesos_labels_max, values=pesos_sharpe_max * 100, textinfo='label+percent', texttemplate='%{label}', marker=dict(colors=px.colors.qualitative.Bold))])
fig_pie_max.update_traces(hoverinfo='label+percent', textinfo='percent', textfont_size=20)
fig_pie_max.update_layout(title='Pesos de la Cartera Óptima (Sharpe Máximo)', showlegend=False)
fig_pie_max.show()

### Resultados finales modelo 2:

In [67]:
retorno_cartera_modelo_2 = retorno_sharpe_max
volatilidad_cartera_modelo_2 = volatilidad_sharpe_max
sharpe_cartera_modelo_2 = sharpe_max

In [68]:
retorno_cartera_modelo_2

0.2056690927175107

In [69]:
volatilidad_cartera_modelo_2

0.0934438500148037

In [70]:
sharpe_cartera_modelo_2

2.2009912122084856

In [71]:
pesos_cartera_optima_modelo_2 = {nombre: peso for nombre, peso in zip(valores.keys(), pesos_sharpe_max)}
pesos_cartera_optima_modelo_2

{'ACS': 0.02337471507731495,
 'SAN': 0.038732338632112506,
 'BBVA': 0.0034730326626115655,
 'REP': 0.0962887729299202,
 'IBE': 0.051718583621555125,
 'NIFTY50': 0.2798208011110855,
 'ASX200': 0.24322602890559283,
 'SP500': 0.1504175660024468,
 'Nasdaq': 0.020937224018215413,
 'SPCanada': 0.09201093703914515}

## 5.3.- Modelo Supervisado ML con Gradient Boosting (Modelo 3)

El Modelo 3 emplea Gradient Boosting para optimizar una cartera de inversión. 

Inicialmente, se calculan los retornos y las volatilidades anualizadas de diez valores seleccionados y se crea una matriz de covarianza para analizar la relación entre sus retornos. 

Luego, se generan 10,000 combinaciones aleatorias de pesos para estos valores, calculando el retorno esperado, la volatilidad y el ratio Sharpe para cada combinación. Con estos datos, se entrena un modelo de Gradient Boosting para predecir el ratio Sharpe de las carteras. 

La cartera óptima se identifica buscando los pesos que maximizan este ratio. 

Posteriormente, se calcula y visualiza la frontera eficiente de Markowitz, mostrando las carteras que ofrecen el máximo retorno para un nivel dado de riesgo, junto con los puntos de retorno y volatilidad de cada valor individual y la cartera con el ratio Sharpe máximo. 

Este enfoque integra el aprendizaje supervisado para mejorar la selección de la cartera optimizada.



In [72]:
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.model_selection import train_test_split

In [73]:
ACS_dataset = pd.read_csv('../data/ACS_dataset.csv')
SAN_dataset = pd.read_csv('../data/SAN_dataset.csv')
BBVA_dataset = pd.read_csv('../data/BBVA_dataset.csv')
REP_dataset = pd.read_csv('../data/REP_dataset.csv')
IBE_dataset = pd.read_csv('../data/IBE_dataset.csv')
NIFTY50_dataset = pd.read_csv('../data/NIFTY50_dataset.csv')
ASX200_dataset = pd.read_csv('../data/ASX200_dataset.csv')
SP500_dataset = pd.read_csv('../data/SP500_dataset.csv')
Nasdaq_dataset = pd.read_csv('../data/Nasdaq_dataset.csv')
SPCanada_dataset = pd.read_csv('../data/SPCanada_dataset.csv')

Paso 1: Calcular Retorno y Volatilidad para Cada Valor

Calculamos el retorno anualizado y la volatilidad anualizada para cada uno de los 10 valores. Utilizamos la media y la desviación estándar de los cambios porcentuales diarios (retornos diarios) multiplicados por 252 (el número aproximado de días de trading en un año).

In [74]:
def calcular_retorno_volatilidad(datos):
    retorno = datos['Close'].pct_change().mean() * 252
    volatilidad = datos['Close'].pct_change().std() * np.sqrt(252)
    return retorno, volatilidad

In [75]:
valores = {
    'ACS': ACS_dataset,
    'SAN': SAN_dataset,
    'BBVA': BBVA_dataset,
    'REP': REP_dataset,
    'IBE': IBE_dataset,
    'NIFTY50': NIFTY50_dataset,
    'ASX200': ASX200_dataset,
    'SP500': SP500_dataset,
    'Nasdaq': Nasdaq_dataset,
    'SPCanada': SPCanada_dataset
}

In [76]:
retorno_volatilidad = {nombre: calcular_retorno_volatilidad(datos) for nombre, datos in valores.items()}

In [77]:
for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    print(f'{nombre}: Retorno={retorno}, Volatilidad={volatilidad}')

ACS: Retorno=0.1523721024945055, Volatilidad=0.33027813359082275
SAN: Retorno=0.08291557771568378, Volatilidad=0.3453637063280006
BBVA: Retorno=0.17127798798180807, Volatilidad=0.35552148147840634
REP: Retorno=0.11094421970794896, Volatilidad=0.3300932573774622
IBE: Retorno=0.16669281698517, Volatilidad=0.2132397213062408
NIFTY50: Retorno=0.13932316527144406, Volatilidad=0.1789617173764289
ASX200: Retorno=0.05304050788008818, Volatilidad=0.16250254349303883
SP500: Retorno=0.12690088320284273, Volatilidad=0.20239974483891737
Nasdaq: Retorno=0.16547900809319033, Volatilidad=0.24087009429471273
SPCanada: Retorno=0.06460765390358833, Volatilidad=0.1677521778699786


Paso 2: Crear la Matriz de Covarianza

La matriz de covarianza mide cómo los retornos de los diferentes valores se mueven juntos. Esta matriz es esencial para calcular la volatilidad de la cartera.

In [78]:
matriz_covarianza = np.zeros((len(valores), len(valores)))
for i, (_, datos_i) in enumerate(valores.items()):
    for j, (_, datos_j) in enumerate(valores.items()):
        matriz_covarianza[i][j] = datos_i['Close'].pct_change().cov(datos_j['Close'].pct_change()) * 252

Paso 3: Optimización de la Cartera usando Gradient Boosting

Generamos 10,000 combinaciones de pesos al azar para los valores en la cartera y calculamos el retorno esperado, la volatilidad y el ratio Sharpe para cada combinación. 

Luego, entrenamos un modelo de Gradient Boosting para predecir el ratio Sharpe en función de los pesos y utilizamos el modelo para encontrar los pesos que maximizan y minimizan el ratio Sharpe.

In [79]:
# Generar combinaciones de pesos al azar y calcular retornos, volatilidades y ratios Sharpe
num_simulaciones = 10000
resultados = np.zeros((num_simulaciones, len(valores) + 3))

In [80]:
for i in range(num_simulaciones):
    pesos = np.random.random(len(valores))
    pesos /= np.sum(pesos)
    
    retorno_esperado = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos)
    volatilidad_esperada = np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos)))
    ratio_sharpe = retorno_esperado / volatilidad_esperada
    
    resultados[i, :len(valores)] = pesos
    resultados[i, len(valores)] = retorno_esperado
    resultados[i, len(valores) + 1] = volatilidad_esperada
    resultados[i, len(valores) + 2] = ratio_sharpe

In [81]:
# Datos para el modelo de Gradient Boosting
X = resultados[:, :len(valores)]
y = resultados[:, len(valores) + 2]

In [82]:
# Entrenar modelo de Gradient Boosting
gb = GradientBoostingRegressor(n_estimators=100, max_depth=3)
gb.fit(X, y)


In [83]:
# Predecir ratios Sharpe con Gradient Boosting
predicciones = gb.predict(X)

Paso 4: Calcular Indicadores de Evaluación del Modelo

Calculamos el MSE, RMSE, MAE y R² para evaluar el rendimiento del modelo de Gradient Boosting.

In [84]:
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

In [85]:
mse = mean_squared_error(y, predicciones)
rmse = np.sqrt(mse)
mae = mean_absolute_error(y, predicciones)
r2 = r2_score(y, predicciones)

In [86]:
print(f'Mean Squared Error (MSE): {mse}')
print(f'Root Mean Squared Error (RMSE): {rmse}')
print(f'Mean Absolute Error (MAE): {mae}')
print(f'R-squared (R²): {r2}')

Mean Squared Error (MSE): 0.0004617414534963201
Root Mean Squared Error (RMSE): 0.02148817008254356
Mean Absolute Error (MAE): 0.01616921181306106
R-squared (R²): 0.9708684906369692


Paso 5: Mostrar Resultados

Mostramos los resultados de la optimización, incluyendo los pesos de los valores en la cartera, el retorno, la volatilidad y el ratio Sharpe.

In [87]:
# Encontrar los pesos que maximizan el ratio Sharpe
pesos_optimales = X[np.argmax(predicciones)]
retorno_optimo = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos_optimales)
volatilidad_optima = np.sqrt(np.dot(pesos_optimales.T, np.dot(matriz_covarianza, pesos_optimales)))
sharpe_max = retorno_optimo / volatilidad_optima

In [88]:
# Encontrar los pesos que minimizan el ratio Sharpe (maximizar la penalización negativa)
pesos_minimos = X[np.argmin(predicciones)]
retorno_minimo = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos_minimos)
volatilidad_minima = np.sqrt(np.dot(pesos_minimos.T, np.dot(matriz_covarianza, pesos_minimos)))
sharpe_min = retorno_minimo / volatilidad_minima

In [89]:
print(f'Ratio Sharpe Máximo: {sharpe_max}')
print(f'Retorno de la Cartera (Sharpe Máximo): {retorno_optimo}')
print(f'Volatilidad de la Cartera (Sharpe Máximo): {volatilidad_optima}')
print('Pesos de la Cartera (Sharpe Máximo):')
for nombre, peso in zip(valores.keys(), pesos_optimales):
    print(f'{nombre}: {peso:.2f}%')

Ratio Sharpe Máximo: 2.204285534900005
Retorno de la Cartera (Sharpe Máximo): 0.21581335363271473
Volatilidad de la Cartera (Sharpe Máximo): 0.09790626042578685
Pesos de la Cartera (Sharpe Máximo):
ACS: 0.08%
SAN: 0.02%
BBVA: 0.03%
REP: 0.04%
IBE: 0.15%
NIFTY50: 0.22%
ASX200: 0.19%
SP500: 0.09%
Nasdaq: 0.11%
SPCanada: 0.07%


In [90]:
print(f'Ratio Sharpe Mínimo: {sharpe_min}')
print(f'Retorno de la Cartera (Sharpe Mínimo): {retorno_minimo}')
print(f'Volatilidad de la Cartera (Sharpe Mínimo): {volatilidad_minima}')
print('Pesos de la Cartera (Sharpe Mínimo):')
for nombre, peso in zip(valores.keys(), pesos_minimos):
    print(f'{nombre}: {peso:.2f}%')

Ratio Sharpe Mínimo: 1.3421888284365024
Retorno de la Cartera (Sharpe Mínimo): 0.31177219964895453
Volatilidad de la Cartera (Sharpe Mínimo): 0.23228639148496993
Pesos de la Cartera (Sharpe Mínimo):
ACS: 0.20%
SAN: 0.19%
BBVA: 0.20%
REP: 0.22%
IBE: 0.02%
NIFTY50: 0.01%
ASX200: 0.03%
SP500: 0.05%
Nasdaq: 0.02%
SPCanada: 0.06%


Paso 6: Frontera Eficiente de Markowitz

Calculamos la frontera eficiente de Markowitz, que representa las carteras que ofrecen el máximo retorno para un nivel dado de riesgo. Utilizamos optimización numérica para encontrar estas carteras.

In [91]:
frontera_volatilidad = np.linspace(0, 0.3, 100)
frontera_retorno = []
for volatilidad in frontera_volatilidad:
    restricciones_frontera = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1},
                              {'type': 'eq', 'fun': lambda pesos: np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos))) - volatilidad})
    resultados_frontera = minimize(lambda pesos: -np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos), pesos_optimales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones_frontera)
    retorno = np.dot([retorno for _, retorno in retorno_volatilidad.values()], resultados_frontera.x)
    frontera_retorno.append(retorno)

Paso 6: Graficar la Frontera Eficiente y los Resultados

Graficamos la frontera eficiente y los puntos de los valores individuales.

In [92]:
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=resultados[:, len(valores) + 1],
    y=resultados[:, len(valores)],
    mode='markers',
    marker=dict(color=resultados[:, len(valores) + 2], colorscale='Viridis', showscale=True, colorbar=dict(title='Ratio Sharpe')),
    name='Portafolios'
))

for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    fig.add_trace(go.Scatter(
        x=[volatilidad], y=[retorno], mode='markers', name=nombre,
        legendgroup='Valores Individuales', marker=dict(size=10)
    ))

fig.add_trace(go.Scatter(
    x=frontera_volatilidad, y=frontera_retorno, mode='lines', name='Frontera eficiente de Markowitz',
    line=dict(color='red', dash='dash'), legendgroup='Frontera'
))

fig.add_trace(go.Scatter(
    x=[volatilidad_optima], y=[retorno_optimo], mode='markers+text', 
    marker=dict(color='red', size=12, symbol='star'), 
    text=["Sharpe Máximo"], textposition='top center',
    name='Sharpe Máximo'
))

fig.update_layout(
    title='Portafolios Simulados y Frontera Eficiente de Markowitz',
    xaxis_title='Volatilidad',
    yaxis_title='Retorno esperado',
    showlegend=True,
    legend=dict(
        orientation="h",  
        yanchor="bottom", 
        y=1.02,
        xanchor="right",
        x=1
    ),
    width=1200,  
    height=800  
)

fig.show()

Los portafolios generados aleatoriamente suelen estar fuera de la frontera eficiente porque no están diseñados para maximizar el retorno para una determinada volatilidad. 

Sin embargo, al simular múltiples portafolios, algunos de ellos podrían acercarse o incluso coincidir con la frontera eficiente, dependiendo de cuán cerca estén de las combinaciones óptimas de activos.

Paso 7: Crear Gráfico Interactivo Circular con los Pesos de la Cartera Óptima

Finalmente, creamos un gráfico circular para visualizar los pesos de la cartera óptima (con el ratio Sharpe máximo).

In [93]:
pesos_labels_max = [f'{nombre}: {peso:.2f}%' for nombre, peso in zip(valores.keys(), pesos_optimales * 100)]
fig_pie_max = go.Figure(data=[go.Pie(labels=pesos_labels_max, values=pesos_optimales * 100, textinfo='label+percent', texttemplate='%{label}', marker=dict(colors=px.colors.qualitative.Bold))])
fig_pie_max.update_traces(hoverinfo='label+percent', textinfo='percent', textfont_size=20)
fig_pie_max.update_layout(title='Pesos de la Cartera Óptima (Sharpe Máximo)', showlegend=False)
fig_pie_max.show()

### Resultados finales modelo 3:

In [94]:
mse_modelo_3 = mse
rmse_modelo_3 = rmse
mae_modelo_3 = mae
r2_modelo_3 = r2

In [95]:
retorno_cartera_modelo_3 = retorno_optimo
volatilidad_cartera_modelo_3 = volatilidad_optima
sharpe_cartera_modelo_3 = sharpe_max

In [96]:
retorno_cartera_modelo_3

0.21581335363271473

In [97]:
volatilidad_cartera_modelo_3

0.09790626042578685

In [98]:
sharpe_cartera_modelo_3

2.204285534900005

In [99]:
pesos_cartera_optima_modelo_3 = {nombre: peso for nombre, peso in zip(valores.keys(), pesos_optimales)}
pesos_cartera_optima_modelo_3

{'ACS': 0.07830517185411671,
 'SAN': 0.021045977607808224,
 'BBVA': 0.02635616545557384,
 'REP': 0.044349721114101175,
 'IBE': 0.1503339739729728,
 'NIFTY50': 0.21591875185417483,
 'ASX200': 0.1921851003131517,
 'SP500': 0.09196868489535832,
 'Nasdaq': 0.10957125100848777,
 'SPCanada': 0.06996520192425461}

## 5.4.- Modelo Supervisado ML con XGBoost (Modelo 4)

El Modelo 4 utiliza XGBoost, una técnica de machine learning supervisada, para optimizar una cartera de inversión. 

Inicialmente, se calculan los retornos y las volatilidades anualizadas de diez valores seleccionados, y se construye una matriz de covarianza para analizar cómo se mueven conjuntamente estos retornos. 

Se generan 10,000 combinaciones aleatorias de pesos para los valores, calculando el retorno esperado, la volatilidad y el ratio Sharpe para cada combinación.

Utilizando estos datos, se entrena un modelo de XGBoost para predecir el ratio Sharpe de las carteras. 

Posteriormente, se identifican los pesos óptimos que maximizan este ratio, optimizando así la cartera. Además, se calcula y visualiza la frontera eficiente de Markowitz, destacando las carteras que ofrecen el mejor retorno para un nivel dado de riesgo. 

Este enfoque permite integrar técnicas avanzadas de machine learning para mejorar la selección y optimización de carteras de inversión.

In [100]:
import xgboost as xgb

In [101]:
ACS_dataset = pd.read_csv('../data/ACS_dataset.csv')
SAN_dataset = pd.read_csv('../data/SAN_dataset.csv')
BBVA_dataset = pd.read_csv('../data/BBVA_dataset.csv')
REP_dataset = pd.read_csv('../data/REP_dataset.csv')
IBE_dataset = pd.read_csv('../data/IBE_dataset.csv')
NIFTY50_dataset = pd.read_csv('../data/NIFTY50_dataset.csv')
ASX200_dataset = pd.read_csv('../data/ASX200_dataset.csv')
SP500_dataset = pd.read_csv('../data/SP500_dataset.csv')
Nasdaq_dataset = pd.read_csv('../data/Nasdaq_dataset.csv')
SPCanada_dataset = pd.read_csv('../data/SPCanada_dataset.csv')

Paso 1: Calcular Retorno y Volatilidad para Cada Valor

Primero, calculamos el retorno esperado anualizado y la volatilidad anualizada para cada uno de los 10 valores.

In [102]:
def calcular_retorno_volatilidad(datos):
    retorno = datos['Close'].pct_change().mean() * 252
    volatilidad = datos['Close'].pct_change().std() * np.sqrt(252)
    return retorno, volatilidad

In [103]:
valores = {
    'ACS': ACS_dataset,
    'SAN': SAN_dataset,
    'BBVA': BBVA_dataset,
    'REP': REP_dataset,
    'IBE': IBE_dataset,
    'NIFTY50': NIFTY50_dataset,
    'ASX200': ASX200_dataset,
    'SP500': SP500_dataset,
    'Nasdaq': Nasdaq_dataset,
    'SPCanada': SPCanada_dataset
}

In [104]:
retorno_volatilidad = {nombre: calcular_retorno_volatilidad(datos) for nombre, datos in valores.items()}

In [105]:
for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    print(f'{nombre}: Retorno={retorno}, Volatilidad={volatilidad}')

ACS: Retorno=0.1523721024945055, Volatilidad=0.33027813359082275
SAN: Retorno=0.08291557771568378, Volatilidad=0.3453637063280006
BBVA: Retorno=0.17127798798180807, Volatilidad=0.35552148147840634
REP: Retorno=0.11094421970794896, Volatilidad=0.3300932573774622
IBE: Retorno=0.16669281698517, Volatilidad=0.2132397213062408
NIFTY50: Retorno=0.13932316527144406, Volatilidad=0.1789617173764289
ASX200: Retorno=0.05304050788008818, Volatilidad=0.16250254349303883
SP500: Retorno=0.12690088320284273, Volatilidad=0.20239974483891737
Nasdaq: Retorno=0.16547900809319033, Volatilidad=0.24087009429471273
SPCanada: Retorno=0.06460765390358833, Volatilidad=0.1677521778699786


Paso 2: Crear la Matriz de Covarianza

La matriz de covarianza mide cómo los retornos de los diferentes valores se mueven juntos. Esta matriz es esencial para calcular la volatilidad de la cartera.

In [106]:
matriz_covarianza = np.zeros((len(valores), len(valores)))
for i, (_, datos_i) in enumerate(valores.items()):
    for j, (_, datos_j) in enumerate(valores.items()):
        matriz_covarianza[i][j] = datos_i['Close'].pct_change().cov(datos_j['Close'].pct_change()) * 252

Paso 3: Optimización de la Cartera usando XGBoost

Generamos 10,000 combinaciones de pesos al azar para los valores en la cartera y calculamos el retorno esperado, la volatilidad y el ratio Sharpe para cada combinación. 

Luego, entrenamos un modelo de XGBoost para predecir el ratio Sharpe, optimizando posteriormente la cartera.

In [107]:
num_simulaciones = 10000
resultados = np.zeros((num_simulaciones, len(valores) + 3))

In [108]:
for i in range(num_simulaciones):
    pesos = np.random.random(len(valores))
    pesos /= np.sum(pesos)
    
    retorno_esperado = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos)
    volatilidad_esperada = np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos)))
    ratio_sharpe = retorno_esperado / volatilidad_esperada
    
    resultados[i, :len(valores)] = pesos
    resultados[i, len(valores)] = retorno_esperado
    resultados[i, len(valores) + 1] = volatilidad_esperada
    resultados[i, len(valores) + 2] = ratio_sharpe

In [109]:
# Datos para el modelo de XGBoost
X = resultados[:, :len(valores)]
y = resultados[:, len(valores) + 2]

In [110]:
# Entrenar el modelo de XGBoost
dtrain = xgb.DMatrix(X, label=y)
params = {'max_depth': 3, 'eta': 0.1, 'objective': 'reg:squarederror'}
num_round = 100
bst = xgb.train(params, dtrain, num_round)

In [111]:
# Predecir ratios Sharpe con XGBoost
dtest = xgb.DMatrix(X)
predicciones = bst.predict(dtest)

Paso 4: Calcular Indicadores de Evaluación del Modelo

Calculamos el MSE, RMSE, MAE y R² para evaluar el rendimiento del modelo de XGBoost

In [112]:
mse = mean_squared_error(y, predicciones)
rmse = np.sqrt(mse)
mae = mean_absolute_error(y, predicciones)
r2 = r2_score(y, predicciones)

In [113]:
print(f'Mean Squared Error (MSE): {mse}')
print(f'Root Mean Squared Error (RMSE): {rmse}')
print(f'Mean Absolute Error (MAE): {mae}')
print(f'R-squared (R²): {r2}')

Mean Squared Error (MSE): 0.00047857504472993966
Root Mean Squared Error (RMSE): 0.021876358123095803
Mean Absolute Error (MAE): 0.01626990605791912
R-squared (R²): 0.9697104817358178


Paso 5: Mostrar Resultados

Mostramos los resultados de la optimización, incluyendo los pesos de los valores en la cartera, el retorno, la volatilidad y el ratio Sharpe.

In [114]:
# Encontrar los pesos que maximizan el ratio Sharpe
pesos_optimales = X[np.argmax(predicciones)]
retorno_optimo = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos_optimales)
volatilidad_optima = np.sqrt(np.dot(pesos_optimales.T, np.dot(matriz_covarianza, pesos_optimales)))
sharpe_max = retorno_optimo / volatilidad_optima

In [115]:
# Encontrar los pesos que minimizan el ratio Sharpe (maximizar la penalización negativa)
pesos_minimos = X[np.argmin(predicciones)]
retorno_minimo = np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos_minimos)
volatilidad_minima = np.sqrt(np.dot(pesos_minimos.T, np.dot(matriz_covarianza, pesos_minimos)))
sharpe_min = retorno_minimo / volatilidad_minima

In [116]:
print(f'Ratio Sharpe Máximo: {sharpe_max}')
print(f'Retorno de la Cartera (Sharpe Máximo): {retorno_optimo}')
print(f'Volatilidad de la Cartera (Sharpe Máximo): {volatilidad_optima}')
print('Pesos de la Cartera (Sharpe Máximo):')
for nombre, peso in zip(valores.keys(), pesos_optimales):
    print(f'{nombre}: {peso:.2f}')

Ratio Sharpe Máximo: 2.152692858314209
Retorno de la Cartera (Sharpe Máximo): 0.20318821216199598
Volatilidad de la Cartera (Sharpe Máximo): 0.0943879250480323
Pesos de la Cartera (Sharpe Máximo):
ACS: 0.04
SAN: 0.01
BBVA: 0.03
REP: 0.00
IBE: 0.13
NIFTY50: 0.20
ASX200: 0.23
SP500: 0.04
Nasdaq: 0.19
SPCanada: 0.14


In [117]:
print(f'Ratio Sharpe Mínimo: {sharpe_min}')
print(f'Retorno de la Cartera (Sharpe Mínimo): {retorno_minimo}')
print(f'Volatilidad de la Cartera (Sharpe Mínimo): {volatilidad_minima}')
print('Pesos de la Cartera (Sharpe Mínimo):')
for nombre, peso in zip(valores.keys(), pesos_minimos):
    print(f'{nombre}: {peso:.2f}')

Ratio Sharpe Mínimo: 1.2926848236280906
Retorno de la Cartera (Sharpe Mínimo): 0.31078298156596834
Volatilidad de la Cartera (Sharpe Mínimo): 0.2404166707037798
Pesos de la Cartera (Sharpe Mínimo):
ACS: 0.09
SAN: 0.28
BBVA: 0.27
REP: 0.12
IBE: 0.09
NIFTY50: 0.03
ASX200: 0.04
SP500: 0.04
Nasdaq: 0.02
SPCanada: 0.02


Paso 6: Frontera Eficiente de Markowitz

Calculamos la frontera eficiente de Markowitz, que representa las carteras que ofrecen el máximo retorno para un nivel dado de riesgo. Utilizamos optimización numérica para encontrar estas carteras.

In [118]:
frontera_volatilidad = np.linspace(0, 0.3, 100)
frontera_retorno = []
for volatilidad in frontera_volatilidad:
    restricciones_frontera = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1},
                              {'type': 'eq', 'fun': lambda pesos: np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza, pesos))) - volatilidad})
    resultados_frontera = minimize(lambda pesos: -np.dot([retorno for _, retorno in retorno_volatilidad.values()], pesos), pesos_optimales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones_frontera)
    retorno = np.dot([retorno for _, retorno in retorno_volatilidad.values()], resultados_frontera.x)
    frontera_retorno.append(retorno)

Paso 7: Graficar la Frontera Eficiente y los Resultados

Graficamos la frontera eficiente y los puntos de los valores individuales.

In [119]:
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=resultados[:, len(valores) + 1],
    y=resultados[:, len(valores)],
    mode='markers',
    marker=dict(color=resultados[:, len(valores) + 2], colorscale='Viridis', showscale=True, colorbar=dict(title='Ratio Sharpe')),
    name='Portafolios'
))

for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    fig.add_trace(go.Scatter(
        x=[volatilidad], y=[retorno], mode='markers', name=nombre,
        legendgroup='Valores Individuales', marker=dict(size=10)
    ))

fig.add_trace(go.Scatter(
    x=frontera_volatilidad, y=frontera_retorno, mode='lines', name='Frontera eficiente de Markowitz',
    line=dict(color='red', dash='dash'), legendgroup='Frontera'
))

fig.add_trace(go.Scatter(
    x=[volatilidad_optima], y=[retorno_optimo], mode='markers+text', 
    marker=dict(color='red', size=12, symbol='star'), 
    text=["Sharpe Máximo"], textposition='top center',
    name='Sharpe Máximo'
))

fig.update_layout(
    title='Portafolios Simulados y Frontera Eficiente de Markowitz',
    xaxis_title='Volatilidad',
    yaxis_title='Retorno esperado',
    showlegend=True,
    legend=dict(
        orientation="h", 
        yanchor="bottom", 
        y=1.02,
        xanchor="right",
        x=1
    ),
    width=1200, 
    height=800 
)

fig.show()


El modelo de XGBoost puede haber logrado una mayor precisión en las predicciones, resultando en una distribución de portafolios que se ajusta mejor a la frontera eficiente en el gráfico del modelo 4.

Paso 8: Crear Gráfico Interactivo Circular con los Pesos de la Cartera Óptima

Finalmente, creamos un gráfico circular para visualizar los pesos de la cartera óptima (con el ratio Sharpe máximo).

In [120]:
pesos_labels_max = [f'{nombre}: {peso:.2f}%' for nombre, peso in zip(valores.keys(), pesos_optimales * 100)]
fig_pie_max = go.Figure(data=[go.Pie(labels=pesos_labels_max, values=pesos_optimales * 100, textinfo='label+percent', texttemplate='%{label}', marker=dict(colors=px.colors.qualitative.Bold))])
fig_pie_max.update_traces(hoverinfo='label+percent', textinfo='percent', textfont_size=20)
fig_pie_max.update_layout(title='Pesos de la Cartera Óptima (Sharpe Máximo)', showlegend=False)
fig_pie_max.show()

### Resultados finales modelo 4:

In [121]:
mse_modelo_4 = mse
rmse_modelo_4 = rmse
mae_modelo_4 = mae
r2_modelo_4 = r2

In [122]:
retorno_cartera_modelo_4 = retorno_optimo
volatilidad_cartera_modelo_4 = volatilidad_optima
sharpe_cartera_modelo_4 = sharpe_max

In [123]:
retorno_cartera_modelo_4

0.20318821216199598

In [124]:
volatilidad_cartera_modelo_4

0.0943879250480323

In [125]:
sharpe_cartera_modelo_4

2.152692858314209

In [126]:
pesos_cartera_optima_modelo_4 = {nombre: peso for nombre, peso in zip(valores.keys(), pesos_optimales)}
pesos_cartera_optima_modelo_4

{'ACS': 0.039895535320134214,
 'SAN': 0.005791059804015857,
 'BBVA': 0.025727165229622415,
 'REP': 0.003343314971729776,
 'IBE': 0.1321813088409768,
 'NIFTY50': 0.1977455852934193,
 'ASX200': 0.22541958912701435,
 'SP500': 0.04111141494726429,
 'Nasdaq': 0.19256027350839133,
 'SPCanada': 0.1362247529574317}

## 5.5.- Modelo No Supervisado PCA (Principal Component Analysis) (Modelo 5)

El Modelo 5 utiliza el análisis de componentes principales (PCA) para optimizar una cartera de inversión. 

Primero, se calculan los retornos y las volatilidades anualizadas de diez valores seleccionados. Luego, se crea una matriz de covarianza para entender cómo se mueven conjuntamente estos retornos. 

Se aplica PCA para reducir la dimensionalidad de los datos, identificando las componentes principales que explican la mayor parte de la variabilidad en los retornos. Con estas componentes principales, se reconstruyen los retornos de los valores. Utilizando los datos reducidos, se optimiza la cartera buscando minimizar la volatilidad y maximizar el ratio Sharpe, lo que resulta en la identificación de los pesos óptimos para cada valor en la cartera. 

Finalmente, se visualiza la frontera eficiente de Markowitz, los puntos de retorno y volatilidad de cada valor individual, y la cartera con el ratio Sharpe máximo. 

Este enfoque permite simplificar la estructura de los datos y optimizar la cartera de manera eficiente.

In [127]:
from sklearn.decomposition import PCA

In [128]:
ACS_dataset = pd.read_csv('../data/ACS_dataset.csv')
SAN_dataset = pd.read_csv('../data/SAN_dataset.csv')
BBVA_dataset = pd.read_csv('../data/BBVA_dataset.csv')
REP_dataset = pd.read_csv('../data/REP_dataset.csv')
IBE_dataset = pd.read_csv('../data/IBE_dataset.csv')
NIFTY50_dataset = pd.read_csv('../data/NIFTY50_dataset.csv')
ASX200_dataset = pd.read_csv('../data/ASX200_dataset.csv')
SP500_dataset = pd.read_csv('../data/SP500_dataset.csv')
Nasdaq_dataset = pd.read_csv('../data/Nasdaq_dataset.csv')
SPCanada_dataset = pd.read_csv('../data/SPCanada_dataset.csv')

Paso 1: Calcular Retorno y Volatilidad para Cada Valor

Primero, necesitamos calcular el retorno esperado anualizado y la volatilidad anualizada para cada uno de los 10 valores.

In [129]:
def calcular_retorno_volatilidad(datos):
    retorno = datos['Close'].pct_change().mean() * 252
    volatilidad = datos['Close'].pct_change().std() * np.sqrt(252)
    return retorno, volatilidad

In [130]:
valores = {
    'ACS': ACS_dataset,
    'SAN': SAN_dataset,
    'BBVA': BBVA_dataset,
    'REP': REP_dataset,
    'IBE': IBE_dataset,
    'NIFTY50': NIFTY50_dataset,
    'ASX200': ASX200_dataset,
    'SP500': SP500_dataset,
    'Nasdaq': Nasdaq_dataset,
    'SPCanada': SPCanada_dataset
}

In [131]:
retorno_volatilidad = {nombre: calcular_retorno_volatilidad(datos) for nombre, datos in valores.items()}

In [132]:
for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    print(f'{nombre}: Retorno={retorno}, Volatilidad={volatilidad}')

ACS: Retorno=0.1523721024945055, Volatilidad=0.33027813359082275
SAN: Retorno=0.08291557771568378, Volatilidad=0.3453637063280006
BBVA: Retorno=0.17127798798180807, Volatilidad=0.35552148147840634
REP: Retorno=0.11094421970794896, Volatilidad=0.3300932573774622
IBE: Retorno=0.16669281698517, Volatilidad=0.2132397213062408
NIFTY50: Retorno=0.13932316527144406, Volatilidad=0.1789617173764289
ASX200: Retorno=0.05304050788008818, Volatilidad=0.16250254349303883
SP500: Retorno=0.12690088320284273, Volatilidad=0.20239974483891737
Nasdaq: Retorno=0.16547900809319033, Volatilidad=0.24087009429471273
SPCanada: Retorno=0.06460765390358833, Volatilidad=0.1677521778699786


Paso 2: Crear la Matriz de Covarianza

La matriz de covarianza se utiliza para medir cómo los retornos de los valores se mueven juntos. Esta matriz es esencial para calcular la volatilidad de la cartera.

In [133]:
matriz_covarianza = np.zeros((len(valores), len(valores)))
for i, (_, datos_i) in enumerate(valores.items()):
    for j, (_, datos_j) in enumerate(valores.items()):
        matriz_covarianza[i][j] = datos_i['Close'].pct_change().cov(datos_j['Close'].pct_change()) * 252

Paso 3: Aplicar PCA

Utilizamos PCA para reducir la dimensionalidad y encontrar las componentes principales que expliquen la mayor parte de la variabilidad en los retornos.

 Alineamos los índices de los DataFrames para asegurar que todas las series temporales tengan la misma longitud.

In [134]:
# Alinear los índices de los DataFrames para asegurar que todas las series temporales tengan la misma longitud
retornos_diarios_df = pd.concat([datos['Close'].pct_change().dropna() for _, datos in valores.items()], axis=1, join='inner')
retornos_diarios_df.columns = valores.keys()

In [135]:
# Convertir DataFrame a matriz numpy
retornos_diarios = retornos_diarios_df.values

In [136]:
# Aplicar PCA
pca = PCA()
pca.fit(retornos_diarios)
componentes_principales = pca.transform(retornos_diarios)

In [137]:
# Reconstruir los datos utilizando solo las componentes principales más significativas
num_componentes = np.argmax(np.cumsum(pca.explained_variance_ratio_) > 0.95) + 1
retornos_reconstruidos = np.dot(componentes_principales[:, :num_componentes], pca.components_[:num_componentes, :])
retornos_reconstruidos += pca.mean_

Paso 4: Optimización de la Cartera usando las Componentes Principales

Utilizamos las componentes principales para optimizar la cartera.

In [138]:
# Calcular el retorno y la volatilidad de la cartera utilizando las componentes principales
retornos_medios = retornos_reconstruidos.mean(axis=0) * 252
volatilidades = retornos_reconstruidos.std(axis=0) * np.sqrt(252)
matriz_covarianza_pca = np.cov(retornos_reconstruidos.T) * 252

In [139]:
# Función minimizar la volatilidad de la cartera
def objetivo(pesos):
    return np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza_pca, pesos)))


In [140]:
# Restricciones para los pesos de la cartera
restricciones = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1})

In [141]:
# Optimización
pesos_iniciales = np.ones(len(valores)) / len(valores)
resultados = minimize(objetivo, pesos_iniciales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones)

In [142]:
# Calcular retorno, volatilidad y ratio Sharpe de la cartera óptima
retorno_cartera = np.dot(retornos_medios, resultados.x)
volatilidad_cartera = np.sqrt(np.dot(resultados.x.T, np.dot(matriz_covarianza_pca, resultados.x)))
sharpe_cartera = retorno_cartera / volatilidad_cartera

In [143]:
# Encontrar los pesos que maximizan el ratio Sharpe
pesos_sharpe_max = resultados.x
retorno_sharpe_max = retorno_cartera
volatilidad_sharpe_max = volatilidad_cartera
sharpe_max = sharpe_cartera

In [144]:
# Encontrar los pesos que minimizan el ratio Sharpe (maximizar la penalización negativa)
resultados_min = minimize(lambda pesos: -np.dot(retornos_medios, pesos) / np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza_pca, pesos))), pesos_iniciales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones)
pesos_sharpe_min = resultados_min.x
retorno_sharpe_min = np.dot(retornos_medios, pesos_sharpe_min)
volatilidad_sharpe_min = np.sqrt(np.dot(pesos_sharpe_min.T, np.dot(matriz_covarianza_pca, pesos_sharpe_min)))
sharpe_min = retorno_sharpe_min / volatilidad_sharpe_min

Paso 5: Mostrar Resultados

Mostramos los resultados de la optimización, incluyendo los pesos de los valores en la cartera, el retorno, la volatilidad y el ratio Sharpe.

In [145]:
print(f'Ratio Sharpe Máximo: {sharpe_max}')
print(f'Retorno de la Cartera (Sharpe Máximo): {retorno_sharpe_max}')
print(f'Volatilidad de la Cartera (Sharpe Máximo): {volatilidad_sharpe_max}')
print('Pesos de la Cartera (Sharpe Máximo):')
for nombre, peso in zip(valores.keys(), pesos_sharpe_max):
    print(f'{nombre}: {peso:.2f}%')

Ratio Sharpe Máximo: 1.1616573608985359
Retorno de la Cartera (Sharpe Máximo): 0.1011443232216238
Volatilidad de la Cartera (Sharpe Máximo): 0.08706898146230416
Pesos de la Cartera (Sharpe Máximo):
ACS: 0.03%
SAN: 0.00%
BBVA: 0.00%
REP: 0.02%
IBE: 0.12%
NIFTY50: 0.27%
ASX200: 0.27%
SP500: 0.11%
Nasdaq: 0.00%
SPCanada: 0.18%


In [146]:
print(f'Ratio Sharpe Mínimo: {sharpe_min}')
print(f'Retorno de la Cartera (Sharpe Mínimo): {retorno_sharpe_min}')
print(f'Volatilidad de la Cartera (Sharpe Mínimo): {volatilidad_sharpe_min}')
print('Pesos de la Cartera (Sharpe Mínimo):')
for nombre, peso in zip(valores.keys(), pesos_sharpe_min):
    print(f'{nombre}: {peso:.2f}%')

Ratio Sharpe Mínimo: 1.3379106799887082
Retorno de la Cartera (Sharpe Mínimo): 0.132785063541061
Volatilidad de la Cartera (Sharpe Mínimo): 0.09924807801233913
Pesos de la Cartera (Sharpe Mínimo):
ACS: 0.04%
SAN: 0.00%
BBVA: 0.03%
REP: 0.00%
IBE: 0.20%
NIFTY50: 0.35%
ASX200: 0.15%
SP500: 0.00%
Nasdaq: 0.21%
SPCanada: 0.03%


Paso 6: Frontera Eficiente de Markowitz

Calculamos la frontera eficiente de Markowitz, que representa las carteras que ofrecen el máximo retorno para un nivel dado de riesgo.

In [147]:
frontera_volatilidad = np.linspace(0, 0.3, 100)
frontera_retorno = []
for volatilidad in frontera_volatilidad:
    restricciones_frontera = ({'type': 'eq', 'fun': lambda pesos: np.sum(pesos) - 1},
                              {'type': 'eq', 'fun': lambda pesos: np.sqrt(np.dot(pesos.T, np.dot(matriz_covarianza_pca, pesos))) - volatilidad})
    resultados_frontera = minimize(lambda pesos: -np.dot(retornos_medios, pesos), pesos_iniciales, method='SLSQP', bounds=[(0, 1)] * len(valores), constraints=restricciones_frontera)
    retorno = np.dot(retornos_medios, resultados_frontera.x)
    frontera_retorno.append(retorno)

Paso 7: Graficar la Frontera Eficiente y los Resultados

Graficamos la frontera eficiente y los puntos de los valores individuales.

In [149]:
fig = go.Figure()

for nombre, (retorno, volatilidad) in retorno_volatilidad.items():
    fig.add_trace(go.Scatter(
        x=[volatilidad], y=[retorno], mode='markers', name=nombre,
        legendgroup='Valores Individuales', marker=dict(size=10)
    ))

fig.add_trace(go.Scatter(
    x=frontera_volatilidad, y=frontera_retorno, mode='lines', name='Frontera eficiente de Markowitz',
    line=dict(color='red', dash='dash'), legendgroup='Frontera'
))

fig.add_trace(go.Scatter(
    x=[volatilidad_sharpe_max], y=[retorno_sharpe_max], mode='markers+text', 
    marker=dict(color='red', size=12, symbol='star'), 
    text=["Sharpe Máximo"], textposition='top center',
    name='Sharpe Máximo'
))

fig.update_layout(
    title='Frontera Eficiente de Markowitz y Valores Individuales',
    xaxis_title='Volatilidad',
    yaxis_title='Retorno esperado',
    showlegend=True,
    legend=dict(
        orientation="h",  
        yanchor="bottom", 
        y=1.02,
        xanchor="right",
        x=1
    ),
    width=1200,  
    height=800  
)

fig.show()

Paso 8: Crear Gráfico Interactivo Circular con los Pesos de la Cartera Óptima

Finalmente, creamos un gráfico circular para visualizar los pesos de la cartera óptima (con el ratio Sharpe máximo).

In [150]:
pesos_labels_max = [f'{nombre}: {peso:.2f}%' for nombre, peso in zip(valores.keys(), pesos_sharpe_max * 100)]
fig_pie_max = go.Figure(data=[go.Pie(labels=pesos_labels_max, values=pesos_sharpe_max * 100, textinfo='label+percent', texttemplate='%{label}', marker=dict(colors=px.colors.qualitative.Bold))])
fig_pie_max.update_traces(hoverinfo='label+percent', textinfo='percent', textfont_size=20)
fig_pie_max.update_layout(title='Pesos de la Cartera Óptima (Sharpe Máximo)', showlegend=False)
fig_pie_max.show()

### Resultados finales modelo 5:

In [151]:
mse_modelo_5 = mse
rmse_modelo_5 = rmse
mae_modelo_5 = mae
r2_modelo_5 = r2

In [152]:
retorno_cartera_modelo_5 = retorno_sharpe_max
volatilidad_cartera_modelo_5 = volatilidad_sharpe_max
sharpe_cartera_modelo_5 = sharpe_max

In [153]:
retorno_cartera_modelo_5

0.1011443232216238

In [154]:
volatilidad_cartera_modelo_5

0.08706898146230416

In [155]:
sharpe_cartera_modelo_5

1.1616573608985359

In [156]:
pesos_cartera_optima_modelo_5 = {nombre: peso for nombre, peso in zip(valores.keys(), pesos_sharpe_max)}
pesos_cartera_optima_modelo_5

{'ACS': 0.028327222516489114,
 'SAN': 0.0035709224883293403,
 'BBVA': 7.047314121155779e-19,
 'REP': 0.021504951834317027,
 'IBE': 0.11678849010961301,
 'NIFTY50': 0.2674391355170808,
 'ASX200': 0.2679969801083963,
 'SP500': 0.11265196613195416,
 'Nasdaq': 2.4330174376932523e-17,
 'SPCanada': 0.18172033129382012}

# 6.- Comparacion de resultados finales de los 5 modelos

## 6.1.- Comparacion de 4 indicadores (MSE, RMSE, MAE y R2) en modelos 3, 4 y 5

In [168]:
resultados = {
    'Indicador': ['MSE', 'RMSE', 'MAE', 'R²'],
    'Modelo 3': [mse_modelo_3, rmse_modelo_3, mae_modelo_3, r2_modelo_3],
    'Modelo 4': [mse_modelo_4, rmse_modelo_4, mae_modelo_4, r2_modelo_4],
    'Modelo 5': [mse_modelo_5, rmse_modelo_5, mae_modelo_5, r2_modelo_5]
}

In [169]:
pd.DataFrame(resultados)

Unnamed: 0,Indicador,Modelo 3,Modelo 4,Modelo 5
0,MSE,0.000462,0.000479,0.000479
1,RMSE,0.021488,0.021876,0.021876
2,MAE,0.016169,0.01627,0.01627
3,R²,0.970868,0.96971,0.96971


Utilizando Gradient Boosting, el modelo 3 demuestra ser el más preciso y efectivo en términos de todos los indicadores evaluados (MSE, RMSE, MAE y R²). Es el mejor modelo para minimizar los errores y maximizar la capacidad explicativa.

Aunque los modelos 4 y 5 tienen un rendimiento muy similar y son solo ligeramente inferiores al Modelo 3, su desempeño es prácticamente idéntico entre ellos en todos los indicadores. Estos modelos siguen siendo bastante precisos y pueden ser útiles, pero no alcanzan el nivel de precisión del Modelo 3.

## 6.2.- Comparacion de retorno, volatilidad y sharpe de las 5 carteras

In [157]:
resultados_modelos = {
    'Modelo 1': {
        'retorno': retorno_cartera_modelo_1,
        'volatilidad': volatilidad_cartera_modelo_1,
        'sharpe': sharpe_cartera_modelo_1
    },
    'Modelo 2': {
        'retorno': retorno_cartera_modelo_2,
        'volatilidad': volatilidad_cartera_modelo_2,
        'sharpe': sharpe_cartera_modelo_2
    },
    'Modelo 3': {
        'retorno': retorno_cartera_modelo_3,
        'volatilidad': volatilidad_cartera_modelo_3,
        'sharpe': sharpe_cartera_modelo_3
    },
    'Modelo 4': {
        'retorno': retorno_cartera_modelo_4,
        'volatilidad': volatilidad_cartera_modelo_4,
        'sharpe': sharpe_cartera_modelo_4
    },
    'Modelo 5': {
        'retorno': retorno_cartera_modelo_5,
        'volatilidad': volatilidad_cartera_modelo_5,
        'sharpe': sharpe_cartera_modelo_5
    }
}

Crear la Tabla de Comparación

In [158]:
df_comparacion = pd.DataFrame({
    'Modelo': resultados_modelos.keys(),
    'Retorno': [resultados_modelos[modelo]['retorno'] for modelo in resultados_modelos],
    'Volatilidad': [resultados_modelos[modelo]['volatilidad'] for modelo in resultados_modelos],
    'Ratio Sharpe': [resultados_modelos[modelo]['sharpe'] for modelo in resultados_modelos]
})

In [159]:
df_comparacion.set_index('Modelo', inplace=True)

In [170]:
df_comparacion

Unnamed: 0_level_0,Retorno,Volatilidad,Ratio Sharpe
Modelo,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Modelo 1,0.187358,0.086479,2.16652
Modelo 2,0.205669,0.093444,2.200991
Modelo 3,0.215813,0.097906,2.204286
Modelo 4,0.203188,0.094388,2.152693
Modelo 5,0.101144,0.087069,1.161657


Visualización de resultados

In [161]:
trace_retorno = go.Bar(
    x=df_comparacion.index,
    y=df_comparacion['Retorno'],
    name='Retorno',
    marker=dict(color='skyblue')
)

trace_volatilidad = go.Bar(
    x=df_comparacion.index,
    y=df_comparacion['Volatilidad'],
    name='Volatilidad',
    marker=dict(color='lightcoral')
)

trace_sharpe = go.Bar(
    x=df_comparacion.index,
    y=df_comparacion['Ratio Sharpe'],
    name='Ratio Sharpe',
    marker=dict(color='lightgreen')
)

fig = go.Figure(data=[trace_retorno, trace_volatilidad, trace_sharpe])

fig.update_layout(
    title='Comparación de Retorno, Volatilidad y Ratio Sharpe entre Modelos',
    xaxis_title='Modelos',
    yaxis_title='Valores',
    barmode='group',
    template='plotly_white'
)

fig.show()

Para entender cuál es el mejor modelo, consideramos las tres métricas: retorno, volatilidad y ratio Sharpe. El ratio Sharpe es particularmente importante porque mide el rendimiento ajustado por riesgo de una cartera.

Siendo:

- Retorno: una medida del beneficio esperado de la cartera
- Volatilidad: una medida del riesgo o la variabilidad de los retornos de la cartera
- El ratio Sharpe: mide el rendimiento ajustado por riesgo. Un ratio Sharpe más alto indica un mejor rendimiento ajustado por riesgo

Interpretación de los Resultados

1) Modelo 3: Destaca como el mejor modelo con el mayor retorno y el mejor ratio Sharpe, aunque también es el más volátil. Es ideal para inversores que buscan maximizar el rendimiento y están dispuestos a asumir más riesgo.

2) Modelo 2: Presenta un buen balance entre retorno y riesgo, con un ratio Sharpe alto y un retorno considerablemente alto, siendo una excelente opción para una cartera bien equilibrada.

3) Modelo 1: Tiene la menor volatilidad, lo que lo hace atractivo para inversores más conservadores, pero con un buen ratio Sharpe y un retorno sólido.

4) Modelo 4: Aunque tiene un buen desempeño, queda por detrás de los Modelos 1, 2 y 3 en términos de ratio Sharpe y retorno.

5) Modelo 5: Muestra un rendimiento significativamente menor en comparación con los otros modelos, tanto en términos de retorno como de ratio Sharpe, siendo el menos atractivo en esta comparación.

En resumen, para maximizar el rendimiento ajustado por riesgo, el Modelo 3 sería la elección óptima, seguido de cerca por el Modelo 2. Para inversores más conservadores, el Modelo 1 ofrece una buena opción con menor volatilidad.

## 6.3.- Comparacion de peso de carteras

Primero recogemos los datos. Puesto que los modelos 2, 3, 4 y 5 mostraban los resultados de los porcentajes, en formato decimal (20 % = 0.20), van a tener que multiplicarse sus resultados por 100. Con el fin de iguar los resultados con los del modelo 1.

In [162]:
pesos_modelos = {
    'Modelo 1': pesos_cartera_optima_modelo_1,
    'Modelo 2': {k: v * 100 for k, v in pesos_cartera_optima_modelo_2.items()},
    'Modelo 3': {k: v * 100 for k, v in pesos_cartera_optima_modelo_3.items()},
    'Modelo 4': {k: v * 100 for k, v in pesos_cartera_optima_modelo_4.items()},
    'Modelo 5': {k: v * 100 for k, v in pesos_cartera_optima_modelo_5.items()}
}

Crear la Tabla de Comparación de Pesos

Convertimos los datos de los pesos en un DataFrame para facilitar su manipulación y visualización.

In [163]:
df_pesos = pd.DataFrame(pesos_modelos)
df_pesos.index.name = 'Activos'
df_pesos.reset_index(inplace=True)
print(df_pesos)

    Activos      Modelo 1   Modelo 2   Modelo 3   Modelo 4      Modelo 5
0       ACS  3.070835e+00   2.337472   7.830517   3.989554  2.832722e+00
1       SAN  0.000000e+00   3.873234   2.104598   0.579106  3.570922e-01
2      BBVA  0.000000e+00   0.347303   2.635617   2.572717  7.047314e-17
3       REP  2.331275e+00   9.628877   4.434972   0.334331  2.150495e+00
4       IBE  1.193730e+01   5.171858  15.033397  13.218131  1.167885e+01
5   NIFTY50  2.641375e+01  27.982080  21.591875  19.774559  2.674391e+01
6    ASX200  2.701508e+01  24.322603  19.218510  22.541959  2.679970e+01
7     SP500  1.113487e+01  15.041757   9.196868   4.111141  1.126520e+01
8    Nasdaq  8.751544e-16   2.093722  10.957125  19.256027  2.433017e-15
9  SPCanada  1.809689e+01   9.201094   6.996520  13.622475  1.817203e+01


In [164]:
trazas = []
for modelo in df_pesos.columns[1:]:
    traza = go.Bar(
        x=df_pesos['Activos'],
        y=df_pesos[modelo],
        name=modelo
    )
    trazas.append(traza)

fig = go.Figure(data=trazas)

fig.update_layout(
    title='Comparación de Pesos de Carteras entre Modelos',
    xaxis_title='Activos',
    yaxis_title='Peso (%)',
    barmode='group',
    template='plotly_white'
)

fig.show()

La comparación de los pesos de las diferentes carteras muestra varias diferencias significativas en la asignación de activos entre los modelos.

En general, los activos NIFTY50 y ASX200 son consistentemente favorecidos, mientras que IBE y Nasdaq destacan particularmente en los Modelos 3 y 4. Estas diferencias en asignación reflejan las distintas estrategias de optimización y perfiles de riesgo adoptados por cada modelo.