In [1]:
import pandas as pd
import requests, json
import numpy as np
import random
import cvxpy as cp
import matplotlib.pyplot as plt
from sklearn.metrics import pairwise_distances

In [2]:
url_base = 'https://miax-gateway-jog4ew3z3q-ew.a.run.app'
competi = 'mia_10'
user_key = 'AIzaSyDMTpNC68E6xjWBWVOWh61i7EvzduUit2Y'
market = 'IBEX'
competi = 'mia_10'
algo_tag = 'ibusteros_algo3'

In [3]:
def get_ticker_master():
    url = f'{url_base}/data/ticker_master'
    params = {
        'competi': competi,
        'market': 'IBEX',
        'key': user_key
        }
    response = requests.get(url, params)
    tk_master = response.json()
    maestro_df = pd.DataFrame(tk_master['master'])
    return maestro_df

def get_close_data(tck):
    url2 = f'{url_base}/data/time_series'
    params = {
        'market': 'IBEX',
        'key': user_key,
        'ticker': tck,
        'close': True
        }
    response = requests.get(url2, params)
    tk_data = response.json()
    series_data = pd.read_json(tk_data, typ='series')
    return series_data

def get_ohlc_data(tck):
    url2 = f'{url_base}/data/time_series'
    params = {
        'market': 'IBEX',
        'key': user_key,
        'ticker': tck,
        'close': False
        }
    response = requests.get(url2, params)
    tk_data = response.json()
    series_data = pd.read_json(tk_data, typ='series')
    return series_data

def get_df_close(df_maestro):
    data_close_all = {}
    for _,row in df_maestro.iterrows():
        tick = row.ticker
        #print(f'Downloading: {tick}...')
        close_data = get_close_data(tick)
        data_close_all[tick] = close_data

    return(pd.DataFrame(data_close_all))

def send_alloc(algo_tag, date, allocation):
    url = f'{url_base}/participants/allocation?key={user_key}'
    data = {
    'competi': competi,
    'algo_tag': algo_tag,
    'market': market,
    'date': date,
    'allocation': allocation
        }
    response = requests.post(url, data=json.dumps(data))
    print(response.text)

def allocs_to_frame(json_allocations):
        alloc_list = []
        for json_alloc in json_allocations:
            #print(json_alloc)
            allocs = pd.DataFrame(json_alloc['allocations'])
            allocs.set_index('ticker', inplace=True)
            alloc_serie = allocs['alloc']
            alloc_serie.name = json_alloc['date'] 
            alloc_list.append(alloc_serie)
        all_alloc_df = pd.concat(alloc_list, axis=1).T
        return all_alloc_df

def get_allocs(algo_tag):
        url = f'{url_base}/participants/algo_allocations'
        params = {
            'key':user_key,
            'competi': competi,
            'algo_tag': algo_tag,
            'market': market,
        }
        response = requests.get(url, params)
        return allocs_to_frame(response.json())

def delete_allocs(algo_tag):
        url = f'{url_base}/participants/delete_allocations'
        url_auth = f'{url}?key={user_key}'
        params = {
            'competi': competi,
            'algo_tag': algo_tag,
            'market': market,
            }
        response = requests.post(url_auth, data=json.dumps(params))
        print(response.status_code)
     


def get_algos():
    url = f'{url_base}/participants/algorithms'
    params = {
        'competi': competi,
        'key': user_key
    }
    response = requests.get(url, params)
    algos = response.json()
    algos_df = pd.DataFrame(algos)
    return algos_df


def exec_algo(algo_tag):
        url = f'{url_base}/participants/exec_algo?key={user_key}'
        params = {
            'competi': competi,
            'algo_tag': algo_tag,
            'market': market,
        }
        response = requests.post(url, data=json.dumps(params))
        if response.status_code == 200:
            exec_data = response.json()
            status = exec_data.get('status')
            print(status)
            res_data = exec_data.get('content')
            if res_data:
                metrics = pd.Series(res_data['result'])
                trades = pd.DataFrame(res_data['trades'])
                return metrics, trades
        else:
            exec_data = dict()
            print(response.text)

def get_exec_results(algo_tag):
        url = f'{url_base}/participants/algo_exec_results'
        params = {
            'key': user_key,
            'competi': competi,
            'algo_tag': algo_tag,
            'market': market,
        }

        response = requests.get(url, params)
        exec_data = response.json()
        print(exec_data.get('status'))
        res_data = exec_data.get('content')
        if res_data:
            metrics = pd.Series(res_data['result'])
            trades = pd.DataFrame(res_data['trades'])
            return metrics, trades


In [4]:
t_master = get_ticker_master()
df_close = get_df_close(t_master)
df_rets = np.log(df_close).diff().iloc[1:,:]

In [6]:
# FUNCTIONS GENETIC ALGORITHM

In [83]:
def weights_marko(long, n_reps):
    """
    Genera una matriz de pesos normalizados al azar para un modelo Markoviano.

    Parámetros:
    -----------
    long : int
        La longitud de la matriz de pesos.
    n_reps : int
        El número de repeticiones para generar la matriz de pesos.

    Devuelve:
    ---------
    mat_pesos_norm : numpy.ndarray
        La matriz de pesos normalizados al azar para un modelo Markoviano.

    Notas:
    ------
    Esta función permite a los pesos tener ceros en algunos de los fondos del portfolio.
    """

    # Genera una matriz de pesos y una matriz binaria aleatoria del mismo tamaño
    mat_pesos = np.random.uniform(0, 1, (n_reps, long))
    matrix_01 = np.random.randint(0, 2, size=(n_reps, long))

    # Multiplica la matriz de pesos con la matriz binaria para crear una matriz aleatoria 
    # con algunos elementos de la matriz de pesos y otros iguales a cero
    m1 = mat_pesos[matrix_01.sum(axis=1) != 0,:] * matrix_01[matrix_01.sum(axis=1) != 0,:]

    # Normaliza la matriz de pesos aleatoria resultante para que la suma de los pesos en cada fila sea 1
    mat_pesos_norm = m1 / np.sum(m1, axis=1, keepdims=True)
    
    # Reemplaza los valores NaN en la matriz de pesos normalizados con ceros
    mat_pesos_norm = np.nan_to_num(mat_pesos_norm)

    return mat_pesos_norm





def best_marko(funds, mean_rents, df_rents, n_reps= 100):
    """
    Encuentra la asignación de pesos óptima para un conjunto de fondos utilizando el modelo Markoviano.

    Parámetros:
    -----------
    funds : list
        Una lista de los nombres de los fondos.
    n_reps : int, opcional (valor predeterminado = 100)
        El número de repeticiones para generar la matriz de pesos aleatoria.

    Devuelve:
    ---------
    tuple
        Una tupla que contiene la mejor relación riesgo-recompensa, la asignación de pesos óptima 
        y una lista de los fondos con asignación de peso no nula.

    Notas:
    ------
    Esta función utiliza el modelo Markoviano para encontrar la asignación de pesos óptima 
    para un conjunto de fondos dados. Se genera una matriz de pesos aleatoria y se calcula 
    la relación riesgo-recompensa para cada una de las asignaciones de pesos. La asignación 
    de pesos con la mejor relación riesgo-recompensa se devuelve junto con la relación 
    riesgo-recompensa correspondiente y una lista de los fondos con asignación de peso no nula.
    """

    # Convierte la lista de fondos en un array numpy
    funds = np.array(funds)

    # Obtiene la longitud de los fondos y genera una matriz de pesos aleatoria
    long = len(funds)
    w = weights_marko(long, n_reps)

    # Calcula la rentabilidad media y la matriz de covarianza de los fondos
    r_bar = np.array(mean_rents[funds])
    mat_cov = df_rents.loc[:, funds].cov()

    # Calcula la rentabilidad esperada y la volatilidad para cada asignación de pesos
    v_rents = np.dot(w, r_bar)
    m1 = np.dot(w, np.array(mat_cov))
    v_risk = np.sqrt((m1 * w).sum(axis=1))

    # Calcula la relación riesgo-recompensa para cada asignación de pesos
    efic = v_rents / v_risk

    # Encuentra la asignación de pesos con la mejor relación riesgo-recompensa
    best_weight = w[efic.argmax()]
    l_fond_0 = funds[best_weight > 0]
    best_sharpe = efic[efic.argmax()]

    return best_sharpe, best_weight, l_fond_0



def select_parents(n_indiv_inic, mean_rents, df_rents, min_fond=1, max_fond=20):
    """
    Selecciona los padres para la siguiente generación.

    Parameters
    ----------
    n_indiv_inic : int
        Número de individuos iniciales a crear.
    min_fond : int, optional
        Número mínimo de fondos en la selección de fondos aleatorios, por defecto 1.
    max_fond : int, optional
        Número máximo de fondos en la selección de fondos aleatorios, por defecto 20.

    Returns
    -------
    parent_funds : numpy.ndarray
        Array de fondos de inversión de los padres seleccionados para la siguiente generación.
    best_parent : numpy.ndarray
        Array de fondos de inversión del mejor padre de la generación actual.
    best_parent_sharpe : float
        Ratio Sharpe del mejor padre de la generación actual.
    """

    invest_funds = list()
    #final_weights = list()
    fitness = list()

    #n_fond = np.random.randint(min_fond, max_fond, size=n_indiv_inic)
    fondos_20 = np.random.choice(df_rents.columns, size=(n_indiv_inic,max_fond))
    matrix_01 = np.random.choice([True, False], size=(n_indiv_inic,max_fond))

    fondos_20 = fondos_20[matrix_01.sum(axis=1) != 0,:]
    matrix_01 = matrix_01[matrix_01.sum(axis=1) != 0,:]

    for i in range(len(fondos_20)):
        l_fond = fondos_20[i][matrix_01[i]]
        #print(f'long inic: {len(l_fond)}')
        #l_fond = random.sample(df_close.columns.tolist(), n_fond[i])
        sh, _, l_fond_0 = best_marko(l_fond, mean_rents, df_rents)
        #print(f'long final: {len(l_fond_0)}')
        #print('-------------')
        
        
        fitness.append(sh)
        #final_weights.append(w)
        invest_funds.append(l_fond_0)

    fitness_norm = (np.array(fitness) - min(fitness)) / (max(fitness)-min(fitness))
    thresh = random.uniform(0,1)
    #print(f'umbral: {thresh}, mediana de fitness_norm {np.median(fitness_norm)}')

    fitness_norm = np.array(fitness_norm, dtype=object)
    invest_funds = np.array(invest_funds, dtype=object)
    #final_weights = np.array(final_weights, dtype=object)

    best_parent = invest_funds[fitness_norm.argmax()]
    best_parent_sharpe = fitness[fitness_norm.argmax()]

    mask_parent = fitness_norm > thresh
    parent_funds = invest_funds[mask_parent]
    #print(f'longitud de la generacion: {len(parent_funds)}')
    #parent_weights = final_weights[mask_parent]

    return parent_funds, best_parent, best_parent_sharpe










def combine_nextgen(parent1, l_parent2, df_rents):
    """
    Combina el primer padre con una lista de segundos padres para generar la siguiente generación.

    Parameters
    ----------
    parent1 : array-like
        Lista de fondos del primer padre.
    l_parent2 : array-like
        Lista de listas de fondos de los segundos padres.

    Returns
    -------
    array
        Lista de fondos combinados con el padre con el que tiene una mayor correlación.

    """
    val_parent = list()

    for p2 in l_parent2:
        funds_p = np.union1d(parent1, p2)
        val = abs(df_rents.loc[:,funds_p].corr()).mean().mean()
        val_parent.append(val)

    val_parent = np.array(val_parent)
    #print(val_parent)
    #print(f'se ha juntado con el padre nº {val_parent.argmin()}')
    #print(f'en particular con el {val_parent.argmin()}º')

    return np.union1d(parent1, l_parent2[val_parent.argmin()])



def generate_couples(parent_funds, df_rents, n_hijos=100, n_azar=3):
    """
    Genera parejas de fondos para la siguiente generación a partir de los padres de la actual generación.

    Parameters
    ----------
    parent_funds : array-like
        Lista de arrays de fondos de inversión de la generación anterior.
    n_hijos : int, optional
        Número de parejas de fondos a generar (default is 100).
    n_azar : int, optional
        Número de padres aleatorios para combinar con cada padre seleccionado (default is 3).

    Returns
    -------
    list
        Lista de arrays de fondos de inversión que representan las parejas de fondos de la siguiente generación.
    """
    couples = list()

    # Seleccionar padres y candidatos aleatoriamente
    padres = np.random.randint(len(parent_funds), size=n_hijos)
    candidatos = np.random.randint(len(parent_funds), size=(n_hijos,n_azar))

    # Generar parejas de fondos combinando padres y candidatos
    for i in range(n_hijos):
        parent1 = parent_funds[padres[i]]
        #print(f'se ha juntado el: {padres[i]}')
        l_parent2 = parent_funds[candidatos[i]]
        #print(f'con alguno de los padres {candidatos[i]}')

        # Combinar padres y candidatos para generar la nueva pareja de fondos
        couple = combine_nextgen(parent1, l_parent2, df_rents) # emparejamiento variado inverso
        couples.append(couple)
        #print(f'----------------------')

    return couples


def create_next_gen(best_parent, best_parent_sharpe, couples, mean_rents, df_rents, n_explore=4):
    """
    Crea la siguiente generación de individuos a partir de los padres y las parejas creadas en la generación anterior.

    Parámetros:
    - best_parent: numpy array de strings. Fondos de inversión que conforman el mejor individuo de la generación anterior.
    - best_parent_sharpe: float. Sharpe ratio del mejor individuo de la generación anterior.
    - couples: lista de numpy arrays de strings. Pares de fondos de inversión que han sido seleccionados como padres de la siguiente generación.
    - n_explore: int. Número de nuevos fondos que se añadirán a cada hijo de la siguiente generación.

    Return:
    - ng_sharpe: numpy array de floats. Sharpe ratio de cada individuo de la siguiente generación.
    - next_gen_funds: numpy array de numpy arrays de strings. Fondos de inversión que conforman cada individuo de la siguiente generación.
    """
    next_gen_funds = list()
    ng_sharpe = list()

    next_gen_funds.append(best_parent) # el mejor de la generacion anterior
    ng_sharpe.append(best_parent_sharpe)

    new_fonds = np.random.choice(df_rents.columns.tolist(), size=(len(couples),n_explore)) # los nuevos fondos a explorar

    for i in range(len(couples)):
        #print(f'la preja es: {couples[i]}')
        fond_son = np.union1d(couples[i], new_fonds[i])
        #print(f'con los nuevos fondos es: {fond_son}')

        sh,w,hijo = best_marko(fond_son,mean_rents,df_rents)
        #print(f'tras aplicar markowitz: {hijo}')
        #print(f'----------------------')

        ng_sharpe.append(sh)
        next_gen_funds.append(hijo)

    next_gen_funds = np.array(next_gen_funds, dtype=object)
    ng_sharpe = np.array(ng_sharpe)

    return ng_sharpe, next_gen_funds


def select_parents_next_gen(ng_sharpe, next_gen_funds):
    """
    Selecciona los padres para la siguiente generación en función de su
    función de aptitud y devuelve el mejor padre de la generación anterior
    así como los que han pasado el umbral

    Args:
    - ng_sharpe (array-like): Array de flotantes que representan el valor Sharpe de cada
      cartera en la siguiente generación.
    - next_gen_funds (array-like): Array de arrays con los fondos de cada cartera en la
      siguiente generación.

    Returns:
    - parent_funds (array-like): Array de arrays con los fondos de los padres seleccionados.
    - best_parent (array): Array con los fondos del mejor padre de la generación anterior.
    - best_parent_sharpe (float): Valor Sharpe del mejor padre de la generación anterior.
    """


    # Normalizar la fitness
    fitness_norm = (ng_sharpe - min(ng_sharpe))/(max(ng_sharpe)-min(ng_sharpe))
    # Seleccionar un umbral aleatorio
    thresh = random.uniform(0,1)
    # Crear una máscara booleana para los padres que superan el umbral
    mask_thresh = fitness_norm > thresh

    # Seleccionar los padres que superan el umbral, el mejor y su fitness
    parent_funds = next_gen_funds[mask_thresh]
    best_parent = next_gen_funds[fitness_norm.argmax()]
    best_parent_sharpe = ng_sharpe[fitness_norm.argmax()]

    return parent_funds, best_parent, best_parent_sharpe







In [99]:

f2 = pd.to_datetime('2022-01-01')
f1 = f2 - pd.DateOffset(days=15)
#df_small = df_close.loc[f1:f2,:].dropna(axis=1)
#df = np.log(df_small).diff()
df = df_rets.loc[f1:f2,:].dropna(axis=1)
mean_r = df.mean()
n_indiv_inic=400
parent_funds, best_parent, best_parent_sharpe=select_parents(n_indiv_inic=n_indiv_inic, mean_rents=mean_r, df_rents=df, min_fond=1, max_fond=len(mean_r))

n_it = 100
cont = 0
opt = -np.Inf
it = 0

while cont<15 and it<n_it:
    it +=1
    print(it)
    print(cont)
    couples = generate_couples(parent_funds, df_rents=df, n_hijos=100, n_azar=3)
    ng_sharpe, next_gen_funds = create_next_gen(best_parent, best_parent_sharpe, couples, mean_rents=mean_r,df_rents=df, n_explore=4)
    parent_funds, best_parent, best_parent_sharpe = select_parents_next_gen(ng_sharpe, next_gen_funds)
    print(best_parent, best_parent_sharpe)
    print('--------------------------')
    cont += 1

    if best_parent_sharpe>opt:
        opt = best_parent_sharpe
        cont = 0


1
0
['ACX' 'AENA' 'ANA' 'PHM' 'REE'] 1.9355572758267963
--------------------------
2
0
['ACX' 'AENA' 'ANA' 'PHM' 'REE'] 1.9355572758267963
--------------------------
3
1
['ACX' 'AENA' 'ANA' 'CIE' 'PHM' 'REE'] 1.9596740465328373
--------------------------
4
0
['ACX' 'AENA' 'ANA' 'CIE' 'PHM' 'REE'] 1.9596740465328373
--------------------------
5
1
['ACX' 'AENA' 'ANA' 'CIE' 'PHM' 'REE'] 1.9596740465328373
--------------------------
6
2
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 'REE'] 2.023142523183408
--------------------------
7
0
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 'REE'] 2.023142523183408
--------------------------
8
1
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 'REE'] 2.023142523183408
--------------------------
9
2
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 'REE'] 2.023142523183408
--------------------------
10
3
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 'REE'] 2.023142523183408
--------------------------
11
4
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 'REE'] 2.023142523183408
--------------------------
12
5
['ACX' 'AENA' 'ANA' 'FER' 'PHM' 

In [98]:
print(f"['ACX' 'ANA' 'PHM' 'REE']")

['ACX' 'ANA' 'PHM' 'REE']


In [79]:
print(f'total padres: {len(parent_funds)}')
print(best_parent, best_parent_sharpe)

total padres: 80
['SGRE' 'MEL' 'BKT' 'CIE'] 0.9567458334934221


In [87]:
couples = generate_couples(parent_funds, df_rents=df, n_hijos=100, n_azar=3)
ng_sharpe, next_gen_funds = create_next_gen(best_parent, best_parent_sharpe, couples, mean_rents=mean_r,df_rents=df, n_explore=4)
parent_funds, best_parent, best_parent_sharpe = select_parents_next_gen(ng_sharpe, next_gen_funds)

In [89]:
print(best_parent, best_parent_sharpe)

['CIE' 'SGRE'] 1.406508174817915
