In [1]:
# =============================================================================
# FASE 1: IMPORTACIÓN DE LIBRERÍAS Y CONFIGURACIÓN
# =============================================================================
import yfinance as yf
import pandas as pd
import numpy as np
import datetime as dt
import matplotlib.pyplot as plt
import seaborn as sns
from fredapi import Fred
from sqlalchemy import create_engine
from scipy.optimize import minimize
import os
from dotenv import load_dotenv

# Importaciones para Machine Learning
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score


In [7]:
# --- Configuración del Proyecto ---
# Activos a analizar
TICKERS_ACCIONES = ['aapl', 'sqm']
TICKER_ETF_MERCADO = 'SPY' # Usaremos el S&P 500 como proxy del mercado
TICKER_BONO_FRED = 'DGS10' # Tasa del Tesoro de EEUU a 10 años

# Fechas para el análisis histórico
END_DATE = dt.date.today()
START_DATE = END_DATE - dt.timedelta(days=5*365) # 5 años de datos

# Parámetros de la simulación
NUM_PORTFOLIOS = 25000
RISK_FREE_RATE = 0.0 # Asumimos 0 por simplicidad, se podría usar la tasa del bono

# Configuración para la base de datos (simulada con CSV en este ejemplo)
load_dotenv()

db_user = os.getenv("DB_USER")
db_password = os.getenv("DB_PASSWORD")
db_host = os.getenv("DB_HOST")
db_port = os.getenv("DB_PORT")
db_name = os.getenv("DB_NAME")
key = os.getenv("fred")
fred = Fred(api_key = key)

db_engine = create_engine(f'postgresql://{db_user}:{db_password}@{db_host}:{db_port}/{db_name}')


In [3]:
print(db_password)

123


In [4]:
# =============================================================================
# FASE 2: EXTRACCIÓN Y ALMACENAMIENTO DE DATOS (ETL)
# =============================================================================
def descargar_y_guardar_datos():
    """
    Descarga los datos históricos de las APIs y los guarda en una base de datos.
    """
    print("Iniciando descarga de datos...")
    
    # Descargar datos de acciones y ETF con yfinance
    activos = TICKERS_ACCIONES + [TICKER_ETF_MERCADO]
    datos_activos = yf.download(activos, start=START_DATE, end=END_DATE, auto_adjust = True)
    
    # Descargar datos de bonos desde FRED
    datos_bono = fred.get_series(TICKER_BONO_FRED, start=START_DATE, end=END_DATE)
    datos_bono = datos_bono / 100 # Rellenar nulos y convertir a decimal
    
    # Unir todos los datos en un solo DataFrame
    df_precios = datos_activos.join(datos_bono).ffill().dropna()
    df_precios.columns = TICKERS_ACCIONES + [TICKER_ETF_MERCADO] + ['BONO_USA_10Y']

    print("Datos descargados exitosamente.")
    
    # --- Simulación de guardado en SQL ---
    # En un proyecto real, aquí te conectarías a PostgreSQL y guardarías el DataFrame.
    # Por simplicidad, aquí lo guardamos en una base de datos SQLite local.
    try:
        df_precios.to_sql('precios_historicos', db_engine, if_exists='replace', index=True)
        print(f"Datos guardados en la tabla 'precios_historicos' de la base de datos.")
    except Exception as e:
        print(f"Error al guardar en la base de datos: {e}")
        
    return df_precios

def cargar_datos_desde_db():
    """
    Carga los datos desde la base de datos a un DataFrame de pandas.
    """
    try:
        df = pd.read_sql('SELECT * FROM precios_historicos', db_engine, index_col='fecha')
        df.index = pd.to_datetime(df.index)
        print("Datos cargados desde la base de datos.")
        return df
    except Exception as e:
        print(f"Error al cargar desde la base de datos, descargando de nuevo... ({e})")
        return descargar_y_guardar_datos()

# Ejecutamos las funciones ETL
df_precios = cargar_datos_desde_db()



Datos cargados desde la base de datos.


In [8]:
# =============================================================================
# FASE 3: CÁLCULO DE RETORNOS Y VOLATILIDAD
# =============================================================================
# Nos quedamos solo con los activos de nuestro portafolio
df_portafolio = df_precios[TICKERS_ACCIONES + ['bono_usa_10y']]
retornos = df_portafolio.pct_change().dropna()

retornos_medios_anual = retornos.mean() * 252
matriz_cov_anual = retornos.cov() * 252

print("\n--- Retornos Medios Anualizados ---")
print(retornos_medios_anual)



--- Retornos Medios Anualizados ---
aapl            NaN
sqm             NaN
bono_usa_10y    NaN
dtype: object


  avg = a.mean(axis, **keepdims_kw)
  ret = um.true_divide(
  base_cov = np.cov(mat.T, ddof=ddof)
  c *= np.true_divide(1, fact)
  c *= np.true_divide(1, fact)


In [None]:
# =============================================================================
# FASE 4: OPTIMIZACIÓN DE PORTAFOLIO (MONTE CARLO)
# =============================================================================
print(f"\nEjecutando simulación de Monte Carlo con {NUM_PORTFOLIOS} portafolios...")

resultados = []
pesos_portafolios = []
num_activos = len(df_portafolio.columns)

for i in range(NUM_PORTFOLIOS):
    # Generar pesos aleatorios
    pesos = np.random.random(num_activos)
    pesos /= np.sum(pesos)
    pesos_portafolios.append(pesos)
    
    # Calcular retorno y volatilidad del portafolio
    retorno_portafolio = np.sum(retornos_medios_anual * pesos)
    volatilidad_portafolio = np.sqrt(np.dot(pesos.T, np.dot(matriz_cov_anual, pesos)))
    
    # Calcular Ratios
    sharpe = (retorno_portafolio - RISK_FREE_RATE) / volatilidad_portafolio
    
    # Para el Sortino, calculamos la volatilidad a la baja
    retornos_negativos = retornos[retornos < 0]
    volatilidad_baja = retornos_negativos.cov() * 252
    sortino_downside_vol = np.sqrt(np.dot(pesos.T, np.dot(volatilidad_baja, pesos)))
    sortino = (retorno_portafolio - RISK_FREE_RATE) / sortino_downside_vol if sortino_downside_vol > 0 else 0
    
    resultados.append([retorno_portafolio, volatilidad_portafolio, sharpe, sortino])

# Crear DataFrame con los resultados de la simulación
df_resultados = pd.DataFrame(resultados, columns=['retorno', 'volatilidad', 'sharpe', 'sortino'])
df_pesos = pd.DataFrame(pesos_portafolios, columns=df_portafolio.columns)
df_simulacion = pd.concat([df_resultados, df_pesos], axis=1)

# Identificar portafolios óptimos
max_sortino_port = df_simulacion.loc[df_simulacion['sortino'].idxmax()]
min_vol_port = df_simulacion.loc[df_simulacion['volatilidad'].idxmin()]

print("\n--- Portafolio de Mínima Volatilidad ---")
print(min_vol_port.tail(num_activos))
print("\n--- Portafolio de Máximo Ratio de Sortino ---")
print(max_sortino_port.tail(num_activos))

# --- Cuantificación del Riesgo (VaR Histórico) ---
retornos_portafolio_optimo = (retornos * max_sortino_port.tail(num_activos)).sum(axis=1)
var_95 = np.percentile(retornos_portafolio_optimo, 5)
print(f"\nVaR al 95% del portafolio óptimo: {var_95:.2%}")
print(f"Esto significa que hay un 5% de probabilidad de perder más del {abs(var_95):.2%} en un día.")



In [None]:
# =============================================================================
# FASE 5: VISUALIZACIÓN DE LA FRONTERA EFICIENTE
# =============================================================================
plt.figure(figsize=(12, 8))
plt.scatter(df_simulacion['volatilidad'], df_simulacion['retorno'], c=df_simulacion['sortino'], cmap='viridis', marker='o', s=10, alpha=0.5)
plt.colorbar(label='Ratio de Sortino')
plt.scatter(max_sortino_port['volatilidad'], max_sortino_port['retorno'], marker='*', color='r', s=500, label='Máximo Ratio de Sortino')
plt.scatter(min_vol_port['volatilidad'], min_vol_port['retorno'], marker='*', color='b', s=500, label='Mínima Volatilidad')
plt.title('Simulación de Monte Carlo - Frontera Eficiente')
plt.xlabel('Volatilidad Anualizada')
plt.ylabel('Retorno Anualizado')
plt.legend(labelspacing=0.8)
plt.show()


In [None]:
# =============================================================================
# FASE 6: MACHINE LEARNING PARA PREDICCIÓN DE RÉGIMEN DE VOLATILIDAD
# =============================================================================
print("\n--- Entrenando modelo de ML para predecir régimen de volatilidad ---")
# Usaremos los datos del S&P 500 (SPY) para definir el régimen
spy_retornos = df_precios[TICKER_ETF_MERCADO].pct_change().dropna()
spy_volatilidad = spy_retornos.rolling(window=21).std() * np.sqrt(252) # Volatilidad móvil de 1 mes

# 1. Feature Engineering
df_ml = pd.DataFrame(index=spy_volatilidad.index)
df_ml['volatilidad_pasada'] = spy_volatilidad.shift(1)
df_ml['retorno_pasado_1m'] = spy_retornos.rolling(window=21).mean().shift(1)
df_ml['retorno_pasado_3m'] = spy_retornos.rolling(window=63).mean().shift(1)

# 2. Creación del Target
umbral_volatilidad = spy_volatilidad.quantile(0.75) # Consideramos 'alta volatilidad' por sobre el percentil 75
df_ml['regimen_futuro'] = (spy_volatilidad.shift(-21) > umbral_volatilidad).astype(int)

df_ml = df_ml.dropna()

# 3. Entrenamiento del Modelo
X = df_ml.drop('regimen_futuro', axis=1)
y = df_ml['regimen_futuro']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=False, random_state=42)

ml_model = RandomForestClassifier(n_estimators=100, random_state=42)
ml_model.fit(X_train, y_train)

print(f"Accuracy del modelo de ML en datos de prueba: {accuracy_score(y_test, ml_model.predict(X_test)):.2%}")

# 4. Predicción y Aplicación
ultimas_features = X.tail(1)
prediccion_regimen = ml_model.predict(ultimas_features)[0]

print("\n--- Recomendación Estratégica Basada en ML ---")
if prediccion_regimen == 1:
    print("📈 Régimen de ALTA VOLATILIDAD predicho para el próximo mes.")
    print("Recomendación: Usar el portafolio de MÍNIMA VOLATILIDAD para preservar capital.")
    print(min_vol_port.tail(num_activos))
else:
    print("📉 Régimen de BAJA VOLATILIDAD predicho para el próximo mes.")
    print("Recomendación: Usar el portafolio de MÁXIMO RATIO DE SORTINO para maximizar retornos ajustados por riesgo.")
    print(max_sortino_port.tail(num_activos))