<a href="https://colab.research.google.com/github/brayanricardo13/Analisis-Econometrico/blob/main/Cesantias_y_Pensiones_Obligatorias.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [31]:
# Instalar la librería necesaria si aún no la tienes
!pip install pandas requests

import pandas as pd
import requests
import time  # Importamos la librería time para evitar sobrecargar el servidor

# URL del recurso JSON base
base_url = "https://www.datos.gov.co/resource/uawh-cjvi.json"

# Tamaño del lote (1000 filas por solicitud)
limit = 1000
offset = 0
all_data = []

print("Descargando datos históricos...")

while True:
    # Construir la URL con los parámetros $limit y $offset
    url = f"{base_url}?$limit={limit}&$offset={offset}"
    print(f"Solicitando datos desde el offset: {offset}")

    # Realizar la solicitud GET
    response = requests.get(url)

    # Verificar que la solicitud fue exitosa
    if response.status_code == 200:
        data = response.json()  # Convertir a formato JSON
        if not data:
            print("Se descargaron todos los datos.")
            break  # No hay más datos
        all_data.extend(data)
        offset += limit
        time.sleep(1) # Esperar 1 segundo entre solicitudes para ser respetuoso con el servidor
    else:
        print(f"Error al acceder a los datos en el offset {offset}: {response.status_code}")
        break

# Convertir toda la lista de diccionarios a un DataFrame de pandas
if all_data:
    df_historico = pd.DataFrame(all_data)
    print("Datos históricos cargados exitosamente.")
    display(df_historico.tail())  # Mostrar las últimas filas del DataFrame histórico
else:
    print("No se descargaron datos.")

Descargando datos históricos...
Solicitando datos desde el offset: 0
Solicitando datos desde el offset: 1000
Solicitando datos desde el offset: 2000
Solicitando datos desde el offset: 3000
Solicitando datos desde el offset: 4000
Solicitando datos desde el offset: 5000
Solicitando datos desde el offset: 6000
Solicitando datos desde el offset: 7000
Solicitando datos desde el offset: 8000
Solicitando datos desde el offset: 9000
Solicitando datos desde el offset: 10000
Solicitando datos desde el offset: 11000
Solicitando datos desde el offset: 12000
Solicitando datos desde el offset: 13000
Solicitando datos desde el offset: 14000
Solicitando datos desde el offset: 15000
Solicitando datos desde el offset: 16000
Solicitando datos desde el offset: 17000
Solicitando datos desde el offset: 18000
Solicitando datos desde el offset: 19000
Solicitando datos desde el offset: 20000
Solicitando datos desde el offset: 21000
Solicitando datos desde el offset: 22000
Solicitando datos desde el offset: 230

Unnamed: 0,fecha,codigo_entidad,nombre_entidad,codigo_patrimonio,nombre_fondo,valor_unidad
84736,2025-04-14T00:00:00.000,9,Skandia Pensiones Y Cesantías S.A.,1000,Fondo de Pensiones Moderado,57806.03
84737,2025-04-12T00:00:00.000,2,Proteccion,2,Fondo de Cesantias Corto Plazo,41465.44
84738,2025-04-09T00:00:00.000,2,Proteccion,1000,Fondo de Pensiones Moderado,82534.84
84739,2025-04-11T00:00:00.000,9,Skandia Pensiones Y Cesantías S.A.,5000,Fondo de Pensiones Conservador,53851.7
84740,2025-04-13T00:00:00.000,2,Proteccion,6000,Fondo de Pensiones Mayor Riesgo,83609.37


In [32]:
# Asumiendo que ya tienes el DataFrame 'df_historico' cargado

# Convertir la columna 'fecha' al tipo datetime
df_historico['fecha'] = pd.to_datetime(df_historico['fecha'])

# Ordenar el DataFrame por 'nombre_entidad' y luego por 'nombre_fondo'
df_ordenado = df_historico.sort_values(by=['nombre_entidad', 'nombre_fondo', 'fecha'])

# Mostrar las primeras filas del DataFrame ordenado
print("DataFrame ordenado por entidad, fondo y fecha:")
display(df_ordenado.head(1000))

DataFrame ordenado por entidad, fondo y fecha:


Unnamed: 0,fecha,codigo_entidad,nombre_entidad,codigo_patrimonio,nombre_fondo,valor_unidad
20,2016-01-01,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,21589.170000
45,2016-01-02,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,21592.010000
70,2016-01-03,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,21594.860000
95,2016-01-04,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,21597.080000
120,2016-01-05,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,21601.260000
...,...,...,...,...,...,...
24895,2018-09-22,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,25144.840000
24920,2018-09-23,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,25147.140000
24945,2018-09-24,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,25147.350000
24970,2018-09-25,10,Colfondos S.A. Pensiones Y Cesantias,2,Fondo de Cesantias Corto Plazo,25147.730000


In [33]:
import plotly.express as px

# Asumiendo que ya tienes el DataFrame 'df_fondo_corto_plazo' con la columna 'valor_normalizado'

# Crear la gráfica de líneas interactiva y más estilizada
fig = px.line(df_fondo_corto_plazo,
              x='fecha',
              y='valor_normalizado',
              color='nombre_entidad',
              title='<span style="font-size: 20px; font-weight: bold;">Evolución del Fondo de Cesantías Corto Plazo (Base 1000)</span>', # Título más grande y en negrita con HTML
              labels={'valor_normalizado': '<b>Valor Normalizado</b><br>(Base 1000)', # Etiqueta del eje y con salto de línea
                      'nombre_entidad': '<b>Entidad</b>',
                      'fecha': '<b>Fecha</b>'},
              hover_data={'nombre_entidad': True,
                          'valor_normalizado': ':.2f',
                          'fecha': '%Y-%m-%d'},
              template="plotly_white", # Mantenemos un tema base limpio
              line_shape='spline', # Líneas curvas para una apariencia más suave
              render_mode='svg') # Mejor calidad para exportación

# Personalizar el diseño con más detalle
fig.update_layout(
    title={
        'text': '<b>Evolución del Fondo de Cesantías Corto Plazo (Base 1000)</b>',
        'y': 0.95, # Ajustar la posición vertical del título (0 es abajo, 1 es arriba)
        'x': 0.5, # Centrar horizontalmente el título (0 es izquierda, 1 es derecha)
        'xanchor': 'center', # Asegurar que el centro del texto esté en la posición 'x'
        'yanchor': 'top' # Asegurar que la parte superior del texto esté en la posición 'y'
    },
    legend_title_text='<b>Entidades</b>',
    legend=dict(orientation="h", yanchor="bottom", y=-0.2, xanchor="center", x=0.5), # Leyenda centrada debajo
    xaxis=dict(showgrid=False, zeroline=False, title_standoff=10), # Ocultar cuadrícula y línea cero del eje x, espacio para el título
    yaxis=dict(showgrid=True, gridcolor='lightgray', zeroline=True, zerolinewidth=1, zerolinecolor='darkgray', title_standoff=10), # Línea cero destacada en el eje y
    plot_bgcolor='white',
    margin=dict(l=50, r=20, t=120, b=100), # Ajustar margen superior para el título centrado
    font=dict(family="Arial, sans-serif", size=11, color="black") # Fuente consistente
)

# Añadir anotaciones para resaltar puntos clave (opcional, requiere más análisis)
# Ejemplo: Resaltar el inicio de un periodo o un pico de rendimiento para una entidad
# fig.add_annotation(x='2016-06-01', y=1050, text="Pico de Ejemplo", showarrow=True, arrowhead=1)

fig.show()

In [34]:
import numpy as np
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Asumiendo que ya tienes el DataFrame 'df_fondo_corto_plazo'

def calculate_cagr_normalized(df):
    start_value = 1000
    end_value = df['valor_normalizado'].iloc[-1]
    start_date = df['fecha'].iloc[0]
    end_date = df['fecha'].iloc[-1]
    years = (end_date - start_date).days / 365.25
    return (np.power((end_value / start_value), (1 / years)) - 1) * 100 if years > 0 else 0

def calculate_volatility_normalized(df):
    df['daily_return'] = df['valor_normalizado'].pct_change()
    return df['daily_return'].std() * np.sqrt(252) * 100

def calculate_sharpe_ratio_normalized(df):
    cagr = calculate_cagr_normalized(df)
    volatility = calculate_volatility_normalized(df)
    return cagr / volatility if volatility > 0 else np.nan

# Calcular todas las métricas por entidad
rendimiento_final = df_fondo_corto_plazo.groupby('nombre_entidad')['valor_normalizado'].last().reset_index(name='Rendimiento Final (Base 1000)')
cagr_por_entidad = df_fondo_corto_plazo.groupby('nombre_entidad').apply(calculate_cagr_normalized).reset_index(name='CAGR (%)')
volatility_por_entidad = df_fondo_corto_plazo.groupby('nombre_entidad').apply(calculate_volatility_normalized).reset_index(name='Volatilidad Anual (%)')
sharpe_ratio_por_entidad = df_fondo_corto_plazo.groupby('nombre_entidad').apply(calculate_sharpe_ratio_normalized).reset_index(name='Ratio de Sharpe')

# Combinar todas las métricas en un solo DataFrame
df_consolidado = pd.merge(rendimiento_final, cagr_por_entidad, on='nombre_entidad')
df_consolidado = pd.merge(df_consolidado, volatility_por_entidad, on='nombre_entidad')
df_consolidado = pd.merge(df_consolidado, sharpe_ratio_por_entidad, on='nombre_entidad')

print(df_consolidado)

# Crear subplots
fig = make_subplots(rows=2, cols=2, subplot_titles=('Rendimiento Final (Base 1000)', 'CAGR (%)', 'Volatilidad Anual (%)', 'Ratio de Sharpe'))

# Gráfico de barras para el rendimiento final
fig.add_trace(go.Bar(x=df_consolidado['nombre_entidad'], y=df_consolidado['Rendimiento Final (Base 1000)'], name='Rendimiento Final'), row=1, col=1)

# Gráfico de barras para el CAGR
fig.add_trace(go.Bar(x=df_consolidado['nombre_entidad'], y=df_consolidado['CAGR (%)'], name='CAGR (%)'), row=1, col=2)

# Gráfico de barras para la volatilidad
fig.add_trace(go.Bar(x=df_consolidado['nombre_entidad'], y=df_consolidado['Volatilidad Anual (%)'], name='Volatilidad Anual (%)'), row=2, col=1)

# Gráfico de barras para el Ratio de Sharpe
fig.add_trace(go.Bar(x=df_consolidado['nombre_entidad'], y=df_consolidado['Ratio de Sharpe'], name='Ratio de Sharpe'), row=2, col=2)

# Actualizar el layout para una mejor presentación
fig.update_layout(title_text='<b>Métricas de Desempeño del Fondo de Cesantías Corto Plazo</b>', template="plotly_white", showlegend=False)
fig.update_yaxes(title_text="Valor", row=1, col=1)
fig.update_yaxes(title_text="%", row=1, col=2)
fig.update_yaxes(title_text="%", row=2, col=1)
fig.update_yaxes(title_text="Ratio", row=2, col=2)
fig.update_xaxes(title_text="Entidad", row=1, col=1)
fig.update_xaxes(title_text="Entidad", row=1, col=2)
fig.update_xaxes(title_text="Entidad", row=2, col=1)
fig.update_xaxes(title_text="Entidad", row=2, col=2)

# Mostrar la figura
fig.show()









                         nombre_entidad  Rendimiento Final (Base 1000)  \
0  Colfondos S.A. Pensiones Y Cesantias                    1736.593857   
1                              Porvenir                    1754.338943   
2                            Proteccion                    1779.031926   
3    Skandia Pensiones Y Cesantías S.A.                    1747.752420   

   CAGR (%)  Volatilidad Anual (%)  Ratio de Sharpe  
0  6.134458               0.317047        19.348735  
1  6.254723               0.923525         6.772665  
2  6.399538               1.422372         4.499203  
3  6.196498               0.420706        14.728822  
