# Descarga del Cuadro 1 desde SPensiones

En esta clase vamos a replicar, de forma simplificada, la l√≥gica utilizada en el proyecto **FondosdePensiones** para descargar informaci√≥n desde la Superintendencia de Pensiones.

El objetivo ser√°:

1. Acceder al √≠ndice mensual de carteras agregadas.
2. Obtener el primer cuadro disponible en formato HTML.
3. Descargar el contenido del cuadro.
4. Decodificar correctamente el HTML.
5. Transformar los n√∫meros desde formato chileno a formato est√°ndar.
6. Convertir la tabla en un DataFrame utilizando pandas.

Este ser√° el insumo para construir posteriormente un panel de datos mensual.

In [1]:
#LIBRER√çAS
import requests
import pandas as pd
import re
from bs4 import BeautifulSoup
from urllib.parse import urljoin
from io import StringIO

## Problemas comunes con datos de SPensiones

Al descargar tablas desde SPensiones nos enfrentamos a:

### üî§ Problemas de codificaci√≥n

Ejemplo:

INVERSI√ìN ‚Üí INVERSI√É¬ìN  
Esto ocurre porque el HTML no viene en UTF-8.

---

### üî¢ Formato num√©rico europeo

Las tablas contienen n√∫meros como:

| Original | Significado |
|----------|-------------|
| 4.471,70 | 4471.70 |
| 12.345 | 12345 |
| 123,4 | 123.4 |

Este formato no es reconocido por pandas, por lo que debemos transformarlo previamente.

In [2]:
#DECODIFICACI√ìN (DEL PROYECTO)
def decode_html(resp):

    raw = resp.content

    try:
        return raw.decode("utf-8")
    except UnicodeDecodeError:
        pass

    enc = (resp.apparent_encoding or "").lower().strip()
    if enc:
        try:
            return raw.decode(enc, errors="replace")
        except Exception:
            pass

    return raw.decode("latin1", errors="replace")

## Transformaci√≥n del formato num√©rico

Antes de leer la tabla con pandas debemos transformar:

1.234,56 ‚Üí 1234.56  
12.345 ‚Üí 12345  
123,4 ‚Üí 123.4  

‚ö†Ô∏è IMPORTANTE:

Debemos modificar SOLO los n√∫meros dentro del HTML,
sin alterar texto, encabezados ni atributos.

In [3]:
#TRANSFORMACI√ìN NUM√âRICA (DEL PROYECTO)
_RE_CH_NUM = re.compile(
    r"\b\d{1,3}(?:\.\d{3})*(?:,\d+)?\b|\b\d+(?:,\d+)\b|\b\d+\b"
)

def _to_float_token(token):
    return token.replace(".", "").replace(",", ".")

def _transformar_solo_numeros_en_texto(text):

    def _repl(m):
        return _to_float_token(m.group(0))

    return _RE_CH_NUM.sub(_repl, text)

def _html_transformar_solo_numeros(html):

    soup = BeautifulSoup(html, "html.parser")

    for node in soup.find_all(string=True):

        if node.parent.name in ("script", "style"):
            continue

        original = str(node)

        if not original.strip():
            continue

        nuevo = _transformar_solo_numeros_en_texto(original)

        if nuevo != original:
            node.replace_with(nuevo)

    return str(soup)

## Descarga del Cuadro 1

SPensiones publica m√∫ltiples cuadros mensuales.

Para simplificar:

Tomaremos el **primer link disponible en formato HTML**
correspondiente al Cuadro 1.

## 1. Creaci√≥n de la sesi√≥n HTTP

Para acceder a SPensiones debemos simular un navegador web.

Esto se realiza mediante el objeto `Session()` de la librer√≠a `requests`.

Esto permite:

- Mantener conexi√≥n persistente (Keep-Alive)
- Reducir latencia
- Enviar encabezados HTTP personalizados

En particular debemos indicar:

- `User-Agent`: identifica el cliente como navegador
- `Referer`: p√°gina de origen requerida por SPensiones

In [4]:
s = requests.Session()

s.headers.update({
    "User-Agent": "Mozilla/5.0",
    "Referer": "https://www.spensiones.cl/apps/centroEstadisticas/paginaCuadrosCCEE.php"
})

## 2. Acceso al √≠ndice mensual

SPensiones organiza los cuadros mensuales mediante
una p√°gina intermedia que act√∫a como √≠ndice.

La URL contiene el par√°metro:

- `periodo`: formato YYYYMM

In [5]:
BASE = "https://www.spensiones.cl"
periodo = "202001"

url = f"{BASE}/apps/loadCarteras/loadCarAgr.php?menu=sci&menuN1=estfinfp&menuN2=NOID&orden=20&periodo={periodo}&ext=.php"

r = s.get(url)

## 3. Extracci√≥n del link del Cuadro

La p√°gina anterior no contiene directamente la tabla.

Contiene enlaces que apuntan a los cuadros en HTML.

Utilizamos BeautifulSoup para:

- Parsear el HTML
- Identificar los enlaces disponibles
- Tomar el primer link correspondiente al Cuadro 1

In [6]:
soup = BeautifulSoup(r.text, "html.parser")

a = soup.find("a", title="Html")

if a is None:
    print("No hay cuadro disponible")

real_link = urljoin(BASE, a["href"])
print(real_link)

https://www.spensiones.cl/apps/carteras/genera_xsl_v2.0.php?param=L09hMXNCSkZ6Qk5yQ0hKK1phTmdjZjVGSklOOS9tcWJxVUFyelc4MjhwMCtrWWU0dlk3MVRnPT0=


## 4. Descarga del HTML del Cuadro

Ahora descargamos el contenido real de la tabla.

‚ö†Ô∏è IMPORTANTE:

No utilizamos `.text`
ya que puede generar problemas de codificaci√≥n.

In [7]:
r2 = s.get(real_link)
html = decode_html(r2)

## 5. Conversi√≥n del formato num√©rico

Los datos se encuentran en formato europeo:

1.234,56 ‚Üí 1234.56

Debemos transformar √∫nicamente los n√∫meros
sin modificar texto o encabezados.

In [8]:
html_transformado = _html_transformar_solo_numeros(html)

In [9]:
print(html_transformado)

<html>
<head>
<title>Superintendencia de Pensiones - SP</title>
<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>
<link href="https://www.spensiones.cl/css/appscreen.css" rel="stylesheet" type="text/css"/>
<script src="/javascript/functions.js" type="text/javascript"></script>
</head>
<body><div class="col-sm-10 col-sm-offset-1">
<h3>CUADRO N¬∫ 1: CARTERA AGREGADA DE LOS FONDOS DE PENSIONES POR TIPO DE FONDO</h3>
<h3>Al 31-01-2020 - En millones de d√≥lares y porcentaje</h3>
<table class="table">
<tr>
<th align="center" rowspan="2"> </th>
<th align="center" colspan="2">A</th>
<th align="center" colspan="2">B</th>
<th align="center" colspan="2">C</th>
<th align="center" colspan="2">D</th>
<th align="center" colspan="2">E</th>
<th align="center" colspan="2">TOTAL</th>
</tr>
<tr>
<th>MMUS$</th>
<th>%Fondo</th>
<th>MMUS$</th>
<th>%Fondo</th>
<th>MMUS$</th>
<th>%Fondo</th>
<th>MMUS$</th>
<th>%Fondo</th>
<th>MMUS$</th>
<th>%Fondo</th>
<th>MMUS$</th>
<th>%Fondo</th>
</tr>
<t

## 6. Conversi√≥n a DataFrame

Finalmente utilizamos pandas para:

- Leer la tabla HTML
- Detectar encabezado multinivel
- Convertir columnas num√©ricas

In [10]:
from io import StringIO

tablas = pd.read_html(StringIO(html_transformado), header=[0,1])

df = tablas[0]

for col in df.columns[1:]:
    df[col] = pd.to_numeric(df[col], errors="coerce")

df.head()

Unnamed: 0_level_0,Unnamed: 0_level_0,A,A,B,B,C,C,D,D,E,E,TOTAL,TOTAL
Unnamed: 0_level_1,Unnamed: 0_level_1.1,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo
0,INVERSI√ìN NACIONAL TOTAL,4471.7,16.09,10903.82,33.05,37625.73,50.99,25176.07,70.19,32144.42,90.9,110321.73,53.6
1,RENTA VARIABLE,3802.3,13.68,3821.15,11.58,6239.95,8.46,1359.31,3.79,728.47,2.06,15951.18,7.75
2,Acciones,3123.52,11.24,3281.8,9.95,5206.25,7.06,1104.92,3.08,722.18,2.04,13438.68,6.53
3,Fondos de Inversi√≥n y Otros (4),621.12,2.23,470.21,1.43,871.06,1.18,213.46,0.6,4.05,0.01,2179.89,1.06
4,Activos Alternativos (5),57.67,0.21,69.15,0.21,162.64,0.22,40.93,0.11,2.23,0.01,332.61,0.16


## Automatizaci√≥n del proceso

Una vez comprendidas las etapas del proceso,
podemos encapsularlas en una funci√≥n
para facilitar su reutilizaci√≥n.

In [11]:
#FUNCI√ìN FINAL
def bajar_primer_cuadro(periodo):

    BASE = "https://www.spensiones.cl"

    s = requests.Session()
    s.headers.update({
        "User-Agent": "Mozilla/5.0",
        "Referer": "https://www.spensiones.cl/apps/centroEstadisticas/paginaCuadrosCCEE.php"
    })

    url = f"{BASE}/apps/loadCarteras/loadCarAgr.php?menu=sci&menuN1=estfinfp&menuN2=NOID&orden=20&periodo={periodo}&ext=.php"

    r = s.get(url)
    soup = BeautifulSoup(r.text, "html.parser")

    a = soup.find("a", title="Html")

    if a is None:
        print("‚ùå No hay link")
        return None

    real_link = urljoin(BASE, a["href"])

    r2 = s.get(real_link)
    html = decode_html(r2)

    html_transformado = _html_transformar_solo_numeros(html)

    tablas = pd.read_html(StringIO(html_transformado), header=[0,1])

    df = tablas[0]

    for col in df.columns[1:]:
        df[col] = pd.to_numeric(df[col], errors="coerce")

    return df

## Ejemplo: Periodo Enero 2020

Ahora descargaremos el Cuadro 1 correspondiente al periodo 202001.

In [12]:
#EJECUCI√ìN
df = bajar_primer_cuadro("202001")
df.head()

Unnamed: 0_level_0,Unnamed: 0_level_0,A,A,B,B,C,C,D,D,E,E,TOTAL,TOTAL
Unnamed: 0_level_1,Unnamed: 0_level_1.1,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo
0,INVERSI√ìN NACIONAL TOTAL,4471.7,16.09,10903.82,33.05,37625.73,50.99,25176.07,70.19,32144.42,90.9,110321.73,53.6
1,RENTA VARIABLE,3802.3,13.68,3821.15,11.58,6239.95,8.46,1359.31,3.79,728.47,2.06,15951.18,7.75
2,Acciones,3123.52,11.24,3281.8,9.95,5206.25,7.06,1104.92,3.08,722.18,2.04,13438.68,6.53
3,Fondos de Inversi√≥n y Otros (4),621.12,2.23,470.21,1.43,871.06,1.18,213.46,0.6,4.05,0.01,2179.89,1.06
4,Activos Alternativos (5),57.67,0.21,69.15,0.21,162.64,0.22,40.93,0.11,2.23,0.01,332.61,0.16


## Guardado a CSV (Opcional)

Para utilizar esta informaci√≥n posteriormente
(en Excel o para construir paneles de datos),
podemos guardar el DataFrame como CSV.

In [13]:
#GUARDAR
df.to_csv("cartera_agregada_202001.csv", index=False, encoding="utf-8-sig")

# Descarga masiva: todos los meses de un a√±o

Hasta ahora hemos descargado el Cuadro 1 para un √∫nico periodo.

Sin embargo, en an√°lisis financiero y econom√©trico
necesitamos construir **series de tiempo** o **paneles de datos**.

Para esto debemos descargar la informaci√≥n de m√∫ltiples meses.

---

## Objetivo

Descargar el Cuadro 1 para:

202001  
202002  
...  
202012  

Es decir, todos los meses del a√±o 2020.

## Generaci√≥n autom√°tica de periodos

Los periodos deben estar en formato:

YYYYMM

Por ejemplo:

202001  
202002  
202003  

Podemos generar estos valores utilizando un ciclo `for`.

In [14]:
periodos = []

for mes in range(1,13):
    periodo = f"2020{mes:02d}"
    periodos.append(periodo)

periodos

['202001',
 '202002',
 '202003',
 '202004',
 '202005',
 '202006',
 '202007',
 '202008',
 '202009',
 '202010',
 '202011',
 '202012']

## Descarga iterativa de los cuadros

Ahora utilizaremos:

- Nuestra funci√≥n `bajar_primer_cuadro()`
- Un ciclo `for`
- Una lista para almacenar los resultados

Cada tabla ser√° guardada como un DataFrame independiente.

In [15]:
dataframes = []

for periodo in periodos:

    print(f"Procesando {periodo}")

    try:
        df = bajar_primer_cuadro(periodo)

        if df is not None:

            # üî• agregar columna PERIODO
            df["PERIODO"] = periodo

            dataframes.append(df)

    except Exception as e:
        print(f"Error en {periodo}: {e}")

Procesando 202001
Procesando 202002
Procesando 202003
Procesando 202004
Procesando 202005
Procesando 202006
Procesando 202007
Procesando 202008
Procesando 202009
Procesando 202010
Procesando 202011
Procesando 202012


## Verificaci√≥n de resultados

Podemos verificar cu√°ntos meses fueron descargados correctamente.

In [16]:
len(dataframes)

12

## Construcci√≥n de panel de datos

Una vez descargadas todas las tablas mensuales,
podemos combinarlas en un √∫nico DataFrame
utilizando `pd.concat()`.

In [17]:
panel_2020 = pd.concat(dataframes, ignore_index=True)

panel_2020

Unnamed: 0_level_0,Unnamed: 0_level_0,A,A,B,B,C,C,D,D,E,E,TOTAL,TOTAL,PERIODO
Unnamed: 0_level_1,Unnamed: 0_level_1.1,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,Unnamed: 14_level_1
0,INVERSI√ìN NACIONAL TOTAL,4471.70,16.09,10903.82,33.05,37625.73,50.99,25176.07,70.19,32144.42,90.90,110321.73,53.60,202001
1,RENTA VARIABLE,3802.30,13.68,3821.15,11.58,6239.95,8.46,1359.31,3.79,728.47,2.06,15951.18,7.75,202001
2,Acciones,3123.52,11.24,3281.80,9.95,5206.25,7.06,1104.92,3.08,722.18,2.04,13438.68,6.53,202001
3,Fondos de Inversi√≥n y Otros (4),621.12,2.23,470.21,1.43,871.06,1.18,213.46,0.60,4.05,0.01,2179.89,1.06,202001
4,Activos Alternativos (5),57.67,0.21,69.15,0.21,162.64,0.22,40.93,0.11,2.23,0.01,332.61,0.16,202001
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
379,TOTAL ACTIVOS,27292.67,100.00,29182.36,100.00,70982.81,100.00,38066.60,100.00,48152.02,100.00,213676.45,100.00,202012
380,SUBTOTAL RENTA VARIABLE,21842.44,80.03,17738.43,60.78,28756.22,40.51,7637.44,20.06,2350.89,4.88,78325.43,36.66,202012
381,SUBTOTAL RENTA FIJA,5111.13,18.73,10966.00,37.58,41196.16,58.04,29922.28,78.61,45237.52,93.95,132433.09,61.98,202012
382,SUBTOTAL DERIVADOS,169.76,0.62,351.41,1.20,765.01,1.08,344.30,0.90,391.83,0.81,2022.31,0.95,202012


Antes de transformar a formato Long,
debemos inspeccionar los nombres de columnas.

En particular, verificar si la variable PERIODO
se mantiene correctamente despu√©s de la concatenaci√≥n.

Las columnas se encuentran en formato multinivel (MultiIndex).

Debemos convertir estos encabezados en nombres planos
antes de utilizar la funci√≥n melt().

In [18]:
panel_2020.columns

MultiIndex([('Unnamed: 0_level_0', 'Unnamed: 0_level_1'),
            (                 'A',              'MMUS$'),
            (                 'A',             '%Fondo'),
            (                 'B',              'MMUS$'),
            (                 'B',             '%Fondo'),
            (                 'C',              'MMUS$'),
            (                 'C',             '%Fondo'),
            (                 'D',              'MMUS$'),
            (                 'D',             '%Fondo'),
            (                 'E',              'MMUS$'),
            (                 'E',             '%Fondo'),
            (             'TOTAL',              'MMUS$'),
            (             'TOTAL',             '%Fondo'),
            (           'PERIODO',                   '')],
           )

# Wide ‚Üí Long (correcto) usando `stack` sobre MultiIndex

Nuestro `panel_2020` est√° en formato **Wide** y sus columnas son un **MultiIndex**:

- **Nivel 0**: Fondo (A, B, C, D, E, TOTAL)
- **Nivel 1**: M√©trica (MMUS$, %Fondo)

En formato Long queremos que **FONDO** y **METRICA** sean variables separadas, no un string tipo `A_MMUSD`.

Por eso NO usamos `melt` juntando nombres, sino `stack(level=[0,1])`.

In [19]:
df = panel_2020.copy()
df.head()

Unnamed: 0_level_0,Unnamed: 0_level_0,A,A,B,B,C,C,D,D,E,E,TOTAL,TOTAL,PERIODO
Unnamed: 0_level_1,Unnamed: 0_level_1.1,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,Unnamed: 14_level_1
0,INVERSI√ìN NACIONAL TOTAL,4471.7,16.09,10903.82,33.05,37625.73,50.99,25176.07,70.19,32144.42,90.9,110321.73,53.6,202001
1,RENTA VARIABLE,3802.3,13.68,3821.15,11.58,6239.95,8.46,1359.31,3.79,728.47,2.06,15951.18,7.75,202001
2,Acciones,3123.52,11.24,3281.8,9.95,5206.25,7.06,1104.92,3.08,722.18,2.04,13438.68,6.53,202001
3,Fondos de Inversi√≥n y Otros (4),621.12,2.23,470.21,1.43,871.06,1.18,213.46,0.6,4.05,0.01,2179.89,1.06,202001
4,Activos Alternativos (5),57.67,0.21,69.15,0.21,162.64,0.22,40.93,0.11,2.23,0.01,332.61,0.16,202001


## 1) Identificar las columnas "id" (identificadores)

Para construir un panel Long necesitamos al menos dos identificadores:

- **TipoInstrumento**: la categor√≠a (texto) de la fila
- **PERIODO**: el mes en formato YYYYMM

El resto de columnas corresponde a combinaciones (FONDO, METRICA).

‚ö†Ô∏è Detalle importante:
Cuando un DataFrame tiene columnas MultiIndex, una columna simple como PERIODO
puede quedar guardada como `('PERIODO','')` en vez de `"PERIODO"`.
Por eso primero la detectamos de forma robusta.

In [20]:
tipo_col = df.columns[0]

periodo_col = None
if "PERIODO" in df.columns:
    periodo_col = "PERIODO"
else:
    for c in df.columns:
        if isinstance(c, tuple) and str(c[0]).strip().upper() == "PERIODO":
            periodo_col = c
            break

if periodo_col is None:
    raise KeyError("No se encontr√≥ la columna PERIODO en el DataFrame")

tipo_col, periodo_col

(('Unnamed: 0_level_0', 'Unnamed: 0_level_1'), 'PERIODO')

## 2) Pasar identificadores a √≠ndice (`set_index`)

Para usar `stack`, primero convertimos nuestros identificadores en √≠ndice.
Esto significa:

- Las filas quedar√°n identificadas por (TipoInstrumento, PERIODO)
- Las columnas quedar√°n como MultiIndex (FONDO, METRICA)

En otras palabras: dejamos el DataFrame listo para ‚Äúapilar‚Äù los niveles de columnas.

In [21]:
dfi = df.set_index([tipo_col, periodo_col])
dfi.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,A,A,B,B,C,C,D,D,E,E,TOTAL,TOTAL
Unnamed: 0_level_1,Unnamed: 1_level_1,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo,MMUS$,%Fondo
"(Unnamed: 0_level_0, Unnamed: 0_level_1)",PERIODO,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2
INVERSI√ìN NACIONAL TOTAL,202001,4471.7,16.09,10903.82,33.05,37625.73,50.99,25176.07,70.19,32144.42,90.9,110321.73,53.6
RENTA VARIABLE,202001,3802.3,13.68,3821.15,11.58,6239.95,8.46,1359.31,3.79,728.47,2.06,15951.18,7.75
Acciones,202001,3123.52,11.24,3281.8,9.95,5206.25,7.06,1104.92,3.08,722.18,2.04,13438.68,6.53
Fondos de Inversi√≥n y Otros (4),202001,621.12,2.23,470.21,1.43,871.06,1.18,213.46,0.6,4.05,0.01,2179.89,1.06
Activos Alternativos (5),202001,57.67,0.21,69.15,0.21,162.64,0.22,40.93,0.11,2.23,0.01,332.61,0.16


## 3) Transformaci√≥n Wide ‚Üí Long usando `stack(level=[0,1])`

`stack()` toma niveles de columnas y los baja a filas.

Aqu√≠ hacemos:

- `stack(level=0)` baja el Fondo (A,B,C...)
- `stack(level=1)` baja la M√©trica (MMUS$, %Fondo)

Como queremos ambos identificadores separados, usamos:

`stack(level=[0,1])`

Resultado:

- FONDO pasa a ser una columna
- METRICA pasa a ser una columna
- y queda una columna final llamada `valor`

In [22]:
panel_long = (
    dfi
    .stack(level=[0, 1])
    .reset_index()
)

panel_long.head()

Unnamed: 0,"(Unnamed: 0_level_0, Unnamed: 0_level_1)",PERIODO,level_2,level_3,0
0,INVERSI√ìN NACIONAL TOTAL,202001,A,MMUS$,4471.7
1,INVERSI√ìN NACIONAL TOTAL,202001,A,%Fondo,16.09
2,INVERSI√ìN NACIONAL TOTAL,202001,B,MMUS$,10903.82
3,INVERSI√ìN NACIONAL TOTAL,202001,B,%Fondo,33.05
4,INVERSI√ìN NACIONAL TOTAL,202001,C,MMUS$,37625.73


## 4) Renombrar columnas finales

Despu√©s de `reset_index()` pandas deja nombres gen√©ricos.

Queremos un panel limpio con columnas:

- TipoInstrumento
- PERIODO
- FONDO
- METRICA
- valor

Esto deja el dataset listo para an√°lisis econom√©trico, gr√°ficos y concatenaci√≥n de periodos.

In [23]:
panel_long.columns = ["TipoInstrumento", "PERIODO", "FONDO", "METRICA", "valor"]
panel_long.head()

Unnamed: 0,TipoInstrumento,PERIODO,FONDO,METRICA,valor
0,INVERSI√ìN NACIONAL TOTAL,202001,A,MMUS$,4471.7
1,INVERSI√ìN NACIONAL TOTAL,202001,A,%Fondo,16.09
2,INVERSI√ìN NACIONAL TOTAL,202001,B,MMUS$,10903.82
3,INVERSI√ìN NACIONAL TOTAL,202001,B,%Fondo,33.05
4,INVERSI√ìN NACIONAL TOTAL,202001,C,MMUS$,37625.73


## (Opcional) Normalizar m√©tricas

Para estandarizar el panel:

- MMUS$ ‚Üí MMUSD
- %Fondo ‚Üí PCT

Esto evita problemas al concatenar a√±os o hacer an√°lisis.

In [24]:
panel_long["METRICA"] = (
    panel_long["METRICA"]
    .astype(str)
    .str.replace("MMUS$", "MMUSD", regex=False)
    .str.replace("%Fondo", "PCT", regex=False)
)

panel_long.head()

Unnamed: 0,TipoInstrumento,PERIODO,FONDO,METRICA,valor
0,INVERSI√ìN NACIONAL TOTAL,202001,A,MMUSD,4471.7
1,INVERSI√ìN NACIONAL TOTAL,202001,A,PCT,16.09
2,INVERSI√ìN NACIONAL TOTAL,202001,B,MMUSD,10903.82
3,INVERSI√ìN NACIONAL TOTAL,202001,B,PCT,33.05
4,INVERSI√ìN NACIONAL TOTAL,202001,C,MMUSD,37625.73


## (Opcional) Normalizar nombres de m√©tricas

A veces el segundo nivel trae `MMUS$` y `%Fondo`.
Podemos renombrarlo a:

- MMUS$ ‚Üí MMUSD
- %Fondo ‚Üí PCT

Esto deja el panel consistente para an√°lisis y para concatenar a√±os.

In [25]:
panel_long["METRICA"] = (
    panel_long["METRICA"]
    .astype(str)
    .str.replace("MMUS$", "MMUSD", regex=False)
    .str.replace("%Fondo", "PCT", regex=False)
)

panel_long.head()

Unnamed: 0,TipoInstrumento,PERIODO,FONDO,METRICA,valor
0,INVERSI√ìN NACIONAL TOTAL,202001,A,MMUSD,4471.7
1,INVERSI√ìN NACIONAL TOTAL,202001,A,PCT,16.09
2,INVERSI√ìN NACIONAL TOTAL,202001,B,MMUSD,10903.82
3,INVERSI√ìN NACIONAL TOTAL,202001,B,PCT,33.05
4,INVERSI√ìN NACIONAL TOTAL,202001,C,MMUSD,37625.73


## Guardar el panel Long

Guardamos en CSV para usar en Excel / an√°lisis posterior.

In [26]:
panel_long.to_csv("panel_cartera_agregada_2020_long.csv",
                   index=False, encoding="utf-8-sig")
