# Indexación Jerárquica

In [None]:
import pandas as pd
import numpy as np

## Series Indexadas de forma Múltiple

In [None]:
# Forma incorrecta
index = [('California', 2010), ('California', 2020),
         ('New York', 2010), ('New York', 2020),
         ('Texas', 2010), ('Texas', 2020)]
populations = [37253956, 39538223,
               19378102, 20201249,
               25145561, 29145505]

pop = pd.Series(populations, index=index)
pop

Unnamed: 0,0
"(California, 2010)",37253956
"(California, 2020)",39538223
"(New York, 2010)",19378102
"(New York, 2020)",20201249
"(Texas, 2010)",25145561
"(Texas, 2020)",29145505


In [None]:
pop[('California', 2020):('Texas', 2010)]

Unnamed: 0,0
"(California, 2020)",39538223
"(New York, 2010)",19378102
"(New York, 2020)",20201249
"(Texas, 2010)",25145561


In [None]:
pop[[i for i in pop.index if i[1] == 2010]]

Unnamed: 0,0
"(California, 2010)",37253956
"(New York, 2010)",19378102
"(Texas, 2010)",25145561


In [None]:
index = pd.MultiIndex.from_tuples(index)
index

MultiIndex([('California', 2010),
            ('California', 2020),
            (  'New York', 2010),
            (  'New York', 2020),
            (     'Texas', 2010),
            (     'Texas', 2020)],
           )

In [None]:
pop = pop.reindex(index)
pop

Unnamed: 0,Unnamed: 1,0
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


In [None]:
pop[:, 2020]

Unnamed: 0,0
California,39538223
New York,20201249
Texas,29145505


In [None]:
pop_df = pop.unstack()
pop_df

Unnamed: 0,2010,2020
California,37253956,39538223
New York,19378102,20201249
Texas,25145561,29145505


In [None]:
pop_df = pd.DataFrame({'total': pop,
                       'under18': [9284094, 8898092,
                                   4318033, 4181528,
                                   6879014, 7432474]})
pop_df

Unnamed: 0,Unnamed: 1,total,under18
California,2010,37253956,9284094
California,2020,39538223,8898092
New York,2010,19378102,4318033
New York,2020,20201249,4181528
Texas,2010,25145561,6879014
Texas,2020,29145505,7432474


In [None]:
f_u18 = pop_df['under18'] / pop_df['total']
f_u18

Unnamed: 0,Unnamed: 1,0
California,2010,0.249211
California,2020,0.22505
New York,2010,0.222831
New York,2020,0.206994
Texas,2010,0.273568
Texas,2020,0.255013


In [None]:
f_u18.unstack()

Unnamed: 0,2010,2020
California,0.249211,0.22505
New York,0.222831,0.206994
Texas,0.273568,0.255013


## Métodos de Creación de MultiIndex

In [None]:
df = pd.DataFrame(np.random.rand(4, 2),
                  index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]],
                  columns=['data1', 'data2'])
df

Unnamed: 0,Unnamed: 1,data1,data2
a,1,0.532657,0.545505
a,2,0.186372,0.435744
b,1,0.86336,0.244064
b,2,0.646269,0.173523


In [None]:
data = {('California', 2010): 37253956,
        ('California', 2020): 39538223,
        ('New York', 2010): 19378102,
        ('New York', 2020): 20201249,
        ('Texas', 2010): 25145561,
        ('Texas', 2020): 29145505}
pd.Series(data)

Unnamed: 0,Unnamed: 1,0
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


In [None]:
pd.MultiIndex.from_arrays([['a', 'a', 'b', 'b'], [1, 2, 1, 2]])

MultiIndex([('a', 1),
            ('a', 2),
            ('b', 1),
            ('b', 2)],
           )

In [None]:
pd.MultiIndex.from_tuples([('a', 1), ('a', 2), ('b', 1), ('b', 2)])

MultiIndex([('a', 1),
            ('a', 2),
            ('b', 1),
            ('b', 2)],
           )

In [None]:
pd.MultiIndex.from_product([['a', 'b'], [1, 2]])

MultiIndex([('a', 1),
            ('a', 2),
            ('b', 1),
            ('b', 2)],
           )

## MultiIndex Nombres

In [None]:
pop.index.names = ['state', 'year']
pop

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


## MultiIndex en Columnas

In [None]:
index = pd.MultiIndex.from_product([[2013, 2014], [1, 2]],
                                   names=['year', 'visit'])
columns = pd.MultiIndex.from_product([['Bob', 'Guido', 'Sue'], ['HR', 'Temp']],
                                     names=['subject', 'type'])

data = np.round(np.random.randn(4, 6), 1)
data[:, ::2] *=2
data += 37

data

array([[38. , 37. , 35.2, 36.2, 37.4, 38.5],
       [34.8, 36.6, 34.6, 37.8, 39.6, 37.2],
       [37.6, 35.3, 38.8, 37.9, 38.2, 37.3],
       [34.8, 36.5, 36.4, 36.6, 36.4, 37.2]])

In [None]:
health_data = pd.DataFrame(data, index=index, columns=columns)
health_data

Unnamed: 0_level_0,subject,Bob,Bob,Guido,Guido,Sue,Sue
Unnamed: 0_level_1,type,HR,Temp,HR,Temp,HR,Temp
year,visit,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2
2013,1,38.0,37.0,35.2,36.2,37.4,38.5
2013,2,34.8,36.6,34.6,37.8,39.6,37.2
2014,1,37.6,35.3,38.8,37.9,38.2,37.3
2014,2,34.8,36.5,36.4,36.6,36.4,37.2


In [None]:
health_data['Guido']

Unnamed: 0_level_0,type,HR,Temp
year,visit,Unnamed: 2_level_1,Unnamed: 3_level_1
2013,1,35.2,36.2
2013,2,34.6,37.8
2014,1,38.8,37.9
2014,2,36.4,36.6


## Indexing y Slicing en MultiIndex

In [None]:
pop

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


In [None]:
pop['California', 2010]

np.int64(37253956)

In [None]:
pop['California']

Unnamed: 0_level_0,0
year,Unnamed: 1_level_1
2010,37253956
2020,39538223


In [None]:
pop.loc['California':'New York']

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249


In [None]:
pop[:, 2010]

Unnamed: 0_level_0,0
state,Unnamed: 1_level_1
California,37253956
New York,19378102
Texas,25145561


In [None]:
pop[pop > 22000000]

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
Texas,2010,25145561
Texas,2020,29145505


## DataFrames con Múltiple Indexación

In [None]:
health_data

Unnamed: 0_level_0,subject,Bob,Bob,Guido,Guido,Sue,Sue
Unnamed: 0_level_1,type,HR,Temp,HR,Temp,HR,Temp
year,visit,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2
2013,1,38.0,37.0,35.2,36.2,37.4,38.5
2013,2,34.8,36.6,34.6,37.8,39.6,37.2
2014,1,37.6,35.3,38.8,37.9,38.2,37.3
2014,2,34.8,36.5,36.4,36.6,36.4,37.2


In [None]:
health_data['Guido', 'HR']

Unnamed: 0_level_0,Unnamed: 1_level_0,Guido
Unnamed: 0_level_1,Unnamed: 1_level_1,HR
year,visit,Unnamed: 2_level_2
2013,1,35.2
2013,2,34.6
2014,1,38.8
2014,2,36.4


In [None]:
health_data.iloc[:2, :2]

Unnamed: 0_level_0,subject,Bob,Bob
Unnamed: 0_level_1,type,HR,Temp
year,visit,Unnamed: 2_level_2,Unnamed: 3_level_2
2013,1,38.0,37.0
2013,2,34.8,36.6


In [None]:
health_data.loc[:, ('Bob', 'HR')]

Unnamed: 0_level_0,Unnamed: 1_level_0,Bob
Unnamed: 0_level_1,Unnamed: 1_level_1,HR
year,visit,Unnamed: 2_level_2
2013,1,38.0
2013,2,34.8
2014,1,37.6
2014,2,34.8


In [None]:
health_data.loc[(:, 1), ('Bob', 'HR')]

SyntaxError: invalid syntax (<ipython-input-40-9a9cba6fef4e>, line 1)

## Ordenado de Índices

In [None]:
index = pd.MultiIndex.from_product([['a', 'c', 'b'], [1, 2]])
data = pd.Series(np.random.rand(6), index=index)
data.index.names = ['char', 'int']
data

Unnamed: 0_level_0,Unnamed: 1_level_0,0
char,int,Unnamed: 2_level_1
a,1,0.899893
a,2,0.44639
c,1,0.562854
c,2,0.285918
b,1,0.458591
b,2,0.288916


In [None]:
data['a':'b']

UnsortedIndexError: 'Key length (1) was greater than MultiIndex lexsort depth (0)'

In [None]:
data = data.sort_index()
data

Unnamed: 0_level_0,Unnamed: 1_level_0,0
char,int,Unnamed: 2_level_1
a,1,0.899893
a,2,0.44639
b,1,0.458591
b,2,0.288916
c,1,0.562854
c,2,0.285918


In [None]:
data['a':'b']

Unnamed: 0_level_0,Unnamed: 1_level_0,0
char,int,Unnamed: 2_level_1
a,1,0.899893
a,2,0.44639
b,1,0.458591
b,2,0.288916


## Stacking y Unstacking

In [None]:
pop

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


In [None]:
pop.unstack()

year,2010,2020
state,Unnamed: 1_level_1,Unnamed: 2_level_1
California,37253956,39538223
New York,19378102,20201249
Texas,25145561,29145505


In [None]:
pop.unstack(level=0)

state,California,New York,Texas
year,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2010,37253956,19378102,25145561
2020,39538223,20201249,29145505


In [None]:
pop.unstack(level=1)

year,2010,2020
state,Unnamed: 1_level_1,Unnamed: 2_level_1
California,37253956,39538223
New York,19378102,20201249
Texas,25145561,29145505


In [None]:
pop.unstack().stack()

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


## Resetting de índice

In [None]:
pop

Unnamed: 0_level_0,Unnamed: 1_level_0,0
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


In [None]:
pop_flat = pop.reset_index(name='population')
pop_flat

Unnamed: 0,state,year,population
0,California,2010,37253956
1,California,2020,39538223
2,New York,2010,19378102
3,New York,2020,20201249
4,Texas,2010,25145561
5,Texas,2020,29145505


In [None]:
pop_flat.set_index(['state', 'year'])

Unnamed: 0_level_0,Unnamed: 1_level_0,population
state,year,Unnamed: 2_level_1
California,2010,37253956
California,2020,39538223
New York,2010,19378102
New York,2020,20201249
Texas,2010,25145561
Texas,2020,29145505


# Ejercicios de Indexación Jerárquica en Pandas

## Ejercicio 1: Creación de MultiIndex y operaciones básicas


```python
import pandas as pd
import numpy as np

# 1.1 Crea un MultiIndex utilizando from_product con las siguientes categorías:
# - Regiones: 'Norte', 'Sur', 'Este', 'Oeste'
# - Años: 2021, 2022
# - Trimestres: 'Q1', 'Q2', 'Q3', 'Q4'
# Tu código aquí

# 1.2 Crea una Series con el MultiIndex anterior y datos aleatorios entre 100 y 1000 (enteros)
# para representar ventas trimestrales
# Pista: Necesitarás 32 valores aleatorios (4 regiones × 2 años × 4 trimestres)
# Tu código aquí

# 1.3 Asigna nombres adecuados a los niveles del índice: 'region', 'año', 'trimestre'
# Tu código aquí

# 1.4 Accede a las ventas del 'Norte' para el año 2022
# Tu código aquí

# 1.5 Accede a las ventas de todas las regiones para el primer trimestre (Q1) de 2021
# Tu código aquí

# 1.6 Calcula el promedio de ventas por región (independientemente del año y trimestre)
# Tu código aquí

# 1.7 Reorganiza los datos usando unstack para convertir el nivel 'trimestre' en columnas
# Tu código aquí

# 1.8 A partir del resultado anterior, convierte el nivel 'año' en columnas
# para tener una vista más compacta con la región como único índice
# Tu código aquí
```

## Ejercicio 2: Manipulación avanzada de MultiIndex en DataFrames


```python
import pandas as pd
import numpy as np

# 2.1 Crea un DataFrame con los siguientes datos:
# - MultiIndex para filas con dos niveles: 'estudiante' y 'periodo'
#   - Estudiantes: 'Ana', 'Carlos', 'Elena'
#   - Períodos: 'Parcial1', 'Parcial2', 'Final'
# - MultiIndex para columnas con dos niveles: 'asignatura' y 'métrica'
#   - Asignaturas: 'Matemáticas', 'Ciencias', 'Historia'
#   - Métricas: 'nota', 'asistencia'
# - Rellena el DataFrame con:
#   - Notas aleatorias entre 60 y 100
#   - Asistencia aleatoria entre 70% y 100%
# Tu código aquí

# 2.2 Accede a todas las notas de 'Matemáticas' para todos los estudiantes y períodos
# Tu código aquí

# 2.3 Obtén todas las métricas de 'Ana' para el 'Parcial1'
# Tu código aquí

# 2.4 Calcula el promedio de notas por estudiante en todas las asignaturas
# (independientemente del período)
# Tu código aquí

# 2.5 Calcula el promedio de asistencia por asignatura
# (independientemente del estudiante y período)
# Tu código aquí

# 2.6 Encuentra al estudiante con la mejor nota final en 'Ciencias'
# Tu código aquí

# 2.7 Reorganiza el DataFrame para tener un formato donde:
# - Las filas sean los estudiantes
# - Las columnas sean una combinación de asignatura, período y métrica
# Pista: usa un método stack/unstack adecuado
# Tu código aquí

# 2.8 A partir de tu DataFrame original, reinicia el índice para obtener un DataFrame
# "plano" donde 'estudiante' y 'periodo' sean columnas normales
# Tu código aquí

# 2.9 A partir del DataFrame "plano", vuelve a establecer el índice multinivel original
# usando set_index
# Tu código aquí
```

In [None]:
## Ejercicio 1: Creación de MultiIndex y operaciones básicas


import pandas as pd
import numpy as np

# 1.1 Crea un MultiIndex utilizando from_product
regiones = ['Norte', 'Sur', 'Este', 'Oeste']
años = [2021, 2022]
trimestres = ['Q1', 'Q2', 'Q3', 'Q4']

idx = pd.MultiIndex.from_product([regiones, años, trimestres])
print("MultiIndex creado:")
print(idx)

# 1.2 Crea una Series con el MultiIndex
np.random.seed(42)  # Para reproducibilidad
ventas = pd.Series(np.random.randint(100, 1000, size=len(idx)), index=idx)
print("\nSeries con ventas trimestrales:")
print(ventas.head(8))  # Mostrar primeras 8 filas

# 1.3 Asigna nombres a los niveles del índice
ventas.index.names = ['region', 'año', 'trimestre']
print("\nSeries con nombres de niveles:")
print(ventas.head(8))

# 1.4 Accede a las ventas del 'Norte' para el año 2022
ventas_norte_2022 = ventas.loc[('Norte', 2022)]
print("\nVentas del Norte en 2022:")
print(ventas_norte_2022)

# 1.5 Accede a las ventas de todas las regiones para el primer trimestre (Q1) de 2021
ventas_q1_2021 = ventas.loc[(slice(None), 2021, 'Q1')]
# Alternativa usando IndexSlice
idx = pd.IndexSlice
ventas_q1_2021_alt = ventas.loc[idx[:, 2021, 'Q1']]
print("\nVentas del Q1 de 2021 para todas las regiones:")
print(ventas_q1_2021)

# 1.6 Calcula el promedio de ventas por región
ventas_promedio_region = ventas.groupby('region').mean()
print("\nPromedio de ventas por región:")
print(ventas_promedio_region)

# 1.7 Reorganiza los datos usando unstack para el nivel 'trimestre'
ventas_unstacked_trimestre = ventas.unstack(level='trimestre')
print("\nDatos con trimestres como columnas:")
print(ventas_unstacked_trimestre)

# 1.8 Convierte también el nivel 'año' en columnas
ventas_unstacked_completo = ventas_unstacked_trimestre.unstack(level='año')
print("\nDatos con años y trimestres como columnas:")
print(ventas_unstacked_completo)


In [None]:
# 2.1 Crea un DataFrame con MultiIndex para filas y columnas
np.random.seed(42)  # Para reproducibilidad

# Índices para filas y columnas
estudiantes = ['Ana', 'Carlos', 'Elena']
periodos = ['Parcial1', 'Parcial2', 'Final']
asignaturas = ['Matemáticas', 'Ciencias', 'Historia']
metricas = ['nota', 'asistencia']

# Crear MultiIndex para filas y columnas
idx_filas = pd.MultiIndex.from_product([estudiantes, periodos],
                                      names=['estudiante', 'periodo'])
idx_columnas = pd.MultiIndex.from_product([asignaturas, metricas],
                                         names=['asignatura', 'métrica'])

# Generar datos aleatorios
notas = np.random.randint(60, 101, size=(len(idx_filas), len(asignaturas)))
asistencia = np.random.randint(70, 101, size=(len(idx_filas), len(asignaturas)))

# Crear array para todos los datos
data = np.empty((len(idx_filas), len(idx_columnas)))
for i in range(len(asignaturas)):
    data[:, i*2] = notas[:, i]        # Notas (columnas pares)
    data[:, i*2+1] = asistencia[:, i] # Asistencia (columnas impares)

# Crear DataFrame
calificaciones = pd.DataFrame(data, index=idx_filas, columns=idx_columnas)
print("DataFrame de calificaciones:")
print(calificaciones)

# 2.2 Accede a todas las notas de 'Matemáticas'
notas_matematicas = calificaciones.loc[:, ('Matemáticas', 'nota')]
print("\nNotas de Matemáticas:")
print(notas_matematicas)

# 2.3 Obtén todas las métricas de 'Ana' para el 'Parcial1'
ana_parcial1 = calificaciones.loc[('Ana', 'Parcial1'), :]
print("\nMétricas de Ana en el Parcial1:")
print(ana_parcial1)

# 2.4 Calcula el promedio de notas por estudiante
idx = pd.IndexSlice
notas_df = calificaciones.loc[:, idx[:, 'nota']]
promedio_por_estudiante = notas_df.groupby('estudiante').mean()
print("\nPromedio de notas por estudiante:")
print(promedio_por_estudiante)

# 2.5 Calcula el promedio de asistencia por asignatura
asistencia_df = calificaciones.loc[:, idx[:, 'asistencia']]
promedio_asistencia_asignatura = asistencia_df.mean(axis=0)
print("\nPromedio de asistencia por asignatura:")
print(promedio_asistencia_asignatura)

# 2.6 Encuentra al estudiante con la mejor nota final en 'Ciencias'
idx = pd.IndexSlice
notas_finales_ciencias = calificaciones.loc[idx[:, 'Final'], idx['Ciencias', 'nota']]
mejor_estudiante_ciencias = notas_finales_ciencias.idxmax()[0]  # Solo necesitamos el estudiante
print(f"\nEstudiante con mejor nota final en Ciencias: {mejor_estudiante_ciencias}")

# 2.7 Reorganiza el DataFrame
reorganizado = calificaciones.unstack(level=0)  # Estudiantes a columnas
print("\nDataFrame reorganizado:")
print(reorganizado.head())

# 2.8 Reinicia el índice para obtener un DataFrame "plano"
calificaciones_plano = calificaciones.reset_index()
print("\nDataFrame plano:")
print(calificaciones_plano.head())

# 2.9 Vuelve a establecer el índice multinivel
calificaciones_multinivel = calificaciones_plano.set_index(['estudiante', 'periodo'])
print("\nDataFrame con índice multinivel restablecido:")
print(calificaciones_multinivel.head())

DataFrame de calificaciones:
asignatura          Matemáticas            Ciencias            Historia  \
métrica                    nota asistencia     nota asistencia     nota   
estudiante periodo                                                        
Ana        Parcial1        98.0       96.0     88.0      100.0     74.0   
           Parcial2        67.0       97.0     80.0       97.0     98.0   
           Final           78.0       84.0     82.0       99.0     70.0   
Carlos     Parcial1        70.0       84.0     83.0       99.0     95.0   
           Parcial2        99.0       81.0     83.0       92.0     62.0   
           Final           81.0       94.0     61.0       72.0     83.0   
Elena      Parcial1        89.0       88.0     97.0       76.0     61.0   
           Parcial2        80.0       78.0     92.0       76.0     71.0   
           Final           81.0       73.0     84.0       94.0     86.0   

asignatura                      
métrica             asistencia  
estu

## Bonus: IndexSlice
Según documentación de pandas: Create an object to more easily perform multi-index slicing.

In [None]:
import pandas as pd
import numpy as np

index = pd.MultiIndex.from_product([['2023', '2024'], [1, 2]],
                                   names=['año', 'visita'])

columns = pd.MultiIndex.from_product([['Ana', 'Juan', 'María'], ['Temp', 'HR']],
                                     names=['paciente', 'medida'])

np.random.seed(42)
data = np.round(np.random.randn(4, 6), 1)
data[:, ::2] *= 10
data += 37

health_data = pd.DataFrame(data, index=index, columns=columns)
print(health_data)

paciente      Ana        Juan       María      
medida       Temp    HR  Temp    HR  Temp    HR
año  visita                                    
2023 1       42.0  36.9  43.0  38.5  35.0  36.8
     2       53.0  37.8  32.0  37.5  32.0  36.5
2024 1       39.0  35.1  20.0  36.4  27.0  37.3
     2       28.0  35.6  52.0  36.8  38.0  35.6


In [None]:
idx = pd.IndexSlice

# Seleccionar todas las medidas de HR para todos los años y visitas
health_data.loc[:,idx[:,'HR']]

Unnamed: 0_level_0,paciente,Ana,Juan,María
Unnamed: 0_level_1,medida,HR,HR,HR
año,visita,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2
2023,1,36.9,38.5,36.8
2023,2,37.8,37.5,36.5
2024,1,35.1,36.4,37.3
2024,2,35.6,36.8,35.6


In [None]:
# Seleccionar solo la visita 1 de todos los años y todas las medidas
health_data.loc[idx[:, 1], :]

Unnamed: 0_level_0,paciente,Ana,Ana,Juan,Juan,María,María
Unnamed: 0_level_1,medida,Temp,HR,Temp,HR,Temp,HR
año,visita,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2
2023,1,42.0,36.9,43.0,38.5,35.0,36.8
2024,1,39.0,35.1,20.0,36.4,27.0,37.3


In [None]:
# Selección más específica: solo HR de la visita 1
health_data.loc[idx[:,1], idx[:, 'HR']]

Unnamed: 0_level_0,paciente,Ana,Juan,María
Unnamed: 0_level_1,medida,HR,HR,HR
año,visita,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2
2023,1,36.9,38.5,36.8
2024,1,35.1,36.4,37.3


In [None]:
# Seleccionar datos del año 2023 y paciente Ana
health_data.loc[idx['2023', :], idx['Ana', :]]

Unnamed: 0_level_0,paciente,Ana,Ana
Unnamed: 0_level_1,medida,Temp,HR
año,visita,Unnamed: 2_level_2,Unnamed: 3_level_2
2023,1,42.0,36.9
2023,2,53.0,37.8


In [None]:
# Seleccionar temperatura de todos los pacientes en la visita 2 de 2024
health_data.loc[idx['2024', 2], idx[:, 'Temp']]

Unnamed: 0_level_0,Unnamed: 1_level_0,2024
Unnamed: 0_level_1,Unnamed: 1_level_1,2
paciente,medida,Unnamed: 2_level_2
Ana,Temp,28.0
Juan,Temp,52.0
María,Temp,38.0
