# Índice y manipulación de índice

El índice de un DataFrame puede ser configurado al momento de la creación del DataFrame o modificado posteriormente utilizando varios métodos. 

Para establecer una columna como índice, se utiliza el método ``set_index()``. Este método devuelve un nuevo DataFrame con la columna especificada como índice:

In [3]:
import pandas as pd

# Crear un DataFrame de ejemplo
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
})

# Establecer la columna 'A' como índice
df_indexed = df.set_index('A')
print(df_indexed)

   B  C
A      
1  4  7
2  5  8
3  6  9


Para restablecer el índice a su estado original, se utiliza el método ``reset_index()``, que **devuelve el índice a una columna del DataFrame:**

In [5]:
# Restablecer el índice a una columna
df_reset = df_indexed.reset_index()
print(df_reset)

   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9


Es posible establecer **múltiples columnas como índice**, creando un índice jerárquico (MultiIndex). Esto se puede lograr pasando una lista de columnas al método ``set_index()``:

In [9]:
# Establecer múltiples columnas como índice
df_multi_indexed = df.set_index(['A', 'B'])
print(df_multi_indexed)

     C
A B   
1 4  7
2 5  8
3 6  9


El acceso a los datos en un DataFrame con un índice jerárquico se realiza utilizando el método ``xs()`` (cross-section), que permite seleccionar datos en niveles específicos del índice:

In [12]:
# Acceder a los datos en un índice jerárquico
cross_section = df_multi_indexed.xs(key=2, level='A')
print(cross_section)

   C
B   
5  8


Para renombrar el índice, se puede utilizar el método ``rename_axis()``, que permite cambiar el nombre del índice sin modificar los datos:

In [15]:
# Renombrar el índice
df_renamed_index = df_indexed.rename_axis('NewIndex')
print(df_renamed_index)

          B  C
NewIndex      
1         4  7
2         5  8
3         6  9


En ocasiones, es útil cambiar el tipo de datos del índice. Esto se puede lograr utilizando el método ``astype()``:

In [18]:
# Cambiar el tipo de datos del índice a cadena de texto
df_indexed.index = df_indexed.index.astype(str)
print(df_indexed)

   B  C
A      
1  4  7
2  5  8
3  6  9


Para ordenar un DataFrame basado en su índice, se utiliza el método ``sort_index()``, que ordena el DataFrame según los valores del índice:

In [21]:
# Ordenar el DataFrame basado en el índice
df_sorted = df_indexed.sort_index()
print(df_sorted)

   B  C
A      
1  4  7
2  5  8
3  6  9


Además, pandas permite la reindexación de un DataFrame utilizando el método ``reindex()``, que ajusta el DataFrame a un nuevo índice, agregando filas con valores faltantes (NaN) si el nuevo índice contiene valores que no estaban en el índice original:

In [24]:
# Reindexar el DataFrame
new_index = [1, 2, 3, 4]
df_reindexed = df_indexed.reindex(new_index)
print(df_reindexed)

    B   C
A        
1 NaN NaN
2 NaN NaN
3 NaN NaN
4 NaN NaN


Finalmente, para trabajar con índices de fechas, pandas proporciona el método ``pd.date_range()`` para crear un índice de fechas y el método set_index() para establecerlo en el DataFrame:

In [27]:
# Crear un índice de fechas y establecerlo en el DataFrame
date_index = pd.date_range(start='2023-01-01', periods=3, freq='D')
df_date_indexed = df.set_index(date_index)
print(df_date_indexed)

            A  B  C
2023-01-01  1  4  7
2023-01-02  2  5  8
2023-01-03  3  6  9
