# Indexado

In [None]:
import pandas as pd

In [None]:
datos_perros = {
    'Nombre': ['Max', 'Bella', 'Charlie', 'Luna', 'Cooper', 'Lucy', 'Max', 'Daisy', 'Rocky', 'Luna', 'Buddy',
               'Molly', 'Charlie', 'Sadie', 'Toby', 'Lucy', 'Max', 'Milo', 'Bella', 'Bailey', 'Max', 'Buddy',
               'Lola', 'Daisy', 'Cooper', 'Bentley', 'Luna', 'Charlie', 'Max', 'Lucy'],
    'Raza': ['Labrador Retriever', 'Poodle', 'German Shepherd', 'Bulldog', 'Golden Retriever', 'Beagle',
             'Labrador Retriever', 'Poodle', 'German Shepherd', 'Bulldog', 'Golden Retriever', 'Beagle',
             'Labrador Retriever', 'Poodle', 'German Shepherd', 'Bulldog', 'Golden Retriever', 'Beagle',
             'Labrador Retriever', 'Poodle', 'German Shepherd', 'Bulldog', 'Golden Retriever', 'Beagle',
             'Labrador Retriever', 'Poodle', 'German Shepherd', 'Bulldog', 'Golden Retriever', 'Beagle'],
    'Color': ['Negro', 'Blanco', 'Marrón', 'Atigrado', 'Dorado', 'Tricolor', 'Negro', 'Blanco', 'Marrón',
              'Atigrado', 'Dorado', 'Tricolor', 'Negro', 'Blanco', 'Marrón', 'Atigrado', 'Dorado', 'Tricolor',
              'Negro', 'Blanco', 'Marrón', 'Atigrado', 'Dorado', 'Tricolor', 'Negro', 'Blanco', 'Marrón',
              'Atigrado', 'Dorado', 'Tricolor'],
    'Altura (cm)': [60, 40, 65, 35, 55, 30, 60, 40, 65, 35, 55, 30, 60, 40, 65, 35, 55, 30, 60, 40, 65, 35, 55, 30, 60,
               40, 65, 35, 55, 30],
    'Peso (kg)': [25, 15, 30, 20, 35, 12, 25, 15, 30, 20, 35, 12, 25, 15, 30, 20, 35, 12, 25, 15, 30, 20, 35, 12, 25, 15,
             30, 20, 35, 12]
}

# Crear DataFrame
df = pd.DataFrame(datos_perros)
df.head()


## Subconjuntos con LOC y ILOC

### loc

La función loc en Pandas es un método de indexación basado en etiquetas que permite acceder a filas y columnas específicas en un DataFrame utilizando etiquetas de índice o etiquetas de columna. 

- **Acceso por etiquetas de índice:** Puedes utilizar etiquetas de índice para acceder a filas específicas en el DataFrame. Por ejemplo, *df.loc['etiqueta']* devolverá la fila con la etiqueta de índice correspondiente.

- **Acceso por rango de etiquetas de índice:** También puedes especificar un rango de etiquetas de índice para seleccionar un conjunto de filas consecutivas. Por ejemplo, *df.loc['inicio':'fin']* devolverá todas las filas desde la etiqueta de inicio hasta la etiqueta de fin, inclusive.

- **Acceso por etiquetas de columna:** Además de las filas, loc también permite acceder a columnas específicas utilizando etiquetas de columna. Por ejemplo, *df.loc[:, 'columna']* devolverá la columna con la etiqueta de columna especificada.

In [None]:
df.loc[0]

EL método loc **si incluye** el índice final.

In [None]:
df.loc[0: 5]

In [None]:
df.loc[0: 3, ['Raza', 'Color']]

### iloc

 El método iloc en Pandas es una función de indexación basada en enteros que permite acceder a filas y columnas específicas en un DataFrame utilizando índices enteros.

- ** Acceso por posición de índice:** Puedes utilizar índices enteros para acceder a filas y columnas específicas en el DataFrame. Por ejemplo, *df.iloc[0]* devolverá la primera fila del DataFrame.

- **Acceso por rango de posición de índice:** También puedes especificar un rango de índices enteros para seleccionar un conjunto de filas o columnas consecutivas. Por ejemplo, *df.iloc[0:3]* devolverá las primeras tres filas del DataFrame.

- **Acceso selectivo de filas y columnas:** Puedes combinar índices enteros para realizar una indexación selectiva de filas y columnas. Por ejemplo, *df.iloc[0, 1]* devolverá el valor en la primera fila y segunda columna del DataFrame.

- **Indexación con listas de índices:** Además de los índices individuales, también puedes utilizar listas de índices enteros para seleccionar filas o columnas específicas. Por ejemplo, *df.iloc[[0, 2, 4], [1, 3]]* devolverá las filas 0, 2 y 4, y las columnas 1 y 3 del DataFrame.

In [None]:
df.iloc[0]

iloc **no incluye** el índice final

In [None]:
df.iloc[0: 5]

In [None]:
df.iloc[:, -1]

## Índices explícitos 

Los índices explícitos (explicit indexes) se refieren a los índices definidos explícitamente por el usuario para identificar y acceder a filas específicas en un DataFrame. 


Cuando creas un DataFrame, se genera un índice por defecto que consta de enteros consecutivos. Sin embargo, es posible definir un índice explícito utilizando el método ***set_index()***. 

Este método permite establecer una columna existente como el nuevo índice del DataFrame.

In [None]:
df = df.set_index('Nombre')
df.sample(5)

Podemos regresar los indices a su estado original.

In [None]:
df = df.reset_index()
df.sample(5)

Los índices nos pueden ayudar a hacer consultas mas sencillas en los datos, por ejemplo, supongamos que queremos encontrar los perros cuyo nombre sea Lucy o Daisy.

In [None]:
df[df['Nombre'].isin(['Daisy', 'Lucy'])]

Podemos hacer esta consulta más fácil de entender con índices explícitos.

In [None]:
df_ind = df.set_index('Nombre')
df_ind.loc[['Daisy', 'Lucy']]

Los indices no necesitan ser unicos

In [None]:
df_raza = df.set_index('Raza')
df_raza.head()

In [None]:
df_raza.loc['Poodle']

Pandas cuenta con una función para ordenar de manera sencilla por indices, esta función trabaja de la misma manera que la función sort_values

In [None]:
df_raza.sort_index().head(8)

Podemos tener multiples indices

In [None]:
df_multi = df.set_index(['Raza', 'Nombre'])
df_multi.head(10)

In [None]:
df_multi.sort_index(ascending=[False, True]).head(10)