- 5. Manipulación avanzada de índices y selección de datos con Pandas
    
    ### Instrucciones:
    
    1. **Carga el dataset:** Usa el siguiente código para cargar el conjunto de datos `iris` de `scikit-learn` y convertirlo en un `DataFrame` de pandas. Asegúrate de utilizar la columna `species` como índice.

In [15]:
import pandas as pd
from sklearn.datasets import load_iris

# Cargar el dataset
data = load_iris()
df = pd.DataFrame(data.data, columns=data.feature_names)

# Añadir la columna 'species'
df['species'] = data.target_names[data.target]

# Establecer 'species' como índice
df.set_index('species', inplace=True)

# Mostrar las primeras filas para ver cómo está estructurado el DataFrame
df.head()

Unnamed: 0_level_0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm)
species,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
setosa,5.1,3.5,1.4,0.2
setosa,4.9,3.0,1.4,0.2
setosa,4.7,3.2,1.3,0.2
setosa,4.6,3.1,1.5,0.2
setosa,5.0,3.6,1.4,0.2


1. **Ejercicio 1 - Cambiar el índice:**
    - Usa el método `set_index()` para cambiar el índice del DataFrame a la columna 'sepal length (cm)'.
    - Muestra las primeras filas de este DataFrame modificado.

In [16]:
slcm_index = df.set_index("sepal length (cm)")
slcm_index.head()

Unnamed: 0_level_0,sepal width (cm),petal length (cm),petal width (cm)
sepal length (cm),Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
5.1,3.5,1.4,0.2
4.9,3.0,1.4,0.2
4.7,3.2,1.3,0.2
4.6,3.1,1.5,0.2
5.0,3.6,1.4,0.2


2. **Ejercicio 2 - Resetear el índice:**
    - Usa el método `reset_index()` para restablecer el índice a valores por defecto (números enteros).
    - Muestra las primeras filas del DataFrame resultante.

In [17]:
slcm_index = slcm_index.reset_index()
slcm_index

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm)
0,5.1,3.5,1.4,0.2
1,4.9,3.0,1.4,0.2
2,4.7,3.2,1.3,0.2
3,4.6,3.1,1.5,0.2
4,5.0,3.6,1.4,0.2
...,...,...,...,...
145,6.7,3.0,5.2,2.3
146,6.3,2.5,5.0,1.9
147,6.5,3.0,5.2,2.0
148,6.2,3.4,5.4,2.3


3. **Ejercicio 3 - Reindexar el DataFrame:**
    - Usa el método `reindex()` para reordenar las filas del DataFrame de manera aleatoria.
    - Muestra las primeras filas después de reindexar.

In [18]:
import numpy as np
import random
from tabulate import tabulate

slcm_index = slcm_index.reindex(random.sample(range(0, len(slcm_index)), k=150))
print(tabulate(slcm_index, headers="keys", tablefmt="fancy_grid"))

╒═════╤═════════════════════╤════════════════════╤═════════════════════╤════════════════════╕
│     │   sepal length (cm) │   sepal width (cm) │   petal length (cm) │   petal width (cm) │
╞═════╪═════════════════════╪════════════════════╪═════════════════════╪════════════════════╡
│  38 │                 4.4 │                3   │                 1.3 │                0.2 │
├─────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤
│ 124 │                 6.7 │                3.3 │                 5.7 │                2.1 │
├─────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤
│  36 │                 5.5 │                3.5 │                 1.3 │                0.2 │
├─────┼─────────────────────┼────────────────────┼─────────────────────┼────────────────────┤
│ 142 │                 5.8 │                2.7 │                 5.1 │                1.9 │
├─────┼─────────────────────┼────────────────────┼──────────

4. **Ejercicio 4 - Seleccionar datos con `.loc`, `.iloc`, `.at`, `.iat`:**
    - Usa `.loc[]` para seleccionar todas las filas donde la especie sea "setosa".
    - Usa `.iloc[]` para seleccionar las filas en la posición 10 a 20 y las columnas 2 a 4 (usa índices enteros).
    - Usa `.at[]` para obtener el valor de "sepal width (cm)" en la fila con índice "setosa" y en la primera columna.
    - Usa `.iat[]` para obtener el valor de "sepal length (cm)" en la posición de fila 0 y columna 2.

In [19]:
print(df.loc["setosa",:])
print(df.iloc[10:20, 2:4])
print(df.at["setosa","sepal width (cm)"])
print(df.iat[0,2])

         sepal length (cm)  sepal width (cm)  petal length (cm)  \
species                                                           
setosa                 5.1               3.5                1.4   
setosa                 4.9               3.0                1.4   
setosa                 4.7               3.2                1.3   
setosa                 4.6               3.1                1.5   
setosa                 5.0               3.6                1.4   
setosa                 5.4               3.9                1.7   
setosa                 4.6               3.4                1.4   
setosa                 5.0               3.4                1.5   
setosa                 4.4               2.9                1.4   
setosa                 4.9               3.1                1.5   
setosa                 5.4               3.7                1.5   
setosa                 4.8               3.4                1.6   
setosa                 4.8               3.0                1.

5. **Ejercicio 5 - Filtrar columnas con `usecols`:**
    - Utiliza el argumento `usecols` para cargar solo las columnas relacionadas con el "sepal length" y "sepal width" cuando cargues el DataFrame de nuevo.
    - Muestra las primeras filas de este DataFrame reducido.

In [20]:
df.to_csv("species.csv")
new_df = pd.read_csv("species.csv", usecols=["sepal length (cm)","sepal width (cm)"])
new_df

Unnamed: 0,sepal length (cm),sepal width (cm)
0,5.1,3.5
1,4.9,3.0
2,4.7,3.2
3,4.6,3.1
4,5.0,3.6
...,...,...
145,6.7,3.0
146,6.3,2.5
147,6.5,3.0
148,6.2,3.4


### Requisitos:

- Usa `pandas` para manipular los datos.
- Asegúrate de trabajar con los índices y las localizaciones de datos de manera eficiente usando los