### Ordenar filas en un DataFrame

En este cuaderno aprenderás cómo cambiar el orden de las filas en un DataFrame para que los datos más relevantes aparezcan en la parte superior.

Para lograrlo, puedes utilizar el método `sort_values()`, indicando el nombre de la columna por la que deseas ordenar. Esto te permite organizar tu información de manera más útil y visual.

Por ejemplo, para ordenar los libros por el título:

```python
import pandas as pd

df = pd.read_csv("../data/Books.csv")
df_ordenado = df.sort_values("title",ascending = False)  # Ordena el DataFrame por la columna 'title'
print(df_ordenado)
```

> **Nota:**  
> Puedes usar el parámetro `ascending=False` si quieres que los valores más altos aparezcan primero.

In [2]:
import pandas as pd

df = pd.read_csv("../data/Books.csv")
print(df.sort_values("pages",ascending=True))  # Sort the DataFrame by the 'title' column

                                                  title  \
1125  Timeless Themes in To Kill a Mockingbird An An...   
1336                                     Sand Dune Life   
1221                   JK Rowling's Harry Potter Novels   
1301     Four Stories From Shakespeare - Ober - Level 4   
894                                      Collection # 6   
...                                                 ...   
469                                       The Army Cook   
1906  Focus On: 100 Most Popular Films Based on Brit...   
360                                 What Is Psychology?   
1710  Supplement to Employment, Hours, and Earnings,...   
612                              Resources in Education   

                                            author    pages  \
1125                        Online Digital Centre        10   
1336                              Yves Earhart, AI      100   
1221                                    Philip Nel      100   
1301                                Unk

## Ordenar por múltiples columnas en pandas

Puedes ordenar un DataFrame por varias columnas al mismo tiempo utilizando la función `sort_values()` y pasando una lista con los nombres de las columnas.

Por ejemplo, para ordenar primero por **autor** y luego por **páginas**:

```python
df.sort_values(["author", "pages"])
```

Esto primero ordena por la columna `author` y, en caso de empate, por la columna `pages`.

---

### Ordenar en diferentes direcciones

Si deseas especificar la dirección de orden para cada columna, usa el parámetro `ascending` con una lista de valores booleanos.  
Cada valor corresponde a la dirección de orden para la columna respectiva (`True` para ascendente, `False` para descendente).

Por ejemplo, para ordenar primero por **autor** en orden ascendente y luego por **páginas** en orden descendente:

```python
df.sort_values(["author", "pages"], ascending=[True, False])
```

---

**Resumen:**
- `sort_values(["col1", "col2"])`: Ordena primero por `col1`, luego por `col2`.
- `sort_values(["col1", "col2"], ascending=[True, False])`: Ordena `col1` ascendente y `col2` descendente.

> Puedes ordenar por tantas columnas como necesites, solo asegúrate de que la lista de columnas y la lista de valores para `ascending` tengan la misma longitud.




In [3]:
print("Ordenamos el DataFrame por la columna 'pages' de forma ascendente.")
print(df.sort_values("pages", ascending=True).head(10))  # Display the first 10 rows of the sorted DataFrame


Ordenamos el DataFrame por la columna 'pages' de forma ascendente.
                                                  title  \
1125  Timeless Themes in To Kill a Mockingbird An An...   
1336                                     Sand Dune Life   
1221                   JK Rowling's Harry Potter Novels   
1301     Four Stories From Shakespeare - Ober - Level 4   
894                                      Collection # 6   
528                                     Destination USA   
475                                         Food Yields   
257           The maker of dreams; a fantasy in one act   
452   Periodicals Currently Received in Army Medical...   
1425                 The Truth Behind the Da Vinci Code   

                                                 author pages  \
1125                             Online Digital Centre     10   
1336                                   Yves Earhart, AI   100   
1221                                         Philip Nel   100   
1301                   

Puede que queramos ampliar solo una columna.
Podemos hacerlo utilizando el nombre del DataFrame seguido de unos corchetes con el nombre de la columna adentro.

```python
df['pages']
```

Para seleccionar varias columnas, necesitas dos pares de corchetes.

```python
"""
Los corchetes externos son responsables de crear subconjuntos del DataFrame
Y los corchetes internos crean una lista de nombres de columnas para crear subconjuntos
"""
df[['title','pages']]

```

Esto significa que puede proporcionar una lista separada de nombres de columnas como el siguiente ejemplo.


```python
columns = ['title','pages']
df[columns]
```

La forma mas habitual de hacerlo es creando una condicion logica para filtrar
Por ejemplo buscaremos el libro que tenga un total de 10 paginas.

```python
df[df['pages'] == 100]
```


In [20]:
print("Subconjunto del DataFrame donde el género es 'Fiction':")
print(df[df['genre'] == 'Fiction'])

Subconjunto del DataFrame donde el género es 'Fiction':
                                                  title  \
4     Fictional Space in the Modernist and Post-mode...   
27                      Critical Survey of Long Fiction   
86    The Circle of Knowledge: A Classified, Simplif...   
95    A Classified Catalogue of the Malta Garrison L...   
97    References to the Principal Works in every Dep...   
...                                                 ...   
1995                       Ο ιππότης των Επτά Βασιλείων   
1996                                           Isdraken   
1997     Festín de cuervos (Canción de Hielo y Fuego 4)   
1998                                     Ruas Estranhas   
1999                                              검의 폭풍   

                                                 author pages    genre  \
4                                  Carl Darryl Malmgren   248  Fiction   
27                                 Frank Northen Magill   526  Fiction   
86           

## Filtrar filas por múltiples condiciones en pandas

Puedes crear subconjuntos de un DataFrame seleccionando las filas que cumplen varias condiciones.  
Para ello, puedes combinar condiciones utilizando operadores lógicos, como **AND** (`&`) y **OR** (`|`).

### Ejemplo: Filtrar con el operador OR (`|`)

Supón que quieres seleccionar las filas donde el género sea **"Action"** o **"Fiction"**:

```python
is_action = df['genre'] == 'Action'
is_fiction = df['genre'] == 'Fiction'
df[is_action | is_fiction]
```

Esto retorna todas las filas cuyo género es **"Action"** **o** **"Fiction"**.

---

### Ejemplo: Filtrar con el operador AND (`&`)

Si quisieras seleccionar las filas donde el género sea **"Action"** y el año sea **2024**, podrías hacerlo así:

```python
is_action = df['genre'] == 'Action'
is_2024 = df['year'] == 2024
df[is_action & is_2024]
```

---

### Recomendaciones importantes

- **Pon cada condición entre paréntesis** para evitar errores de precedencia.
- No uses los operadores `and` y `or` de Python, usa `&` y `|` para trabajar con Series de pandas.
- Puedes combinar tantas condiciones como necesites.

---

**Resumen:**  
- `|` : Operador **OR** (o)
- `&` : Operador **AND** (y)

Ejemplo combinando ambos operadores:

```python
df[(df['genre'] == 'Action') | ((df['genre'] == 'Fiction') & (df['year'] == 2024))]
```

In [25]:
is_action = df['genre'] ==  'Action'
is_Fiction = df['genre'] == 'Fiction'
df[is_action | is_Fiction].head(5)  # Display the first 10 rows of the subset DataFrame

Unnamed: 0,title,author,pages,genre,description,published_date,publisher,language,average_rating,ratings_count,thumbnail
4,Fictional Space in the Modernist and Post-mode...,Carl Darryl Malmgren,248,Fiction,Fictional space is the imaginal expanse of fie...,1985,Bucknell University Press,en,No rating,0,http://books.google.com/books/content?id=KXzoz...
27,Critical Survey of Long Fiction,Frank Northen Magill,526,Fiction,A comprehensive study of long fiction authors ...,1984,Unknown Publisher,en,No rating,0,http://books.google.com/books/content?id=Js83A...
86,"The Circle of Knowledge: A Classified, Simplif...",Various,2131,Fiction,The Circle of Knowledge is an informative book...,2022-06-02,DigiCat,en,No rating,0,http://books.google.com/books/content?id=dBF0E...
95,A Classified Catalogue of the Malta Garrison L...,Anonymous,222,Fiction,"Reprint of the original, first published in 1840.",2024-08-28,BoD – Books on Demand,en,No rating,0,http://books.google.com/books/content?id=LyUdE...
97,References to the Principal Works in every Dep...,Howard Malcom,490,Fiction,"Reprint of the original, first published in 1868.",2020-09-23,BoD – Books on Demand,en,No rating,0,http://books.google.com/books/content?id=TpX_D...


## Filtrar filas por varios valores de una variable categórica en pandas

Si quieres seleccionar las filas que tienen **cualquiera** de varios valores en una columna categórica, la forma más sencilla es utilizar el método `.isin()`.

Por ejemplo, para filtrar los libros cuyo género sea **"Fiction"** o **"Action"**:

```python
# Crea una máscara booleana para los géneros deseados
is_action_or_fiction = df['genre'].isin(['Fiction', 'Action'])

# Aplica el filtro al DataFrame
df[is_action_or_fiction]
```

Esto retorna todas las filas donde el género es **"Fiction"** **o** **"Action"**.

---

### Ventajas de `.isin()`

- Es más compacto y eficiente que usar múltiples operadores lógicos.
- Puedes pasar una lista de tantos valores como necesites.
- Funciona para cualquier tipo de columna categórica.

---

**Resumen:**  
Usa `.isin([valor1, valor2, ...])` para filtrar filas que tengan alguno de esos valores en la columna seleccionada.

Ejemplo general:

```python
df[ df['columna'].isin(['valor1', 'valor2', 'valor3']) ]
```

In [26]:
is_action_or_fiction = df['genre'].isin(['Fiction','Action'])
df[is_action_or_fiction]

Unnamed: 0,title,author,pages,genre,description,published_date,publisher,language,average_rating,ratings_count,thumbnail
4,Fictional Space in the Modernist and Post-mode...,Carl Darryl Malmgren,248,Fiction,Fictional space is the imaginal expanse of fie...,1985,Bucknell University Press,en,No rating,0,http://books.google.com/books/content?id=KXzoz...
27,Critical Survey of Long Fiction,Frank Northen Magill,526,Fiction,A comprehensive study of long fiction authors ...,1984,Unknown Publisher,en,No rating,0,http://books.google.com/books/content?id=Js83A...
86,"The Circle of Knowledge: A Classified, Simplif...",Various,2131,Fiction,The Circle of Knowledge is an informative book...,2022-06-02,DigiCat,en,No rating,0,http://books.google.com/books/content?id=dBF0E...
95,A Classified Catalogue of the Malta Garrison L...,Anonymous,222,Fiction,"Reprint of the original, first published in 1840.",2024-08-28,BoD – Books on Demand,en,No rating,0,http://books.google.com/books/content?id=LyUdE...
97,References to the Principal Works in every Dep...,Howard Malcom,490,Fiction,"Reprint of the original, first published in 1868.",2020-09-23,BoD – Books on Demand,en,No rating,0,http://books.google.com/books/content?id=TpX_D...
...,...,...,...,...,...,...,...,...,...,...,...
1995,Ο ιππότης των Επτά Βασιλείων,George R. R. Martin,404,Fiction,Ο Ιππότης των Επτά Βασιλείων λαμβάνει χώρα σχε...,Unknown,Metaichmio Publications,el,No rating,0,http://books.google.com/books/content?id=XdGTC...
1996,Isdraken,George RR Martin,87,Fiction,Isdraken är ett mytologiskt djur som alla är r...,2016-06-01,Natur & Kultur,sv,No rating,0,http://books.google.com/books/content?id=Vx1FD...
1997,Festín de cuervos (Canción de Hielo y Fuego 4),George R. R. Martin,1124,Fiction,Los cinco títulos hasta ahora publicados de «C...,2023-06-22,PLAZA & JANÉS,es,No rating,0,http://books.google.com/books/content?id=PDi9E...
1998,Ruas Estranhas,"Conn Iggulden, Charlaine Harris, Diana Gabaldo...",587,Fiction,Ruas Estranhas é uma coleção de 16 histórias d...,2013-01-01,Leya,pt,No rating,0,http://books.google.com/books/content?id=d2OkJ...
