# Objetivo general:

### Una experta de la selección de datos: filtrar, ordenar, encontrar patrones complejos y sacar justo la información que necesito —como si usaras un oráculo, pero en pandas.

### Usaremos un dataset mitológico con mezcla de culturas y características para hacerlo más interesante.

## 🧙 Dataset mitológico para el día 7:

In [1]:
import pandas as pd

datos_mitologicos = {
    'Nombre': ['Zeus', 'Thor', 'Ra', 'Atenea', "Loki", "Isis", "Apolo", "Freya", "Hades", "Anubis"],
    "Mitologia": ["Griega", "Nórdica", "Egipcia", "Griega", "Nórdica", "Egipcia", "Griega", "Nórdica", "Griega", "Egipcia"],
    "Dominio": ["Trueno", "Trueno", "Sol", "Sabiduría", "Engaño", "Magia", "Artes", "Amor", "Inframundo", "Muerte"],
    "Edad": [3000, 1500, 5000, 2900, 1400, 4800, 2800, 1600, 3100, 4700],
    "Simbolo": ["Rayo", "Martillo", "Disco solar", "Búho", "Serpiente", "Anj", "Lira", "Collar", "Casco", "Chacal"]
}

df = pd.DataFrame(datos_mitologicos)
df

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
0,Zeus,Griega,Trueno,3000,Rayo
1,Thor,Nórdica,Trueno,1500,Martillo
2,Ra,Egipcia,Sol,5000,Disco solar
3,Atenea,Griega,Sabiduría,2900,Búho
4,Loki,Nórdica,Engaño,1400,Serpiente
5,Isis,Egipcia,Magia,4800,Anj
6,Apolo,Griega,Artes,2800,Lira
7,Freya,Nórdica,Amor,1600,Collar
8,Hades,Griega,Inframundo,3100,Casco
9,Anubis,Egipcia,Muerte,4700,Chacal


<a id="objetivo-general"></a>
## 🌀 1. Selección por condición simple
### Supongamos que quieres todas las filas donde la mitología sea Griega.

In [2]:
# Este filtro simple usa una condición con ==
# si lo pusieramos asi: griegos = df["Mitologia"] == "Griega". solo me daria una columna donde griega seria true y no griega false.

griegos = df[df["Mitologia"] == "Griega"]

print(griegos)

   Nombre Mitologia     Dominio  Edad Simbolo
0    Zeus    Griega      Trueno  3000    Rayo
3  Atenea    Griega   Sabiduría  2900    Búho
6   Apolo    Griega       Artes  2800    Lira
8   Hades    Griega  Inframundo  3100   Casco


### 🌿 Ejercicio 1:
#### Saca todas las criaturas que tengan "Edad" mayor a 3000 años.

→ Tu turno: escribe tu código y dime qué te devuelve.

In [3]:
mayores_3000 = df[df['Edad'] > 3000]
mayores_3000

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
2,Ra,Egipcia,Sol,5000,Disco solar
5,Isis,Egipcia,Magia,4800,Anj
8,Hades,Griega,Inframundo,3100,Casco
9,Anubis,Egipcia,Muerte,4700,Chacal


## 🧿 2. Selección por condiciones múltiples
#### ¿Qué pasa si quieres ver solo las criaturas que son de la mitología Egipcia y además tienen más de 4500 años?

#### Usamos el operador & (y) entre condiciones, ¡pero cada condición debe ir entre paréntesis!



In [4]:
# egipcias y edad mayor a 4500

antiguas_egipcias = df[(df["Mitologia"] == "Egipcia") & (df["Edad"] > 4500)]
print(antiguas_egipcias)

   Nombre Mitologia Dominio  Edad      Simbolo
2      Ra   Egipcia     Sol  5000  Disco solar
5    Isis   Egipcia   Magia  4800          Anj
9  Anubis   Egipcia  Muerte  4700       Chacal


### 🧪 También puedes usar | para "o":

In [5]:
# solicita un dataframe de la mitiogia griega o romana

griega_o_romana = df[(df["Mitologia"] == "Griega") | (df["Mitologia"] == "Romana")]
griega_o_romana

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
0,Zeus,Griega,Trueno,3000,Rayo
3,Atenea,Griega,Sabiduría,2900,Búho
6,Apolo,Griega,Artes,2800,Lira
8,Hades,Griega,Inframundo,3100,Casco


### 🌺 Ejercicio 2:
#### Saca todas las criaturas que:

* Sean de la mitología Griega

* tengan un "Dominio" que sea Inframundo

→ ¡Intenta escribir el código! Luego me dices qué criaturas aparecen.

In [6]:
griegos_inframundo = df[(df["Mitologia"] == "Griega") & (df["Dominio"] == "Inframundo")]
griegos_inframundo

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
8,Hades,Griega,Inframundo,3100,Casco


## 🧠 Ahora vamos a practicar un nuevo metodo: isin()
### ¿Para qué sirve?
#### Cuando quieres seleccionar varias opciones de una columna sin escribir mil condiciones |, puedes usar:

In [7]:
df["Mitologia"].isin(["Egipcia", "Nórdica"])
# Esto devuelve true en las filas que tengan esas mitologias

Unnamed: 0,Mitologia
0,False
1,True
2,True
3,False
4,True
5,True
6,False
7,True
8,False
9,True


In [8]:
# esto devuelve un dataframe con las mitologias nordicas y egipcias

df[df["Mitologia"].isin(["Egipcia", "Nórdica"])]

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
1,Thor,Nórdica,Trueno,1500,Martillo
2,Ra,Egipcia,Sol,5000,Disco solar
4,Loki,Nórdica,Engaño,1400,Serpiente
5,Isis,Egipcia,Magia,4800,Anj
7,Freya,Nórdica,Amor,1600,Collar
9,Anubis,Egipcia,Muerte,4700,Chacal


### 🌿 Ejercicio 3:
#### Saca las criaturas que pertenezcan a estas tres mitologías:

* Egipcia

* Griega

* Nórdica

In [9]:
df[(df["Mitologia"].isin(["Egipcia", "Griega", "Nórdica"]))]

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
0,Zeus,Griega,Trueno,3000,Rayo
1,Thor,Nórdica,Trueno,1500,Martillo
2,Ra,Egipcia,Sol,5000,Disco solar
3,Atenea,Griega,Sabiduría,2900,Búho
4,Loki,Nórdica,Engaño,1400,Serpiente
5,Isis,Egipcia,Magia,4800,Anj
6,Apolo,Griega,Artes,2800,Lira
7,Freya,Nórdica,Amor,1600,Collar
8,Hades,Griega,Inframundo,3100,Casco
9,Anubis,Egipcia,Muerte,4700,Chacal


## 🧠 Nuevo poder: Filtrar y ordenar al mismo tiempo
### Supongamos que quieres saber:

#### ¿Cuál es la criatura más antigua entre las mitologías Egipcia, Griega y Nórdica?

### ✨ Ejercicio 4:
#### Haz esto paso a paso (y lo puedes hacer en una sola línea si quieres):

* Filtra las criaturas que pertenezcan a Egipcia, Griega o Nórdica (isin()).

* Ordena el resultado por la columna "Edad" de forma descendente (.sort_values(by="Edad", ascending=False)).

**Quédate solo con la primera fila usando .head(1) o .iloc[0].**

In [10]:
# esto busca al mas anciano de entre las mitologias seleccionadas
df[df["Mitologia"].isin(["Egipcia", "Griega", "Nórdica"])].sort_values(by="Edad", ascending=False).head(1)


Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
2,Ra,Egipcia,Sol,5000,Disco solar


In [11]:
# esto busca al mas joven de entre las mitologias seleccionadas
df[df["Mitologia"].isin(["Egipcia", "Griega", "Nórdica"])].sort_values(by="Edad", ascending=True).head(1)

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
4,Loki,Nórdica,Engaño,1400,Serpiente


In [12]:
# Para obtener la ultima fila se usaria .tail(1)
df[df["Mitologia"].isin(["Egipcia", "Griega", "Nórdica"])].sort_values(by="Edad", ascending=False).tail(1)

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
4,Loki,Nórdica,Engaño,1400,Serpiente


In [13]:
# con iloc seria: .iloc[0] porque la primera fila es 0
df[df["Mitologia"].isin(["Egipcia", "Griega", "Nórdica"])].sort_values(by="Edad", ascending=False).iloc[0]

Unnamed: 0,2
Nombre,Ra
Mitologia,Egipcia
Dominio,Sol
Edad,5000
Simbolo,Disco solar


In [14]:
# y con iloc para obtener la ultima fila seria .iloc[-1], porque el -1 es la última fila
df[df["Mitologia"].isin(["Egipcia", "Griega", "Nórdica"])].sort_values(by="Edad", ascending=False).iloc[-1]

Unnamed: 0,4
Nombre,Loki
Mitologia,Nórdica
Dominio,Engaño
Edad,1400
Simbolo,Serpiente


## 1. Selección con condiciones complejas (más de una condición)
### Podemos combinar condiciones con & (and) y | (or), pero hay que usar paréntesis para agruparlas:

In [15]:
# Te devuelve las filas donde la mitología es egipcia y la edad es mayor a 4000.

df[(df["Mitologia"] == "Egipcia") & (df["Edad"] > 4000)]


Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
2,Ra,Egipcia,Sol,5000,Disco solar
5,Isis,Egipcia,Magia,4800,Anj
9,Anubis,Egipcia,Muerte,4700,Chacal


## 2. Selección usando .query()
### Es una forma muy legible y elegante de filtrar filas con condiciones:

In [16]:
# Funciona casi igual, pero con sintaxis de texto. Muy útil para filtros complejos y cuando las columnas tienen nombres simples.

df.query("Mitologia == 'Egipcia' and Edad > 4000")

Unnamed: 0,Nombre,Mitologia,Dominio,Edad,Simbolo
2,Ra,Egipcia,Sol,5000,Disco solar
5,Isis,Egipcia,Magia,4800,Anj
9,Anubis,Egipcia,Muerte,4700,Chacal


 ### Ejercicio paso a paso:
#### Con nuestro dataset mitológico, haz lo siguiente:

* Selecciona criaturas de mitología “Griega” o “Nórdica” que tengan edad menor a 1600.

* Muestra solo columnas Nombre, Dominio y Edad.

In [17]:
df[(df["Mitologia"].isin(["Griega", "Nórdica"])) & (df["Edad"] < 1600)][["Nombre", "Dominio", "Edad"]]

Unnamed: 0,Nombre,Dominio,Edad
1,Thor,Trueno,1500
4,Loki,Engaño,1400


## 3. Selección combinada con .loc[ ]
### .loc[ ] te permite seleccionar filas y columnas al mismo tiempo:

In [18]:
# df.loc[condicion, ["Nombre", "Dominio"]]

In [None]:
# Selecciona solo columnas Nombre y Simbolo de mitología nórdica con edad mayor a 1400.

df.loc[(df["Mitologia"] == "Nórdica") & (df["Edad"] > 1400), ["Nombre", "Simbolo"]]

Unnamed: 0,Nombre,Simbolo
1,Thor,Martillo
7,Freya,Collar


### Ejercicio para ti:
#### Usa .loc[ ] para mostrar los nombres y dominios de las criaturas de mitología griega que tengan una edad menor a 4000.

In [None]:
df.loc[(df["Mitologia"] == "Griega") & (df["Edad"] < 4000), ["Nombre", "Dominio"]]

Unnamed: 0,Nombre,Dominio
0,Zeus,Trueno
3,Atenea,Sabiduría
6,Apolo,Artes
8,Hades,Inframundo


### Explicacion del codigo paso a paso
**df.loc[
    * (df["Mitologia"] == "Griega") & (df["Edad"] < 4000),  # ← condición sobre filas
    * ["Nombre", "Dominio"]                                # ← columnas que quieres mostrar
]**

* Filtra solo criaturas griegas
* Que tengan una edad menor a 4000
* muestra solo las columnas Nombre y Dominio

## 🧠 1. .query() — Filtrado elegante tipo SQL
### Es una forma más legible de escribir filtros complejos:

In [None]:
'''
Ventajas:
Más fácil de leer que .loc[ ] cuando hay muchas condiciones
Muy parecido al lenguaje SQL
'''

df.query("Mitologia == 'Griega' and Edad < 4000")[["Nombre", "Dominio"]]

Unnamed: 0,Nombre,Dominio
0,Zeus,Trueno
3,Atenea,Sabiduría
6,Apolo,Artes
8,Hades,Inframundo


## 🧠 2. .iloc[ ] — Selección por posición (no por etiquetas)
### Te permite seleccionar filas o columnas por su índice numérico:

In [20]:
'''
útil cuando no te interesan los nombres de columnas y solo quieres trabajar
por posicion
'''

df.iloc[0]   #Primera fila
df.iloc[[1, 3], [0, 2]]  # Filas 1 y 3, columnas 0 y 2

Unnamed: 0,Nombre,Dominio
1,Thor,Trueno
3,Atenea,Sabiduría


## 🧠 3. .between() — Filtrar dentro de un rango

In [19]:
df[df["Edad"].between(1500, 3000)][["Nombre", "Edad"]]
# Esto es equivalente a hacer:
# (df["Edad"] >= 1500) & (df["Edad"] <= 3000), pero mucho más limpio

Unnamed: 0,Nombre,Edad
0,Zeus,3000
1,Thor,1500
3,Atenea,2900
6,Apolo,2800
7,Freya,1600


## 🧪 Vamos a practicar ahora:
### Ejercicio 1: Usando .query(), muestra nombre y edad de criaturas de mitología egipcia con edad mayor a 4500.

### Ejercicio 2: Con .iloc[], muestra los datos de las filas 2 y 4, y las columnas de índice 0 y 3.

### Ejercicio 3: Con .between(), muestra nombre, edad y símbolo de las criaturas con edades entre 3000 y 5000 años.

In [None]:
# Ejercicio 1:
# Nombre y Edad de criatuas egipcias con edad > 4500
df.query('Mitologia == "Egipcia" and Edad > 4500')[["Nombre", "Edad"]]

Unnamed: 0,Nombre,Edad
2,Ra,5000
5,Isis,4800
9,Anubis,4700


#### si que es sencillo .query(), ya sabemos que las deidades de mas de 4500 años son Ra, Isis y Anubis. No creo que sea coincidencia de que justo las 3 son egipcias.

#### Al fin y al cabo, la civilización egipcia es más antigua que la romana o la griega, aunque no estoy segura si más que la vikinga.

In [None]:
# Ejercicio 2:
# filas 2 y 4 y columnas 0 y 3
df.iloc[[2, 4],[0, 4]]

Unnamed: 0,Nombre,Simbolo
2,Ra,Disco solar
4,Loki,Serpiente


#### vaya!!!!, resulta que las deidades que estan en las filas 2 y 4 son Ra y Loki. y las filas 0-3 nos dan la informacion del indice, el nombre y el simbolo.

In [None]:
# Ejercicio 3:
# Nombre, Edad y Símbolo de edad entre 3000 y 5000 años
df[df["Edad"].between(3000, 5000)][["Nombre", "Edad", "Simbolo"]]

Unnamed: 0,Nombre,Edad,Simbolo
0,Zeus,3000,Rayo
2,Ra,5000,Disco solar
5,Isis,4800,Anj
8,Hades,3100,Casco
9,Anubis,4700,Chacal


#### Muy bien, hemos descubierto que solo 5 deidades tienen el rango de edad entre 3000 y 5000 años.