# Ejercicios de Pandas - Nivel Inicial

In [1]:
import pandas as pd
import numpy as np

## Ejercicio 1: Creación y manipulación de Series
1. Crea una Serie a partir del diccionario {'Matemáticas': 9, 'Historia': 7.5, 'Física': 8.2}
2. Accede a la nota de 'Historia' usando la notación de corchetes
3. Crea otra Serie con las mismas materias pero diferentes notas y suma ambas Series

In [12]:
notas = {'Matemáticas': 9, 'Historia': 7.5, 'Física': 8.2}
notas_series = pd.Series(notas)
notas_series

Unnamed: 0,0
Matemáticas,9.0
Historia,7.5
Física,8.2


In [4]:
nota_historia = notas_series['Historia']
nota_historia

np.float64(7.5)

In [15]:
notas2 = {'Matemáticas': 8, 'Historia': 8.5, 'Física': 9.2, "Gimnasia": 6}
notas2_series = pd.Series(notas2)
notas2_series

Unnamed: 0,0
Matemáticas,8.0
Historia,8.5
Física,9.2
Gimnasia,6.0


In [16]:
totales = notas_series + notas2_series
totales

Unnamed: 0,0
Física,17.4
Gimnasia,
Historia,16.0
Matemáticas,17.0


## Ejercicio 2: Operaciones básicas con DataFrames
Dado el siguiente DataFrame:

In [19]:
df = pd.DataFrame({
    'Producto': ['Manzana', 'Pera', 'Plátano'],
    'Precio': [1.2, 1.5, 0.8],
    'Stock': [45, 32, 67]
})


1. Muestra solo la columna 'Precio'
2. Filtra los productos con precio mayor a 1.0
3. Añade una nueva columna 'Valor_total' que sea Precio * Stock

In [20]:
precio = df['Precio']
precio

Unnamed: 0,Precio
0,1.2
1,1.5
2,0.8


In [21]:
df['Precio'] > 1

Unnamed: 0,Precio
0,True
1,True
2,False


In [22]:
precio_mayor_1 = df[df['Precio'] > 1]
precio_mayor_1

Unnamed: 0,Producto,Precio,Stock
0,Manzana,1.2,45
1,Pera,1.5,32


In [23]:
df["Total"] = df["Precio"] * df["Stock"]

In [24]:
df

Unnamed: 0,Producto,Precio,Stock,Total
0,Manzana,1.2,45,54.0
1,Pera,1.5,32,48.0
2,Plátano,0.8,67,53.6


## Ejercicio 3: Selección de datos
Usando el DataFrame del ejercicio 2:
1. Selecciona la fila del 'Plátano' usando loc
2. Selecciona el precio de la 'Pera' usando iloc
3. Muestra solo las columnas 'Producto' y 'Stock' para todos los productos

In [26]:
df.loc[df['Producto'] == 'Plátano']

Unnamed: 0,Producto,Precio,Stock,Total
2,Plátano,0.8,67,53.6


In [27]:
df.iloc[1,1]

np.float64(1.5)

In [28]:
df[['Producto','Stock']]

Unnamed: 0,Producto,Stock
0,Manzana,45
1,Pera,32
2,Plátano,67


## Ejercicio 4: Valores faltantes
Dado este DataFrame:

In [29]:
df = pd.DataFrame({
    'A': [1,np.nan,3,4],
    'B': [5,6,np.nan,8],
    'C': [9,10,11,12]
})

1. Elimina las filas que contengan algún NaN
2. Rellena los NaN de la columna 'A' con su valor medio
3. Rellena los NaN de la columna 'B' con el valor máximo de esa columna

In [30]:
df.dropna()

Unnamed: 0,A,B,C
0,1.0,5.0,9
3,4.0,8.0,12


In [31]:
df["A"] = df["A"].fillna(df["A"].mean())
df

Unnamed: 0,A,B,C
0,1.0,5.0,9
1,2.666667,6.0,10
2,3.0,,11
3,4.0,8.0,12


In [32]:
df["B"] = df["B"].fillna(df["B"].max())
df

Unnamed: 0,A,B,C
0,1.0,5.0,9
1,2.666667,6.0,10
2,3.0,8.0,11
3,4.0,8.0,12


## Ejercicio 5: Índices
1. Crea un DataFrame con datos aleatorios (3x3) y los índices ['X', 'Y', 'Z']
2. Resetea el índice y muestra el resultado
3. Vuelve a establecer la columna de índice como índice principal

In [39]:
df = pd.DataFrame(np.random.rand(3,3), index=['X','Y','Z'], columns=['A','B','C'])
df

Unnamed: 0,A,B,C
X,0.228809,0.221545,0.95297
Y,0.408559,0.547669,0.457276
Z,0.743994,0.501103,0.954653


In [40]:
df.reset_index(inplace=True)
df

Unnamed: 0,index,A,B,C
0,X,0.228809,0.221545,0.95297
1,Y,0.408559,0.547669,0.457276
2,Z,0.743994,0.501103,0.954653


In [41]:
df

Unnamed: 0,index,A,B,C
0,X,0.228809,0.221545,0.95297
1,Y,0.408559,0.547669,0.457276
2,Z,0.743994,0.501103,0.954653


In [42]:
df = df.set_index('index')
df

Unnamed: 0_level_0,A,B,C
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
X,0.228809,0.221545,0.95297
Y,0.408559,0.547669,0.457276
Z,0.743994,0.501103,0.954653


## Ejercicio 6: Filtrado condicional
Dado este DataFrame

In [65]:
datos = {
    'Nombre': ['Ana', 'Juan', 'Sofía', 'Carlos'],
    'Edad': [25, 32, 28, 40],
    'Ciudad': ['Madrid', 'Barcelona', 'Madrid', 'Valencia']
}

In [66]:
datos_df = pd.DataFrame(datos)
datos_df

Unnamed: 0,Nombre,Edad,Ciudad
0,Ana,25,Madrid
1,Juan,32,Barcelona
2,Sofía,28,Madrid
3,Carlos,40,Valencia


1. Filtra las personas que viven en 'Madrid'
2. Muestra los nombres de las personas mayores de 30 años
3. Crea un filtro combinado: personas de Madrid mayores de 26 años

In [54]:
datos_df[datos_df["Ciudad"]=='Madrid']

Unnamed: 0,Nombre,Edad,Ciudad
0,Ana,25,Madrid
2,Sofía,28,Madrid


In [59]:
datos_df

Unnamed: 0,Nombre,Edad,Ciudad
0,Ana,25,Madrid
1,Juan,32,Barcelona
2,Sofía,28,Madrid
3,Carlos,40,Valencia


In [64]:
datos_df[datos_df["Edad"] > 30]

Unnamed: 0,Nombre,Edad,Ciudad
1,Juan,32,Barcelona
3,Carlos,40,Valencia


In [67]:
datos_df["Edad"]>26

Unnamed: 0,Edad
0,False
1,True
2,True
3,True


In [68]:
datos_df["Ciudad"] == "Madrid"

Unnamed: 0,Ciudad
0,True
1,False
2,True
3,False


In [69]:
(datos_df["Edad"]>26) & (datos_df["Ciudad"] == "Madrid")

Unnamed: 0,0
0,False
1,False
2,True
3,False


In [71]:
datos_df[(datos_df["Edad"]>26) & (datos_df["Ciudad"] == "Madrid")]

Unnamed: 0,Nombre,Edad,Ciudad
2,Sofía,28,Madrid
