**Ejercicio 1: Calcular promedio**

Desarrolla una función llamada calcular_promedio que tome como entrada un DataFrame de pandas que contiene datos numéricos y calcule el promedio de cada columna. La función debe devolver un nuevo DataFrame que contenga los promedios de cada columna.

```python	
def calcular_promedio(dataframe):


# Ejemplo de uso
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [9, 10, 11, 12]
}
 
df = pd.DataFrame(data)
resultado = calcular_promedio(df)
print(resultado)


Resultado
```

```
A     2.5
B     6.5
C    10.5
dtype: float64
```

In [2]:
import pandas as pd

In [3]:
# Mi solución

def calcular_promedio(dataframe):
    return dataframe.mean()

# Ejemplo de uso
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [9, 10, 11, 12]
}

df = pd.DataFrame(data)
resultado = calcular_promedio(df)
print(resultado)

A     2.5
B     6.5
C    10.5
dtype: float64


In [4]:
# Reto propio: calcular el promedio sin utilizar mean

def calcular_promedio(dataframe):
    promedios = []
    for columna in dataframe.columns:
        suma = 0
        contador = 0
        for valor in dataframe[columna]:
            suma += valor
            contador += 1
        promedios.append(suma / contador)
    return pd.Series(data=promedios, index=dataframe.columns)

# Ejemplo de uso
data = {
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [9, 10, 11, 12]
}

df = pd.DataFrame(data)
resultado = calcular_promedio(df)
print(resultado)

A     2.5
B     6.5
C    10.5
dtype: float64


In [45]:
import unittest

# Clase de prueba unitaria
class TestCalcularPromedio(unittest.TestCase):
    
    def test_dataframe_vacio(self):
        """Test para verificar que el promedio de un DataFrame vacío es una Serie vacía."""
        df_vacio = pd.DataFrame()
        resultado = calcular_promedio(df_vacio)
        self.assertTrue(resultado.empty, "El resultado debería ser una Serie vacía para un DataFrame vacío.")
    
    def test_promedio_columnas(self):
        """Test para verificar el cálculo del promedio de cada columna."""
        data = {
            'A': [1, 2, 3, 4],
            'B': [5, 6, 7, 8],
            'C': [9, 10, 11, 12]
        }
        df = pd.DataFrame(data)
        resultado = calcular_promedio(df)
        esperado = pd.Series({'A': 2.5, 'B': 6.5, 'C': 10.5})
        pd.testing.assert_series_equal(resultado, esperado, check_dtype=False)

# Ejecutar las pruebas
unittest.main(argv=[''], verbosity=2, exit=False)  # permite ejecutar las pruebas en un entorno de Jupyter Notebook sin que el kernel se detenga.

test_dataframe_vacio (__main__.TestCalcularPromedio.test_dataframe_vacio)
Test para verificar que el promedio de un DataFrame vacío es una Serie vacía. ... ok
test_promedio_columnas (__main__.TestCalcularPromedio.test_promedio_columnas)
Test para verificar el cálculo del promedio de cada columna. ... ok
test_cualificaciones_altas (__main__.TestSeleccionarDatos.test_cualificaciones_altas)
Test para seleccionar estudiantes con calificaciones mayores o iguales a 90. ... ok
test_edad_mayor_de_18 (__main__.TestSeleccionarDatos.test_edad_mayor_de_18)
Test para seleccionar estudiantes con edad mayor de 18 años. ... ok

----------------------------------------------------------------------
Ran 4 tests in 0.052s

OK


<unittest.main.TestProgram at 0x7566795b4f20>

---
**Ejercicio 2: Seleccionar datos**

Desarrolla una función llamada seleccionar_datos que tome como entrada un DataFrame de pandas que contiene información sobre estudiantes (por ejemplo, nombre, edad, calificaciones, etc.) y seleccione un subconjunto de datos basado en ciertos criterios.

Los criterios se pueden basar en el nombre, edad o calificaciones

```python	
def seleccionar_datos(dataframe, criterio):


# Ejemplo de uso
data = {
    'nombre': ['Alice', 'Bob', 'Charlie', 'David'],
    'edad': [20, 22, 18, 25],
    'calificaciones': [90, 88, 75, 95]
}
 
df = pd.DataFrame(data)
criterio = 'edad > 18'
resultado = seleccionar_datos(df, criterio)
print(resultado)
```

```
  nombre  edad  calificaciones
0  Alice    20              90
1    Bob    22              88
3  David    25              95
```	

In [56]:
# Mi solución:

def seleccionar_datos(dataframe, criterio):
    return dataframe.query(criterio)

# Ejemplo de uso
data = {
    'nombre': ['Alice', 'Bob', 'Charlie', 'David'],
    'edad': [20, 22, 18, 25],
    'calificaciones': [90, 88, 75, 95]
}
 
df = pd.DataFrame(data)
criterio = 'edad > 18'
resultado = seleccionar_datos(df, criterio)
print(resultado)

  nombre  edad  calificaciones
0  Alice    20              90
1    Bob    22              88
3  David    25              95


In [74]:
# Reto propio: filtrar el DataFrame por columnas sin utilizar query

def seleccionar_datos(dataframe, criterio):
    tokens = criterio.split()
    objeto, operador, valor = tokens[0], tokens[1], tokens[2]
    
    valor = int(valor) if valor.isdigit() else valor
    
    operadores = {">": lambda x: x > valor, ">=": lambda x: x >= valor, "<": lambda x: x < valor, "<=": lambda x: x <= valor, \
                  "==": lambda x: x == valor,"!=": lambda x: x != valor}
    
    if operador not in operadores:
        raise ValueError(f"Operador no soportado: {operador}")
    
    if objeto not in dataframe.columns:
        raise ValueError(f"El objeto '{objeto}' no es una columna válida en el DataFrame.")
    
    if objeto == "nombre" and type(valor) == str:
        resultado = dataframe[operadores[operador](dataframe["nombre"])]
    elif objeto in ["edad", "calificaciones"] and type(valor) == int:
        resultado = dataframe[operadores[operador](dataframe[objeto])]
    else:
        raise ValueError(f"Condición no válida para '{objeto}' con valor '{valor}'.")
    
    if resultado.empty:
        raise ValueError(f"No se encuentran coincidencias en la columna '{objeto}'.")
    return resultado

# Ejemplo de uso
data = {
    'nombre': ['Alice', 'Bob', 'Charlie', 'David'],
    'edad': [20, 22, 18, 25],
    'calificaciones': [90, 88, 75, 95]
}
 
df = pd.DataFrame(data)
criterio = 'edad > 25'
resultado = seleccionar_datos(df, criterio)
print(resultado)

ValueError: No se encuentran coincidencias en la columna 'edad'.

In [76]:
# Clase de prueba unitaria
class TestSeleccionarDatos(unittest.TestCase):
    
    def setUp(self):
        """Configurar el DataFrame de prueba."""
        self.data = {
            'nombre': ['Alice', 'Bob', 'Charlie', 'David'],
            'edad': [20, 22, 18, 25],
            'calificaciones': [90, 88, 75, 95]
        }
        self.df = pd.DataFrame(self.data)
    
    def test_cualificaciones_altas(self):
        """Test para seleccionar estudiantes con calificaciones mayores o iguales a 90."""
        criterio = 'calificaciones >= 90'
        resultado = seleccionar_datos(self.df, criterio)
        esperado = pd.DataFrame({
            'nombre': ['Alice', 'David'],
            'edad': [20, 25],
            'calificaciones': [90, 95]
        }).reset_index(drop=True)
        pd.testing.assert_frame_equal(resultado.reset_index(drop=True), esperado)

    def test_edad_mayor_de_18(self):
        """Test para seleccionar estudiantes con edad mayor de 18 años."""
        criterio = 'edad > 18'
        resultado = seleccionar_datos(self.df, criterio)
        esperado = pd.DataFrame({
            'nombre': ['Alice', 'Bob', 'David'],
            'edad': [20, 22, 25],
            'calificaciones': [90, 88, 95]
        }).reset_index(drop=True)
        pd.testing.assert_frame_equal(resultado.reset_index(drop=True), esperado)

# Ejecutar las pruebas
unittest.main(argv=[''], verbosity=2, exit=False)

test_dataframe_vacio (__main__.TestCalcularPromedio.test_dataframe_vacio)
Test para verificar que el promedio de un DataFrame vacío es una Serie vacía. ... ok
test_promedio_columnas (__main__.TestCalcularPromedio.test_promedio_columnas)
Test para verificar el cálculo del promedio de cada columna. ... ok
test_cualificaciones_altas (__main__.TestSeleccionarDatos.test_cualificaciones_altas)
Test para seleccionar estudiantes con calificaciones mayores o iguales a 90. ... ok
test_edad_mayor_de_18 (__main__.TestSeleccionarDatos.test_edad_mayor_de_18)
Test para seleccionar estudiantes con edad mayor de 18 años. ... ok

----------------------------------------------------------------------
Ran 4 tests in 0.036s

OK


<unittest.main.TestProgram at 0x756632e9e120>