<a href="https://colab.research.google.com/github/armekmc54-ops/175932/blob/future%2F175932/175932_pandas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Ejercicios de Pandas con pruebas usando doctest
Cada función incluye pruebas en su docstring que se pueden ejecutar con el módulo `doctest`.

In [1]:

import pandas as pd
import doctest


In [2]:

def crear_serie(lista):
    """
    Crea una Serie de Pandas a partir de una lista.

    >>> crear_serie([1, 2, 3]).tolist()
    [1, 2, 3]
    """
    assert isinstance(lista, list), "La entrada debe ser una lista"
    return pd.Series(lista)


In [10]:

def crear_dataframe(diccionario):
    """
    Crea un DataFrame a partir de un diccionario.

    >>> df = crear_dataframe({'a': [1, 2], 'b': [3, 4]})
    >>> df.shape
    (2, 2)
    >>> list(df.columns)
    ['a', 'b']
    """
    assert isinstance(diccionario, dict), "La entrada debe ser un diccionario"
    return pd.DataFrame(diccionario)



In [12]:

def seleccionar_columna(df, columna):
    """
    Selecciona una columna de un DataFrame.

    >>> df = pd.DataFrame({'x': [10, 20], 'y': [30, 40]})
    >>> seleccionar_columna(df, 'x').tolist()
    [10, 20]
    """
    assert columna in df.columns, f"La columna '{columna}' no existe en el DataFrame"
    return df[columna]



In [13]:

def filtrar_por_condicion(df, columna, valor):
    """
    Filtra filas donde la columna es mayor que el valor dado.

    >>> df = pd.DataFrame({'edad': [15, 25, 35]})
    >>> filtrar_por_condicion(df, 'edad', 20)['edad'].tolist()
    [25, 35]
    """
    assert columna in df.columns, f"La columna '{columna}' no existe en el DataFrame"
    return df[df[columna] > valor]



In [14]:

def agregar_columna(df, nueva_columna, valores):
    """
    Agrega una nueva columna al DataFrame.

    >>> df = pd.DataFrame({'a': [1, 2]})
    >>> agregar_columna(df, 'b', [3, 4])['b'].tolist()
    [3, 4]
    """
    assert len(valores) == len(df), "La longitud de los valores debe coincidir con el número de filas en el DataFrame"
    df[nueva_columna] = valores
    return df




In [19]:

def crear_indexacion_jerarquica():
    """
    Crea una Serie con indexación jerárquica.

    >>> s = crear_indexacion_jerarquica()
    >>> s.loc['a', 1]
    1
    """
    s = pd.Series(range(1, 5), index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]])
    return s


In [20]:

def suma_columnas(df, col1, col2):
    """
    Suma dos columnas de un DataFrame.

    >>> df = pd.DataFrame({'x': [1, 2], 'y': [3, 4]})
    >>> suma_columnas(df, 'x', 'y').tolist()
    [4, 6]
    """
    assert col1 in df.columns and col2 in df.columns, f"Las columnas '{col1}' y '{col2}' no existen en el DataFrame"
    return df[col1] + df[col2]



In [21]:

def rellenar_nulos(df, valor):
    """
    Rellena valores nulos con un valor dado.

    >>> df = pd.DataFrame({'a': [1, None, 3]})
    >>> rellenar_nulos(df, 0)['a'].tolist()
    [1.0, 0.0, 3.0]
    """
    df.fillna(valor, inplace=True)
    return df


In [22]:

def agrupar_y_promediar(df, columna_agrupacion, columna_valores):
    """
    Agrupa por una columna y calcula el promedio de otra.

    >>> df = pd.DataFrame({'grupo': ['A', 'A', 'B', 'B'], 'valor': [10, 20, 30, 40]})
    >>> resultado = agrupar_y_promediar(df, 'grupo', 'valor')
    >>> resultado['A'] == 15 and resultado['B'] == 35
    True
    """
    return df.groupby(columna_agrupacion)[columna_valores].mean()


In [24]:

def ordenar_dataframe(df, columna):
    """
    Ordena un DataFrame por una columna.

    >>> df = pd.DataFrame({'a': [3, 1, 2]})
    >>> ordenar_dataframe(df, 'a')['a'].tolist()
    [1, 2, 3]
    """
    assert columna in df.columns, f"La columna '{columna}' no existe en el DataFrame"
    return df.sort_values(by=columna)


In [25]:
def combinar_dataframes(df1, df2, clave):
    """
    Combina dos DataFrames usando merge por una clave.

    >>> df1 = pd.DataFrame({'id': [1, 2], 'valor': ['A', 'B']})
    >>> df2 = pd.DataFrame({'id': [1, 2], 'extra': ['X', 'Y']})
    >>> combinado = combinar_dataframes(df1, df2, 'id')
    >>> combinado.shape
    (2, 3)
    """
    return pd.merge(df1, df2, on=clave)


In [26]:
def concatenar_dataframes(lista_df):
    """
    Concatena una lista de DataFrames.

    >>> df1 = pd.DataFrame({'a': [1]})
    >>> df2 = pd.DataFrame({'a': [2]})
    >>> concatenado = concatenar_dataframes([df1, df2])
    >>> concatenado['a'].tolist()
    [1, 2]
    """
    assert all(isinstance(df, pd.DataFrame) for df in lista_df), "Todos los elementos de la lista deben ser DataFrames"
    return pd.concat(lista_df)

In [27]:
def transformar_tipo(df, columna, tipo):
    """
    Transforma el tipo de datos de una columna.

    >>> df = pd.DataFrame({'a': ['1', '2']})
    >>> transformar_tipo(df, 'a', int)['a'].tolist()
    [1, 2]
    """
    s = df[columna].astype(tipo)
    return s


In [28]:

# Ejecutar pruebas doctest
import doctest
import __main__
doctest.testmod(__main__, verbose=True)


Trying:
    df = pd.DataFrame({'a': [1, 2]})
Expecting nothing
ok
Trying:
    agregar_columna(df, 'b', [3, 4])['b'].tolist()
Expecting:
    [3, 4]
ok
Trying:
    df = pd.DataFrame({'grupo': ['A', 'A', 'B', 'B'], 'valor': [10, 20, 30, 40]})
Expecting nothing
ok
Trying:
    resultado = agrupar_y_promediar(df, 'grupo', 'valor')
Expecting nothing
ok
Trying:
    resultado['A'] == 15 and resultado['B'] == 35
Expecting:
    True
**********************************************************************
File "__main__", line 7, in __main__.agrupar_y_promediar
Failed example:
    resultado['A'] == 15 and resultado['B'] == 35
Expected:
    True
Got:
    np.True_
Trying:
    df1 = pd.DataFrame({'id': [1, 2], 'valor': ['A', 'B']})
Expecting nothing
ok
Trying:
    df2 = pd.DataFrame({'id': [1, 2], 'extra': ['X', 'Y']})
Expecting nothing
ok
Trying:
    combinado = combinar_dataframes(df1, df2, 'id')
Expecting nothing
ok
Trying:
    combinado.shape
Expecting:
    (2, 3)
ok
Trying:
    df1 = pd.DataFrame(

TestResults(failed=3, attempted=31)