In [30]:
import pandas as pd
import numpy as np

df_temp = pd.read_csv("../datasets/frutas_verduras_temporada.csv")
df_temp_cp = df_temp.copy()
df_temp_cp.head(5)

Unnamed: 0,nombre,tipo,temporada_pico
0,Aguacate,Fruta,Dic-May (alta); disponible todo el año
1,Ciruela,Fruta,Jul–Ago
2,Durazno,Fruta,Jul–Sep
3,Fresa,Fruta,May-Jun
4,Granada roja,Fruta,Sep–Oct


In [31]:
def cambiar_valores_columna(df : pd.DataFrame, nombre_columna: str, valor: any) -> pd.DataFrame:
    """
    Reemplaza todos los valores de una columna específica en un DataFrame por un nuevo valor.

    Parametros
    ----------
    df : pandas.DataFrame
        El DataFrame que contiene la columna a modificar.
    column_name : str
        El nombre de la columna cuyos valores seran reemplazados.
    value : any
        El nuevo valor que se asignara a todos los elementos de la columna.
        Puede ser un valor escalar (str, int, float, bool, etc.).

    Retorna
    -------
    pandas.DataFrame
        Una copia del DataFrame con la columna modificada.  
        No altera el DataFrame original.
    """
    
    if nombre_columna not in df.columns:
        raise KeyError(f"La columna '{nombre_columna}' no existe en el DataFrame.")
    df_copy = df.copy()
    df_copy[nombre_columna] = valor
    return df_copy


#Se cambia solo se cambia la categoria a 'fruits-vegetables'
df_temp_cp = cambiar_valores_columna(df_temp_cp, 'tipo', 'fruits-vegetables')
df_temp_cp.tail(3)

Unnamed: 0,nombre,tipo,temporada_pico
47,Tomate verde (tomatillo),fruits-vegetables,Todo el año
48,Verdolaga,fruits-vegetables,Abr-Oct
49,Zanahoria,fruits-vegetables,Todo el año


In [None]:
import pandas as pd
import numpy as np

def extraer_temporadas(df, col="temporada_pico"):
    """
    Crea tres nuevas columnas en el DataFrame con información sobre la temporada.

    - todo_el_anio: True si en el texto aparece "todo el año"
    - temporada_pico_inicio: número del mes donde inicia la temporada (1 = enero)
    - temporada_pico_fin: número del mes donde termina la temporada (12 = diciembre)
    """

    # Diccionario para convertir abreviaturas de meses a numeros
    meses = {
        "ene": 1, "feb": 2, "mar": 3, "abr": 4, "may": 5, "jun": 6,
        "jul": 7, "ago": 8, "sep": 9, "oct": 10, "nov": 11, "dic": 12
    }

    # Lista donde guardar los resultados
    todo_el_anio = []
    mes_inicio = []
    mes_fin = []

    # Recorrido de cada valor de la columna
    for texto in df[col]:
        # Si el valor está vacío o es NaN
        if pd.isna(texto):
            todo_el_anio.append(False)
            mes_inicio.append(np.nan)
            mes_fin.append(np.nan)
            continue

        texto = texto.lower().replace("–", "-")  # reemplaza guiones raros
        es_todo_anio = "todo el año" in texto or "Todo el año" in texto

        # Buscar un rango con guion
        if "-" in texto:
            # Tomamos las primeras tres letras de cada mes
            partes = texto.split("-")
            mes_i = partes[0].strip()[:3]
            mes_f = partes[1].strip()[:3]
            inicio = meses.get(mes_i, np.nan)
            fin = meses.get(mes_f, np.nan)
        else:
            # En caso de no haber guion
            inicio = fin = np.nan
            for m in meses:
                if m in texto:
                    inicio = fin = meses[m]
                    break

        todo_el_anio.append(es_todo_anio)
        mes_inicio.append(inicio)
        mes_fin.append(fin)

    # Agregar las tres nuevas columnas al DataFrame
    df["todo_el_anio"] = todo_el_anio
    df["temporada_pico_inicio"] = mes_inicio
    df["temporada_pico_fin"] = mes_fin

    return df


df = extraer_temporadas(df_temp_cp)
df

Unnamed: 0,nombre,tipo,temporada_pico,todo_el_anio,temporada_pico_inicio,temporada_pico_fin
0,Aguacate,fruits-vegetables,Dic-May (alta); disponible todo el año,True,12.0,5.0
1,Ciruela,fruits-vegetables,Jul–Ago,False,7.0,8.0
2,Durazno,fruits-vegetables,Jul–Sep,False,7.0,9.0
3,Fresa,fruits-vegetables,May-Jun,False,5.0,6.0
4,Granada roja,fruits-vegetables,Sep–Oct,False,9.0,10.0
5,Guayaba,fruits-vegetables,Sep-Dic,False,9.0,12.0
6,Higo,fruits-vegetables,Jul–Oct,False,7.0,10.0
7,Lima,fruits-vegetables,Nov–Abr,False,11.0,4.0
8,Limón,fruits-vegetables,Todo el año (picos Oct-Dic),True,,12.0
9,Mamey,fruits-vegetables,Abr–Jun,False,4.0,6.0
