In [23]:
import pandas as pd
import numpy as np

df_temp = pd.read_csv("../datasets/frutas_verduras_temporada.csv")
df_temp_cp = df_temp.copy()
df_temp_cp.head(5)

Unnamed: 0,nombre,tipo,temporada_pico
0,Aguacate,Fruta,Jun–Nov (alta); disponible todo el año
1,Ciruela,Fruta,Jun–Ago
2,Durazno,Fruta,Jul–Sep
3,Fresa,Fruta,Nov–May
4,Granada roja,Fruta,Ago–Oct


In [14]:
def cambiar_valores_columna(df : pd.DataFrame, nombre_columna: str, valor: any) -> pd.DataFrame:
    """
    Reemplaza todos los valores de una columna específica en un DataFrame por un nuevo valor.

    Parametros
    ----------
    df : pandas.DataFrame
        El DataFrame que contiene la columna a modificar.
    column_name : str
        El nombre de la columna cuyos valores seran reemplazados.
    value : any
        El nuevo valor que se asignara a todos los elementos de la columna.
        Puede ser un valor escalar (str, int, float, bool, etc.).

    Retorna
    -------
    pandas.DataFrame
        Una copia del DataFrame con la columna modificada.  
        No altera el DataFrame original.
    """
    
    if nombre_columna not in df.columns:
        raise KeyError(f"La columna '{nombre_columna}' no existe en el DataFrame.")
    df_copy = df.copy()
    df_copy[nombre_columna] = valor
    return df_copy


#Se cambia solo se cambia la categoria a 'fruits-vegetables'
df_temp_cp = cambiar_valores_columna(df_temp_cp, 'tipo', 'fruits-vegetables')
df_temp_cp.tail(3)

Unnamed: 0,nombre,tipo,temporada_pico
47,Tomate verde (tomatillo),fruits-vegetables,Todo el año
48,Verdolaga,fruits-vegetables,Jun
49,Zanahoria,fruits-vegetables,Todo el año


In [29]:
import pandas as pd
import numpy as np

def extraer_temporadas(df, col="temporada_pico"):
    """
    Crea tres nuevas columnas en el DataFrame con información sobre la temporada.

    - todo_el_anio: True si en el texto aparece "todo el año"
    - temporada_pico_inicio: número del mes donde inicia la temporada (1 = enero)
    - temporada_pico_fin: número del mes donde termina la temporada (12 = diciembre)
    """

    # Diccionario para convertir abreviaturas de meses a números
    meses = {
        "ene": 1, "feb": 2, "mar": 3, "abr": 4, "may": 5, "jun": 6,
        "jul": 7, "ago": 8, "sep": 9, "oct": 10, "nov": 11, "dic": 12
    }

    # Lista donde guardaremos los resultados
    todo_el_anio = []
    mes_inicio = []
    mes_fin = []

    # Recorremos cada valor de la columna
    for texto in df[col]:
        # Si el valor está vacío o es NaN
        if pd.isna(texto):
            todo_el_anio.append(False)
            mes_inicio.append(np.nan)
            mes_fin.append(np.nan)
            continue

        texto = texto.lower().replace("–", "-")  # reemplaza guiones raros
        es_todo_anio = "todo el año" in texto or "Todo el año" in texto

        # Buscamos un rango con guion, como "jun-ago"
        if "-" in texto:
            # Tomamos las primeras tres letras de cada mes
            partes = texto.split("-")
            mes_i = partes[0].strip()[:3]
            mes_f = partes[1].strip()[:3]
            inicio = meses.get(mes_i, np.nan)
            fin = meses.get(mes_f, np.nan)
        else:
            # Si no hay guion, buscamos un solo mes
            inicio = fin = np.nan
            for m in meses:
                if m in texto:
                    inicio = fin = meses[m]
                    break

        # Guardamos los resultados
        todo_el_anio.append(es_todo_anio)
        mes_inicio.append(inicio)
        mes_fin.append(fin)

    # Agregamos las tres nuevas columnas al DataFrame
    df["todo_el_anio"] = todo_el_anio
    df["temporada_pico_inicio"] = mes_inicio
    df["temporada_pico_fin"] = mes_fin

    return df


df = extraer_temporadas(df_temp_cp)
df

Unnamed: 0,nombre,tipo,temporada_pico,todo_el_anio,temporada_pico_inicio,temporada_pico_fin
0,Aguacate,Fruta,Jun–Nov (alta); disponible todo el año,True,6.0,11.0
1,Ciruela,Fruta,Jun–Ago,False,6.0,8.0
2,Durazno,Fruta,Jul–Sep,False,7.0,9.0
3,Fresa,Fruta,Nov–May,False,11.0,5.0
4,Granada roja,Fruta,Ago–Oct,False,8.0,10.0
5,Guayaba,Fruta,Ago–Mar,False,8.0,3.0
6,Higo,Fruta,Jul–Sep,False,7.0,9.0
7,Lima,Fruta,Ene–Feb y Nov–Dic,False,1.0,2.0
8,Limón,Fruta,Todo el año (picos Feb–Abr y Jul–Nov),True,,4.0
9,Mamey,Fruta,Feb–Jun,False,2.0,6.0


In [22]:
df_temp_cp['todo_el_anio'] = df_temp_cp['temporada_pico'].str.contains('todo el año', case=False)
df_temp_cp['temporada_pico'].head(50)

0     Jun–Nov (alta); disponible todo el año
1                                    Jun–Ago
2                                    Jul–Sep
3                                    Nov–May
4                                    Ago–Oct
5                                    Ago–Mar
6                                    Jul–Sep
7                          Ene–Feb y Nov–Dic
8      Todo el año (picos Feb–Abr y Jul–Nov)
9                                    Feb–Jun
10                                   Oct–Feb
11                                   Mar–Ago
12            Jul–Nov (disponible hasta mar)
13                                   Abr–Oct
14                                   Nov–Abr
15                               Todo el año
16                                   May–Nov
17                               Todo el año
18                               Todo el año
19                                   Feb–Sep
20                                   Ene–Abr
21                                   Oct–Dic
22        

In [None]:
"""
nombre,tipo,todo_el_anio,inicio_temporada_pico,fin_temporada_pico,comentarios
Aguacate,Fruta,si,06,11,Jun–Nov (alta); disponible todo el año
Ciruela,Fruta,no,06,08,Jun–Ago
Durazno,Fruta,no,07,09,Jul–Sep
Fresa,Fruta,no,11,05,Nov–May
Granada roja,Fruta,no,08,10,Ago–Oct
Guayaba,Fruta,Ago–Mar
Higo,Fruta,Jul–Sep
Lima,Fruta,Ene–Feb y Nov–Dic
Limón,Fruta,Todo el año (picos Feb–Abr y Jul–Nov)
Mamey,Fruta,Feb–Jun
Mandarina,Fruta,Oct–Feb
Mango,Fruta,Mar–Ago
Manzana,Fruta,Jul–Nov (disponible hasta mar)
Melón,Fruta,Abr–Oct
Naranja,Fruta,Nov–Abr
Papaya,Fruta,Todo el año
Pera,Fruta,May–Nov
Piña,Fruta,Todo el año
Plátano,Fruta,Todo el año
Sandía,Fruta,Feb–Sep
Tamarindo,Fruta,Ene–Abr
Tejocote,Fruta,Oct–Dic
Toronja (pomelo),Fruta,Nov–Abr
Tuna,Fruta,Jul–Sep
Uva,Fruta,Jun–Nov
Zapote negro,Fruta,Dic–Ene
Acelga,Verdura,Todo el año
Ajo,Verdura,Todo el año
Berenjena,Verdura,Ene–Feb y May y Sep–Oct
Berro,Verdura,Jun–Jul
Betabel,Verdura,Todo el año
Calabacita,Verdura,Todo el año
Cebolla,Verdura,Todo el año
Chayote,Verdura,Abr–Oct
Chile poblano,Verdura,Ago–Oct
Chile verde (jalapeño/serrano),Verdura,Ene–Oct
Chícharo,Verdura,Feb–May y Ago–Sep
Col (repollo),Verdura,Todo el año (pico Oct–Abr)
Coliflor,Verdura,Oct–May
Ejote,Verdura,Feb–Nov
Elote (maíz tierno),Verdura,Mar–Nov
Espinaca,Verdura,Todo el año
Jitomate (tomate rojo),Verdura,Todo el año
Lechuga,Verdura,Todo el año
Nopal,Verdura,Mar–Jun y Ago–Nov
Papa,Verdura,Todo el año
Pepino,Verdura,Todo el año
Tomate verde (tomatillo),Verdura,Todo el año
Verdolaga,Verdura,Jun
Zanahoria,Verdura,Todo el año

"""