# Reto 3 – Clasificación de biomasa

**Objetivo:** Clasificar los ecosistemas según su biomasa y variables ambientales asociadas.

Carga el conjunto de datos y explora las variables relevantes.

In [3]:
import pandas as pd

df = pd.read_csv("/workspaces/5-funciones-y-pandas-grupo_1/data/resultados_experimentos.csv")

df.head()

Unnamed: 0,sitio,temperatura,humedad,luz,biomasa
0,Bosque Alto de Nocaima,23.8,82.2,1030,250.8
1,Humedal Facatativá,18.0,89.7,395,225.8
2,Río San Francisco,17.2,85.4,647,237.5
3,Ladera de La Vega,21.7,81.4,769,252.4
4,Zona Húmeda El Vergel,24.1,85.3,1333,302.7


## Exploración inicial
Describe las columnas y analiza los tipos de datos.

In [6]:
import pandas as pd


df = pd.read_csv("../data/resultados_experimentos.csv")


pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
pd.set_option('display.width', None)

print(" Información general del conjunto de datos:\n")
print(df.info())


print("\n Primeras filas del DataFrame:\n")
print(df.head())

print("\n Estadísticas descriptivas de las variables numéricas:\n")
print(df.describe())

print("\n Conteo de valores nulos por columna:\n")
print(df.isnull().sum())

print("\n Tipos de datos por columna:\n")
print(df.dtypes)


 Información general del conjunto de datos:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 5 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   sitio        20 non-null     object 
 1   temperatura  20 non-null     float64
 2   humedad      20 non-null     float64
 3   luz          20 non-null     int64  
 4   biomasa      20 non-null     float64
dtypes: float64(3), int64(1), object(1)
memory usage: 932.0+ bytes
None

 Primeras filas del DataFrame:

                    sitio  temperatura  humedad   luz  biomasa
0  Bosque Alto de Nocaima         23.8     82.2  1030    250.8
1      Humedal Facatativá         18.0     89.7   395    225.8
2       Río San Francisco         17.2     85.4   647    237.5
3       Ladera de La Vega         21.7     81.4   769    252.4
4   Zona Húmeda El Vergel         24.1     85.3  1333    302.7

 Estadísticas descriptivas de las variables numéricas:

       temperatura 

## Desarrollo del reto
Aplica funciones y análisis según el objetivo. Usa `def` para definir tus funciones.

In [13]:

# Definimos una función para clasificar los ecosistemas según su biomasa
def clasificar_biomasa(valor):
    if valor < 50:
        return "Baja"
    elif 50 <= valor < 150:
        return "Media"
    else:
        return "Alta"

# Aplicamos la función a la columna 'biomasa' (ajusta el nombre exacto si es diferente)
df['Clasificación_biomasa'] = df['biomasa'].apply(clasificar_biomasa)

# Mostramos una vista previa con la nueva columna
print("\n Clasificación de biomasa agregada:\n")
print(df[['biomasa', 'Clasificación_biomasa']].head())

# Análisis por grupo
promedios_por_clase = df.groupby('Clasificación_biomasa')[['temperatura', 'humedad', 'luz','biomasa']].mean()
print("\n Promedios de variables ambientales por clase de biomasa:\n")
print(promedios_por_clase)

# Exportar resultados clasificados a un nuevo archivo CSV
df.to_csv("../data/resultados_clasificados.csv", index=False)
print("\n Archivo 'resultados_clasificados.csv' guardado correctamente.")



 Clasificación de biomasa agregada:

   biomasa Clasificación_biomasa
0    250.8                  Alta
1    225.8                  Alta
2    237.5                  Alta
3    252.4                  Alta
4    302.7                  Alta

 Promedios de variables ambientales por clase de biomasa:

                       temperatura    humedad         luz     biomasa
Clasificación_biomasa                                                
Alta                     21.030769  79.215385  888.538462  253.446154
Media                    20.071429  76.000000  924.142857   90.500000

 Archivo 'resultados_clasificados.csv' guardado correctamente.


## Interpretación de resultados
Escribe tus observaciones y conclusiones sobre los patrones encontrados.

Los resultados muestran que los ecosistemas con mayor biomasa se encuentran en rangos de temperatura templada, entre los 19 °C y 25 °C, acompañados de una buena disponibilidad de luz, lo que favorece el crecimiento vegetal y la productividad natural. Los bosques húmedos y los humedales templados, como el Bosque Alto de Nocaima, el Humedal Cajicá o la Zona Húmeda El Vergel, se destacan como los más productivos biológicamente, desempeñando un papel importante en la conservación y la captura de carbono. Por otra parte, se evidencia que factores como la baja luminosidad o las temperaturas más frías reducen significativamente la acumulación de biomasa, mientras que la humedad excesiva tampoco garantiza un aumento, ya que puede limitar el oxígeno disponible para las raíces. En general, el equilibrio entre temperatura, luz y humedad se consolida como el principal determinante de la eficiencia fotosintética y la salud de los ecosistemas andinos y húmedos, siendo un indicador clave para entender su productividad y estado ecológico.