
# Reto 3 – Oxígeno disuelto 🌿

**Objetivo:**  
Evaluar el riesgo ecológico según los niveles de oxígeno disuelto en distintas muestras de agua.

**Datos:**  
`data/muestras_calidad_agua.csv`

**Pasos del análisis:**
1. Cargar el archivo CSV en un DataFrame (`df`).
2. Extraer las columnas relevantes: `sitio` y `oxigeno`.
3. Clasificar los valores de oxígeno como **bajo**, **medio** o **alto**.
4. Crear una columna que indique **riesgo biológico** cuando el oxígeno < 5 mg/L.
5. Exportar los resultados a un nuevo archivo CSV: `resultado_oxigeno.csv`.
6. Calcular el porcentaje de sitios con riesgo.


In [None]:

# Paso 1️⃣: Importar librerías
import pandas as pd

# Cargar el CSV desde la carpeta data/
df = pd.read_csv('data/muestras_calidad_agua.csv')

# Mostrar las primeras filas para verificar
df.head()



### ✅ Paso 2: Seleccionar columnas necesarias
Nos enfocamos solo en las columnas `sitio` y `oxigeno`, ya que son las relevantes para el análisis.


In [None]:

df = df[['sitio', 'oxigeno']]
df.head()



### ✅ Paso 3: Clasificar el nivel de oxígeno
Creamos una nueva columna `nivel_oxigeno` según los rangos:
- **Bajo:** oxígeno < 3  
- **Medio:** entre 3 y 6  
- **Alto:** ≥ 6  


In [None]:

def clasificar_nivel(o):
    if o < 3:
        return 'bajo'
    elif o < 6:
        return 'medio'
    else:
        return 'alto'

df['nivel_oxigeno'] = df['oxigeno'].apply(clasificar_nivel)
df.head()



### ✅ Paso 4: Evaluar riesgo biológico
Si el valor de oxígeno es menor a 5 mg/L, se considera que el sitio tiene **riesgo biológico**.


In [None]:

df['riesgo_biologico'] = df['oxigeno'].apply(lambda x: '⚠️ Riesgo' if x < 5 else 'Sin riesgo')
df.head()



### ✅ Paso 5: Exportar resultados
Guardamos el DataFrame resultante en un nuevo archivo CSV para registrar el análisis.


In [None]:

df.to_csv('resultado_oxigeno.csv', index=False)
print("Archivo 'resultado_oxigeno.csv' exportado correctamente ✅")



### ✅ Paso 6: Calcular porcentaje de sitios con riesgo
Esto nos da una idea del estado general del ecosistema.


In [None]:

porcentaje_riesgo = (df['riesgo_biologico'] == '⚠️ Riesgo').mean() * 100
print(f"Porcentaje de sitios con riesgo biológico: {porcentaje_riesgo:.2f}%")



---

### 🧾 Conclusión
Este análisis permite estimar la calidad del agua según su contenido de oxígeno disuelto.  
Un valor bajo (<5 mg/L) puede indicar contaminación o falta de oxigenación, lo que representa un riesgo para la vida acuática.

---
