# 🌱 Análisis de Datos de Sensores IoT para Agricultura Inteligente

## 📋 Contexto del Problema

Una empresa de tecnología agrícola ha implementado una red de sensores IoT en diferentes parcelas de cultivo. Estos sensores recopilan datos cada hora sobre:
- **Temperatura** del suelo (°C)
- **Humedad** del suelo (%)
- **pH** del suelo
- **Luz solar** (lux)

Como **ingeniero de datos**, tu misión es procesar y analizar esta información para optimizar el rendimiento de los cultivos y detectar condiciones anómalas que requieran intervención.

## 🎯 Objetivos de Aprendizaje

Al completar este ejercicio, practicarás los siguientes conceptos de **NumPy**:

- ✅ **Creación y manipulación de arrays multidimensionales**
- ✅ **Indexación y slicing avanzado**
- ✅ **Operaciones vectorizadas y broadcasting**
- ✅ **Funciones de agregación estadística**
- ✅ **Operaciones de álgebra lineal básica**
- ✅ **Manejo de valores faltantes (NaN)**
- ✅ **Filtrado y selección condicional de datos**

---

## 📦 Paso 1: Importar NumPy y Configuración Inicial

Comienza importando la librería NumPy y configurando la semilla aleatoria para reproducibilidad.

In [None]:
# TODO: Importa NumPy con el alias 'np'
# TODO: Configura la semilla aleatoria en 42 para reproducibilidad

# Tu código aquí:


## 🏗️ Paso 2: Simulación de Datos de Sensores

Vamos a simular datos de **5 parcelas** durante **24 horas** (1 lectura por hora) con **4 tipos de sensores**.

### Estructura de los datos:
- **Dimensiones**: (5 parcelas, 24 horas, 4 sensores)
- **Sensores**: [Temperatura, Humedad, pH, Luz]
- **Rangos típicos**:
  - Temperatura: 15-30°C
  - Humedad: 30-80%
  - pH: 6.0-8.0
  - Luz: 0-50000 lux

In [None]:
# TODO: Crea un array 3D con forma (5, 24, 4) con valores aleatorios
# Usa np.random.random() y escala los valores a los rangos apropiados

# Paso 2a: Crear array base con valores entre 0 y 1
datos_sensores = # Tu código aquí

print(f"Forma del array: {datos_sensores.shape}")
print(f"Tipo de dato: {datos_sensores.dtype}")

In [None]:
# Paso 2b: Escalar los valores a rangos realistas para cada sensor
# TODO: Usar broadcasting para escalar cada sensor a su rango apropiado

# Rangos para cada sensor: [min_temp, min_hum, min_ph, min_luz]
valores_minimos = np.array([15, 30, 6.0, 0])
rangos = np.array([15, 50, 2.0, 50000])  # [rango_temp, rango_hum, rango_ph, rango_luz]

# TODO: Aplicar la transformación: datos_escalados = datos * rangos + valores_minimos
datos_escalados = # Tu código aquí

print("Valores mínimos y máximos por sensor:")
sensores = ['Temperatura (°C)', 'Humedad (%)', 'pH', 'Luz (lux)']
for i, sensor in enumerate(sensores):
    print(f"{sensor}: {datos_escalados[:,:,i].min():.2f} - {datos_escalados[:,:,i].max():.2f}")

## 📊 Paso 3: Análisis Estadístico Básico

Calcula estadísticas descriptivas para entender mejor los datos recopilados.

In [None]:
# TODO: Calcula la media de cada sensor para todas las parcelas y horas
media_sensores = # Tu código aquí

# TODO: Calcula la desviación estándar de cada sensor
std_sensores = # Tu código aquí

print("📈 Estadísticas Generales por Sensor:")
print("-" * 50)
for i, sensor in enumerate(sensores):
    print(f"{sensor}:")
    print(f"  Media: {media_sensores[i]:.2f}")
    print(f"  Desv. Estándar: {std_sensores[i]:.2f}")
    print()

## 🌡️ Paso 4: Análisis Temporal - Variaciones por Hora

Analiza cómo varían las condiciones a lo largo del día.

In [None]:
# TODO: Calcula la media de cada sensor para cada hora del día (promedio de todas las parcelas)
# Pista: usa axis=0 para promediar sobre las parcelas
variacion_horaria = # Tu código aquí

print(f"Forma del array de variación horaria: {variacion_horaria.shape}")

# TODO: Encuentra la hora con mayor temperatura promedio
hora_max_temp = # Tu código aquí

# TODO: Encuentra la hora con mayor intensidad de luz
hora_max_luz = # Tu código aquí

print(f"\n🕐 Hora con mayor temperatura: {hora_max_temp}:00 hrs")
print(f"☀️ Hora con mayor intensidad de luz: {hora_max_luz}:00 hrs")

## 🌾 Paso 5: Análisis por Parcela

Identifica qué parcelas tienen las mejores y peores condiciones promedio.

In [None]:
# TODO: Calcula la media de cada sensor para cada parcela (promedio de todas las horas)
condiciones_parcela = # Tu código aquí

print("🏞️ Condiciones promedio por parcela:")
print("-" * 60)
for parcela in range(5):
    print(f"Parcela {parcela + 1}:")
    for i, sensor in enumerate(sensores):
        print(f"  {sensor}: {condiciones_parcela[parcela, i]:.2f}")
    print()

In [None]:
# TODO: Encuentra la parcela con la temperatura promedio más alta
parcela_temp_max = # Tu código aquí

# TODO: Encuentra la parcela con la humedad promedio más baja
parcela_hum_min = # Tu código aquí

print(f"🌡️ Parcela más caliente: Parcela {parcela_temp_max + 1}")
print(f"💧 Parcela más seca: Parcela {parcela_hum_min + 1}")

## ⚠️ Paso 6: Detección de Condiciones Anómalas

Identifica lecturas que están fuera del rango óptimo para el crecimiento de cultivos.

In [None]:
# Definir rangos óptimos para cada sensor
rangos_optimos = {
    'temp_min': 18, 'temp_max': 25,    # Temperatura
    'hum_min': 40, 'hum_max': 70,      # Humedad
    'ph_min': 6.5, 'ph_max': 7.5,     # pH
    'luz_min': 20000, 'luz_max': 45000 # Luz
}

# TODO: Crear máscaras booleanas para identificar valores fuera del rango óptimo

# Temperatura fuera de rango
temp_anomala = # Tu código aquí

# Humedad fuera de rango
humedad_anomala = # Tu código aquí

# pH fuera de rango
ph_anomalo = # Tu código aquí

# Luz fuera de rango
luz_anomala = # Tu código aquí

print("⚠️ Detección de Anomalías:")
print(f"Lecturas de temperatura anómalas: {np.sum(temp_anomala)}")
print(f"Lecturas de humedad anómalas: {np.sum(humedad_anomala)}")
print(f"Lecturas de pH anómalas: {np.sum(ph_anomalo)}")
print(f"Lecturas de luz anómalas: {np.sum(luz_anomala)}")

## 🔍 Paso 7: Índice de Calidad del Cultivo

Crea un índice compuesto que combine todos los sensores para evaluar la "calidad" general de las condiciones de cultivo.

In [None]:
# TODO: Normalizar cada sensor a una escala de 0-1 donde 1 es óptimo
# Vamos a usar una función que da 1 en el centro del rango óptimo y decrece hacia los bordes

def calcular_puntuacion_sensor(valores, min_opt, max_opt):
    """
    Calcula una puntuación de 0-1 basada en qué tan cerca están los valores del rango óptimo.
    1.0 = en el rango óptimo, 0.0 = muy lejos del rango óptimo
    """
    centro_optimo = (min_opt + max_opt) / 2
    rango_optimo = max_opt - min_opt
    
    # TODO: Calcula la distancia de cada valor al centro del rango óptimo
    distancia_centro = # Tu código aquí
    
    # TODO: Convierte la distancia en una puntuación (1 - distancia_normalizada)
    # Usa np.clip para mantener valores entre 0 y 1
    puntuacion = # Tu código aquí
    
    return puntuacion

# Calcular puntuaciones para cada sensor
punt_temp = calcular_puntuacion_sensor(datos_escalados[:,:,0], 18, 25)
punt_hum = calcular_puntuacion_sensor(datos_escalados[:,:,1], 40, 70)
punt_ph = calcular_puntuacion_sensor(datos_escalados[:,:,2], 6.5, 7.5)
punt_luz = calcular_puntuacion_sensor(datos_escalados[:,:,3], 20000, 45000)

print("✅ Puntuaciones calculadas para todos los sensores")

In [None]:
# TODO: Combinar las puntuaciones en un índice de calidad compuesto
# Usa diferentes pesos para cada sensor según su importancia
pesos = np.array([0.3, 0.3, 0.2, 0.2])  # [temp, hum, ph, luz]

# TODO: Crear un array con las puntuaciones de todos los sensores
# Forma: (5, 24, 4)
puntuaciones = # Tu código aquí

# TODO: Calcular el índice de calidad usando los pesos
# Pista: usa np.sum() con axis=2 y multiplica por los pesos
indice_calidad = # Tu código aquí

print(f"Forma del índice de calidad: {indice_calidad.shape}")
print(f"Índice de calidad promedio: {np.mean(indice_calidad):.3f}")

## 🏆 Paso 8: Ranking y Recomendaciones

Identifica las mejores parcelas y períodos de tiempo basándote en el índice de calidad.

In [None]:
# TODO: Encuentra la parcela con el mejor índice de calidad promedio
calidad_promedio_parcela = # Tu código aquí
mejor_parcela = # Tu código aquí

# TODO: Encuentra la hora del día con el mejor índice de calidad promedio
calidad_promedio_hora = # Tu código aquí
mejor_hora = # Tu código aquí

# TODO: Encuentra la combinación parcela-hora con el mejor índice
mejor_lectura_pos = # Tu código aquí (usa np.unravel_index y np.argmax)
mejor_parcela_hora, mejor_hora_momento = mejor_lectura_pos

print("🏆 RESULTADOS DEL ANÁLISIS:")
print("=" * 50)
print(f"🥇 Mejor parcela promedio: Parcela {mejor_parcela + 1} (Calidad: {calidad_promedio_parcela[mejor_parcela]:.3f})")
print(f"🕐 Mejor hora promedio: {mejor_hora}:00 hrs (Calidad: {calidad_promedio_hora[mejor_hora]:.3f})")
print(f"⭐ Mejor momento específico: Parcela {mejor_parcela_hora + 1} a las {mejor_hora_momento}:00 hrs")
print(f"   Calidad: {indice_calidad[mejor_parcela_hora, mejor_hora_momento]:.3f}")

## 📋 Paso 9: Reporte de Condiciones Críticas

Genera un reporte de las parcelas que necesitan atención inmediata.

In [None]:
# TODO: Identifica parcelas con índice de calidad promedio menor a 0.6
umbral_critico = 0.6
parcelas_criticas = # Tu código aquí

print("🚨 REPORTE DE CONDICIONES CRÍTICAS:")
print("=" * 45)

if len(parcelas_criticas) > 0:
    for parcela_idx in parcelas_criticas:
        print(f"\n🔴 PARCELA {parcela_idx + 1} - REQUIERE ATENCIÓN")
        print(f"   Índice de calidad: {calidad_promedio_parcela[parcela_idx]:.3f}")
        
        # TODO: Muestra las condiciones promedio de la parcela crítica
        condiciones = condiciones_parcela[parcela_idx]
        print("   Condiciones promedio:")
        for i, sensor in enumerate(sensores):
            valor = condiciones[i]
            print(f"     {sensor}: {valor:.2f}")
        
        # TODO: Cuenta cuántas lecturas anómalas tiene esta parcela
        anomalias_temp = np.sum(temp_anomala[parcela_idx])
        anomalias_hum = np.sum(humedad_anomala[parcela_idx])
        anomalias_ph = np.sum(ph_anomalo[parcela_idx])
        anomalias_luz = np.sum(luz_anomala[parcela_idx])
        
        print(f"   Lecturas anómalas: Temp={anomalias_temp}, Hum={anomalias_hum}, pH={anomalias_ph}, Luz={anomalias_luz}")
else:
    print("✅ Todas las parcelas están en condiciones aceptables")

## 🎯 Paso 10: Desafío Final - Predicción Simple

Como ejercicio final, implementa una predicción simple de la próxima lectura usando el promedio de las últimas 3 horas.

In [None]:
# TODO: Para cada parcela y sensor, calcula la predicción de la "próxima hora" (hora 25)
# usando el promedio de las últimas 3 horas (horas 21, 22, 23)

# Seleccionar las últimas 3 horas de datos
ultimas_horas = # Tu código aquí (slicing)

# Calcular el promedio de las últimas 3 horas para cada parcela y sensor
prediccion_proxima_hora = # Tu código aquí

print("🔮 PREDICCIONES PARA LA PRÓXIMA HORA:")
print("=" * 40)

for parcela in range(5):
    print(f"\n📍 Parcela {parcela + 1}:")
    for i, sensor in enumerate(sensores):
        valor_actual = datos_escalados[parcela, -1, i]  # Última lectura
        prediccion = prediccion_proxima_hora[parcela, i]
        cambio = prediccion - valor_actual
        
        simbolo = "📈" if cambio > 0 else "📉" if cambio < 0 else "➡️"
        print(f"  {sensor}: {prediccion:.2f} {simbolo} (cambio: {cambio:+.2f})")

## 🎉 ¡Felicitaciones!

Has completado exitosamente el ejercicio de análisis de datos de sensores IoT para agricultura inteligente usando NumPy.

### 📚 Conceptos que has practicado:

✅ **Arrays multidimensionales**: Creación y manipulación de arrays 3D  
✅ **Broadcasting**: Escalado de datos usando operaciones vectorizadas  
✅ **Indexación y slicing**: Selección de datos específicos  
✅ **Agregaciones**: Cálculo de medias, máximos, mínimos  
✅ **Máscaras booleanas**: Filtrado condicional de datos  
✅ **Operaciones estadísticas**: Análisis de tendencias y anomalías  
✅ **Aplicaciones prácticas**: Solución de problemas del mundo real  

### 🚀 Próximos pasos:

- Experimenta modificando los rangos óptimos y observa cómo cambian los resultados
- Agrega más sensores (viento, presión atmosférica, etc.)
- Implementa visualizaciones usando Matplotlib
- Explora técnicas más avanzadas de detección de anomalías

---
*¡Excelente trabajo dominando NumPy con un caso de uso real! 🌱*