In [47]:
# Archivo: lab_02_funciones_avanzadas.py
"""
Laboratorio 2: Funciones Avanzadas y Vectorización
Objetivo: Dominar las funciones apply, map, applymap y técnicas de vectorización
          para transformaciones complejas de datos petroleros.

Este laboratorio utiliza datos del archivo sensores_avanzado.csv
"""
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

In [48]:
def main():
    # Cargar datos de ejemplo
    try:
        df_sensores = pd.read_csv('/workspaces/CursoPython-Basico-JuanDavid/Sesión_11/datos/sensores_avanzado.csv')
        print("Datos cargados exitosamente")
        print(f"Forma del DataFrame: {df_sensores.shape}")
        print(f"Columnas: {list(df_sensores.columns)}")
    except FileNotFoundError:
        print("Error: No se encontró el archivo 'datos/sensores_avanzado.csv'")
        return
    except Exception as e:
        print(f"Error al cargar datos: {e}")
        return
    
if __name__ == "__main__":
    main()

df_sensores = pd.read_csv('/workspaces/CursoPython-Basico-JuanDavid/Sesión_11/datos/sensores_avanzado.csv')

print("\n=== Laboratorio 2: Funciones Avanzadas y Vectorización ===\n")

Datos cargados exitosamente
Forma del DataFrame: (36, 12)
Columnas: ['pozo_id', 'sensor_id', 'tipo_sensor', 'ubicacion', 'fecha_hora', 'valor', 'unidad', 'estado_sensor', 'limite_min', 'limite_max', 'prioridad', 'ultima_calibracion']

=== Laboratorio 2: Funciones Avanzadas y Vectorización ===



In [49]:
# EJERCICIO 1: Función apply() con Series
    # -------------------------------------------------------------------
    # Utiliza apply() para transformar datos de sensores:
    # a) Convierte la columna 'fecha_hora' a datetime
    # b) Crea una función que calcule el estado de alarma basado en límites
    # c) Aplica la función a cada fila para determinar si hay alarma

print("Ejercicio 1: Función apply() con Series")
    
# TO DO: Implementa las transformaciones con apply() aquí

# a) Convierte la columna 'fecha_hora' a datetime
df_sensores['fecha_hora'] = pd.to_datetime(df_sensores['fecha_hora'], errors='coerce')

# b) Crea una función que calcule el estado de alarma basado en límites
def calcular_estado_alarma(row):
    if row['valor'] < row['limite_min']:
        return 'ALARMA'
    elif row['valor'] > row['limite_max']:
        return 'ALARMA'
    else:
        return 'NORMAL'

# c) Aplica la función a cada fila para determinar si hay alarma
df_sensores['estado_alarma'] = df_sensores.apply(calcular_estado_alarma, axis=1)

# Imprimir resultados (no modificar)
try:
        print("a) Tipos de datos después de conversión:")
        print(f"   fecha_hora: {df_sensores['fecha_hora'].dtype}")
        print(f"   Rango de fechas: {df_sensores['fecha_hora'].min()} a {df_sensores['fecha_hora'].max()}")
        
        print("\nb) Distribución de estados de alarma:")
        print(df_sensores['estado_alarma'].value_counts())
        
        print("\nc) Ejemplos de alarmas:")
        alarmas = df_sensores[df_sensores['estado_alarma'] == 'ALARMA']
        for _, row in alarmas.head(3).iterrows():
            print(f"   {row['sensor_id']}: {row['valor']} {row['unidad']} (límites: {row['limite_min']}-{row['limite_max']})")
except NameError:
        print("No se han implementado las transformaciones con apply()")
    
print("\n" + "-"*50 + "\n")


Ejercicio 1: Función apply() con Series
a) Tipos de datos después de conversión:
   fecha_hora: datetime64[ns]
   Rango de fechas: 2024-01-01 08:00:00 a 2024-01-01 16:00:00

b) Distribución de estados de alarma:
estado_alarma
NORMAL    36
Name: count, dtype: int64

c) Ejemplos de alarmas:

--------------------------------------------------



In [50]:
# EJERCICIO 2: Función map() para transformaciones de valores
    # -------------------------------------------------------------------
    # Utiliza map() para transformaciones de valores discretos:
    # a) Crea un mapeo de prioridades a valores numéricos
    # b) Mapea tipos de sensores a categorías de criticidad
    # c) Crea un mapeo de ubicaciones a zonas operacionales

print("Ejercicio 2: Función map() para transformaciones de valores")

# TO DO: Implementa las transformaciones con map() aquí

# a) Crea un mapeo de prioridades a valores numéricos
mapeo_prioridades = {
    'Baja': 1,
    'Media': 2,
    'Alta': 3
}
df_sensores['prioridad_numerica'] = df_sensores['prioridad'].map(mapeo_prioridades)

# b) Mapea tipos de sensores a categorías de criticidad
mapeo_criticidad = {
    'Temperatura': 'Crítico',
    'Presión': 'Crítico',
    'Flujo': 'Crítico',
    'Vibración': 'Media',
    'Nivel': 'Alta',
    'Gas': 'Alta',
    'Conductividad': 'Media',
}
df_sensores['criticidad'] = df_sensores['tipo_sensor'].map(mapeo_criticidad)

# c) Crea un mapeo de ubicaciones a zonas operacionales
mapeo_ubicaciones = {
    'Cabeza': 'zona_A',
    'Línea': 'zona_B',
    'Tanque': 'zona_C',
    'Separador': 'zona_D',
    'Bomba': 'zona_E',
    'Agua': 'zona_F'                      
}
df_sensores['zona_operacional'] = df_sensores['ubicacion'].map(mapeo_ubicaciones)

# Imprimir resultados (no modificar)
try:
        print("a) Distribución de prioridades numéricas:")
        print(df_sensores['prioridad_numerica'].value_counts().sort_index())
        
        print("\nb) Distribución por criticidad:")
        print(df_sensores['criticidad'].value_counts())
        
        print("\nc) Distribución por zona operacional:")
        print(df_sensores['zona_operacional'].value_counts())
        
        print("\nd) Sensores críticos por zona:")
        sensores_criticos = df_sensores[df_sensores['criticidad'] == 'Crítico']
        print(sensores_criticos.groupby('zona_operacional')['sensor_id'].count())
except NameError:
        print("No se han implementado las transformaciones con map()")
    
print("\n" + "-"*50 + "\n")

Ejercicio 2: Función map() para transformaciones de valores
a) Distribución de prioridades numéricas:
prioridad_numerica
1     6
2     9
3    21
Name: count, dtype: int64

b) Distribución por criticidad:
criticidad
Crítico    24
Alta        6
Media       6
Name: count, dtype: int64

c) Distribución por zona operacional:
zona_operacional
zona_A    21
zona_B     3
zona_C     3
zona_D     3
zona_E     3
zona_F     3
Name: count, dtype: int64

d) Sensores críticos por zona:
zona_operacional
zona_A    21
zona_B     3
Name: sensor_id, dtype: int64

--------------------------------------------------

