# Limpieza y Análisis de Datos
Este notebook documenta el proceso de manipulación, limpieza y análisis de los datos de Ecoenergy Solutions.

In [None]:
# 1. Importar librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly.express as px
from datetime import datetime

In [None]:
# 2. Configuración y variables del análisis
DATA_PATH = '../data/data_sample.csv'
CLEANED_PATH = '../data/data_cleaned.csv'

In [None]:
# 3. Funciones de procesamiento de datos

def cargar_datos(path):
    """Carga datos desde archivo CSV con validación"""
    try:
        df = pd.read_csv(path)
        return df
    except FileNotFoundError:
        return generar_datos_ficticios()

def generar_datos_ficticios():
    """Genera dataset ficticio para protección de datos"""
    np.random.seed(42)
    data = {
        'id': range(1, 101),
        'product_type': np.random.choice(['Solar_Unit', 'Energy_Storage', 'Converter'], 100),
        'energy_output': np.random.randint(2000, 5000, 100),
        'installation_date': pd.date_range('2024-01-01', periods=100, freq='D')
    }
    return pd.DataFrame(data)

def limpiar_datos(df):
    """Proceso de limpieza y validación de datos"""
    df_clean = df.drop_duplicates()
    df_clean = df_clean.dropna()
    df_clean = df_clean[df_clean['energy_output'] > 0]
    return df_clean

def visualizar_datos(df):
    """Crear visualizaciones de los datos procesados"""
    fig = px.bar(df.head(10), x='product_type', y='energy_output', 
                title='Producción Energética por Tipo de Producto (Muestra)')
    fig.show()

In [None]:
# 4. Ejecutar análisis y procesamiento

# Cargar y procesar datos
df = cargar_datos(DATA_PATH)
df_limpio = limpiar_datos(df)

# Guardar datos procesados
df_limpio.to_csv(CLEANED_PATH, index=False)

# Mostrar estadísticas básicas (información no sensible)
print(f"Registros procesados: {len(df_limpio)}")
print(f"Tipos de productos únicos: {df_limpio['product_type'].nunique()}")

# Visualización
visualizar_datos(df_limpio)