In [None]:
!pip install pandas numpy matplotlib seaborn scikit-learn

import pandas as pd
import numpy as np
import random

# Configuración básica
random.seed(42)
np.random.seed(42)

# Configuración de los datos
departamentos = [f"{chr(65+i)}{j:02d}" for i in range(4) for j in range(1, 11)]  # A01-A10, B01-B10, ...
años = range(2014, 2024)
meses = range(1, 13)
tarifa_gas_bolivianos = 0.6  # Tarifa fija de gas en BOB por m³

# Generar datos simulados
data = []
for depto in departamentos:
    superficie = random.randint(40, 120)  # m²
    piso = int(depto[1])  # Determinar el piso basado en el número
    estado_mantenimiento = random.choice(['Bueno', 'Regular', 'Malo'])
    ocupantes = random.randint(1, 5)
    
    for año in años:
        for mes in meses:
            temp_promedio = random.uniform(-5, 30)  # Temperatura aleatoria en °C
            consumo = (
                (superficie / 10) + 
                (5 * ocupantes) + 
                random.uniform(-3, 3) + 
                (30 - temp_promedio) * 0.5
            )
            consumo = max(consumo, 0)  # Evitar valores negativos
            costo = consumo * tarifa_gas_bolivianos  # Costo en BOB
            data.append([depto, año, mes, round(consumo, 2), round(temp_promedio, 2), ocupantes, superficie, piso, estado_mantenimiento, round(costo, 2)])

# Crear DataFrame
columns = ['Departamento', 'Año', 'Mes', 'Consumo (m³)', 'Temperatura promedio mensual (°C)', 
           'Número de ocupantes', 'Superficie (m²)', 'Piso', 'Estado de mantenimiento', 'Costo (BOB)']
df = pd.DataFrame(data, columns=columns)

# Guardar dataset en archivo CSV
df.to_csv('consumo_gas_departamentos_con_costo.csv', index=False)

# Mostrar un preview del dataset
print(df.head())


  Departamento   Año  Mes  Consumo (m³)  Temperatura promedio mensual (°C)  \
0          A01  2014    1         31.45                               3.57   
1          A01  2014    2         37.55                              -1.41   
2          A01  2014    3         28.90                              14.09   
3          A01  2014    4         34.91                              -3.89   
4          A01  2014    5         34.44                               3.14   

   Número de ocupantes  Superficie (m²)  Piso Estado de mantenimiento  \
0                    3               54     0                   Bueno   
1                    3               54     0                   Bueno   
2                    3               54     0                   Bueno   
3                    3               54     0                   Bueno   
4                    3               54     0                   Bueno   

   Costo (BOB)  
0        18.87  
1        22.53  
2        17.34  
3        20.94  
4      