Proyecto Energia - Analisis de datos - Nivel integrador
## Bases de datos Usadas
    ## https://www.datos.gov.co/Minas-y-Energ-a/Estado-de-la-prestaci-n-del-servicio-de-energ-a-en/3ebi-d83g/about_data
    ## https://www.datos.gov.co/Mapas-Nacionales/DIVIPOLA-C-digos-municipios-geolocalizados/vafm-j2df/data_preview
    ## https://www.datos.gov.co/Minas-y-Energ-a/Meta-FNCER-Incorporar-en-la-matriz-energ-tica-nuev/vy9n-w6hc/about_data

## Preguntas mostrar los siguientes datos (CARDs)
    ## Produccion de energia ZNI total x año
    ## Produccion de energia ZNI x departamento x año
    ## Produccion de energia ZNI x municipio x año.

In [9]:
import pandas as pd

data_base = pd.read_csv("datos/Estado_Zonas_No_Interconectadas_20250614.csv")
data_base.head(3)

data_base.isnull().sum()

ID DEPATAMENTO              0
DEPARTAMENTO                0
ID MUNICIPIO                0
MUNICIPIO                   0
ID LOCALIDAD                0
LOCALIDAD                   0
AÑO SERVICIO                0
MES SERVICIO                0
ENERGÍA ACTIVA              0
ENERGÍA REACTIVA            0
POTENCIA MÁXIMA             0
DÍA DE DEMANDA MÁXIMA       1
FECHA DE DEMANDA MÁXIMA     0
PROMEDIO DIARIO EN HORAS    0
dtype: int64

In [10]:
# Eliminamos algunas columnas que no son de interes
zni_data = data_base.drop(columns=["DÍA DE DEMANDA MÁXIMA", "FECHA DE DEMANDA MÁXIMA","LOCALIDAD"])
zni_data.head(3)

Unnamed: 0,ID DEPATAMENTO,DEPARTAMENTO,ID MUNICIPIO,MUNICIPIO,ID LOCALIDAD,AÑO SERVICIO,MES SERVICIO,ENERGÍA ACTIVA,ENERGÍA REACTIVA,POTENCIA MÁXIMA,PROMEDIO DIARIO EN HORAS
0,91,AMAZONAS,91001,LETICIA,91001000,2024,6,3994102,1010671.0,7824.51,24.0
1,91,AMAZONAS,91540,PUERTO NARIÑO,91540000,2024,6,127838,40378.0,256.0,24.0
2,91,AMAZONAS,91798,TARAPACA (ANM),91798000,2024,6,26578,11917.0,101.43,10.18


In [11]:
zni_data.isnull().sum()
zni_data["DEPARTAMENTO"].value_counts()

DEPARTAMENTO
CHOCÓ                                                       1243
NARIÑO                                                       861
CAUCA                                                        676
VICHADA                                                      215
CAQUETÁ                                                      212
VALLE DEL CAUCA                                              178
VAUPÉS                                                       177
AMAZONAS                                                     170
BOLÍVAR                                                      148
GUAINÍA                                                      124
CHOCO                                                        102
ANTIOQUIA                                                     95
PUTUMAYO                                                      94
ARCHIPIÉLAGO DE SAN ANDRÉS, PROVIDENCIA Y SANTA CATALINA      65
MAGDALENA                                                     59
META        

In [12]:
#Limpieza de datos, de los departamentos que tienen tilde y los que no
# Crear un diccionario de referencia con las tildes correctas

def limpieza_tildes_departamento_municipios(id, divisionpolitica):
    referencia = (
        zni_data[[id, divisionpolitica]]
        .dropna()
        .drop_duplicates(id)
        .set_index(id)[divisionpolitica]
        .apply(lambda x: x.strip())  # Eliminar espacios
        .to_dict()
    )
    return referencia

# Aplicar la corrección a los Departamentos
zni_data["DEPARTAMENTO"] = zni_data["ID DEPATAMENTO"].map(limpieza_tildes_departamento_municipios("ID DEPATAMENTO", "DEPARTAMENTO"))

zni_data[["ID DEPATAMENTO","DEPARTAMENTO"]].value_counts()

ID DEPATAMENTO  DEPARTAMENTO                            
27              CHOCÓ                                       1345
52              NARIÑO                                       861
19              CAUCA                                        675
99              VICHADA                                      215
18              CAQUETÁ                                      215
97              VAUPÉS                                       179
76              VALLE DEL CAUCA                              178
91              AMAZONAS                                     170
13              BOLÍVAR                                      151
94              GUAINÍA                                      126
88              ARCHIPIÉLAGO DE SAN ANDRÉS y PROVIDENCIA     101
5               ANTIOQUIA                                     95
86              PUTUMAYO                                      94
47              MAGDALENA                                     59
50              META             

In [13]:
# Aplicar la corrección a los Municipios
zni_data["MUNICIPIO"] = zni_data["ID MUNICIPIO"].map(limpieza_tildes_departamento_municipios("ID MUNICIPIO", "MUNICIPIO"))

zni_data[["ID MUNICIPIO","MUNICIPIO"]].value_counts()

ID MUNICIPIO  MUNICIPIO              
19809         TIMBIQUÍ                   336
19418         LÓPEZ DE MICAY             243
52390         LA TOLA                    224
27077         BAJO BAUDÓ                 198
52250         EL CHARCO                  198
52835         SAN ANDRÉS DE TUMACO       184
76109         BUENAVENTURA               178
27099         BOJAYÁ                     171
27800         UNGUÍA                     171
27075         BAHÍA SOLANO               159
27495         NUQUÍ                      154
13001         CARTAGENA DE INDIAS        151
18753         SAN VICENTE DEL CAGUÁN     132
27006         ACANDÍ                     116
99001         PUERTO CARREÑO              99
52696         SANTA BÁRBARA               98
19318         GUAPI                       97
5873          VIGÍA DEL FUERTE            95
86573         PUERTO LEGUÍZAMO            94
27425         MEDIO ATRATO                86
27250         EL LITORAL DEL SAN JUAN     86
18150         CAR

In [None]:
# Revision de municipios

In [14]:
zni_data[(zni_data["DEPARTAMENTO"] == "ANTIOQUIA") & (zni_data["AÑO SERVICIO"] == 2023)]

Unnamed: 0,ID DEPATAMENTO,DEPARTAMENTO,ID MUNICIPIO,MUNICIPIO,ID LOCALIDAD,AÑO SERVICIO,MES SERVICIO,ENERGÍA ACTIVA,ENERGÍA REACTIVA,POTENCIA MÁXIMA,PROMEDIO DIARIO EN HORAS
506,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873010,2023,12,8082,4939.0,24.91,21.52
507,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873013,2023,12,10159,3759.0,34.25,23.59
590,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873013,2023,11,4113,1393.0,27.83,19.33
591,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,11,3347,853.0,69.6,3.35
718,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,9,5685,837.0,56.26,6.18
789,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,8,5313,735.0,54.62,5.59
866,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,7,4947,471.0,32.06,6.39
926,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,6,4562,657.0,43.9,6.15
993,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,5,4558,847.0,63.07,4.32
1061,5,ANTIOQUIA,5873,VIGÍA DEL FUERTE,5873002,2023,4,4117,807.0,52.7,508.0


In [15]:
zni_data.groupby(["DEPARTAMENTO", "AÑO SERVICIO"])["ENERGÍA ACTIVA"].sum()
    

DEPARTAMENTO  AÑO SERVICIO
AMAZONAS      2020            37018005
              2021            44413734
              2022            51118722
              2023            48599379
              2024            47569686
                                ...   
VICHADA       2021            34672088
              2022            39101769
              2023            33974694
              2024            31584902
              2025             9833008
Name: ENERGÍA ACTIVA, Length: 97, dtype: int64

In [16]:
# Cargar base de datos con la Latitud y Longitud x codigos de municpios y departamentos
geodata = pd.read_csv("datos/DIVIPOLA_code_municipio_departamento_geolocalizados.csv")
geodata.head(5)

Unnamed: 0,COD_DPTO,NOM_DPTO,COD_MPIO,NOM_MPIO,TIPO,LATITUD,LONGITUD,Geo Municipio
0,5,ANTIOQUIA,5001,MEDELLÍN,Municipio,6.25759,-75.611031,POINT (-75.61103107 6.257590259)
1,5,ANTIOQUIA,5002,ABEJORRAL,Municipio,5.803728,-75.438474,POINT (-75.43847353 5.803728154)
2,5,ANTIOQUIA,5004,ABRIAQUÍ,Municipio,6.627569,-76.085978,POINT (-76.08597756 6.627569378)
3,5,ANTIOQUIA,5021,ALEJANDRÍA,Municipio,6.365534,-75.090597,POINT (-75.09059702 6.365534125)
4,5,ANTIOQUIA,5030,AMAGÁ,Municipio,6.032922,-75.708003,POINT (-75.7080031 6.032921994)


In [None]:
# Hacer merge entre los dataframe zni_data y el geodata con la columna en comun Cod_Mpio e ID municipio
zni_data_geodata = zni_data.merge(
    geodata[["COD_MPIO", "LATITUD", "LONGITUD"]],
    how="left",
    left_on="ID MUNICIPIO",
    right_on="COD_MPIO"
)
zni_data_geodata.drop(columns=["COD_MPIO"], inplace=True)
zni_data_geodata.head(5)

Unnamed: 0,ID DEPATAMENTO,DEPARTAMENTO,ID MUNICIPIO,MUNICIPIO,ID LOCALIDAD,AÑO SERVICIO,MES SERVICIO,ENERGÍA ACTIVA,ENERGÍA REACTIVA,POTENCIA MÁXIMA,PROMEDIO DIARIO EN HORAS,LATITUD,LONGITUD
0,91,AMAZONAS,91001,LETICIA,91001000,2024,6,3994102,1010671.0,7824.51,24.0,-3.530059,-70.045137
1,91,AMAZONAS,91540,PUERTO NARIÑO,91540000,2024,6,127838,40378.0,256.0,24.0,-3.631323,-70.47199
2,91,AMAZONAS,91798,TARAPACA (ANM),91798000,2024,6,26578,11917.0,101.43,10.18,-2.451794,-70.006515
3,88,ARCHIPIÉLAGO DE SAN ANDRÉS y PROVIDENCIA,88564,PROVIDENCIA,88564000,2024,6,1284196,274864.0,2241.56,24.0,13.35111,-81.373885
4,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,13001007,2024,6,60724,28336.0,265.63,9.4,10.463434,-75.458899


In [18]:
zni_data_geodata.to_csv("datos/zni_geodata.csv", index=False)
fromcsv_zni_geodata = pd.read_csv("datos/zni_geodata.csv")
fromcsv_zni_geodata.head(5)

Unnamed: 0,ID DEPATAMENTO,DEPARTAMENTO,ID MUNICIPIO,MUNICIPIO,ID LOCALIDAD,AÑO SERVICIO,MES SERVICIO,ENERGÍA ACTIVA,ENERGÍA REACTIVA,POTENCIA MÁXIMA,PROMEDIO DIARIO EN HORAS,LATITUD,LONGITUD
0,91,AMAZONAS,91001,LETICIA,91001000,2024,6,3994102,1010671.0,7824.51,24.0,-3.530059,-70.045137
1,91,AMAZONAS,91540,PUERTO NARIÑO,91540000,2024,6,127838,40378.0,256.0,24.0,-3.631323,-70.47199
2,91,AMAZONAS,91798,TARAPACA (ANM),91798000,2024,6,26578,11917.0,101.43,10.18,-2.451794,-70.006515
3,88,ARCHIPIÉLAGO DE SAN ANDRÉS y PROVIDENCIA,88564,PROVIDENCIA,88564000,2024,6,1284196,274864.0,2241.56,24.0,13.35111,-81.373885
4,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,13001007,2024,6,60724,28336.0,265.63,9.4,10.463434,-75.458899


In [19]:
# Cargar dataframe de energias no convecionales
no_convencionales = pd.read_csv("datos/Fuentes_No_Convencionales_de_Energ_a_Renovable.csv")
no_convencionales.head(5)

Unnamed: 0,Proyecto,Tipo,Capacidad,Departamento,Municipio,Código Departamento,Código Municipio,Fecha estimada FPO,Energía [kWh/día],Usuarios,Inversión estimada [COP],Empleos estimados,Emisiones CO2 [Ton/año]
0,JEPIRACHI,Eólico,18.42,LA GUAJIRA,URIBIA,44,44847,2004-04-27T00:00:00.000,176832,30665,79206000000,51,51635
1,AUTOG CELSIA SOLAR YUMBO,Solar,9.8,VALLE DEL CAUCA,YUMBO,76,76892,2017-03-09T00:00:00.000,47040,8157,42140000000,68,13736
2,CELSIA SOLAR BOLIVAR,Solar,8.06,BOLÍVAR,SANTA ROSA,13,13683,2019-02-01T00:00:00.000,38688,6709,34658000000,56,11297
3,EL PASO SOLAR (ENEL GREEN POWER),Solar,67.0,CESAR,EL PASO,20,20250,2019-04-05T00:00:00.000,321600,55769,288100000000,466,93907
4,SOLAR CASTILLA ECP,Solar,20.0,META,CASTILLA LA NUEVA,50,50150,2019-10-10T00:00:00.000,96000,16647,86000000000,139,28032


In [20]:
no_convencionales[no_convencionales["Código Municipio"]== 44847]

Unnamed: 0,Proyecto,Tipo,Capacidad,Departamento,Municipio,Código Departamento,Código Municipio,Fecha estimada FPO,Energía [kWh/día],Usuarios,Inversión estimada [COP],Empleos estimados,Emisiones CO2 [Ton/año]
0,JEPIRACHI,Eólico,18.42,LA GUAJIRA,URIBIA,44,44847,2004-04-27T00:00:00.000,176832,30665,79206000000,51,51635
57,PARQUE EÓLICO GUAJIRA I,Eólico,19.9,LA GUAJIRA,URIBIA,44,44847,2021-12-31T00:00:00.000,191040,33128,85570000000,55,55784
82,WESP01,Eólico,12.0,LA GUAJIRA,URIBIA,44,44847,2022-08-05T00:00:00.000,115200,19977,51600000000,33,33638
126,CASA ELÉCTRICA (AES),Eólico,176.3,LA GUAJIRA,URIBIA,44,44847,2024-01-01T00:00:00.000,1692480,293494,661125000000,490,494204
127,APOTOLORRU (AES),Eólico,75.0,LA GUAJIRA,URIBIA,44,44847,2024-01-01T00:00:00.000,720000,124855,281250000000,209,210240
141,CHEMESKY (ENEL GREEN POWER),Eólico,98.85,LA GUAJIRA,URIBIA,44,44847,2024-01-01T00:00:00.000,948960,164560,370688000000,275,277096
144,TUMAWIND (ENEL GREEN POWER),Eólico,197.77,LA GUAJIRA,URIBIA,44,44847,2024-01-01T00:00:00.000,1898592,329236,741638000000,550,554389
145,CAMELIA (CELSIA),Eólico,250.0,LA GUAJIRA,URIBIA,44,44847,2023-12-01T00:00:00.000,2400000,416185,937500000000,695,700800


In [22]:
# Asegurar que ambas columnas clave estén como string y sin espacios
geodata["COD_MPIO"] = geodata["COD_MPIO"].astype(str).str.strip()
no_convencionales["Código Municipio"] = no_convencionales["Código Municipio"].astype(str).str.strip()

# Hacer el merge para obtener coordenadas
no_convencionales_geo = no_convencionales.merge(
    geodata[["COD_MPIO", "LATITUD", "LONGITUD"]],
    left_on="Código Municipio",
    right_on="COD_MPIO",
    how="left"
)

no_convencionales_geo.drop(columns=["COD_MPIO"], inplace=True)
no_convencionales_geo.head()

Unnamed: 0,Proyecto,Tipo,Capacidad,Departamento,Municipio,Código Departamento,Código Municipio,Fecha estimada FPO,Energía [kWh/día],Usuarios,Inversión estimada [COP],Empleos estimados,Emisiones CO2 [Ton/año],LATITUD,LONGITUD
0,JEPIRACHI,Eólico,18.42,LA GUAJIRA,URIBIA,44,44847,2004-04-27T00:00:00.000,176832,30665,79206000000,51,51635,11.99972,-71.748827
1,AUTOG CELSIA SOLAR YUMBO,Solar,9.8,VALLE DEL CAUCA,YUMBO,76,76892,2017-03-09T00:00:00.000,47040,8157,42140000000,68,13736,3.595914,-76.510988
2,CELSIA SOLAR BOLIVAR,Solar,8.06,BOLÍVAR,SANTA ROSA,13,13683,2019-02-01T00:00:00.000,38688,6709,34658000000,56,11297,10.469207,-75.361161
3,EL PASO SOLAR (ENEL GREEN POWER),Solar,67.0,CESAR,EL PASO,20,20250,2019-04-05T00:00:00.000,321600,55769,288100000000,466,93907,9.683475,-73.738338
4,SOLAR CASTILLA ECP,Solar,20.0,META,CASTILLA LA NUEVA,50,50150,2019-10-10T00:00:00.000,96000,16647,86000000000,139,28032,3.805154,-73.538867


In [None]:
no_convencionales_geo.to_csv("datos/no_convencionales_geo.csv", index=False)
fromcsv_zni_geodata = pd.read_csv("datos/no_convencionales_geo.csv")
fromcsv_zni_geodata.head(5)

In [29]:
#encontrar en donde de las zonas no interconectas la generacion de energia es de tipo no convencional Eólica, solar o biomasa
coincidentes_zni_no_convencional = zni_data.merge(
    no_convencionales,
    how="inner",
    left_on="ID MUNICIPIO",
    right_on="Código Municipio"
)
coincidentes_zni_no_convencional.drop(columns=["ID LOCALIDAD", "Departamento", "Municipio", "Código Departamento", "Código Municipio", "Inversión estimada [COP]", "Empleos estimados", "Emisiones CO2 [Ton/año]"], inplace=True)
coincidentes_zni_no_convencional.head()

Unnamed: 0,ID DEPATAMENTO,DEPARTAMENTO,ID MUNICIPIO,MUNICIPIO,AÑO SERVICIO,MES SERVICIO,ENERGÍA ACTIVA,ENERGÍA REACTIVA,POTENCIA MÁXIMA,PROMEDIO DIARIO EN HORAS,Proyecto,Tipo,Capacidad,Fecha estimada FPO,Energía [kWh/día],Usuarios
0,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,2024,6,60724,28336.0,265.63,9.4,BAYUNCA 1,Solar,3.0,2020-09-30T00:00:00.000,14400,2497
1,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,2024,6,60724,28336.0,265.63,9.4,PUERTO DE CARTAGENA,Solar,2.2,2021-03-31T00:00:00.000,10560,1831
2,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,2024,6,60724,28336.0,265.63,9.4,GR PARQUE SOLAR TUCANES,Solar,9.9,2022-05-31T00:00:00.000,47520,8240
3,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,2024,6,12040,3944.0,53.41,9.24,BAYUNCA 1,Solar,3.0,2020-09-30T00:00:00.000,14400,2497
4,13,BOLÍVAR,13001,CARTAGENA DE INDIAS,2024,6,12040,3944.0,53.41,9.24,PUERTO DE CARTAGENA,Solar,2.2,2021-03-31T00:00:00.000,10560,1831
