# Análisis de Datos

**Objetivo del proyecto:** Analizar el nivel de impacto de las descargas de *Aguas Residuales* de las *Centrales Termoeléctricas* en los cuerpos receptores, siendo éstos, ríos, lagos y/o mares.

## Importar librerías

In [39]:
import pandas as pd
import numpy as np

In [40]:
path = f'./data/2022/EMISIONES/Emisiones2022-07_Act2022-09-01.csv'
df = pd.read_csv(path, sep = ',', low_memory = False)
df.head()

Unnamed: 0,PeriodoInforme,RUT,RazonSocial,Planta,PuntoDeDescarga,CuerpoReceptor,Norma,Muestra,MuestraParametro_Codigo,Parametro,...,ComunaNombre,NombreCategoria,NombreSubCategoria,Latitud,Longitud,CodigoRETC,Tabla,Direccion,NumeroRCA,FechaRCA
0,2022/07/01 00:00:00,3189619-3,RIBBA,PISCICULTURA LONCOTRARO,PUNTO 1 ESTERO LONCOTRARO VILLARRICA,ESTERO LONCOTRARO,DS 90,4370877,4370877,Coliformes Fecales o Termotolerantes,...,Villarrica,Pesca y Acuicultura,Centro de cultivo de peces,-39.308049,-72.077654,322380,Tabla 3,"RUTA 199 SN, Villarrica",,
1,2022/07/01 00:00:00,3189619-3,RIBBA,PISCICULTURA LONCOTRARO,PUNTO 1 ESTERO LONCOTRARO VILLARRICA,ESTERO LONCOTRARO,DS 90,4370878,4370878,Coliformes Fecales o Termotolerantes,...,Villarrica,Pesca y Acuicultura,Centro de cultivo de peces,-39.308049,-72.077654,322380,Tabla 3,"RUTA 199 SN, Villarrica",,
2,2022/07/01 00:00:00,3189619-3,RIBBA,PISCICULTURA LONCOTRARO,PUNTO 1 ESTERO LONCOTRARO VILLARRICA,ESTERO LONCOTRARO,DS 90,4370879,4370879,Coliformes Fecales o Termotolerantes,...,Villarrica,Pesca y Acuicultura,Centro de cultivo de peces,-39.308049,-72.077654,322380,Tabla 3,"RUTA 199 SN, Villarrica",,
3,2022/07/01 00:00:00,3189619-3,RIBBA,PISCICULTURA LONCOTRARO,PUNTO 1 ESTERO LONCOTRARO VILLARRICA,ESTERO LONCOTRARO,DS 90,132857,4370880,Sólidos Sedimentables,...,Villarrica,Pesca y Acuicultura,Centro de cultivo de peces,-39.308049,-72.077654,322380,Tabla 3,"RUTA 199 SN, Villarrica",,
4,2022/07/01 00:00:00,3189619-3,RIBBA,PISCICULTURA LONCOTRARO,PUNTO 1 ESTERO LONCOTRARO VILLARRICA,ESTERO LONCOTRARO,DS 90,4370881,4370881,pH,...,Villarrica,Pesca y Acuicultura,Centro de cultivo de peces,-39.308049,-72.077654,322380,Tabla 3,"RUTA 199 SN, Villarrica",,


In [41]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 62697 entries, 0 to 62696
Data columns (total 30 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   PeriodoInforme           62697 non-null  object 
 1   RUT                      62697 non-null  object 
 2   RazonSocial              62697 non-null  object 
 3   Planta                   62697 non-null  object 
 4   PuntoDeDescarga          62697 non-null  object 
 5   CuerpoReceptor           61940 non-null  object 
 6   Norma                    62697 non-null  object 
 7   Muestra                  62697 non-null  int64  
 8   MuestraParametro_Codigo  62697 non-null  int64  
 9   Parametro                62697 non-null  object 
 10  Unidad                   62697 non-null  object 
 11  Valor reportado          62697 non-null  float64
 12  Caudal Muestra (m3/dia)  62697 non-null  float64
 13  RPM                      62697 non-null  int64  
 14  Tipo de control       

In [42]:
df_termoelectricas = df[df["NombreSubCategoria"] == "Central termoeléctrica"]

In [43]:
df_termoelectricas.shape

(4501, 30)

La emisión de distintos niveles de Metales Pesados y otros parámetros relevantes (Ejemplo: Hierro, Cobre, Mercurio, Molibdeno, Temperatura etc.) que se descargan a los cuerpos receptores

In [44]:
df_termoelectricas_filtrado = df_termoelectricas[(df_termoelectricas["Parametro"]=='Hierro Disuelto') |
        (df_termoelectricas["Parametro"]=='Cobre') |
        (df_termoelectricas["Parametro"]=='Mercurio') |
        (df_termoelectricas["Parametro"]=='Molibdeno') |
        (df_termoelectricas["Parametro"]=='Temperatura') |
        (df_termoelectricas["Parametro"]=='Caudal')]
df_termoelectricas_filtrado.reset_index()

Unnamed: 0,index,PeriodoInforme,RUT,RazonSocial,Planta,PuntoDeDescarga,CuerpoReceptor,Norma,Muestra,MuestraParametro_Codigo,...,ComunaNombre,NombreCategoria,NombreSubCategoria,Latitud,Longitud,CodigoRETC,Tabla,Direccion,NumeroRCA,FechaRCA
0,3481,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,132114,4331243,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
1,3489,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,4331251,4331251,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
2,3492,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,132117,4331268,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
3,3500,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,4331276,4331276,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
4,3503,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,132119,4331279,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1940,54735,2022/07/01 00:00:00,96717620-6,SOCIEDAD ELECTRICA SANTIAGO SPA,SANTA LIDIA,PUNTO 1 CANAL COLONIA SUR,CANAL COLONIA SUR,DS 90,132079,4328177,...,Cabrero,Energía,Central termoeléctrica,-37.078033,-72.345822,3188001,Tabla 1,"CAMINO A CHARRÚA KM 7, Cabrero",,
1941,55999,2022/07/01 00:00:00,96814370-0,EMPRESA ELECTRICA VENTANAS S.A,CENTRAL TERMOELÉCTRICA NUEVA VENTANAS,VENTANAS.3,BAHÍA QUINTERO,DS 90,4383883,4383883,...,Puchuncaví,Energía,Central termoeléctrica,-32.749400,-71.483300,309729,Tabla 4,"F-30-E S/N, Puchuncaví",1124,2013-08-16
1942,56010,2022/07/01 00:00:00,96814370-0,EMPRESA ELECTRICA VENTANAS S.A,CENTRAL TERMOELÉCTRICA NUEVA VENTANAS,VENTANAS.3,BAHÍA QUINTERO,DS 90,4383909,4383909,...,Puchuncaví,Energía,Central termoeléctrica,-32.749400,-71.483300,309729,Tabla 4,"F-30-E S/N, Puchuncaví",1124,2013-08-16
1943,56019,2022/07/01 00:00:00,96814370-0,EMPRESA ELECTRICA VENTANAS S.A,CENTRAL TERMOELÉCTRICA NUEVA VENTANAS,VENTANAS.3,BAHÍA QUINTERO,DS 90,4383919,4383919,...,Puchuncaví,Energía,Central termoeléctrica,-32.749400,-71.483300,309729,Tabla 4,"F-30-E S/N, Puchuncaví",1124,2013-08-16


In [45]:
df_termoelectricas_filtrado.shape

(1945, 30)

In [46]:
df_termoelectricas_filtrado["Parametro"].value_counts()

Temperatura        1361
Caudal              406
Hierro Disuelto      83
Cobre                47
Molibdeno            24
Mercurio             24
Name: Parametro, dtype: int64

Remover duplicados

In [47]:
df_termoelectricas_filtrado = df_termoelectricas_filtrado.drop_duplicates()
df_termoelectricas_filtrado.reset_index()

Unnamed: 0,index,PeriodoInforme,RUT,RazonSocial,Planta,PuntoDeDescarga,CuerpoReceptor,Norma,Muestra,MuestraParametro_Codigo,...,ComunaNombre,NombreCategoria,NombreSubCategoria,Latitud,Longitud,CodigoRETC,Tabla,Direccion,NumeroRCA,FechaRCA
0,3481,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,132114,4331243,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
1,3489,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,4331251,4331251,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
2,3492,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,132117,4331268,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
3,3500,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,4331276,4331276,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
4,3503,2022/07/01 00:00:00,76004976-K,EMPRESA ELECTRICA ANGAMOS S.A.,CENTRAL TERMOELÉCTRICA ANGAMOS,T.ANGAMOS,BAHIA MEJILLONES,DS 90,132119,4331279,...,Mejillones,Energía,Central termoeléctrica,-23.025082,-70.320068,5452292,Tabla 4,"SÉPTIMA INDUSTRIAL 1100, Mejillones",290,2013-08-01
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1440,54735,2022/07/01 00:00:00,96717620-6,SOCIEDAD ELECTRICA SANTIAGO SPA,SANTA LIDIA,PUNTO 1 CANAL COLONIA SUR,CANAL COLONIA SUR,DS 90,132079,4328177,...,Cabrero,Energía,Central termoeléctrica,-37.078033,-72.345822,3188001,Tabla 1,"CAMINO A CHARRÚA KM 7, Cabrero",,
1441,55999,2022/07/01 00:00:00,96814370-0,EMPRESA ELECTRICA VENTANAS S.A,CENTRAL TERMOELÉCTRICA NUEVA VENTANAS,VENTANAS.3,BAHÍA QUINTERO,DS 90,4383883,4383883,...,Puchuncaví,Energía,Central termoeléctrica,-32.749400,-71.483300,309729,Tabla 4,"F-30-E S/N, Puchuncaví",1124,2013-08-16
1442,56010,2022/07/01 00:00:00,96814370-0,EMPRESA ELECTRICA VENTANAS S.A,CENTRAL TERMOELÉCTRICA NUEVA VENTANAS,VENTANAS.3,BAHÍA QUINTERO,DS 90,4383909,4383909,...,Puchuncaví,Energía,Central termoeléctrica,-32.749400,-71.483300,309729,Tabla 4,"F-30-E S/N, Puchuncaví",1124,2013-08-16
1443,56019,2022/07/01 00:00:00,96814370-0,EMPRESA ELECTRICA VENTANAS S.A,CENTRAL TERMOELÉCTRICA NUEVA VENTANAS,VENTANAS.3,BAHÍA QUINTERO,DS 90,4383919,4383919,...,Puchuncaví,Energía,Central termoeléctrica,-32.749400,-71.483300,309729,Tabla 4,"F-30-E S/N, Puchuncaví",1124,2013-08-16


In [48]:
df_termoelectricas_filtrado.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 1445 entries, 3481 to 56029
Data columns (total 30 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   PeriodoInforme           1445 non-null   object 
 1   RUT                      1445 non-null   object 
 2   RazonSocial              1445 non-null   object 
 3   Planta                   1445 non-null   object 
 4   PuntoDeDescarga          1445 non-null   object 
 5   CuerpoReceptor           1445 non-null   object 
 6   Norma                    1445 non-null   object 
 7   Muestra                  1445 non-null   int64  
 8   MuestraParametro_Codigo  1445 non-null   int64  
 9   Parametro                1445 non-null   object 
 10  Unidad                   1445 non-null   object 
 11  Valor reportado          1445 non-null   float64
 12  Caudal Muestra (m3/dia)  1445 non-null   float64
 13  RPM                      1445 non-null   int64  
 14  Tipo de control     

Análisis de Temperaturas

## Temperatura

In [49]:
temperaturas = df_termoelectricas_filtrado[df_termoelectricas_filtrado["Parametro"]=='Temperatura']
temperaturas["Valor reportado"].unique()

array([26.  , 26.1 , 25.5 , 19.3 , 19.2 , 19.6 , 19.4 , 19.5 , 18.4 ,
       16.7 , 18.8 , 20.2 , 20.3 , 20.5 , 17.1 , 17.2 , 16.1 , 16.5 ,
       16.9 , 17.3 , 18.  , 18.3 , 18.1 , 18.2 , 18.5 , 21.1 , 20.6 ,
       20.9 , 20.4 , 21.4 , 20.7 , 21.  , 21.2 , 15.3 , 15.5 , 15.6 ,
       15.4 , 15.2 , 15.1 , 15.  , 11.8 , 11.9 , 12.  , 19.9 , 19.7 ,
       20.1 , 22.1 , 22.  , 22.2 , 21.9 , 21.7 , 21.3 , 19.1 , 17.5 ,
       17.4 , 17.6 , 22.3 , 22.4 , 23.8 , 24.7 , 24.8 , 24.9 , 24.5 ,
       25.1 , 25.2 , 24.1 , 23.5 , 24.  , 23.6 , 22.7 , 22.6 , 22.5 ,
       21.8 , 20.  , 19.  , 17.8 , 16.8 , 16.4 , 16.6 , 22.8 , 25.3 ,
       25.8 , 25.9 , 22.9 , 11.5 , 11.3 , 11.6 , 12.3 , 11.  , 12.4 ,
       10.9 , 13.3 , 11.4 , 13.2 , 10.7 , 10.2 , 12.7 , 12.6 , 12.5 ,
       14.6 , 13.73, 13.78, 13.64, 14.64, 14.52, 14.84, 13.69, 14.76,
       12.9 , 13.8 , 14.1 , 16.2 , 14.8 , 23.4 , 23.  , 16.  , 17.  ,
       23.9 , 23.2 , 23.1 , 23.7 , 17.7 , 17.9 , 24.6 , 25.6 , 20.8 ,
       19.8 , 26.2 ,

In [50]:
temperaturas.describe()

Unnamed: 0,Muestra,MuestraParametro_Codigo,Valor reportado,Caudal Muestra (m3/dia),RPM,RegionId,ComunaId,Latitud,Longitud,CodigoRETC
count,881.0,881.0,881.0,881.0,881.0,881.0,881.0,881.0,881.0,881.0
mean,4352382.0,4352382.0,19.331328,403999.7,881.455165,5.083995,110.231555,-28.442166,-71.137618,3415357.0
std,23374.64,23374.64,3.775167,394911.2,887.700454,2.55258,60.231775,5.644774,0.929365,2461328.0
min,4307544.0,4307544.0,7.0,40.0,97.0,3.0,49.0,-37.107246,-73.16584,6638.0
25%,4326631.0,4326631.0,17.0,88458.52,333.0,3.0,71.0,-32.936695,-71.4833,436492.0
50%,4348941.0,4348941.0,19.7,360364.0,706.0,4.0,82.0,-28.472116,-71.247379,4917485.0
75%,4371470.0,4371470.0,22.2,610358.0,1034.0,6.0,108.0,-23.087606,-70.408082,5441923.0
max,4384134.0,4384134.0,27.5,6912022.0,5609.0,10.0,254.0,-22.0981,-70.208398,5453654.0


In [51]:
temperaturas["Planta"].value_counts()

GUACOLDA                                          114
CENTRAL TÉRMICA MEJILLONES                        102
CENTRAL TERMOELÉCTRICA NUEVA TOCOPILLA             96
CENTRAL TERMOELÉCTRICA COCHRANE                    96
CENTRAL TERMICA ANDINA                             96
CENTRAL TERMOELECTRICA BOCAMINA U1                 96
CENTRAL TERMOELECTRICA CAMPICHE                    96
COMPLEJO TERMOELÉCTRICO NEHUENCO                   48
CENTRAL COLMITO                                    31
RENCA NUEVA RENCA                                  24
SANTA LIDIA                                        24
CENTRAL TERMOELÉCTRICA LOS PINOS                   15
YUNGAY (EX CAMPANARIO)                              8
CENTRAL TERMOELÉCTRICA VENTANAS UNIDADES 1 Y 2      8
CENTRAL TERMICA TOCOPILLA                           7
COMPLEJO TERMOELECTRICO SANTA MARIA                 5
CENTRAL TERMOELÉCTRICA ANGAMOS                      4
CENTRAL TERMOELÉCTRICA CANDELARIA                   4
CENTRAL TERMOELÉCTRICA NUEVA

In [52]:
temperaturas["CuerpoReceptor"].value_counts()

BAHIA MEJILLONES      298
PENINSULA GUACOLDA    114
BAHÍA QUINTERO        108
BAHÍA ALGODONALES     103
BAHÍA CORONEL         101
RIO ACONCAGUA          51
ESTERO LAJARILLA       31
RIO MAPOCHO            24
CANAL COLONIA SUR      24
CANAL DE DERRAME       15
ESTERO LOS GUINDOS      8
ESTERO CADEGUA          4
Name: CuerpoReceptor, dtype: int64

In [53]:
temperaturas.groupby(["CuerpoReceptor", "Planta"])["Valor reportado"].mean()

CuerpoReceptor      Planta                                        
BAHIA MEJILLONES    CENTRAL TERMICA ANDINA                            21.020833
                    CENTRAL TERMOELÉCTRICA ANGAMOS                    25.775000
                    CENTRAL TERMOELÉCTRICA COCHRANE                   22.007292
                    CENTRAL TÉRMICA MEJILLONES                        21.100980
BAHÍA ALGODONALES   CENTRAL TERMICA TOCOPILLA                         22.914286
                    CENTRAL TERMOELÉCTRICA NUEVA TOCOPILLA            23.242708
BAHÍA CORONEL       CENTRAL TERMOELECTRICA BOCAMINA U1                18.670625
                    COMPLEJO TERMOELECTRICO SANTA MARIA               18.984000
BAHÍA QUINTERO      CENTRAL TERMOELECTRICA CAMPICHE                   18.240625
                    CENTRAL TERMOELÉCTRICA NUEVA VENTANAS             17.225000
                    CENTRAL TERMOELÉCTRICA VENTANAS UNIDADES 1 Y 2    16.975000
CANAL COLONIA SUR   SANTA LIDIA                      

In [54]:
temperaturas.groupby(["CuerpoReceptor", "Planta"])["Valor reportado"].max()

CuerpoReceptor      Planta                                        
BAHIA MEJILLONES    CENTRAL TERMICA ANDINA                            26.20
                    CENTRAL TERMOELÉCTRICA ANGAMOS                    26.10
                    CENTRAL TERMOELÉCTRICA COCHRANE                   26.00
                    CENTRAL TÉRMICA MEJILLONES                        27.50
BAHÍA ALGODONALES   CENTRAL TERMICA TOCOPILLA                         24.40
                    CENTRAL TERMOELÉCTRICA NUEVA TOCOPILLA            25.10
BAHÍA CORONEL       CENTRAL TERMOELECTRICA BOCAMINA U1                21.00
                    COMPLEJO TERMOELECTRICO SANTA MARIA               21.50
BAHÍA QUINTERO      CENTRAL TERMOELECTRICA CAMPICHE                   21.40
                    CENTRAL TERMOELÉCTRICA NUEVA VENTANAS             19.00
                    CENTRAL TERMOELÉCTRICA VENTANAS UNIDADES 1 Y 2    22.80
CANAL COLONIA SUR   SANTA LIDIA                                       10.10
CANAL DE DERRAME    C

In [55]:
umbral = 30

temperaturas.loc[temperaturas.Parametro == "Temperatura", ["diferencia_umbral"]] = temperaturas["Valor reportado"] - umbral
temperaturas["diferencia_umbral"].describe()

count    881.000000
mean     -10.668672
std        3.775167
min      -23.000000
25%      -13.000000
50%      -10.300000
75%       -7.800000
max       -2.500000
Name: diferencia_umbral, dtype: float64

In [56]:
temperaturas["Tabla"].value_counts()

Tabla 4    628
Tabla 1    109
Tabla 5     96
Tabla 2     48
Name: Tabla, dtype: int64