<a href="https://colab.research.google.com/github/ambatistam/macroinvertebrates/blob/main/CAQPPM_HIDROBIO_Analisis_de_datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## **Análisis de datos de monitoreo hidrobiológico**

**Fecha de elaboración:** 2023-09 <br>
**Autor:** Angélica Batista-Morales <br>
**Responsable de mantenimiento:** Carlos Guio, Maria Isabel Barrera <br>
**Proyecto:** CAQPPM <br>
**Propiedad:** Corporación Geoambiental Terrae <br>
**Modo de uso:** *Con este script se realiza el análisis y visualización de datos de monitoreo hidrobiológico de datos que provienen del análisis técnico de muestras provenientes de diferentes sitios y épocas*

## **1. Setup**
---
Se configura el cuaderno para conectarse al DRIVE de TERRAE. Se cargan las librerias necesarias.

In [38]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [30]:
!pip install rpy2
!pip install ro



In [31]:
import pandas as pd
import numpy as np #manipulación numérica
import seaborn as sns #formato ideal de gráficas estáticas
import matplotlib.pyplot as plt #sirve para modificar parámetros de gráficas
import plotly.express as px #gráficas dinámicas para web
%load_ext rpy2.ipython

The rpy2.ipython extension is already loaded. To reload it, use:
  %reload_ext rpy2.ipython


##**2. Carga de datos**
---
Los datos hidrobiológicos se registraron por la comunidad en formatos de complejidad progresiva, con curaduria por parte de Angélica Batista y se digitalizaron en Kobo posteriormente. Estos datos corresponden a ...

In [49]:
ruta_HIDROBIO = '/content/drive/MyDrive/CAQPPM_DATOS/02_CAQPPM_TABLAS/202305_CAQPPM_MONITOREO_HIDROBIO_Abundancia taxones.xlsx'

HIDROBIO_crudos = pd.read_excel(ruta_HIDROBIO)

HIDROBIO_crudos.head()

Unnamed: 0,COD,COMP_id,REG_id,PTO_id,PTO,FCH,taxon,PTJE_taxon,ABUN_taxon
0,CAQPPM,HIDROBIO,1,C,Quebrada La Paujila,2022-07-23,Calopterygidae,7,8
1,CAQPPM,HIDROBIO,2,C,Quebrada La Paujila,2022-07-23,Palaemonidae,8,2
2,CAQPPM,HIDROBIO,3,C,Quebrada La Paujila,2022-07-23,Gomphidae,10,1
3,CAQPPM,HIDROBIO,4,C,Quebrada La Paujila,2022-07-23,Aeshnidae,6,1
4,CAQPPM,HIDROBIO,5,C,Quebrada La Paujila,2022-07-23,Chironomidae,2,1


Transformar el dataframe de pandas a R

In [50]:
%R -i HIDROBIO_crudos

  for name, values in obj.iteritems():


In [51]:
%%R

head(HIDROBIO_crudos)

     COD  COMP_id REG_id PTO_id                 PTO        FCH           taxon
0 CAQPPM HIDROBIO      1      C Quebrada La Paujila 2022-07-23  Calopterygidae
1 CAQPPM HIDROBIO      2      C Quebrada La Paujila 2022-07-23    Palaemonidae
2 CAQPPM HIDROBIO      3      C Quebrada La Paujila 2022-07-23       Gomphidae
3 CAQPPM HIDROBIO      4      C Quebrada La Paujila 2022-07-23       Aeshnidae
4 CAQPPM HIDROBIO      5      C Quebrada La Paujila 2022-07-23    Chironomidae
5 CAQPPM HIDROBIO      6      C Quebrada La Paujila 2022-07-23 Leptophlebiidae
  PTJE_taxon ABUN_taxon
0          7          8
1          8          2
2         10          1
3          6          1
4          2          1
5          9          1


##**3. Análisis exploratorio**
---

A continuación se exploran sus características básicas

In [40]:
%%R
str(HIDROBIO_crudos)


'data.frame':	239 obs. of  9 variables:
 $ COD       : chr  "CAQPPM" "CAQPPM" "CAQPPM" "CAQPPM" ...
 $ COMP_id   : chr  "HIDROBIO" "HIDROBIO" "HIDROBIO" "HIDROBIO" ...
 $ REG_id    : int  1 2 3 4 5 6 7 8 9 10 ...
 $ PTO_id    : chr  "C" "C" "C" "C" ...
 $ PTO       : chr  "Quebrada La Paujila" "Quebrada La Paujila" "Quebrada La Paujila" "Quebrada La Paujila" ...
 $ FCH       : POSIXct, format: "2022-07-23" "2022-07-23" ...
 $ taxon     : chr  "Calopterygidae" "Palaemonidae" "Gomphidae" "Aeshnidae" ...
 $ PTJE_taxon: int  7 8 10 6 2 9 7 9 2 7 ...
 $ ABUN_taxon: int  8 2 1 1 1 1 11 3 5 1 ...


In [14]:
%%R
summary(HIDROBIO_crudos)

     COD              COMP_id              REG_id         PTO_id         
 Length:239         Length:239         Min.   :  1.0   Length:239        
 Class :character   Class :character   1st Qu.: 60.5   Class :character  
 Mode  :character   Mode  :character   Median :120.0   Mode  :character  
                                       Mean   :120.0                     
                                       3rd Qu.:179.5                     
                                       Max.   :239.0                     
     PTO                 FCH                            taxon          
 Length:239         Min.   :2022-07-23 00:00:00.00   Length:239        
 Class :character   1st Qu.:2022-09-20 00:00:00.00   Class :character  
 Mode  :character   Median :2023-03-27 00:00:00.00   Mode  :character  
                    Mean   :2023-02-16 18:52:43.18                     
                    3rd Qu.:2023-05-18 00:00:00.00                     
                    Max.   :2023-08-29 00:00:00.00

## **4. Cargar librerias**
---

In [41]:
%%R
install.packages("reshape2")
library("reshape2")

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



In [42]:
%%R
install.packages("knitr")
library("knitr")

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



In [43]:
%%R
install.packages("stringr")
library("stringr")

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



In [44]:
%%R
install.packages("dplyr")
library("dplyr")

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



In [45]:
%%R
install.packages("plyr")
library("plyr")

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



In [46]:
%%R
install.packages("plotly")
library(plotly)

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



In [47]:
%%R
install.packages("ggplot2")
library(ggplot2)

(as ‘lib’ is unspecified)







	‘/tmp/RtmpjzzfsQ/downloaded_packages’



## **5. Análisis de datos**
---

En este script se hacen los cálculos para estimar índices a partir de los datos crudos de monitoreo ambiental comunitario.

### 5.1 Cálculo de índices BWMP y ASTP
---

El bioindicador el BMWP/col (Biological Monitoring Working Party / Colombia), utiliza la proporción de taxones sensibles a contaminantes bajo una clasificación aprobada para los ríos colombianosadaptado para Colombia por Roldan (2003). El indicador ASTP (Average Score per Taxon) resulta de ponderar BMWP por el numero de taxones.

In [56]:
# Multiplicar cantidad de familias por puntaje. Crear dataframe de resultados y añadirle el calculo del Indicador BMWP
%%R
nt_SFP$sub_BMWP <- nt_SFP$nt_SFP*nt_SFP$PTJE_taxon
resultado <- aggregate(sub_BMWP ~ PTO_id + FCH, data = nt_SFP, FUN = sum, na.rm = TRUE)
names (resultado)[3] = "BMWP_col"
as.Date(resultado$FCH, format="%d/%m/%Y")
arrange(resultado,PTO_id,FCH)
head(resultado)

  PTO_id        FCH BMWP_col
1      C 2022-07-23       58
2      D 2022-07-23       36
3      E 2022-07-23       63
4      P 2022-07-23       89
5      T 2022-07-23       44
6      D 2022-08-20       19


In [57]:
# Crear interpretación de BMWP con un control de flujo

%%R
BMWP_int<-c()
for(i in resultado$BMWP_col){
  BMWP_int<-c(BMWP_int, if(i<=15){
    "Muy critica"
  } else if (15 <i & i <= 36){
    "Critica"
  }
  else if (36 <i & i <= 60){
    "Aceptable"
  }
  else if (60 <i & i <= 100){
    "Buena"
  } else {"Excelente"}
  )
}
head(BMWP_int)

[1] "Aceptable" "Critica"   "Buena"     "Buena"     "Aceptable" "Critica"  


In [58]:
# Añadir columna de interpretacion del BMWP en el dataframe. Renombrar el dataframe, ahora se llama "resultado"
%%R
resultado$BMWP_int<-BMWP_int
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int
1      C 2022-07-23       58 Aceptable
2      D 2022-07-23       36   Critica
3      E 2022-07-23       63     Buena
4      P 2022-07-23       89     Buena
5      T 2022-07-23       44 Aceptable
6      D 2022-08-20       19   Critica


In [59]:
#3. Calcular indicador ASTP y añadirlo al dataframe "resultado"
%%R
resultado$ASTP <- resultado$BMWP_col/nt_SF$nt_SF
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP
1      C 2022-07-23       58 Aceptable 7.250000
2      D 2022-07-23       36   Critica 5.142857
3      E 2022-07-23       63     Buena 7.000000
4      P 2022-07-23       89     Buena 6.846154
5      T 2022-07-23       44 Aceptable 7.333333
6      D 2022-08-20       19   Critica 6.333333


In [60]:
# Crear interpretación de ASTP con un control de flujo
%%R
ASTP_int<-c()
for(i in resultado$ASTP){
  ASTP_int<-c(ASTP_int, if(i<=3){
    "Muy contaminada"
  } else if (3 <i & i <= 4.5){
    "Contaminada"
  }
  else if (4.5 <i & i <= 6.5){
    "Contaminación moderada"
  }
  else if (6.5 <i & i <= 8){
    "Contaminación baja"
  }
  else {"No contaminado"}
  )
}
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP
1      C 2022-07-23       58 Aceptable 7.250000
2      D 2022-07-23       36   Critica 5.142857
3      E 2022-07-23       63     Buena 7.000000
4      P 2022-07-23       89     Buena 6.846154
5      T 2022-07-23       44 Aceptable 7.333333
6      D 2022-08-20       19   Critica 6.333333


In [61]:
# Añadir columna de interpretacion del ASTP_int en el dataframe "resultado"
%%R
resultado$ASTP_int<-ASTP_int
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP               ASTP_int
1      C 2022-07-23       58 Aceptable 7.250000     Contaminación baja
2      D 2022-07-23       36   Critica 5.142857 Contaminación moderada
3      E 2022-07-23       63     Buena 7.000000     Contaminación baja
4      P 2022-07-23       89     Buena 6.846154     Contaminación baja
5      T 2022-07-23       44 Aceptable 7.333333     Contaminación baja
6      D 2022-08-20       19   Critica 6.333333 Contaminación moderada


In [53]:
# Contar filas/riqueza por evento de muestreo (sitio / Fecha / Puntaje)
%%R
nt_SFP = aggregate(taxon ~ PTO_id + FCH + PTJE_taxon, data = HIDROBIO_crudos, FUN=length)
names (nt_SFP)[4] = "nt_SFP"
arrange(nt_SFP,PTO_id,FCH)
head(nt_SFP)

  PTO_id        FCH PTJE_taxon nt_SFP
1      C 2022-07-23          2      1
2      D 2022-07-23          2      1
3      E 2022-07-23          2      1
4      R 2023-02-18          2      2
5      D 2023-02-23          2      1
6      P 2023-02-23          2      1


In [55]:
# Contar filas/observaciones por sitio / Fecha
%%R
nt_SF <- aggregate(nt_SFP ~ PTO_id + FCH, data = nt_SFP, FUN = sum, na.rm = TRUE)
as.Date(nt_SF$FCH, format="%d/%m/%Y")
names (nt_SF)[3] = "nt_SF"
head(nt_SF)

  PTO_id        FCH nt_SF
1      C 2022-07-23     8
2      D 2022-07-23     7
3      E 2022-07-23     9
4      P 2022-07-23    13
5      T 2022-07-23     6
6      D 2022-08-20     3


### 5.2 Cálcular índice H' Shannon
----
El indicador criterio de información de Shannon H’, evalúa el efecto de las abundancias relativas de los diferentes taxones. Aquí se emplea lo propuesto por Pham y Quoc (2016) que adapta su uso como un método para evaluar calidad de agua.

In [62]:
# Calcular H' Shannon

# ESTO NO ES COMNADO SOLO LA ECUACION TEORICA: H'= -Sumatoria Pi ln Pi,  donde pi es la proporción de la especie i respecto al total de individuos

#Calcular proporción de cada taxon del total de taxones dada una fecha y punto de muestreo
%%R
HIDROBIO_crudos$proportion<-as.vector(unlist(tapply(HIDROBIO_crudos$ABUN_taxon,paste(HIDROBIO_crudos$PTO_id,HIDROBIO_crudos$FCH,sep="."),FUN=function(x){x/sum(x)})));

In [63]:
#Calcular ln de la proporción de cada taxon del total de taxones dada una fecha y punto de muestreo
%%R
HIDROBIO_crudos$ln_proportion<-log(HIDROBIO_crudos$proportion)

In [64]:
#Calcular la multiplicacion de pi x ln(pi)
%%R
HIDROBIO_crudos$pi_x_lnpi<-HIDROBIO_crudos$ln_proportion*HIDROBIO_crudos$proportion

In [65]:
#Sumar las proporciones
%%R
sum_proportion <- aggregate(pi_x_lnpi ~ PTO_id + FCH, data = HIDROBIO_crudos, FUN = sum, na.rm = TRUE)
as.Date(sum_proportion$FCH, format="%d/%m/%Y")
arrange(sum_proportion,PTO_id,FCH)

   PTO_id        FCH  pi_x_lnpi
1       C 2022-07-23 -1.6288291
2       C 2022-10-10 -1.2643617
3       C 2023-02-23 -2.1902375
4       C 2023-05-10 -1.0796416
5       C 2023-07-17 -2.3749545
6       D 2022-07-23 -2.0222523
7       D 2022-08-20 -0.6212267
8       D 2022-10-10 -0.3583897
9       D 2023-02-23 -2.3044211
10      D 2023-03-30 -2.2292558
11      D 2023-04-30 -1.0639212
12      D 2023-05-29 -1.6413749
13      D 2023-06-30 -0.8979350
14      D 2023-07-18 -1.5581153
15      E 2022-07-23 -1.9097349
16      E 2022-08-20 -1.4059249
17      E 2022-09-20 -1.2757725
18      E 2023-03-17 -1.2117987
19      E 2023-04-19 -2.0603811
20      E 2023-05-18 -1.8072214
21      P 2022-07-23 -2.0965562
22      P 2022-08-20 -0.8191915
23      P 2022-09-20 -0.4369279
24      P 2023-02-23 -1.6943143
25      P 2023-03-27 -1.9615320
26      P 2023-04-30 -1.5737742
27      P 2023-05-10 -0.7645271
28      P 2023-07-16 -3.7372102
29      R 2023-02-18 -2.9103446
30      R 2023-05-10 -2.6579970
31      

In [68]:
#Añadir columna de H_Shannon en el dataframe
%%R
resultado$H_Shannon <- -1*sum_proportion$pi_x_lnpi
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP               ASTP_int
1      C 2022-07-23       58 Aceptable 7.250000     Contaminación baja
2      D 2022-07-23       36   Critica 5.142857 Contaminación moderada
3      E 2022-07-23       63     Buena 7.000000     Contaminación baja
4      P 2022-07-23       89     Buena 6.846154     Contaminación baja
5      T 2022-07-23       44 Aceptable 7.333333     Contaminación baja
6      D 2022-08-20       19   Critica 6.333333 Contaminación moderada
  H_Shannon
1 1.6288291
2 2.0222523
3 1.9097349
4 2.0965562
5 1.7436154
6 0.6212267


In [70]:
# Crear interpretación de H_Shannon con un control de flujo
#Referencia: Pham, Duc & Quoc, Dung. 2016. Water Quality Assessment Using Benthic Macroinvertebrates in Saigon River and Its Tributaries, Vietnam. GeoScience Engineering. 62. 10.1515/gse-2016-0013.
%%R
H_Shannon_int<-c()
for(i in resultado$H_Shannon){
  H_Shannon_int<-c(H_Shannon_int, if(i<=0.1){
    "Contaminación muy alta"
  } else if (0.1 <i & i <= 0.8){
    "Contaminación alta"
  }
  else if (0.8 <i & i <= 1.4){
    "Contaminación moderada"
  }
  else if (1.4 <i & i <= 2.2){
    "Contaminación baja"
  }
  else if (2.2 <i & i <= 3.35){
    "Contaminación muy baja"
  }
  else {"Sin contaminación"}
  )
}
H_Shannon_int

 [1] "Contaminación baja"     "Contaminación baja"     "Contaminación baja"    
 [4] "Contaminación baja"     "Contaminación baja"     "Contaminación alta"    
 [7] "Contaminación baja"     "Contaminación moderada" "Contaminación moderada"
[10] "Contaminación alta"     "Contaminación moderada" "Contaminación alta"    
[13] "Contaminación muy baja" "Contaminación baja"     "Contaminación muy baja"
[16] "Contaminación baja"     "Contaminación moderada" "Contaminación baja"    
[19] "Contaminación muy baja" "Contaminación baja"     "Contaminación moderada"
[22] "Contaminación baja"     "Contaminación moderada" "Contaminación alta"    
[25] "Contaminación muy baja" "Contaminación baja"     "Contaminación baja"    
[28] "Contaminación moderada" "Contaminación moderada" "Sin contaminación"     
[31] "Contaminación muy baja" "Contaminación baja"     "Contaminación moderada"


In [71]:
# Añadir columna de interpretacion del H_Shannon_int en el dataframe
%%R
resultado$H_Shannon_int<-H_Shannon_int
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP               ASTP_int
1      C 2022-07-23       58 Aceptable 7.250000     Contaminación baja
2      D 2022-07-23       36   Critica 5.142857 Contaminación moderada
3      E 2022-07-23       63     Buena 7.000000     Contaminación baja
4      P 2022-07-23       89     Buena 6.846154     Contaminación baja
5      T 2022-07-23       44 Aceptable 7.333333     Contaminación baja
6      D 2022-08-20       19   Critica 6.333333 Contaminación moderada
  H_Shannon      H_Shannon_int
1 1.6288291 Contaminación baja
2 2.0222523 Contaminación baja
3 1.9097349 Contaminación baja
4 2.0965562 Contaminación baja
5 1.7436154 Contaminación baja
6 0.6212267 Contaminación alta


### 5.3 Cálcular índice D' Simpson
----
El indicador D'Simpson puede interpretarse como la media ponderada de las abundancias proporcionales de diferentes elementos, en este caso taxones. Para éste análisis se consideró la interpretación de Guajardo (2015).

In [72]:
#Calcular D_Simpson. Calcular el cuadrado de la proporción de cada taxon del total de taxones dada una fecha y punto de muestreo
%%R
HIDROBIO_crudos$proportion_2<-HIDROBIO_crudos$proportion^2

In [73]:
#Sumar las proporciones
%%R
sum_proportion_2 <- aggregate(proportion_2 ~ PTO_id + FCH, data = HIDROBIO_crudos, FUN = sum, na.rm = TRUE)
as.Date(sum_proportion_2$FCH, format="%d/%m/%Y")
names (sum_proportion_2)[3] = "sum_proportion_2"

In [74]:
#Añadir columna de D_Simpson en el dataframe "resultado"
%%R
resultado$D_Simpson <- 1-sum_proportion_2$sum_proportion_2

In [75]:
# Crear interpretación de D_Simpson con un control de flujo
#Referencia: Guajardo, Salomon. 2015. Measuring Diversity in Police Agencies. Journal of Ethnicity in Criminal Justice. 13. 1-15. 10.1080/15377938.2014.893220.
%%R
D_Simpson_int<-c()
for(i in resultado$D_Simpson){
  D_Simpson_int<-c(D_Simpson_int, if(i<=0.01){
    "Ausencia de diversidad"
  } else if (0.01 <i & i <= 0.4){
    "Bajo grado de diversidad"
  }
  else if (0.4 <i & i <= 0.6){
    "Moderado grado de diversidad"
  }
  else if (0.6 <i & i <= 0.8){
    "Moderado a alto grado de diversidad"
  }
  else {"Alto grado de diversidad"}
  )
}
D_Simpson_int

 [1] "Moderado a alto grado de diversidad" "Moderado a alto grado de diversidad"
 [3] "Alto grado de diversidad"            "Alto grado de diversidad"           
 [5] "Moderado a alto grado de diversidad" "Alto grado de diversidad"           
 [7] "Moderado a alto grado de diversidad" "Ausencia de diversidad"             
 [9] "Alto grado de diversidad"            "Alto grado de diversidad"           
[11] "Moderado a alto grado de diversidad" "Moderado a alto grado de diversidad"
[13] "Moderado a alto grado de diversidad" "Alto grado de diversidad"           
[15] "Moderado a alto grado de diversidad" "Alto grado de diversidad"           
[17] "Moderado a alto grado de diversidad" "Moderado a alto grado de diversidad"
[19] "Moderado a alto grado de diversidad" "Alto grado de diversidad"           
[21] "Alto grado de diversidad"            "Moderado a alto grado de diversidad"
[23] "Alto grado de diversidad"            "Alto grado de diversidad"           
[25] "Bajo grado de diversid

In [76]:
# Añadir columna de interpretacion del D_Simpson en el dataframe "resultado"
%%R
resultado$D_Simpson_int<-D_Simpson_int
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP               ASTP_int
1      C 2022-07-23       58 Aceptable 7.250000     Contaminación baja
2      D 2022-07-23       36   Critica 5.142857 Contaminación moderada
3      E 2022-07-23       63     Buena 7.000000     Contaminación baja
4      P 2022-07-23       89     Buena 6.846154     Contaminación baja
5      T 2022-07-23       44 Aceptable 7.333333     Contaminación baja
6      D 2022-08-20       19   Critica 6.333333 Contaminación moderada
  H_Shannon      H_Shannon_int D_Simpson                       D_Simpson_int
1 1.6288291 Contaminación baja 0.7423469 Moderado a alto grado de diversidad
2 2.0222523 Contaminación baja 0.6817558 Moderado a alto grado de diversidad
3 1.9097349 Contaminación baja 0.8343827            Alto grado de diversidad
4 2.0965562 Contaminación baja 0.8635355            Alto grado de diversidad
5 1.7436154 Contaminación baja 0.6995398 Moderado a alto grado de diversidad
6 0.6212267 Contaminación alta 0.9791667 

### 5.4 Cálcular índice D_mg Riqueza de Margalef
----
El índice de riqueza de Margalef (D_Mg) determina la biodiversidad de una comunidad biótica con base en la distribución numérica de los individuos de las diferentes especies o taxones, en función del número total de individuos existentes en la muestra analizada. Para interpretar los resultados se empleó la interpretación de Latumahina et al (2020).

In [78]:
#Calculo D_mg Riqueza Margalef
%%R
S_mg = aggregate(taxon ~ PTO_id + FCH, data = HIDROBIO_crudos, FUN=length)
as.Date(S_mg$FCH, format="%d/%m/%Y")
names (S_mg)[3] = "S_mg"
S_mg
N_mg <- aggregate(ABUN_taxon ~ PTO_id + FCH, data = HIDROBIO_crudos, FUN = sum, na.rm = TRUE)
as.Date(N_mg$FCH, format="%d/%m/%Y")
names (N_mg)[3] = "N_mg"

In [79]:
#Añadir columna de D_mg riqueza de Margalef en el dataframe, quito datos que se convierten en NA
%%R
resultado$D_mg <- (S_mg$S_mg -1)/log(N_mg$N_mg)
resultado$D_mg[is.nan(resultado$D_mg)]<-0
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP               ASTP_int
1      C 2022-07-23       58 Aceptable 7.250000     Contaminación baja
2      D 2022-07-23       36   Critica 5.142857 Contaminación moderada
3      E 2022-07-23       63     Buena 7.000000     Contaminación baja
4      P 2022-07-23       89     Buena 6.846154     Contaminación baja
5      T 2022-07-23       44 Aceptable 7.333333     Contaminación baja
6      D 2022-08-20       19   Critica 6.333333 Contaminación moderada
  H_Shannon      H_Shannon_int D_Simpson                       D_Simpson_int
1 1.6288291 Contaminación baja 0.7423469 Moderado a alto grado de diversidad
2 2.0222523 Contaminación baja 0.6817558 Moderado a alto grado de diversidad
3 1.9097349 Contaminación baja 0.8343827            Alto grado de diversidad
4 2.0965562 Contaminación baja 0.8635355            Alto grado de diversidad
5 1.7436154 Contaminación baja 0.6995398 Moderado a alto grado de diversidad
6 0.6212267 Contaminación alta 0.9791667 

In [80]:
# Crear interpretación de D_mg con un control de flujo
#Referencia: Latumahina, Fransina, Mardiatmoko, Gun, Sahusilawane, J. 2020. Richness, Diversity And Evenness Of Birds In Small Island. Journal of Physics: Conference Series. 1463. 012023. 10.1088/1742-6596/1463/1/012023.
%%R
D_mg_int<-c()
for(i in resultado$D_mg){
  D_mg_int<-c(D_mg_int, if(i<=2.05){
    "Riqueza en taxones baja"
  }
  else if (2.04 <i & i <= 4){
    "Riqueza en taxones moderada"
  }
  else {"Riqueza en taxones alta"}
  )
}
head(D_mg_int)

[1] "Riqueza en taxones moderada" "Riqueza en taxones moderada"
[3] "Riqueza en taxones moderada" "Riqueza en taxones moderada"
[5] "Riqueza en taxones moderada" "Riqueza en taxones baja"    


In [81]:
# Añadir columna de interpretacion del D_mg en el dataframe
%%R
resultado$D_mg_int<-D_mg_int
head(resultado)

  PTO_id        FCH BMWP_col  BMWP_int     ASTP               ASTP_int
1      C 2022-07-23       58 Aceptable 7.250000     Contaminación baja
2      D 2022-07-23       36   Critica 5.142857 Contaminación moderada
3      E 2022-07-23       63     Buena 7.000000     Contaminación baja
4      P 2022-07-23       89     Buena 6.846154     Contaminación baja
5      T 2022-07-23       44 Aceptable 7.333333     Contaminación baja
6      D 2022-08-20       19   Critica 6.333333 Contaminación moderada
  H_Shannon      H_Shannon_int D_Simpson                       D_Simpson_int
1 1.6288291 Contaminación baja 0.7423469 Moderado a alto grado de diversidad
2 2.0222523 Contaminación baja 0.6817558 Moderado a alto grado de diversidad
3 1.9097349 Contaminación baja 0.8343827            Alto grado de diversidad
4 2.0965562 Contaminación baja 0.8635355            Alto grado de diversidad
5 1.7436154 Contaminación baja 0.6995398 Moderado a alto grado de diversidad
6 0.6212267 Contaminación alta 0.9791667 

### 5.5 Cálcular índice equidad J' Pielou
----
El índice Pielou es una forma de medir cómo las especies se distribuyen uniformemente en una comunidad. El valor del índice Pielou se define entre 0 y 1, dónde 1 representa una comunidad con perfecta equidad y disminuye a cero a medida que las abundancias relativas de las especies divergen de la uniformidad. Para interpretar los resultados se empleó la interpretación de Hussain et al (2012).

In [None]:
#Calcular Equidad J_Pielou y añadir columna de J_Pielou en el dataframe
# Mide la proporción de la diversidad observada con relación a la máxima diversidad esperada
#ESTA ES LA ECUACION EQUIDAD
#J´=H’/log2S, donde S =  diversidad máxima de Shannon ocurriría si todas las especies tuvieran la misma abundancia

%%R
resultado$J_Pielou <- resultado$H_Shannon/log2(S_mg$S_mg)
is.na(resultado$J_Pielou)<-sapply(resultado$J_Pielou, is.infinite)
resultado$J_Pielou[is.na(resultado$J_Pielou)]<-0

In [None]:
# Crear interpretación de D_mg con un control de flujo
#Referencia: Hussain, N. ., Ali, A. ., & Lazem, L. . 2022. Ecological indices of key biological groups in Southern Iraqi marshland during 2005-2007. Mesopotamian Journal of Marine Sciences, 27(2), 112–125. https://doi.org/10.58629/mjms.v27i2.162

J_Pielou_int<-c()
for(i in resultado$J_Pielou){
  J_Pielou_int<-c(J_Pielou_int, if(i<=0.5){
    "Desbalanceado"
  }
  else if (0.5 <i & i <= 0.8){
    "Semi-balanceado"
  }
  else {"Balanceado"}
  )
}

In [None]:
# Añadir columna de interpretacion del J_Pielou en el dataframe
%%R
resultado$J_Pielou_int<-J_Pielou_int

### 5.6 Cálcular información complementaria
----
Se añade al dataframe datos como el número total de taxones por evento de monitoreo por sitio, así como la abundancia total. Ésto permite dar idea general del comportamiento de los datos.

In [None]:
#Añadir número total de taxones ####
%%R
resultado$S_riq_taxon<-nt_SF$nt_SF

In [None]:
#Añadir abundancia total de individuos  ####
%%R
resultado$ABUN_taxon<-N_mg$N_mg

### 5.7 Generar archivo BD de resultados
----
Se envia una nueva tabla que resume los hallazgos para el monitoreo comunitario, basado en un análisis de nivel técnico de las muestras colectadas.

In [None]:
with open('/content/drive/MyDrive/CAQPPM_DATOS/02_CAQPPM_TABLAS/CAQPPM_TECNICOS_HIDROBIO_Macroinvertebrados.csv', 'w') as resultado:
  df.to_csv(resultado)

##**6. Gráficas**
---
Acá se obtienen las gráficas de cada indicador

### 6.1 Taxones mas representativos en general

In [None]:
%%R
Taxabun <- data.frame(sort(table(mydata$taxon), decreasing = T))[1:10, ]
colnames(Taxabun) <- c("taxon", "ABUN_taxon")
kable(Taxabun, caption="_Ranking_ 10 de las familias más abundantes")

fig_TaxonesRepresentativos <- ggplot(Taxabun) +
  aes(x = taxon, fill = taxon, colour = taxon, weight = ABUN_taxon) +
  geom_bar() +
  scale_fill_brewer(palette = "RdBu") +
  scale_color_brewer(palette = "RdBu") +
  labs(x = "Familias de macroinvertebrados acuáticos",
       y = "Abundancia",
       ylab = "Abundancia absoluta") +
  theme_classic() + theme(legend.position='none') +
  theme(axis.text.x = element_text(angle = 30, hjust = 1))

fig_TaxonesRepresentativos

# Colocar en la leyenda del informe:
#Figura X. Distribución de las abundancias por familia de macroinvertebrados acuaticos

### 6.2 Abundancia en general

In [None]:
%%R
fig_abundancia <-  plot_ly(data = resultado ,x =  ~FCH, y = ~ABUN_taxon, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Abundancia de individuos por monitoreo', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Número de individuos'), legend = list(title=list(text='<b> Puntos </b>')))
fig_abundancia

### 6.3 Riqueza

In [None]:
%%R
fig_riqueza <-  plot_ly(data = resultado ,x =  ~FCH, y = ~S_riq_taxon, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Riqueza de taxones por monitoreo', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Número de taxones'), legend = list(title=list(text='<b> Puntos </b>')))
fig_riqueza

### 6.4 BMWP_col

In [None]:
%%R
fig_BMWP_col <-  plot_ly(data = resultado ,x =  ~FCH, y = ~BMWP_col, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Calidad de agua acorde a BMWP_col', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Índice BMWP_col'), legend = list(title=list(text='<b> Puntos </b>')))

hrect <- function(y0 = 0, y1 = 1, fillcolor = "red", opacity = 0.2) {
  list(
    type = "rect",
    x0 = 0,
    x1 = 1,
    xref = "paper",
    y0 = y0,
    y1 = y1,
    line_width = 0,
    fillcolor = fillcolor,
    opacity = opacity,
    layer = "below"
  )
}

fig_BMWP_col <- fig_BMWP_col |> plotly::layout(shapes = list(
  hrect(y0 = 0, y1 = 15, fillcolor = "red"),
  hrect(y0 = 15, y1 = 36, fillcolor = "darkorange"),
  hrect(y0 = 36, y1 = 60, fillcolor = "yellow"),
  hrect(y0 = 60, y1 = 90, fillcolor = "chartreuse"),
  hrect(y0 = 90, y1 = 110, fillcolor = "darkblue")
))

fig_BMWP_col

### 6.5 ASTP

In [None]:
%%R
fig_ASTP <-  plot_ly(data = resultado ,x =  ~FCH, y = ~ASTP, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Calidad de agua acorde a ASTP', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Índice ASTP'), legend = list(title=list(text='<b> Puntos </b>')))

hrect <- function(y0 = 0, y1 = 1, fillcolor = "red", opacity = 0.2) {
  list(
    type = "rect",
    x0 = 0,
    x1 = 1,
    xref = "paper",
    y0 = y0,
    y1 = y1,
    line_width = 0,
    fillcolor = fillcolor,
    opacity = opacity,
    layer = "below"
  )
}

fig_ASTP <- fig_ASTP |> plotly::layout(shapes = list(
  hrect(y0 = 0, y1 = 3, fillcolor = "red"),
  hrect(y0 = 3, y1 = 4.5, fillcolor = "darkorange"),
  hrect(y0 = 4.5, y1 = 6.5, fillcolor = "yellow"),
  hrect(y0 = 6.5, y1 = 8, fillcolor = "chartreuse"),
  hrect(y0 = 8, y1 = 10, fillcolor = "darkblue")
))

fig_ASTP

### 6.6 H' Shannon

In [None]:
%%R
fig_H_Shannon <-  plot_ly(data = resultado ,x =  ~FCH, y = ~H_Shannon, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Biodiversidad acuática acorde a índice de Shannon', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Índice H_Shannon'), legend = list(title=list(text='<b> Puntos </b>')))

hrect <- function(y0 = 0, y1 = 1, fillcolor = "red", opacity = 0.2) {
  list(
    type = "rect",
    x0 = 0,
    x1 = 1,
    xref = "paper",
    y0 = y0,
    y1 = y1,
    line_width = 0,
    fillcolor = fillcolor,
    opacity = opacity,
    layer = "below"
  )
}

fig_H_Shannon <- fig_H_Shannon |> plotly::layout(shapes = list(
  hrect(y0 = 0, y1 = 0.1, fillcolor = "red"),
  hrect(y0 = 0.1, y1 = 0.8, fillcolor = "darkorange"),
  hrect(y0 = 0.8, y1 = 1.4, fillcolor = "yellow"),
  hrect(y0 = 1.4, y1 = 3.35, fillcolor = "chartreuse"),
  hrect(y0 = 3.35, y1 = 4, fillcolor = "darkblue")
))

fig_H_Shannon

###6.7 D_Simpson

In [None]:
%%R
fig_D_Simpson <-  plot_ly(data = resultado ,x =  ~FCH, y = ~D_Simpson, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Biodiversidad acuática acorde a índice de Simpson', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Índice D_Simpson'), legend = list(title=list(text='<b> Puntos </b>')))

hrect <- function(y0 = 0, y1 = 1, fillcolor = "red", opacity = 0.2) {
  list(
    type = "rect",
    x0 = 0,
    x1 = 1,
    xref = "paper",
    y0 = y0,
    y1 = y1,
    line_width = 0,
    fillcolor = fillcolor,
    opacity = opacity,
    layer = "below"
  )
}

fig_D_Simpson <- fig_D_Simpson |> plotly::layout(shapes = list(
  hrect(y0 = 0, y1 = 0.01, fillcolor = "red"),
  hrect(y0 = 0.01, y1 = 0.4, fillcolor = "darkorange"),
  hrect(y0 = 0.4, y1 = 0.6, fillcolor = "yellow"),
  hrect(y0 = 0.6, y1 = 0.8, fillcolor = "chartreuse"),
  hrect(y0 = 0.8, y1 = 1, fillcolor = "darkblue")
))

fig_D_Simpson

###6.8 D_mg Riqueza Margalef

In [None]:
%%R
fig_D_mg <-  plot_ly(data = resultado ,x =  ~FCH, y = ~D_mg, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Biodiversidad acuática acorde a índice de Margalef', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Índice D_mg'), legend = list(title=list(text='<b> Puntos </b>')))

hrect <- function(y0 = 0, y1 = 1, fillcolor = "red", opacity = 0.2) {
  list(
    type = "rect",
    x0 = 0,
    x1 = 1,
    xref = "paper",
    y0 = y0,
    y1 = y1,
    line_width = 0,
    fillcolor = fillcolor,
    opacity = opacity,
    layer = "below"
  )
}

fig_D_mg <- fig_D_mg |> plotly::layout(shapes = list(
  hrect(y0 = 0, y1 = 2.05, fillcolor = "red"),
  hrect(y0 = 2.05, y1 = 4, fillcolor = "chartreuse"),
  hrect(y0 = 4, y1 = 6, fillcolor = "darkblue")
))

fig_D_mg

In [None]:
###6.9 Equidad Pielou

In [None]:
%%R
fig_J_Pielou <-  plot_ly(data = resultado ,x =  ~FCH, y = ~J_Pielou, color = ~PTO_id, type = 'scatter', mode = 'lines+markers',symbol = ~PTO_id)%>%
  layout(title = 'Biodiversidad acuática acorde a índice de Equidad de taxones', xaxis = list(title = 'Fecha del monitoreo'),
         yaxis = list(title = 'Índice J_Pielou'), legend = list(title=list(text='<b> Puntos </b>')))

hrect <- function(y0 = 0, y1 = 1, fillcolor = "red", opacity = 0.2) {
  list(
    type = "rect",
    x0 = 0,
    x1 = 1,
    xref = "paper",
    y0 = y0,
    y1 = y1,
    line_width = 0,
    fillcolor = fillcolor,
    opacity = opacity,
    layer = "below"
  )
}

fig_J_Pielou <- fig_J_Pielou |> plotly::layout(shapes = list(
  hrect(y0 = 0, y1 = 0.5, fillcolor = "red"),
  hrect(y0 = 0.5, y1 = 0.8, fillcolor = "yellow"),
  hrect(y0 = 0.8, y1 = 0.9, fillcolor = "chartreuse"),
  hrect(y0 = 0.8, y1 = 1, fillcolor = "darkblue")
))

fig_J_Pielou

#Referencias Bibliográficas
--------

Guajardo, Salomon. 2015. Measuring Diversity in Police Agencies. Journal of Ethnicity in Criminal Justice. 13. 1-15. [10.1080/15377938.2014.893220](https://).

Hussain, N. ., Ali, A. ., & Lazem, L. . 2022. Ecological indices of key biological groups in Southern Iraqi marshland during 2005-2007. Mesopotamian Journal of Marine Sciences, 27(2), 112–125. https://doi.org/10.58629/mjms.v27i2.162

Latumahina, Fransina, Mardiatmoko, Gun, Sahusilawane, J. 2020. Richness, Diversity And Evenness Of Birds In Small Island. Journal of Physics: Conference Series. 1463. 012023. [10.1088/1742-6596/1463/1/012023](https://).

Pham, Duc & Quoc, Dung. 2016. Water Quality Assessment Using Benthic Macroinvertebrates in Saigon River and Its Tributaries, Vietnam. GeoScience Engineering. 62. [10.1515/gse-2016-0013](https://)

Roldán (2003) Roldán Pérez, G. A. 2003. Bioindicación de la calidad del agua en Colombia. Uso del método BMWP/Col. Editorial Universidad de Antioquia. Disponible en https://goo.gl/5UMB9u.