# Medindo as diversidades $\alpha$, $\beta$ e $\gamma$: tutorial no R

Neste tutorial iremos utilizar uma base de dados denominada <a href="https://github.com/FCopf/MedidasDiversidade/blob/master/datasets/Baia_santos.xlsx" target="_blank">Baia_santos.xlsx</a>, contendo a abundância de $10$ espécies de peixes captradas na zona de arrebentação da Baía de Santos em $2015$. Cada linha da tabela representa uma amostra, isto é, um arrasto feito ao longo de $200$ m na zona de arrebentação, seguindo a direção da linha da costa. No total foram $12$ amostras. A primeira coluna identifica em que período do ano cada amostra foi obtida. As primeiras $6$ amostras foram tomadas no `VERAO` de $2015$ e as outras  $6$ no `INVERNO` de $2015$. As demais colunas mostram o número de indivíduos de cada espécie nas amostras. Os nomes das espécies foram omitidos para facilitar a apresentação dos dados.

Vamos utilizar esta tabela como exemplo para calcularmos as diversidades $\alpha$, $\beta$ e $\gamma$.

## Peixes de arrasto na zona de arrebentação da baía de Santos - SP

![](imagens/arrasto/IMG_0069.JPG)

![](imagens/Baia_Santos0.png)

## Carregando os pacotes do R

In [None]:
library(readxl)
library(tidyverse)
library(vegan)
library(patchwork)
library(iNEXT)

## Importanto a base de dados

+ 10 espécies (linhas)

+ 12 amostras (6 verão de 2015; 6 inverno de 2015)

In [None]:
pe = read_excel('datasets/Baia_santos.xlsx')

In [1]:
pe

In [None]:
glimpse(pe)

## Diversidade $\alpha$

A diversidade $\alpha$ se refere às diversidades registradas localente, isto é, em cada uma das amostras.

Podemos mensurar a diversidade de epécies pelos seus componentes de **riqueza**, **equabilidade** ou por algum índice que combine estes componentes, isto é, um **índice de diversidade**.

In [None]:
pe

### Riqueza de espécies

+ refere-se simplesmente ao número de espécies em uma amostra
+ função `specnumber()` do pacote `vegan`.

In [None]:
pe = pe %>%
  rowwise() %>% 
  mutate(S = specnumber(c_across(sp_1:sp_10)))

In [None]:
pe

### Índice de diversidade de Simpson

+ a probabilidade de que dois indivíduos retirados aleatoriamente de uma comunidade sejam da mesma espécie

$$D = \sum_{i = 1}^{S}\left(\frac{n_i(n_1 - 1)}{N(N-1)}\right)$$

+ função `diversity()` do pacote `vegan`
    + `index = 'invsimpson'` --> recíproca do índice $\frac{1}{D}$
    + `index = 'simpson'` --> complementar do índice $1 - D$

In [None]:
pe = pe %>%
  rowwise() %>% 
  mutate(D = diversity(c_across(sp_1:sp_10), 
                       index = 'invsimpson'))

In [None]:
pe

### Equabilidade de Simpson

+ mede a uniformidade das abunâncias entre espécies

$$E_{1/D} = \frac{1/D}{S}$$

+ varia de $0$ (equabilidade mínima) a $1$ se todas as espécies tiverem exatamente a mesma abundância. 

In [None]:
pe = pe %>%
  rowwise() %>% 
  mutate(E = D/S)

In [None]:
pe

### Representação gráfica da diversidade $\alpha$: Boxplots

Como temos amostras de `VERAO` e `INVERNO`, nos interessa saber qual a distribuição da riqueza, diversidade e equabilidade nestes dois períodos.

In [None]:
ggplot(pe) +
  aes(x = Epoca, y = D) +
  geom_boxplot()

In [None]:
plt_D = ggplot(pe) +
  aes(x = Epoca, y = D) +
  geom_boxplot(fill = 'lightblue', alpha = 0.5) +
  geom_jitter(width = 0.1, size = 3) +
  labs(y = 'Diversidade de Simpson (1/D)', 
        x = '') +
  theme_classic()

plt_S = ggplot(pe) +
  aes(x = Epoca, y = S) +
  geom_boxplot(fill = 'lightblue', alpha = 0.5) +
  geom_jitter(width = 0.1, size = 3) +
  labs(y = 'Riqueza de Espécies (S)', 
        x = '') +
  theme_classic()

plt_E = ggplot(pe) +
  aes(x = Epoca, y = E) +
  geom_boxplot(fill = 'lightblue', alpha = 0.5) +
  geom_jitter(width = 0.1, size = 3) +
  labs(y = 'Equabilidade de Simpson (E)', 
        x = '') +
  theme_classic()

In [None]:
options(repr.plot.width = 12, repr.plot.height = 5, repr.plot.res = 200) 

In [None]:
plt_D | plt_S | plt_E

## Diversidade $\gamma$

+ Curva de acumulação de espécies: como a riqueza total aumenta à medida que aumenta o esforço amostral, isto é, o número de indivíduos coletados?

+ pacote `iNEXT`

In [None]:
pe_list = list()

pe_list$VERAO = pe %>% 
  filter(Epoca == 'VERAO') %>% 
  select(sp_1:sp_10) %>% 
  colSums()
  
pe_list$INVERNO = pe %>% 
  filter(Epoca == 'INVERNO') %>% 
  select(sp_1:sp_10) %>% 
  colSums()

In [None]:
pe_list

In [None]:
gama_ac = iNEXT(pe_list, 
                 datatype = 'abundance', 
                 q = 0) # q = 0 --> Riqueza de espécies


### Representação gráfica da curva de acumulação

In [None]:
plt_gama = ggiNEXT(gama_ac) +
  labs(y = 'Riqueza acumulada',
       x = 'Número de indivíduos') +
  theme_classic() +
  scale_y_continuous(breaks = 0:10) +
  theme(legend.position = "bottom", 
        legend.title=element_blank())

In [None]:
options(repr.plot.width = 8, repr.plot.height = 6, repr.plot.res = 200) 

In [None]:
plt_gama

## Diversidade $\beta$

+ Índice de Jaccard calcula a similaridade par-a-par

$$J = \frac{a}{a + b + c}$$

    + a: número de espécies presentes nas duas amostras;

    + b: número de espécies presentes somente na Amostra 1;

    + c: número de espécies presentes somente na Amostra 2.

### Matriz de distância

+ a função `decostand(method = 'pa')` cria uma matriz de presença-ausência;

+ função `vegdist()` do pacote `vegan` calcula a **distância** de Jaccard, isto é, 

$$1 - J$$

In [None]:
pe_ocor = pe %>% 
  select(sp_1:sp_10) %>% 
  decostand(method = 'pa')

jac = vegdist(pe_ocor, method = 'jaccard', binary = TRUE)

### Representando uma matriz de dissimilaridade

In [None]:
jac

### Análise de Coordenadas Principais (PCoA)

+ Representando as distâncias em dois eixos

In [None]:
# Fazendo a PCoA
pcoa = cmdscale(jac, eig = TRUE)

# Mapeando as amostras
mapa_amostras = pcoa$points %>%
  as.data.frame() %>% 
  mutate(Epoca = pe$Epoca)

# Mapeando as espécies
mapa_especies = envfit(pcoa, pe_ocor)$vectors$arrows[,1:2] %>%
  as.data.frame() %>% 
  rownames_to_column(var = 'Especies')


In [None]:
options(repr.plot.width = 8, repr.plot.height = 5, repr.plot.res = 200) 

In [None]:
plt_beta = ggplot() +
  geom_point(data = mapa_amostras,
             aes(x = V1, y = V2, color = Epoca)) +
  geom_text(data = mapa_especies,
             aes(x = Dim1, y = Dim2, label = Especies), 
            color = 'darkblue') +
  labs(x = 'Eixo 1', y = 'Eixo 2') +
  theme_bw()

plt_beta

## Salvando as figuras deste tutorial

In [None]:
# Diversidade alfa
div_alfa = plt_D | plt_S | plt_E
ggsave(filename = 'Diversidade_alfa.png', 
       plot = div_alfa, 
       width = 15, height = 5)

# Diversidade gama
div_gama = plt_gama
ggsave(filename = 'Diversidade_gama.png', 
       plot = div_gama, 
       width = 7, height = 5)

# Diversidade beta
div_beta = plt_beta
ggsave(filename = 'Diversidade_beta.png', 
       plot = div_beta,
       width = 7, height = 5)