# Analisis de los datos morfologicos de siete especies
## Bitácora hecha con R y datos morfológicos

In [None]:
# renglones con informacion completa
morfo <-read.csv("~/Desktop/data/morfo/7sppMorfo.csv", header = TRUE)

In [None]:
head(morfo)

In [None]:
library(psych)
library(ggplot2)
library(car)
library(gplots)
library(corrplot)

In [None]:
library(devtools)


In [None]:
library(devtools)
library(ggbiplot)

In [None]:
#Tomado de
#https://stats.idre.ucla.edu/r/faq/how-can-i-get-a-table-of-basic-descriptive-statistics-for-my-variables/
#install.packages("pastecs", dependencies=TRUE, repos='http://cran.us.r-project.org')
library(pastecs)

In [None]:
options(scipen=100)
options(digits=2)

In [None]:
stat.desc(morfo)

## Estadistica básica para las variables morfológicas

## datos simplificados

In [None]:
stat.desc(morfo[3:21], basic = F)

In [None]:
describe(morfo[3:21])

# descripcion por especie

In [None]:
describeBy(morfo[3:21], group=morfo$especie,digits=15, mat = T)

# Graficado de los promedios por especie

In [None]:
attach(morfo)
plotmeans(long_total ~especie)

# Análisis de la longitud total

In [None]:
plot(long_total)

In [None]:
lontotal_anova <- aov(long_total ~especie)
summary (lontotal_anova)

In [None]:
plot(lontotal_anova)

In [None]:
bartlett.test(long_total ~especie)

In [None]:
TukeyHSD(lontotal_anova)

# Longitud estándar

In [None]:
plotmeans(long_estandar ~especie)

In [None]:
plot(long_estandar)

In [None]:
lonestan_anova <- aov(long_estandar ~especie)
summary (lonestan_anova)

In [None]:
plot(lonestan_anova)

In [None]:
bartlett.test(long_estandar ~especie)

# Escriba sus conclusiones

# podría hacer alguna transformación?

In [None]:
lonestan_anova <- aov(long_estandar ~especie)
summary (lonestan_anova)

In [None]:
bartlett.test(long_estandar ~especie)

In [None]:
plot(long_estandar)

In [None]:
ggplot(morfo, aes(x=especie, y=long_total)) + geom_boxplot()

In [None]:
ggplot(morfo, aes(x=especie, y=long_estandar)) + geom_boxplot()

# Para guardar las imágenes obtenidas con ggplot se puede usar

In [None]:
ggplot(morfo, aes(x=especie, y=long_estandar)) + geom_boxplot()
ggsave("img/morfo_long_est.png", width = 6, height = 6)

In [None]:
plotmeans(long_cefalica ~especie)

In [None]:
ggplot(morfo, aes(x=especie, y=long_cefalica)) + geom_boxplot()

In [None]:
ggplot(morfo, aes(x=especie, y=diam_ojo)) + geom_boxplot()

In [None]:
plotmeans(long_hocico ~especie)

In [None]:
ggplot(morfo, aes(x=especie, y=long_mandibular)) + geom_boxplot()

In [None]:
M <- cor(morfo[,3:21])

# Plot the correlation plot with `M`
corrplot(M, method="ellipse", title="\nCorrelacion entre las variables morfologicas de especies", 
         type = c("lower"), order= "FPC")


In [None]:
png("img/morfo_corrplot_.png", width = 800, height = 800)
corrplot(M, method="ellipse", title="\nDispersion variables entre las variables morfologicas de especies",
         type = c("lower"))
dev.off()

# Análisis de Componentes Principales

In [None]:
ir.pca <- prcomp(morfo[3:21],
                 center = TRUE,
                 scale. = TRUE) 
print(ir.pca)

In [None]:
plot(ir.pca, type = "l", main= "Varianza explicada de PCA en morfo")
summary(ir.pca)

In [None]:
png("img/morfo_pca_varianza.png", width = 800, height = 800)
plot(ir.pca, type = "l", main= "Varianza explicada de PCA en variables morfologicas")
dev.off()

# PCA agrupando los datos de especies

In [None]:
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1, 
              groups = morfo$especie, ellipse = TRUE, 
              circle = TRUE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal', 
               legend.position = 'top')
print(g)
# el circulo morado representa por donde están todos las variables con respecto a la media general
# las elipses (circulos) representan los valores por dond están los grupos negativo y positivo a CXc

In [None]:
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1, 
              groups = morfo$especie, ellipse = TRUE, 
              circle = TRUE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal', 
               legend.position = 'bottom')
print(g)
# el circulo morado representa por donde están todos las variables con respecto a la media general
# las elipses (circulos) representan los valores por dond están los grupos negativo y positivo a CXc

In [None]:
?ggbiplot

# PCA agrupando los datos morfológicos
### sin circulos, ni elipses

In [None]:
g <- ggbiplot(ir.pca, obs.scale = 1, var.scale = 1, 
              groups = morfo$especie, ellipse = FALSE, 
              circle = FALSE)
g <- g + scale_color_discrete(name = '')
g <- g + theme(legend.direction = 'horizontal', 
               legend.position = 'top')
print(g)

In [None]:
png("img/morfo_PCA.png", width = 800, height = 800)
print(g)
dev.off()

# Escriba qué es lo que aprendió en esta bitácora y en qué le podría ayudar en su trabajo, sea tan explícito como le sea posible