<h1><center><span class="header-section-number"> R1</span> Estadística Descriptiva con R<br />
Introducción a tidyverse </center></h1>

<h2><span class="header-section-number">R1.1  </span>Introducción </h2>

En este módulo aprenderemos como calcular estadísticas y gráficos descriptivos usando R

Primero instalamos *tidyverse*.

*tidyverse* es una colección  de paquetes R diseñados para la ciencia de datos. Todos los paquetes comparten una filosofía de diseño, gramática y estructuras de datos subyacentes.

Instale el tidyverse completo con:

        install.packages ("tidyverse")
        
Para una introducción a ciencia de datos usando R vaya a <a href="https://www.tidyverse.org/">tidyverse.org</a>.
Para actualizar los paquetes de su instalación use el comando:

        update.packages()
Por defecto R le prguntará por cada paquete para instalar por cada paquete que puede ser actualizdo. Si no desea esto escriba

        update.packages(ask = FALSE)
        
*tidyverse* incluye *ggplot2*, *dplyr*, *tibble*, *tidyr*, *readr*, *purr*.

Los datos de esta lección viene incluidos en la librería (paquete) *dplyr*. Al cargar la librería, los datos estáran disponibles. Para una lista completa de los conjuntos de datos disponibles use el comando

        data()
Pida ayuda  con

        ?data
        
para los detalles del comando.

In [None]:
# instala tidyverse
#
install.packages("tidyverse")
#
# 

<h2><span class="header-section-number">R1.2  </span>Encadenando funciones. Operador de entubamiento (pipe) %>% </h2>

Desea llamar a una función, luego pasar el resultado a otra función y otra, de una manera que sea fácilmente legible utilice %>%, el poerador pipe de R. Por ejemplo:


In [None]:
library(dplyr) # The pipe is provided by dplyr
head(morley)# Look at the morley data set


In [None]:
morley %>%
filter(Expt == 1) %>% # filter is a function  from dplyr
summary()

Este patrón, con el operador %>%, se usa ampliamente con paquetes tidyverse, porque contienen muchas funciones que hacen cosas relativamente pequeñas. La idea es que estas funciones son bloques de construcción que permiten a los usuarios componer el La función llama juntas para producir el resultado deseado. Para ilustrar lo que está sucediendo, aquí hay un ejemplo más simple de dos equivalentes piezas de código: Si $f$ es una function entonces

    f(x)
    # equivalente a
    x %>% f()

In [None]:
f = function(x){x^2}
# 
x = 2
f(x)
#
x %>% f


Si se tiene la cades de funciones 

    h(g(f(x))
    # equivalente a
    x%>% 
    f() %>%
    g()%>%
    h()

<h2><span class="header-section-number">R1.3  </span>Exploración rápida de datos </h2>

<h4><span class="header-section-number">R1.3.1  </span>Diagramas de dispersión </h4>

Usaremos los datos *mtcars*

In [None]:
head(mtcars)

Un diagrama básico de dos variables se obitne simplemente con


In [None]:
plot(mtcars$wt, mtcars$mpg)

Con *ggplot* obtenemos resultados similares, pero más elegantes. Trate de entedender el código.

In [None]:
library(ggplot2)
ggplot(data=mtcars, aes(x=wt, y = mpg)) +
    geom_point()

La primera parte, *ggplot()*, le dice que cree un objeto de trazado, y la segunda parte,
*geom_point() le dice que agregue una capa de puntos a la gráfica.


<h4><span class="header-section-number">R1.3.2  </span>Creación del gráfico de una línea </h4>

Como antes, primerolo haremos de manera primitiva y luego con *ggplot2*. Usamos la base de datos *pressure*

In [None]:
plot(pressure$temperature, pressure$pressure, type = "l")

In [None]:
# Adicionamos puntos a la gráfica  y una gráfica adicional con color rojo.
# Observe que plot se utiliza únicamente la primera vez.
plot(pressure$temperature, pressure$pressure, type = "l")
points(pressure$temperature, pressure$pressure)
lines(pressure$temperature, pressure$pressure/2, col = "red")
points(pressure$temperature, pressure$pressure/2, col = "red")

In [None]:
# ggplot2
ggplot(pressure, aes(x = temperature, y = pressure)) +
geom_line() +
geom_point()

<h4><span class="header-section-number">R1.3.3  </span>Creación de un diagrama de barras  </h4>

Primero dams una mirada al conjunto de datos *BOD*

In [None]:
BOD

In [None]:
barplot(BOD$demand, names.arg= BOD$time)

In [None]:
# ggplot2
ggplot(BOD, aes(x=Time, y = demand)) +
geom_col()

Ahora trataremos Time como un factor. Observe qu el espacio para el valor *Time  = 6* ya no está

In [None]:
ggplot(BOD, aes(x=factor(Time), y = demand)) +
geom_col()

<h4><span class="header-section-number">R1.3.4  </span>Digramas de conteos. Función table </h4>


La función *table()* para calcular conteso (frecuencias de datos)


In [None]:
table(mtcars$cyl)

In [None]:
barplot(table(mtcars$cyl))

In [None]:
#ggplot
ggplot(mtcars, aes(x=cyl))+
geom_bar()

<h4><span class="header-section-number">R1.3.5  </span> Creando histogramas</h4>

Se utilizan para visualizar de forma discreta la distribución de una varriable unidimensional. Use la función *hist()*.


In [None]:
hist(mtcars$mpg)

Especificación del número de bins

In [None]:
hist(mtcars$mpg, breaks = 10)

In [None]:
# ggplot
# With wider bins y colores
ggplot(mtcars, aes(x = mpg)) +
geom_histogram(fill = "lightblue", colour = "black", binwidth = 4)

<h4><span class="header-section-number">R1.3.6  </span> Creando boxplots</h4>

Son utilizados  para mostrar la distribución de datos por grupos. Usaremos el conjunto de datos *ToothGrowth*.  Función base *boxplot()*.

In [None]:
head(ToothGrowth); tail(ToothGrowth)

In [None]:
boxplot(len~supp, data  = ToothGrowth)

In [None]:
# ggplot
library(ggplot2)
ggplot(ToothGrowth, aes(x = supp, y = len)) +
geom_boxplot(fill = "orange", colour = "blue")

<h4><span class="header-section-number">R1.3.7  </span> Gráfica de un función</h4>

Vamos a definir una función y graficarla usando la función *curve()* y en *ggplot*.

In [None]:
fun_l = function(x){
    1/(1+ exp(-x  + 10))
}
#
curve(fun_l(x), from = 0, to = 20)
# add a line:
curve(1-fun_l(x), add = TRUE, col = "red")


In [None]:
# ggplot
ggplot(data.frame(x = c(0,20)),aes(x=x)) +
  stat_function(fun = fun_l, geom = "line",color="blue") +
  stat_function(fun = fun_l, geom = "point", color = "red") 


In [None]:
head(mtcars)