Estadística descriptiva.

## Tipos de datos.

* Continuos (```numeric```, ```float```).
* Discretos (```integer```).
* Categóricos (```factor```).
    * Binarios (```logical```).
    * Ordinales (```factor``` ordenados).

## Métricas descriptivas.

* Media.
* Mediana.
* Desviación estándar.
* Varianzas.
* Cuartiles.

## La función ```summary()```.

In [None]:
clave <- c(1, 2, 3, 4, 5)
fecha <- c("23/11/20", "12/11/20", "20/11/20", "07/11/20", "22/11/20")
estado <- c("CDMX", "NL", "CDMX", "JAL", "NL")
genero <- c("M", "F", "F", "M", "F")
edad <- c(32, 45, 25, 39, 99)
trimestre_1 <- c(5, 3, 3, 3, 2)
trimestre_2 <- c(4, 5, 5, 3, 2)
trimestre_3 <- c(5, 2, 5, 4, 1)
trimestre_4 <- c(5, 5, 5, NA, 2)
trimestre_5 <- c(5, 5, 2, NA, 1)
vendedores <- data.frame(clave, fecha, estado, genero, edad, trimestre_1,
                         trimestre_2, trimestre_3, trimestre_4, trimestre_5)
dimnames(vendedores)[[1]] <- c('A', 'B', 'C', 'D', 'E')
vendedores[2] <- as.Date(vendedores[[2]], '%d/%m/%y')
vendedores

In [None]:
summary(vendedores)

## Datasets.

In [None]:
summary(mtcars)

In [None]:
pesos_autos <- mtcars$wt
pesos_autos

In [None]:
library(palmerpenguins)

In [None]:
penguins

In [None]:
summary(penguins)

In [None]:
gentoo <- subset(penguins[penguins$species == "Gentoo",], select = -species)

In [None]:
summary(gentoo)

In [None]:
chinstrap <- subset(penguins[penguins$species == "Chinstrap",], select = -species)

In [None]:
summary(chinstrap)

In [None]:
adelie <- subset(penguins[penguins$species == "Adelie",], select = -species)

In [None]:
summary(adelie)

In [None]:
pesos_ping <- na.omit(penguins$body_mass_g)

In [None]:
summary(pesos_ping)

## Funciones estadísticas.

### La función ```length()```.

In [None]:
length(pesos_autos)

### La función ```min()```

In [None]:
min(pesos_autos)

### La función ```max()```.

In [None]:
max(pesos_autos)

### La función ```range()```.

In [None]:
range(pesos_autos)

### La función ```cumsum()```.

In [None]:
cumsum(pesos_autos)

### La función ```sum()```.

$$
\sum\limits_{i=1}^{n}x_{i}
$$

In [None]:
sum(pesos_autos)

### La función ```mean()```.

$$
\mu = \frac{\sum\limits_{i=1}^{n}x_{i}}{n}
$$

In [None]:
mean(pesos_autos)

### La función ```sd()```.

$$
\sigma = \sqrt{\frac{\sum_{i=1}^{n}{(x_{i} - \mu)^2}}{n-1}}
$$

In [None]:
(sum((pesos_autos - mean(pesos_autos))^ 2)/ (length(pesos_autos) - 1)) ^ (1 / 2)

In [None]:
sd(pesos_autos)

### La función ```var()```.

$$
var = \sigma^{2}
$$

In [None]:
var(pesos_autos)

In [None]:
sd(pesos_autos) ^ 2

### La función ```median()```.

In [None]:
median(pesos_autos)

### La función  ```quantile()```.

In [None]:
quantile(pesos_autos)

### La función ```fivenum()```.

In [None]:
fivenum(pesos_autos)

## La función ```hist()```.

In [None]:
hist(pesos_autos)

In [None]:
hist(pesos_ping)

## La función ```barplot()```.

In [None]:
table(penguins$island)

In [None]:
barplot(table(penguins$island))

In [None]:
barplot(table(cut(x = pesos_ping, breaks=seq(min(pesos_ping),
                max(pesos_ping), length=10))))

In [None]:
barplot(table(cut(x = pesos_ping, breaks=seq(min(pesos_ping),
                max(pesos_ping), length=15))))

In [None]:
barplot(table(cut(x = pesos_ping, breaks=seq(min(pesos_ping),
                max(pesos_ping), length=20))))

## La función ```boxplot()```.

In [None]:
boxplot(pesos_autos)

In [None]:
boxplot(pesos_ping)

In [None]:
opar <- par(no.readonly=TRUE)
par(mfrow=c(1,3))
boxplot(adelie$body_mass_g)
boxplot(gentoo$body_mass_g)
boxplot(chinstrap$body_mass_g)
par(opar)

In [None]:
boxplot(body_mass_g ~ species, data=penguins)

## Distribuciones probabilísticas.

### Distribuiciones continuas.

* [Distribución normal](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal).
* [Distribución t de Student.](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student) 
* [Distribución chi_cuadrado.](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_%CF%87%C2%B2_)

### Distribuciones discretas.

* [Distribuición uniforme discreta](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_uniforme_discreta).
* [Distribución binomial](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial).
* [Distribución de Poisson](https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Poisson).

## La Distribución normal.

In [None]:
x <- seq(-4, 4, length=100)
y <- dnorm(x)
plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "")
axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))

In [None]:
?rnorm

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2020.</p>