<img src="logo.png">

# Vectores

Ya en el capítulo anterior hemos visto cómo se crean los vectores.

Recordemos que una propiedad importante que tienen los vectores es que sus elementos son todos del mismo tipo. Si uno de los elementos del vector es un texto, en automático tomará los otros elementos también como textos. 

La función para crear vectores en **R** es la función ``c()``. 

In [None]:
c(10000,20000,4000,3000) #crea un vector pero no lo guarda en la memoria

Como todo objeto, a los vectores les podemos asociar nombres:

In [None]:
poblacion <- c(10000,20000,4000,3000) 

Al momento de crearlo, se puede ver en la ventana de *environment* (ambiente) que se crea un objeto en la memoria de **R**. Si corremos la sentencia ``poblacion_nacional``, veremos que se nos produce un error, ya que no hay ningún objeto llamado así.

In [None]:
poblacion_nacional

Para eliminar objetos que ya existen (no importa si son vectores o cualquier otro tipo), utilizamos la función ``rm()`` (remove).

In [None]:
rm(poblacion)

Como el objeto ``poblacion`` ya no existe, al mandarlo a llamar nos genera error.

In [None]:
2*poblacion

Construyamos de nuevo el vector ``poblacion``

In [None]:
poblacion <- c(10000,20000,4000,3000) 
poblacion

Recordemos que todos los elementos de un vector deben ser del mismo tipo. Como todo número se puede representar como texto, pero no todo texto se puede representar como número, si un solo elemento del vector es de tipo texto entonces todos los elementos se convertirán automáticamente en textos.

In [None]:
poblacion_texto  <- c(10000,20000,"4000",3000)
poblacion_texto

In [None]:
# Observamos que como los elementos de poblacion_texto son de tipo texto, no tiene sentido aplicarle operaciones matemáticas
2*poblacion_texto

## Indexado de vectores

Recordemos nuestro vector de pesos en kilogramos: ``mis_personas = c(71.4, 65.1, 63, 94.5)``

In [None]:
mis_personas  <-  c(71.4, 65.1, 63, 94.5)

Ya sabemos cómo mandar a llamar un solo elemento del vector:

In [None]:
mis_personas[4]

Pues bien, una propiedad muy importante y bonita que tienen los vectores **es que se pueden utilizar para indexar vectores**.

Por ejemplo, ``c(1,3)`` es un vector numérico cuyos elementos son los números 1 y 3. Entonces, ``mis_personas[c(1,3)]`` nos devolverá los pesos de la primera y de la tercera personas.

In [None]:
mis_personas[c(1,3)]

Incluso, si hacemos ``per_1_3 <- c(1,3)``, entonces podemos utilizar el nombre ``per_1_3`` para indexar a ``mis_personas``:

In [None]:
per_1_3 <- c(1,3)
mis_personas[per_1_3]

Hay veces que queremos un vector formado por números consecutivos. Para esto, **R** nos brinda el comando ``:`` de esta manera: ``num_inicial:num_final``

In [None]:
2:4

Incluso en el indexado, el uso de ``:`` se vuelve muy cómodo.

In [None]:
mis_personas[2:4]

Más aun, el comando ``:`` también funciona en reversa:

In [None]:
8:2

**Ejemplo Importante**

Supongamos que tienes un vector del cual quieres obtener desde el elemento 5 hasta el último. 

In [None]:
mi_ejemplo  <- c(2,5,2,4,6,2,6,2,7,8,5,7,6,3,5,6,8,3,2)

In [None]:
mi_ejemplo[5:length(mi_ejemplo)]

El comando ``:`` junto con la función ``c()`` se pueden componer de manera importante:

In [None]:
c(1,3,2:6,10)

Así, supongamos que tenemos el vector ``mis_datos  <- c("L","L","H","A","A","L","M","A","B","C","L")`` y queremos obtener los valores en las posiciones 1, 3, 6, 7, 8 y 10.

In [None]:
mis_datos  <- c("L","L","H","A","A","L","M","A","B","C","L")
mis_datos[c(1,3,6:8,10)]

Incluso en el indexado se puede utilizar el signo ``-`` como *complemento*.

In [None]:
mis_datos[-c(1,3,6:8,10)]

## Operaciones con vectores

### Funciones de agregación

Las funciones de agregación son la suma, la media aritmética, el máximo y el mínimo. 

Supongamos que queremos sumar los elementos de un vector numérico. **R** nos provee la función ``sum()`` para esto:

In [None]:
sum(mis_personas)

Ahora bien, recordemos que los ``NaN`` tienen una aritmética muy particular. Por ejemplo:

In [None]:
2+NaN

Es común que nuestros vectores tengan elementos faltantes (como las columnas de bases de datos).

In [None]:
faltante_NA <- c(1,2,3,NA,4,8)
faltante_NA

In [None]:
faltante_NaN <- c(1,2,3,NaN,4,8)
faltante_NaN

In [None]:
sum(faltante_NA)

In [None]:
sum(faltante_NaN)

Así, supongamos que nos interesa la suma de los elementos que sí se pueden sumar. Para ello utilizamos el comando ``na.rm=TRUE`` dentro de nuestra función:

In [None]:
sum(faltante_NA,na.rm=TRUE)

In [None]:
sum(faltante_NaN,na.rm=TRUE)

Las otras funciones de agregación son:

- ``mean()`` para la media aritmética.
- ``max()`` para el máximo.
- ``min()`` para el mínimo.

Su comportamiento es muy similar a la suma. Además es importante notar que si el argumento que se le dá a ``max()`` y a ``min()`` es un vector de textos, devolverán el elemento máximo y mínimo en el sentido de un diccionario.

In [None]:
mean(faltante_NaN)

In [None]:
mean(faltante_NaN,na.rm=TRUE)

In [None]:
max(faltante_NA)

In [None]:
max(faltante_NA,na.rm=TRUE)

In [None]:
max(c("Adelante","Ahora"))

In [None]:
min(faltante_NA)

In [None]:
min(faltante_NA,na.rm=TRUE)

In [None]:
min(c("Adelante","Ahora"))

Los resultados de estas operaciones son objetos, de modo que se les puede asignar un nombre.

In [None]:
promedio  <- mean(faltante_NaN,na.rm=TRUE)
promedio

Otros operadores aritméticos que existen en **R** de gran importancia son los *módulos* o *residuos* y la *división entera*.

In [None]:
# Calcular el residuo de dividir 2022 entre 11

2022 %% 11

In [None]:
# Calcular la división entera de 2022 entre 11

2022 %/% 11

## Ordenaciones

Los vectores también se pueden ordentar utilizando la función ``sort()``. El resultado es un nuevo vector con la misma longitud que el original pero con los datos ordenados de forma ascendente. Si lo que queremos es en orden decreciente, utilizamos el parámetro ``decreasing = TRUE``.

In [None]:
sort(c(33,21,54,3,-7))

In [None]:
sort(faltante_NA)

In [None]:
sort(mis_datos)

In [None]:
sort(mis_datos,decreasing=TRUE)

## Operadores de comparación en vectores

Los vectores son objetos *unidimensionales*. Esto siginifica que únicamente tienen *largo*, pero no *ancho*, como las matrices.

Retomemos nuestro vector ``mis_personas``

In [None]:
mis_personas  <- c(71.4, 65.1, 63, 94.5)

Si nos preguntamos por aquellos pesos que son mayores a 63 simplemente hacemos ``mis_personas > 63``

In [None]:
mis_personas > 63

Nos devuelve un vector de la misma longitud que ``mis_personas`` cuyos elementos son ``TRUE`` o ``FALSE``, dependiendo de si la condicón de comparación se cumple o no. A este tipo de vectores se les llama **vectores lógicos**.

Los vectores lógicos tienen la capacidad de indexar vectores de una manera muy interesante: **si indexas un vector mediante un vector lógico de su misma longitud, te devolverá aquellos elementos que corresponden a los valores ``TRUE``**

In [None]:
mis_personas[mis_personas > 63]

In [None]:
mis_personas_logico  <- mis_personas > 63
mis_personas[mis_personas_logico]

Otros operadores de comparación son ``==``, ``!=``, ``<``, ``>=``, ``<=``

In [None]:
# El número 20278781 es múltiplo de 3?

20278781 %% 3 == 0

Incluso, se puede utilizar una función particular que combina el indexado por vectores lógicos. La función ``which()`` cuyo argumento es la condición que buscamos que se cumpla y nos devuelve los índices del vector original donde se cumple la condición

In [None]:
mis_personas[mis_personas > 63]

In [None]:
which(mis_personas > 63)

### Operadores lógicos

Hasta ahora, hemos visto cómo hacer una sola comparación de vectores. Cuando queremos verificar si se cumplen varias comparaciones, utilizamos los operadores lógicos:

- ``|`` significa *o*.
- ``&`` significa *y*.
- ``!`` significa *negación*
- ``||`` hace un *o* únicamente comparando el primer elemento de un vector con el primer elemento de otro vector, por lo que devuelve un solo valor.
- ``&&`` hace un *y* únicamente comparando el primer elemento de un vector con el primer elemento de otro vector, por lo que devuelve un solo valor.

Al valor numérico 0 lo toma como ``FALSE`` y a cualquier otro valor numérico lo toma como ``TRUE``

In [None]:
mis_personas

In [None]:
mis_personas < 65 | mis_personas > 70

In [None]:
mis_personas > 65 & mis_personas < 70

In [None]:
!(mis_personas > 65 & mis_personas < 70)

In [None]:
X <- c(TRUE,FALSE,0,6)
Y <- c(FALSE,TRUE,FALSE,TRUE)

In [None]:
!X

In [None]:
X & Y

In [None]:
X | Y

In [None]:
X && Y

In [None]:
X || Y

## Nombres en los vectores

Ahora trabajaremos con la *propiedad de nombre* que tienen los vectores. Hasta ahora, hemos hecho indexado numérico y lógico de vectores. La *propiedad de nombre* de los vectores consiste en poder asignar un nombre a los elementos del vector y utilizar los nombres como índices.

Para ello, utilizamos la función ``names()``, cuyo argumento es el vector que nos interesa.

In [None]:
mis_personas  <- c(71.4, 65.1, 63, 94.5)

In [None]:
names(mis_personas)

In [None]:
names(mis_personas)  <- c("Luis","Raúl","María","Ramón")

In [None]:
names(mis_personas)

In [None]:
mis_personas

In [None]:
mis_personas[c("María","Ramón","José")]

In [None]:
which(mis_personas > 60 & mis_personas < 70)

In [None]:
names(which(mis_personas > 60 & mis_personas < 70))

## Modificando los elementos de un vector

Veamos cómo podemos modificar los elementos de un vector.

In [None]:
## Supongamos que a Luis se le asigno un peso incorrecto y su peso verdadero es 65

mis_personas["Luis"]  <- 65 # Como el índice de Luis es 1, también se pudo hacer mis_personas[1]<-65

In [None]:
mis_personas

In [None]:
# Supongamos que nos equivocamos en las personas 2,3 y 4 y los pesos correctos son 63, 64 y 90.9
mis_personas[2:4] <- c(63,64,90.9)
mis_personas

Es **importante** saber que la operación de cambio de valores en un vector **es vectorizada**.

In [None]:
mis_personas[2:4] <- c(60,61)

In [None]:
mis_personas

Utilizando el indexado podemos hacer ya muchas cosas interesantes con los vectores. Volvamos a mis personas original: ``mis_personas = c(71.4, 65.1, 63, 94.5)``

In [None]:
mis_personas <- c(71.4, 65.1, 63, 94.5)

In [None]:
# Añadimos un nuevo elemento
mis_personas[5]  <- 90

In [None]:
mis_personas

In [None]:
# Si a cada persona la queremos bajar 20%, 20%, 10%, 5% y 5%, ¿cuánto pesarían?
(1-c(0.2, 0.2, 0.1, 0.05, 0.05))*mis_personas 

In [None]:
# Cambiemos a las personas con peso mayor a 70 por el valor 70
mis_personas[mis_personas > 70]  <- 70

In [None]:
mis_personas

In [None]:
# Cambiemos el peso de las personas en posición 2 y 4 por su promedio.
mis_personas[c(2,4)]  <- mean(mis_personas[c(2,4)])

In [None]:
mis_personas

In [None]:
# Tomemos a las personas cuyo peso es mayor a 68 y guardemoslas en otro vector.
mis_personas_pesadas  <- mis_personas[mis_personas > 68]

In [None]:
mis_personas_pesadas