# Vectores#

creamos vectores usando la función **c**, abreviatura de **concatenate**. Para crear vectores de tipo "character" debemos usar dobles comillas. En caso contrario R pensará que son variables y usará su valor.

In [1]:
codes <- c(380, 124, 818)
country <- c("italia", "canada", "egipto")

Otra manera de crear vectores numericos es definiendo nombres para cada uno de ellos. No estamos asignando variables sino etiquetando los valores. Aunque estas etiquetas forman parte del vector, sigue siendo de tipo numérico

In [2]:
codes <- c(italia=380, canada=124, egipto=818)
# codes <- c("italia"=380, "canada"=124, "egipto"=818) da el mismo resultado!
codes
class(codes)

otra manera de hacer esto

In [3]:
codes <- c(380, 124, 818)
country <- c("italia", "canada", "egipto")
names (codes) <- country
codes

Otra forma de crear un vector numérico es mediante la función **seq**, abreviatura de **sequence**. **seq** genera una secuencia

In [29]:
seq (1,10) # crea una secuencia de valores numericos del 1 al 10
seq (1,10, 2) # crea una secuencia con un intervalo  = 2
1:10 # equivale a seq (1,10)
seq (1,10,0.5) # genera una secuencia de valores espaciadoso 0.5 unidades
seq(0,100, length.out =5) # genera una secuencia de longitud 5

## Subsetting ##

In [8]:
codes [2] # accede al elemento 2 del vector codes; ojo, el primer elemento es el numero 1!
codes [c(1,3)] # crea un vector con valores 1 y 3 para acceder a estos elementos
codes [1:2] # usando una secuencia para acceder a los dos primeros elementos
codes ["canada"]
codes [c("egipto", "italia")]

## Conversión de tipos (Vector Coercion) ##

R fuerza el tipo de ciertos datos cuando los datos son de tipo distinto.

In [13]:
x <- c(1, "manzanas", 3)
x
class (x)

También podemos forzar el tipo de datos usando **as.character** para convertir a tipo texto o **as.numeric** para convertir a tipo numérico

In [18]:
x <- as.character(1:5)
x; class (x)
y <- as.numeric(x)
y; class (y)

## El valor NA ##

R utiliza el valor **NA** para indicar que un dato falta. Esto puede ocurrir al forzar el tipo de datos.

In [18]:
x <- c("1", "b", "3")
y <- as.numeric(x)
y

"NAs introducidos por coerción"

In [23]:
x <- c(1, 2, NA, 4, 5, NA, 7)
is.na(x) # devuelve un vector indicando si un valor es NA (TRUE)
sum (is.na(x)) # devuelve el total de valores NA

### Eliminando los valores NA ###

In [25]:
x <- c(1, 2, NA, 4, 5, NA, 7)
mean(x) # no es posible calcular la media con valores NA
ind <- is.na(x)
x <- x[!ind] # creamos un nuevo vector sin los valores NA
x
mean (x) # ahora sí podemos calcular la media

[1] NA

## sort, order, rank##

Orange es un dataset incluido en R con datos experimentales sobre el diametro de las naranjas

In [31]:
head(Orange)

Tree,age,circumference
1,118,30
1,484,58
1,664,87
1,1004,115
1,1231,120
1,1372,142


In [2]:
head(Orange$circumference) # nos devuelve un vector cuyos valores tienen el mismo orden que el dataset

In [33]:
sort(Orange$circumference) # devuelve el vector ordenado de menor a mayor

In [34]:
order(Orange$circumference) # devuelve el indice que pondría el vector en orden (utilizando sort)

In [36]:
index <- order(Orange$circumference)
x <- Orange$circumference
x[index]

Esto no permite ordenar un vector según el indice de otro.

In [4]:
index <- order (Orange$circumference)
Orange$age[index]

**max** y **which.max** nos dan el máximo valor de un vector y su indice. **min** y **which.min** el m enor

In [8]:
max(Orange$circumference)
i_max <- which.max(Orange$circumference)
Orange$age[i_max]

In [9]:
min(Orange$circumference)
i_min <- which.min(Orange$circumference)
Orange$age[i_min]

**rank** nos devuelve un vector con los indices

In [2]:
x <- c (31, 4, 15, 92, 65)
rank (x) # devuelve un vector con los indices que ordenarían el vector de menor a mayor.
rank (-x) # igual pero ordenado de mayor a menor

Resumiendo:

In [14]:
x
sort(x)# ordena el vector
order(x) # indices para ordenar el vector original
rank(x) # posición que ocuparían los valores si el vector estuviera ordenado

## Aritmética de vectores ##

Las operaciones aritméticas entre vectores se producen elemento por elemento

In [3]:
inches <- c(11, 14, 15.4, 17, 19, 21, 24, 40)
cm = inches*2.54 # multiplica cada elemento del vector por 2.54
cm

In [13]:
pais <- c('España', 'Francia', 'UK', 'Alemania', 'Italia')
sup <- c(505370, 643801, 243610, 357022, 301340) # fuente wikipedia; en km2
hab <- c(46468102, 64995000, 65648100, 82800000, 60525277) # fuente wikipedia; censo 2016-2017
datos_pais <- data.frame(nombre=pais, superficie=sup, habitantes=hab)
datos_pais$habitantes/datos_pais$superficie # densidad de población en habitantes por km2

In [14]:
x <- seq(1:100)
sum(1/x^2) # suma de euler; resultado es aproximadamente pi^2/6